超越Hadoop的大数据分析之致谢-低调大师

超越Hadoop的大数据分析之致谢

2017-05-01 659

本文翻译自《BIG DATA ANALYTICS BEYOND HADOOP》译者：许巧辉

首先，我要衷心感谢Vineet Tyagi、AVP和Impetus的创新实验室主管。Vineet对我帮助很大，并促使我写这本书。在6、7月份，每个工作日他给我3个小时的时间写作本书，这是帮助我完成本书的关键。任何学术活动都要专门花费很多时间——这时候就得加倍努力，因为我必须在工作之余写作。Vineet令写作成为我工作的一部分。

我也想对Pankaj Mittal、CTO和SVP、Impetus表示感谢，他对研发的全心支持，像我这样的研发全职工作。荣誉对他来说，就是Impetus能够有一个无支付和收入压力的研发团队。这真的释放了我并有助于我专注于研发。在IT行业工作，写书是一个艰巨的任务。感谢Pankaj实现这点及类似的活动。

Praveen Kankariya是Impetus的CEO，他是我灵感的源泉，指导着我。感谢Praveen的支持！我还要感谢在Impetus的Nitin Agarwal博士、AVP和领导、数据科学实践小组。Nitin帮助我塑造一些思想，尤其是在我们讨论机器学习算法的认识/实现之后。他是一个我敬仰的、擅长从生活中找到灵感的人。Nitin是印度管理学院（IIM）印多尔的前教授，这充分体现了我对他的高评价。

这本书的形成离不开Pranay Tonpay，他是Impetus的资深架构师，在我的研发团队主导实时分析流。他一直在帮助实现本书的思想，包括在Spark和Storm上的一些机器学习算法。他是我团队中首要感谢的人，特别感谢Pranay。

Jayati Tiwari是Impetus的资深软件工程师，在Spark和Storm上贡献一些机器学习算法。她对Storm非常了解——其实，她是被视为团队中的Storm专家。她开发了一种倾向于理解的机器学习和Spark。团队因她的存在，增添不少乐趣。感谢Jayati！

Sai Sagar是Impetus的软件工程师，在GraphLab上帮助机器学习算法的实现。感谢Sagar，很高兴团队拥有你。

Ankit Sharma是Impetus的原数据科学家，现在是Snapdeal的研发工程师，他写了逻辑回归（LR）的一小部分，这是本书第3章解释LR的基础。还有我们在机器学习上的一些很好的讨论，感谢Ankit。

我还要感谢编辑者Jeanne Levine、Lori Lyons 和其他工作人员Pearson，他们一直在帮助这本书从我给的雏形到最终形态。还要感谢Pearson这家出版社，使得这本书面世。

我要感谢Gurvinder Arora，他是我们的技术作家，审阅了本书的各个章节。

我想借此机会感觉我的博士指导教授，印度理工学院(IIT)马德拉斯的Janakiram博士，他在我成长的岁月里激励着我走向研究生涯。我欠他很多——他塑造了我的技术思想，道德价值观，并使我学会将整个职业生涯作为灵感的来源。其实，写这本书的想法灵感来源于他最近发布的书(Building Large Scale Software Systems with Tata McGraw-Hill publishers)。不仅仅要感谢DJ教授，我还要感谢我所有的老师，从我在Sankara的高中学校开始，在Sri Venkateshwara College 学院（SVCE）的教师和所有在IIT马德拉斯的教授，是他们成就了我的今天。

我要感谢Edd Dumbill博士，以前在O’Reilly，现在是硅谷数据科学的VP——他是大数据的编辑者，也是我发表文章所在地。他一直帮忙审阅这本书。他是2013年2月加州Strata会议的组织者，当时我谈论了一些beyond-Hadoop的概念。这些谈论本质上也是为了这本书。我也借此机会感谢Strata组织者接受我一些谈论的建议。

我也要感谢Paco Nathan博士审阅这本书，并且为这本书写了前言。他的评论很鼓舞人心，正如他的职业生涯一样。我很崇拜他，感谢Paco！

我还要感谢团队的其他成员Pranav Ganguly，他是Impetus的资深架构师，给了我足够大的压力，并且顺利处理大数据管理线程。非常高兴团队拥有他和Nishant Garg。感谢我的所有团队成员。

如果没有一个强大的家庭后盾，那将是困难的，甚至不可能写成这本书。我的妻子Vidya在确保家庭和睦、幸福中扮演着重要角色。她献出我们本可以一起共度的大量时间，以致于我可以专注的写书。我的孩子Prahaladh和Purvajaa已足够成熟来让我做这个工作。感谢他们三个共同营造一个甜蜜的家庭。我也要感谢我的父母，在我的生命中，他们对我早期的教育、灌输道德。

最后，也是必不可少的。感谢上帝给了我一切，永远感谢全能的主照顾我。

文章转自并发编程网-ifeve.com

微信关注我们

原文链接：https://yq.aliyun.com/articles/88427

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《Flume日志收集与MapReduce模式》一2.4　小结

本节书摘来自华章出版社《Flume日志收集与MapReduce模式》一书中的第2章，第2.4节，作者［美］史蒂夫·霍夫曼（Steve Hoffman）斯里纳特·佩雷拉（Srinath Perera），更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.4　小结本章介绍了如何下载Flume二进制分发包。我们创建了一个简单的配置文件，里面包含了一个源，它会将内容写到一个通道中，后者又会将其写到一个接收器中。源监听着一个Socket，等待网络客户端的连接，并向其发送事件数据。这些事件被写到一个内存通道中，然后被写到一个log4j接收器中，从而成为输出。接下来，我们使用Linux netcat工具连接到监听代理上，向Flume代理的源发送一些字符串事件。最后，我们验证基于log4j的接收器成功将事件写出。下一章将会详细介绍在数据处

2017-05-01

620

1.8　Spark notebook简介在本节中，我们首先讨论有关面向机器学习的notebook方法。然后，我们介绍R Markdown，以其作为一个成熟的notebook案例，最后介绍Spark中的R notebook。学习完本节，读者将掌握notebook相关的方法和概念，并为将其用于管理和开发机器学习项目做好准备。 1.8.1　面向机器学习的notebook方法 notebook已经成为众人青睐的机器学习工具，因为该工具既能动态驱动，还具备可重复生成的特点。大部分notebook接口由一系列代码块（称为单元）构成。其开发过程是一个探索的过程，开发者借此可以在一个单元中开发和运行代码，然后基于上一个单元的结果继续编写下一单元代码。特别是机器学习从业者分析大型数据集时，这种交互式方法利于从业者迅速发现数据模式或提出数据洞见。因此，n

2017-05-01

768

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。