超越Hadoop的大数据分析之致谢
本文翻译自《BIG DATA ANALYTICS BEYOND HADOOP》译者:许巧辉
首先,我要衷心感谢Vineet Tyagi、AVP和Impetus的创新实验室主管。Vineet对我帮助很大,并促使我写这本书。在6、7月份,每个工作日他给我3个小时的时间写作本书,这是帮助我完成本书的关键。任何学术活动都要专门花费很多时间——这时候就得加倍努力,因为我必须在工作之余写作。Vineet令写作成为我工作的一部分。
我也想对Pankaj Mittal、CTO和SVP、Impetus表示感谢,他对研发的全心支持,像我这样的研发全职工作。荣誉对他来说,就是Impetus能够有一个无支付和收入压力的研发团队。这真的释放了我并有助于我专注于研发。在IT行业工作,写书是一个艰巨的任务。感谢Pankaj实现这点及类似的活动。
Praveen Kankariya是Impetus的CEO,他是我灵感的源泉,指导着我。感谢Praveen的支持!我还要感谢在Impetus的Nitin Agarwal博士、AVP和领导、数据科学实践小组。Nitin帮助我塑造一些思想,尤其是在我们讨论机器学习算法的认识/实现之后。他是一个我敬仰的、擅长从生活中找到灵感的人。Nitin是印度管理学院(IIM)印多尔的前教授,这充分体现了我对他的高评价。
这本书的形成离不开Pranay Tonpay,他是Impetus的资深架构师,在我的研发团队主导实时分析流。他一直在帮助实现本书的思想,包括在Spark和Storm上的一些机器学习算法。他是我团队中首要感谢的人,特别感谢Pranay。
Jayati Tiwari是Impetus的资深软件工程师,在Spark和Storm上贡献一些机器学习算法。她对Storm非常了解——其实,她是被视为团队中的Storm专家。她开发了一种倾向于理解的机器学习和Spark。团队因她的存在,增添不少乐趣。感谢Jayati!
Sai Sagar是Impetus的软件工程师,在GraphLab上帮助机器学习算法的实现。感谢Sagar,很高兴团队拥有你。
Ankit Sharma是Impetus的原数据科学家,现在是Snapdeal的研发工程师,他写了逻辑回归(LR)的一小部分,这是本书第3章解释LR的基础。还有我们在机器学习上的一些很好的讨论,感谢Ankit。
我还要感谢编辑者Jeanne Levine、Lori Lyons 和其他工作人员Pearson,他们一直在帮助这本书从我给的雏形到最终形态。还要感谢Pearson这家出版社,使得这本书面世。
我要感谢Gurvinder Arora,他是我们的技术作家,审阅了本书的各个章节。
我想借此机会感觉我的博士指导教授,印度理工学院(IIT)马德拉斯的Janakiram博士,他在我成长的岁月里激励着我走向研究生涯。我欠他很多——他塑造了我的技术思想,道德价值观,并使我学会将整个职业生涯作为灵感的来源。其实,写这本书的想法灵感来源于他最近发布的书(Building Large Scale Software Systems with Tata McGraw-Hill publishers)。不仅仅要感谢DJ教授,我还要感谢我所有的老师,从我在Sankara的高中学校开始,在Sri Venkateshwara College 学院(SVCE)的教师和所有在IIT马德拉斯的教授,是他们成就了我的今天。
我要感谢Edd Dumbill博士,以前在O’Reilly,现在是硅谷数据科学的VP——他是大数据的编辑者,也是我发表文章所在地。他一直帮忙审阅这本书。他是2013年2月加州Strata会议的组织者,当时我谈论了一些beyond-Hadoop的概念。这些谈论本质上也是为了这本书。我也借此机会感谢Strata组织者接受我一些谈论的建议。
我也要感谢Paco Nathan博士审阅这本书,并且为这本书写了前言。他的评论很鼓舞人心,正如他的职业生涯一样。我很崇拜他,感谢Paco!
我还要感谢团队的其他成员Pranav Ganguly,他是Impetus的资深架构师,给了我足够大的压力,并且顺利处理大数据管理线程。非常高兴团队拥有他和Nishant Garg。感谢我的所有团队成员。
如果没有一个强大的家庭后盾,那将是困难的,甚至不可能写成这本书。我的妻子Vidya在确保家庭和睦、幸福中扮演着重要角色。她献出我们本可以一起共度的大量时间,以致于我可以专注的写书。我的孩子Prahaladh和Purvajaa已足够成熟来让我做这个工作。感谢他们三个共同营造一个甜蜜的家庭。我也要感谢我的父母,在我的生命中,他们对我早期的教育、灌输道德。
最后,也是必不可少的。感谢上帝给了我一切,永远感谢全能的主照顾我。
文章转自 并发编程网-ifeve.com

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
《Flume日志收集与MapReduce模式》一2.4 小结
本节书摘来自华章出版社《Flume日志收集与MapReduce模式》一书中的第2章,第2.4节,作者 [美] 史蒂夫·霍夫曼(Steve Hoffman)斯里纳特·佩雷拉(Srinath Perera),更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.4 小结 本章介绍了如何下载Flume二进制分发包。我们创建了一个简单的配置文件,里面包含了一个源,它会将内容写到一个通道中,后者又会将其写到一个接收器中。源监听着一个Socket,等待网络客户端的连接,并向其发送事件数据。这些事件被写到一个内存通道中,然后被写到一个log4j接收器中,从而成为输出。接下来,我们使用Linux netcat工具连接到监听代理上,向Flume代理的源发送一些字符串事件。最后,我们验证基于log4j的接收器成功将事件写出。下一章将会详细介绍在数据处
- 下一篇
Apache Spark机器学习.1.8 Spark notebook简介
1.8 Spark notebook简介 在本节中,我们首先讨论有关面向机器学习的notebook方法。然后,我们介绍R Markdown,以其作为一个成熟的notebook案例,最后介绍Spark中的R notebook。 学习完本节,读者将掌握notebook相关的方法和概念,并为将其用于管理和开发机器学习项目做好准备。 1.8.1 面向机器学习的notebook方法 notebook已经成为众人青睐的机器学习工具,因为该工具既能动态驱动,还具备可重复生成的特点。 大部分notebook接口由一系列代码块(称为单元)构成。其开发过程是一个探索的过程,开发者借此可以在一个单元中开发和运行代码,然后基于上一个单元的结果继续编写下一单元代码。特别是机器学习从业者分析大型数据集时,这种交互式方法利于从业者迅速发现数据模式或提出数据洞见。因此,n
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Mario游戏-低调大师作品
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合Thymeleaf,官方推荐html解决方案