Spark + AI 2019北美技术峰会华丽落幕
| 导语
Apache Spark社区最大的技术峰会,SPARK + AI 峰会(SAIC),于4月23-25日,在美国旧金山落下帷幕。
数据与人工智能需要结合:最佳的人工智能应用,需要有大量大规模持续更新的训练数据,方能构建其最佳的数据模型,时至今日,Apache Spark已成为独特的一体化数据分析引擎,它集成了大规模数据处理和领先的机器学习与人工智能算法。
本次SAIC含盖了数据工程与数据科学的内容,包括AI产品化的最佳实践案例分享:超大数据规模下,利用流数据处理确保训练数据更新的时效性,完成数据质量监控,测试以及数据模型服务。也有对流行的软件框架如TensorFlow,SciKit-Learn,Keras,PyTorch,DeepLearning4J,BigDL以及Deep Learning Pipelines等,分别进行深入的
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Hadoop大数据平台环境搭建注意事项,波若分布式数据采集工具功能剖析,数道云
Hadoop大数据作为时代发展的产物,影响着互联网企业发展、以及企业关于品牌形象推广、政府有关民意采集、以及有关数据信息收集分类……………… Hadoop技术的发展,带来了海量数据高效处理的能力,也给互联网政企、高校的发展带来了突破性的发展。互联网的数据容量巨大,以10-100GB或更多,数据种类多种多样。如何利用Hadoop大数据平台实现大数据的快捷处理呢?以及Hadoop环境搭建注意事项分析。 Hadoop大数据平台选择注意事项: 1.环境的部署和搭建 前期准备:网络环境的搭建、Hadoop环境的部署、需要下载或者安装的Hadoop程序、虚拟机、java JDK环境部署…… 2.集群环境部署 (1)电脑配置(适用于多少台虚拟机同时上线) (2)什么样的虚拟机适用于Hadoop集群环境使用 (3)关于大数据平台搭建系统的选择及使用 (4)了解熟悉安装过程 (5)选择适合的安装模式 3.产品的使用及操作 (1)登录管理界面 (2)启动安装导向 (3)设置集群名称 (4)安装选项,输入集群节点主机名列表 (5)根据需求,选择相对应的服务项目 (6)根据步骤,如果有需要,可以进行定制开发选...
- 下一篇
Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的
Airbnb 日志事件获取 日志事件从客户端(例如移动应用程序和 Web 浏览器)和在线服务发出,其中包含行为或操作的关键信息。每个事件都有一个特定的信息。例如,当客人在 Airbnb.com 上搜索马里布的海滨别墅时,将生成包含位置,登记和结账日期等的搜索事件。 在 Airbnb,事件记录对于我们理解客人和房东,然后为他们提供更好的体验至关重要。它为业务决策提供信息,并推动工程功能(如搜索,实验,付款等)中的产品开发。例如,日志事件是训练机器学习模型以进行列表搜索排名的主要来源。 日志事件近实时地摄取到数据仓库中,并作为许多 ETL 和分析作业的数据来源。事件从客户和服务商发布到 Kafka。Spark streaming 作业(建立在 Airstream 之上,Airbnb 的流处理框架)不断从 Kafka 读取并将事件写入 HBa
相关文章
文章评论
共有0条评论来说两句吧...