钉钉群直播【基于Spark实现的MLSQL如何帮助企业构建数据中台】

2019-05-20 752

直播回看点我

本周我们邀请了圈内大神祝威廉给群内的同学做直播分享

祝威廉，资深数据架构，11年研发经验。同时维护和开发多个开源项目。擅长大数据/AI领域的一些思路和工具。现专注于构建集大数据和机器学习于一体的综合性平台，降低AI落地成本相关工作上。

本次分享中，分享者会阐述他心目中的数据中台的样子，并且介绍如何基于MLSQL完成数据中台的构建。
此外，分享者会也会介绍MLSQL是如何基于Spark来完成这些扩展的，重要的技术点有：

如何扩展Spark SQL使其成为一个数据专用的语言MLSQL.
如何实现对各种数据源譬如HDFS/ES/MySQL/MongoDB等细化到列的权限控制。
如何构建二层RPC通讯强化对Executor的控制，实现对机器学习更好的支持。
如何支持兼容多版本Spark
如何避免机器学习中预测阶段无法复用训练时的代码和数据

微信关注我们

原文链接：https://yq.aliyun.com/articles/703119

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

流数据同步DataConnector测试整理

概述 DataHub DataConnector是把DataHub服务中的流式数据同步到其他云产品中的功能，目前支持将Topic中的数据实时/准实时同步到MaxCompute(ODPS)、OSS、ElasticSearch、RDS Mysql、ADS、TableStore中。用户只需要向DataHub中写入一次数据，并在DataHub服务中配置好同步功能，便可以在各个云产品中使用这份数据。本文主要将各类数据源配置的状况做个总结，算是对官方文档的补充。注意目前所有DataConnector均仅支持同一Region的云服务之间同步数据，不支持同步数据到跨Region的服务。 DataConnector所配置的目标服务Endpoint需要填写相应的内网域名（经典网络），不支持使用公网域名同步。数据同步目前仅支持at least once语义

2019-05-19

788

| 导语 Apache Spark社区最大的技术峰会，SPARK + AI 峰会（SAIC），于4月23-25日，在美国旧金山落下帷幕。数据与人工智能需要结合：最佳的人工智能应用，需要有大量大规模持续更新的训练数据，方能构建其最佳的数据模型，时至今日，Apache Spark已成为独特的一体化数据分析引擎，它集成了大规模数据处理和领先的机器学习与人工智能算法。本次SAIC含盖了数据工程与数据科学的内容，包括AI产品化的最佳实践案例分享：超大数据规模下，利用流数据处理确保训练数据更新的时效性，完成数据质量监控，测试以及数据模型服务。也有对流行的软件框架如TensorFlow，SciKit-Learn，Keras，PyTorch，DeepLearning4J，BigDL以及Deep Learning Pipelines等，分别进行深入的

2019-05-20

723

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

钉钉群直播【基于Spark实现的MLSQL如何帮助企业构建数据中台】

直播回看点我

流数据同步DataConnector测试整理

Spark + AI summit 2019北美技术峰会华丽落幕

相关文章

发表评论

资源下载

Mario

腾讯云软件源

Nacos

Spring

欢迎您来访！