Daft - 分布式查询引擎
Daft 是一个使用 Python 或 SQL 进行大规模数据处理的分布式查询引擎,用 Rust 实现。
- 熟悉的交互式 API:用于快速交互式迭代的 Lazy Python Dataframe,或用于分析查询的 SQL
- Focus on the what:强大的查询优化器,可以重写查询,使其尽可能高效
- 数据目录集成:与 Apache Iceberg 等数据目录完全集成
- 丰富的多模式类型系统:支持图像、URL、张量等多模式类型
- 无缝交换:基于Apache Arrow内存格式构建
- 专为云打造: 与 S3 云存储集成的创纪录I/O 性能
Daft 的设计遵循以下原则:
- 任意数据:除了常见的字符串/数字/日期之外,Daft 的列还可以通过其基于 Arrow 的内存表示高效地存储复杂或嵌套的多模态数据,例如图像、嵌入和 Python 对象。在 Daft 中,多模态数据的提取和基本转换极其简单且高效。
- 交互式计算:Daft 旨在通过笔记本或 REPL 为交互式开发人员体验而构建 - 智能缓存/查询优化可加速您的实验和数据探索。
- 分布式计算:某些工作负载可能很快超出本地笔记本电脑的计算资源 - Daft 与Ray原生集成,可在具有数千个 CPU/GPU 的大型机器集群上运行数据帧。
基准测试
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Kimi 发布全新 Agent 模式“OK Computer”
月之暗面 Kimi 宣布推出全新 Agent 模式“OK Computer”,并开启灰度测试。 “在过去两年的成长过程中曾经给予 Kimi 打赏鼓励的用户将优先获得体验席位 —— 打开网页版 Kimi(kimi.com)就可以收到试用邀请。” 据官方介绍,“OK Computer”延续“模型即 Agent”理念,基于今年 7 月发布的万亿参数 MoE 架构模型 Kimi K2,通过端到端训练显著增强智能体自主性与工具调用能力。 具体来说,启用 OK Computer 后,用户只需下达指令,系统即可在虚拟环境中自主完成多功能网站开发、海量数据分析、图像视频生成及高质量 PPT 制作等任务。
-
下一篇
搜狗输入法回应被指“暗中篡改浏览器配置”:测试功能异常导致,已修复
针对被安全软件公司指控“暗中”篡改浏览器配置,搜狗输入法今日正式作出官方回应。 近日,我们关注到有关搜狗输入法“存在病毒漏洞”的不实信息。经核查,该问题源于一项尚未正式发布的测试功能,由于测试配置异常导致外部可访问。发现问题后,我们已于第一时间(9月20日)完成修复,不会对用户的实际使用造成影响。 对此给大家带来的困扰,我们深表歉意。后续我们将进一步加强测试流程的管理,防止类似情况再次发生。感谢大家对搜狗输入法监督和信任。 https://www.zhihu.com/question/1952759970803196309/answer/1954568475814105677 9月20日,火绒安全发布标题为《搜狗输入法云控下发模块,“暗中”篡改浏览器配置》的文章,称火绒威胁情报中心近期监测到一款专门锁定浏览器主页的病毒正加速蔓延。 经溯源,该病毒的源头指向搜狗输入法。
相关文章
文章评论
共有0条评论来说两句吧...



微信收款码
支付宝收款码