开源日报 | 用Rust重写C++代码的总结;解读Deepseek V3;AI Agent的现状与未来;AI芯片新战役;编程十年的感悟
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.12.30
今日要闻
智元机器人重磅开源百万真机数据集 AgiBot World
智元机器人今天重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集AgiBot World。这一里程碑式的开源项目,标志着具身智能领域“ImageNet时刻”已到来。
智元机器人介绍称,AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比谷歌开源的 Open X-Embodiment 数据集,AgiBot World 长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。
未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。
- GitHub:https://github.com/OpenDriveLab/agibot-world
- 项目主页:https://agibot-world.com/
微软推出 AI Dev Gallery——面向 Windows 11 的本地 AI 开发神器
微软针对 Windows 11 AI+ PC 设备推出了 AI Dev Gallery 功能,旨在帮助开发人员在其应用中尝试各种模型,根据使用场景整合合适的 AI 功能。
该功能已在 GitHub 开源:https://github.com/microsoft/ai-dev-gallery。
目前,Windows 11 AI+ PC 设备已支持运行小语言模型(SLM),通过本地调用 AI 模型,响应速度比基于云端的 Copilot 或 ChatGPT 更快。
据了解,AI Dev Gallery 兼容 Windows 10、Windows 11 系统,支持 x64 和 ARM64 架构,为开发者提供超过 25 个示例模型,涵盖文本、图像、代码、音频、视频以及智能控制等多个领域,极大地方便了开发者将 AI 功能集成到应用中。
FSF 鼓励在 2025 年对微软进行施压
自由软件基金会 (FSF) 发布了一篇名为 “继续向微软施压(Keep putting pressure on Microsoft)” 的文章,鼓励自由软件支持者在 2025 年继续向微软进行施压。
草根组织要对抗微软这样的大公司绝非易事。他们有足够的广告预算来宣称自己 “热爱 Linux”,更不用说有足够的资金和政治意愿来把世界各地的自由软件开发者集中到他们的非自由平台 Microsoft GitHub 上。今年的 IDAD 针对的是一个具体的不公正行为:他们要求强制 “升级” 到 Windows 11 的用户使用硬件 TPM 模块。由于 Windows 10 很快将停止接收安全更新,对于仍在使用该操作系统的用户来说,这是一个(微软制造的)问题。通常,将加密技术转移到不同的硬件模块可以看作是一件好事 —— 但对于非自由软件来说,这只会给用户带来麻烦。
正如我们在今年的行动公告中提到的,我们希望你借此机会与你认识的人分享 GNU/Linux 操作系统,并以此为例解释自由软件的概念。
这些看似微不足道的举动,除了能拯救另一台功能完好的电脑免于成为电子垃圾之外,还能开启一段通往自由的旅程。现在最重要的是继续向微软施压,无论是通过切换到 GNU/Linux、避免使用其软件的新版本,还是采取简单的行动,例如将你的项目从 Microsoft GitHub 上移走。如果你担心电子垃圾,或者有朋友致力于应对气候变化,那么把他们召集起来,向他们介绍自由软件,就是帮助我们的运动发展壮大的最佳方式,也能让更多用户摆脱微软的数字限制。
Fish Shell 用 Rust 重写 C++ 代码的总结
本月初,Fish Shell 4.0 进入测试阶段,C++ 代码被移植到了 Rust。现在,Fish Shell 的大部分代码都过渡到了 Rust,项目团队在日前发布了一篇博文,概述了他们在将庞大的 C++ 代码库移植到 Rust 的过程中取得的成功和遇到的挑战。
Fish Shell 开发人员指出,他们在使用 C++ 时遇到的一些问题导致他们更倾向于探索其他语言,其中包括工具和编译器 / 平台差异、人体工程学和线程安全以及开发社区。其中一个例子是,Fish 曾用 C++ 制作过真正的多线程执行原型,但这对这个开源 Shell 而言是非常痛苦的。
至于 Rust 编程语言,他们承认:"Rust 很酷。它很有趣"。并赞赏了 Rust 的工具性、简单的工具设置、出色的人体工学以及更好的依赖性管理,且 Rust 的发送和同步能力也使其非常适合线程。
苹果在欧盟地区停售 iPhone SE 和 iPhone 14 系列设备
科技媒体 The Verge 报道称,受欧盟新法规影响,苹果宣布在欧盟地区停售配备 Lighting 端口的设备。
据了解,当地时间 12 月 28 日,欧盟委员会 2022 年通过的关于统一充电接口的新规正式生效,电子设备制造商有义务向欧盟 27 国销售的产品配备 USB-C(即 USB Type-C)接口,无法适配的旧设备将逐渐 “退市”。
这项法规还要求支持快速充电的设备支持 USB PD 标准,允许将充电模块与零售设备分开,并通过改进的标签帮助消费者更好地了解他们购买的设备的电源要求。
今日观察
社交观察
解读 DeepseekV3
我见过的最省的GPT4o,Claude,Gemini2级别的模型,而且是国内唯一有机会上桌的,其实海外目前和这三家有资格掰手腕的也只有它自己,可以负责任的说其他的模型不配上桌吃菜(Gemini上个月都没资格)。
其实性能好就不说了,DeepseekR1就还不错,国内讲道理是第一家做inference timing scaling law的模型,阿里是第二家,其他的就不太值得谈论了,其实国外也只有Gpt和google有资格,没想到年底还能出个DeepseekV3,在传统scaling law这边还能玩出花活儿,实属不易。
AI Agent 的现状与未来
AI Agent 的现状让我想起那个梗图,自动售货机里面藏了个人。大家想象中的 AI Agent 已经开始拥有自主意识了,但实际上的 AI Agent 里面其实藏了个开发者。(这里大家脑补画面,我尝试让 AI 生成这个图片,发现 AI 不能理解“藏”)。
AI Agent 框架当前扮演一个粘合剂的作用,把 client(Twitter,Discord,Telegram 等) 和各种插件(各链等)粘合起来,然后框架提供一个基础库(记忆存储,会话隔离,上下文生成)等,后面对接各种 AI 平台接口。
- 微博 jolestar
Deepseek 是站在巨人的肩膀上,使用了大量高质量合成数据
DeepSeek-V3 的训练时间减少和算力需求降低,主要得益于算法优化、硬件适配和模型架构改进。然而,这并不意味着 AI 训练对算力的要求普遍降低,因为 AI 领域的整体趋势仍然是模型规模和复杂性不断增加。我们的优化是针对特定任务和设计进行的,旨在提高效率的同时保持高性能。
- 微博 林毅没有v
DeepSeek-V3 能够降低训练成本的主要技术
DeepSeek-V3能够降低训练成本的几个主要技术是:① 模型架构改进② FP8训练 ③ Multi-token Prediction。这几个技术都是既可以用在训练上,也可以用在推理上的。其中①中的两个架构改进(细粒度MoE和MLA),都是DeepSeek前期论文发表过的工作,是他们自己独创的改进;②FP8训练,一起从来没有人能够在这么大规模的系统上能用这么低精度的参数直接训练,这是非常大的成果,节省的训练算力也是巨大的;当然其他模型训练好以后也可以量化到FP8进行推理,但从来没有能做到直接用FP8训练这么大模型;③MTP的思想虽然不是DeepSeek首次提出的,但他们做了改进并且能够在这么大模型的训练上用起来,这也是第一次。至于蒸馏R1的能力,确实是节省了训练成本,但这个主要是带来长链推理(主要是代码和数学)能力的提高,属于锦上添花,不影响模型的基本能力。至于合成数据、数据配比实验等等,这是现在所有模型训练都要做的事情,没有必要跟训练模型本身所用的时间混为一谈。
- 微博 刘群MT-to-Death
AI工程领域的50篇论文、模型和博客文章
Latent Space 从 AI 工程的 10 个领域中挑选了 50 篇论文/模型/博客:LLMs、基准测试、提示工程、RAG、智能体、代码生成、视觉、语音、扩散模型、微调。
- 微博 i陆三金
媒体观察
美国“芯片战”的枉费心机与一错再错
分析人士认为,美国此前单方面挑起对华经贸摩擦,动摇了全球供应链;如今动辄出口管制和鼓励“回流”,是“用一个错误解决另一个错误”,其本质不过是一种为一己之私的政治操弄。
- 新华社
重视防范AI造假风险
生成式人工智能是当前国内外最热门的AI技术形态,因其强大的内容生产功能和强交互性而受到广大用户欢迎。作为一种颠覆性技术的新生事物,生成式人工智能在给经济社会发展带来巨大利好和无限可能的同时,也在法律规范、伦理道德、社会安全、公共治理等方面带来冲击。
- 经济日报
谷歌量子芯片的突破点在哪儿
5分钟与1025年,如此悬殊的数字对比引起了极大关注。有人不禁遐想,这是否意味着可以用“威洛”高效地挖比特币、运行大模型?对此,陆朝阳在此前发布的视频中解释:“实际上,谷歌在这项研究中展示的算力并非通用算力,而是只针对RCS这一特定数学问题的专用算力。”
- 科技日报
“百镜大战”催热供应链,AI端侧落地驶入快车道
AI发展正酣,其在端侧的落地风潮也涌现而至。近期行业厂商齐推AI智能眼镜新品,与此同时,部分爆款产品预售全面售罄、相关应用下载量暴增等消息频传,产业链上则有大量公司争相布局,无不显示出AI眼镜赛道的“火热”。
- 财联社
雷军千万年薪挖角95后AI天才少女,释放什么信号?
事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一个动作。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。
- 潇湘晨报
AI芯片新战役:ASIC登场,GPU失色
长久以来,人工智能训练主要依赖于价格高昂的英伟达图形处理器。 然而,云服务提供商与初创企业正积极研发成本更低的替代方案,并探索可能实现更高效处理的新途径。苹果采用定制芯片的做法,或许在向其他企业传递一个信号: 非英伟达的训练方案同样也能奏效。
- 半导体产业纵横
今日推荐
开源项目
oracle/tribuo
https://github.com/oracle/tribuo
Tribuo 是 Java 编写的机器学习库,可提供多类分类、回归、聚类、异常检测和多标签分类。Tribuo 提供了流行的机器学习算法的实现,还包装了其他库以提供统一的接口。
每日一博
低成本增量计算:大数据处理的新趋势
本文首先介绍增量计算相关的概念,随后结合 Flink 和 Paimon 两个引擎通过具体案例来介绍当前开源引擎增量计算的能力。从中我们可以得出当前的增量计算还有哪些不足,亦可窥视其未来发展方向。
开源之声
用户观点
编程十年的感悟
- 观点 1:一个在找工作的应届生诚心发问:为什么越学越感觉自己的路越走越窄?一开始想找C++的工作,随着学习的进行,发现和自己对口的工作岗位也越来越少
- 观点 2:编程只是整个项目的一部分,甚至不是最关键的;最好抽时间了解一下项目开发的流程、拓展业务知识,对后续发展有很好的帮助。祝好运。
- 观点 3:10年前我热衷于找一门最好、最漂亮的、最有生产力的语言,10年后为了养家糊口,我用上了 Omnis 这个小众得不能再小众的语言,但是收入比以前高多了,这就够了。
- 观点 4:编程这行还是需要一点灵性的,所思所想都决定着下一步的脚印,能让你独立思考的公司,必须好好去自我进化,人生能有几个十年。与优秀的人在一起久了,就像跟老板在一起久了,你也就成了老板,眼界、思想。在这个科技时代,还是得学会利用科技反哺自己才行,不能只会一味的创造科技,然后接了个电话,走着走着就挂了。
- 观点 5:10万小时学数学还是菜鸟的恐怕不少
- 观点 6:感谢开源与终身学习,喜欢这篇文章
- 观点 7:大部分人第一步不是去学什么英语,而是应该学好语文,中国话都不利索,好高骛远学洋文,最后两头都不占
- 观点 8:单从技术上来讲,个人杂而不精,应该都很水
- 观点 9:编程和做手艺做木工没区别,基本的质量要保证,整体框架不能散,留好余量该快就快。这也不重要那也不重要,能卖出去就行,这和奸商一个路数。
- 观点 10:由于 spring 框架过于重量级,所以用上 springboot??你这十年有点虚度了吧
- 观点 11:哈哈,我想说,机关写材料,跟编程的相似之处,简直太多了!快速迭代,比字斟句酌重要的多,也管用的多!
- 观点 12:20年了还在写,主要不会干别的,脑子也写糊了,最近在学swift
这款“锈化”的开源JS打包工具发布1.0 Beta——性能强劲、尤雨溪主导
- 观点 1:感觉优化 js 引擎和运行时才是正道,优化打包器效果不大。
- 观点 2:让引擎直接支持包管理,不用打包。
- 观点 3:还是太早期了,慢慢等成熟后再看看。另外,rollback,rolldown什么的,这些名词看着就有点血压
- 观点 4:绣化工具我选字节的 rspack,无他,字节自己的网站都在用
- 观点 5:造轮子也就罢了,一个个名字还那么像
- 观点 6:rust更快更安全是共识
- 观点 7:前端圈沉迷文本处理工具无法自拔
- 观点 8:难绷,感觉这么发展下去前端的人能重新发明编译器
- 观点 9:这已经是老历史了~ 写过coffescript吗
- 观点 10:不知道rsbuild和用了rolldown的vite谁更能占据大部分市场?
---END---

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
低成本增量计算:大数据处理的新趋势
自"三驾马车"伊始, 大数据处理技术已经发展了二十年。在前十年中, Hive+Spark 这套离线处理技术就已经基本完善; 近十年来, Flink的快速发展又有效地解决了实时处理的问题。然而, 低成本的近实时处理依然面临挑战。近来, 随着业界对近实时处理及流批一体架构的需求愈发强烈, 增量计算开始重新被关注。Flink在1.20中推出了MaterializedTable(MT) 来统一流批两种模式的处理, 配合Paimon已有的Changelog存储能力, 开源低成本增量计算的曙光已至。 本文首先介绍增量计算相关的概念, 随后结合 Flink 和 Paimon 两个引擎通过具体案例来介绍当前开源引擎增量计算的能力。从中我们可以得出当前的增量计算还有哪些不足, 亦可窥视其未来发展方向。 增量计算为何被重视? 增量计算在数据库领域早有研究, 在数据库领域称为Incremental View Maintenance(IVM), 其核心是为了降低基础数据变化时, 更新物化视图的成本, PostgreSQL对此也有实现。而大数据处理领域一向是大力出奇迹, 为什么近来也开始关注增量计算呢? 笔者认...
- 下一篇
天天 AI-241230:今日热点-OpenAI 搞分裂,全力冲刺 AGI!
2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。 2AGI.NET:天天AI-20241230 人工智能(AI)领域的发展日新月异,不断刷新我们对技术边界的认知。从南京大学周志华教授对AI大模型的展望,到OpenAI对中国大模型的评价,再到美国融资超1亿美元的AI公司盘点,AI技术正以前所未有的速度和规模影响着我们的世界。本文将为您梳理近期的技术热点,带您一探究竟。 南大周志华:百万模型进入学件基座系统,很多我们没预期过的事也有可能实现 | MEET 2025 量子位报道了南京大学周志华教授在MEET 2025会议上的发言,他提出随着百万模型进入学件基座系统,许多之前未能预期的事情将成为可能。这一观点不仅展示了AI大模型的潜力,也为AI技术的未来应用提供了广阔的想象空间。来源原文 OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致! AIGC开放社区报道了OpenAI科学家对中国大模型的高度评价,认为中国在算法和算力方面表现出色。这一评价不仅肯定了中国在AI领域的实力,也为国际合作和技术交流提供了新的动力。来源原文 2024年美国融资超1亿美元AI公...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Red5直播服务器,属于Java语言的直播服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7,8上快速安装Gitea,搭建Git服务器