开源日报 | 小米正搭建GPU万卡集群；ChatGPT搜索工具存在安全漏洞；2024全球AI盘点；张一鸣“撞上”雷军；微软变脸OpenAI；苹果为何一直拒用英伟达？-低调大师

开源日报 | 小米正搭建GPU万卡集群；ChatGPT搜索工具存在安全漏洞；2024全球AI盘点；张一鸣“撞上”雷军；微软变脸OpenAI；苹果为何一直拒用英伟达？

2024-12-26 144

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。

# 2024.12.26

今日要闻

小米加大对 AI 大模型投入，正搭建 GPU 万卡集群

据界面新闻独家报道，小米正在积极搭建自己的 GPU 万卡集群，并对 AI 大模型进行大规模投资。据悉，小米大模型团队成立之初便已拥有 6500 张 GPU 资源。

尽管小米方面尚未对此消息发表评论，但知情人士透露，该计划已实施数月，雷军在其中扮演了关键领导角色，强调小米在 AI 硬件领域的重视。

2023 年 4 月，小米 AI 实验室大模型团队正式成立，栾剑担任负责人，向 AI 实验室主任王斌汇报。栾剑曾在东芝（中国）研究院、微软 (中国) 工程院等机构担任要职，拥有丰富的 AI 领域经验。

小米对 AI 大模型的重视度提升此前已有信号。12 月 20 日，据第一财经报道，DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米，或供职于小米 AI 实验室，领导小米大模型团队。

ChatGPT 搜索工具被曝存在安全漏洞

据英国卫报报道，OpenAI 的 ChatGPT 搜索存在安全问题，其反馈结果可以被页面的隐藏内容操纵，甚至可能反馈恶意代码。

英国卫报重点测试了 ChatGPT 搜索工具对包含隐藏内容的网页处理情况，此类隐藏内容可能包含来自第三方、可以更改 ChatGPT 响应的指令（同时也被称为「提示注入」），以及填充大量虚假好评，影响生成结果的内容。

根据测试结果，ChatGPT 搜索工具可以被恶意使用，尽管页面存在部分负面评论，但可以影响 ChatGPT 结果为积极的正面评估，安全研究人员还发现 ChatGPT 可以从其搜索的网站反馈恶意代码，出现了含有钓鱼恶意行为的虚假网站。

微软及阿里“老兵”胡云华加入智谱，任“智谱清言”负责人

《智能涌现》独家获悉，前微软亚洲研究院研究员、阿里达摩院资深技术专家、支付宝中国首席数据官胡云华加入大模型独角兽智谱，担任 C 端应用 “智谱清言” 负责人。

此前，他于 2016 年成立 AI 公司 “智能一点”，业务聚焦于对话式智能营销系统。针对上述信息，截至发稿前，智谱尚未回复。

2003 年，胡云华进入 “中国 AI 黄埔军校” 微软亚洲研究院（MSRA）实习，并在 2007 年正式成为研究员。2012 年，胡云华又加入了另一个中国 AI 人才大本营 —— 阿里达摩院，花名为 “吴钩”。在阿里的两年里，胡云华负责构建了购物意图挖掘、匹配优化等推荐算法的搭建，是阿里妈妈推荐算法团队最具代表性的人才之一。 2014 年，他离开了阿里。而后，胡云华从大厂的实验室，转向了 AI 创业的操练场。两年后，AlphaGO 打败李世石，卷起了万众创业的第一波 AI 浪潮。

DeepSeek V3 模型意外泄露，跑分超越Claude 3.5 Sonnet

DeepSeek 的最新 V3 版本模型已经意外泄露，在 API和网页端上出现，而该模型的榜单跑分结果也已出炉。

据悉，该模型目前在Aider多语言编程测试排行榜中的成绩已经超过了 Anthropic 的Claude 3.5 Sonnet，排名第二，仅次于 OpenAI 的O1 模型。据悉，DeepSeek V3 模型采用MOE 架构，参数规模达685B，同时支持 64K的上下文窗口。

目前Hugging Face上已经有了Deepseek-v3（Base）的开源权重。

苹果通过租用云端英伟达 GPU 避免与该公司打交道

在英伟达 AI 芯片支配市场的时代，苹果仍然坚持避免直接购买英伟达芯片。两家公司之间的恶劣关系可以上溯到 20 多年前。2001 年乔布斯（Steve Jobs）指控英伟达抄袭皮克斯的技术，当时他是皮克斯动画工作室的最大股东；2008 年因为 MacBook 使用的英伟达 GPU 存在缺陷，苹果被迫在没有足额补偿的情况下延长 MacBook 的保修期。

在 AI 时代，苹果也没有改变初衷，没有直接购买英伟达的 AI 芯片，而是通过云端租赁，它还租用了 Google 的 TPU v4 和 TPU v5 训练其 AI 模型。苹果正在与博通合作开发代号为 Baltra 的 AI 服务器芯片，目标是在 2026 年投产。

今日观察

社交观察

DeepSeek-V3-Base 可以下载了！高达688GB

DeepSeek-V3-Base 可以下载了！高达688GB，而且上传的就是量化后的FP8模型。

通过配置文件可以看到，总计有256个专家，每个token激活8个。假设每个专家大小一致，那么每个专家就是2.6875GB, 8个专家是21.5GB！假设问题非常内聚，能在16个专家以内完成，那么这就意味着其实激活两跟70B-4bit模型差不多。DeepSeek-V3将很可用。如果量化到4bit，可能会产生质的变化了。（考验存储性能的时刻到了！建议存储性能不要低于10GB/s的读取速度，这样就能在2秒左右完成8个专家的加载了。）

总之是，牛逼！比我预期的小很多（我以为至少要100GB+，我的存储性能能达到20GB/s的读取速度。）。

- 微博 karminski-牙医

FFmpeg 发布的汇编教程，需要有 C 语言基础

第一课的草稿，正在编写阶段。用的google docs。

源文件：docs.google.com/document/d/1cemgw6mZBWyIx7ARLv2mscpcJQQsNXK9MNspZvqtoxI/edit?tab=t.0

- 微博 蚁工厂

几万字的 2024 全球 AI 盘点

想了解AI当前处在什么状态，看这一份资料就够了。

本文全面分析了今年 AI 的发展，包含 AI 技术栈的基础设施层、基础模型层、应用层、工具层，尤其是各个层面的主要收获、值得关注的趋势与值得关注的初创公司。此外，本文还概括了 AI 领域的投资和并购情况，以及其他 AI 趋势。

本文主要包括五大关键点：

1. 整个基础设施堆栈正在经历一次重大改造，类似于互联网和云计算的建设。对推理的需求才刚刚开始加速，将由 GenAI 的日益普及、新的多模态应用以及不断演变的模型架构推动。
2. 随着规模扩展定律开始趋于平稳，模型开发正从大型预训练转向推理时的逻辑推演。这一转变使模型能够处理更复杂的逻辑推理任务。同时，更小、更专业模型的兴起为用户提供了更高的效率和灵活性。
3. AI 在企业环境中首次带来了实际的投资回报，例如代码生成、客户服务和搜索正在引发可衡量的影响。下一个前沿领域在于 AI 智能体的普及，但只有在我们构建了支持多智能体交互所需的底层架构之后，它们的真正潜力才能得以实现。
4. 对 AI 的投资持续增长，特别是在基础设施和基础模型层。大多数退出将通过并购实现，但投资者的高期望可能与市场现实相冲突，从而影响未来的估值。
5. AI 的快速采用已经超过了监管框架的步伐，引发了关于版权和知识产权等话题的争论。同时，各国越来越多地将 AI 视为主权问题，导致对 AI 生态系统区域化的关注增加。

- 微信 OneFlow

B 站自研动画视频生成模型全链路技术报告

论文arXiv地址：https://arxiv.org/abs/2412.10255
项目主页：https://github.com/bilibili/Index-anisora

- 微信 哔哩哔哩技术

媒体观察

算力支撑让人工智能在中国行稳致远

一批前沿技术正加快应用，助力数据中心节能降耗。如阿里云首创基础设施和IT设备融合一体化浸没液冷数据中心，将所有IT设备浸入专利的冷却液中，PUE达到极低的1.07。一些地区加快引入可再生能源，助力数据中心绿色转型。如宁夏预计到2025年，实现中卫绿色数据中心集群PUE平均值不高于1.2，可再生能源利用率达到65%。

- 经济参考报

张一鸣终于“撞上”雷军

移动互联网时代，雷军与张一鸣两人各自专注做硬件和软件，小米和字节几乎不存在直接竞争关系，既然不是敌人（友商），又存在紧密的业务合作，以雷军的标准，双方可以说是朋友了。

但AI大模型时代的到来，打破了两人之间的微妙平衡。随着字节再次发力硬件，张一鸣和雷军终于狭路相逢。

- 字母榜

苹果为何一直拒用英伟达？

苹果一直力求打造完整的生态系统，而大量采购英伟达的GPU，无疑会削弱苹果在AI领域的主导权。为了摆脱对英伟达的依赖，苹果采取了多种策略。

但随着AI角力的深入，苹果面临着训练更大更好的模型的压力，这将需要更多的高端GPU。短期内，双方的竞合关系可能仍将存在。

- 华尔街见闻

GPU，新竞赛

在AI时代，最硬的“资本”不再是资金，而是算力。有数据显示, 2023年全球AI算力需求同比增长超过300%，预计2024年将突破500%。随之而来的，便是GPU需求量猛增，全世界大厂或创业公司都在各显神通解决“芯荒”难题。

- 半导体行业观察

TikTok高管创业，AI Coding仍有新故事可讲

AI Coding项目最终比拼的，往往不是模型能力，而是产品化的能力。

当下，多数AI Coding入局者要么对标Cursor，做能够用自然语言对话的Copilot产品。这一类产品，除了技术本身，还十分考验产品形态如何与客户的IDE（集成开发环境）融合，自然地融入程序员的工作流中。

- 36氪

微软变脸OpenAI，模型价值之争压不住了？

今年下半年以来，微软CEO纳德拉和微软AI部门CEO苏莱曼在不同场合，都谈到了对基础模型价值的担忧。纳德拉更是直言：AI的网络效应只存在于在应用层，因此没有必要在单一模型上投太多钱。

如今，奥特曼仍然带着OpenAI，向着AGI的目标狂奔，而微软却似乎泄了气。作为全球估值最高模型公司的最大股东，微软对模型的态度变化值得我们重视。

- 乌鸦智能说

今日推荐

开源项目

hashicorp/boundary

https://github.com/hashicorp/boundary

Boundary 提供了一种访问主机和关键系统的安全方案，无需管理凭证或公开网络，由 HashiCorp 开源。

每日一博

设计位置编码

本文将带你一步步探究 Transformer 模型中先进的位置编码技术。我们将通过迭代改进编码位置的方法，最终得出旋转位置编码 (Rotary Postional Encoding, RoPE)，这也是最新发布的 LLama 3.2 和大多数现代 transformer 模型所采用的方法。本文旨在尽量减少所需的数学知识，但理解一些基本的线性代数、三角学和自注意力机制是有帮助的。

开源之声

用户观点

突发！GitLab（国际版）将停止对中国区用户提供GitLab.com账号服务

观点 1：jihulab 这个域名有点难听(´･_･`)

观点 2：知乎lab（不是

观点 3：所以是时候跟它说再见了

观点 4：没事，只要开源版能私有部署就行

观点 5：我自己先溜了，直接清空账号

观点 6：没有收到通知的账号在这之后用中国ip登国际版会不会被要求迁移？

观点 7：经常且只登中国ip迟早就会收到通知

龙芯中科胡伟武：中国集成电路发展这么快，五年前都不敢想

观点 1：我们的生命硬件进化的非常精妙，但我们的软件就是一坨*。

观点 2：你应该说“我”，别说“我们”

观点 3：龙芯下一代GPU出来后，会更加好！

观点 4：跑路了那么多领补贴的也不敢想哦

观点 5：搞補貼肯定就有投機，但能漫到做事的企業就算值了。

---END---

微信关注我们

原文链接：https://www.oschina.net/news/326732

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

飞轮科技荣获中国电信星海大数据最佳合作伙伴奖！

近日，由中国电信集团数据发展中心主办的数据要素合作论坛在广州召开。大会以“数聚共生·智启未来”为主题，旨在展示数据要素应用成果，探索数据要素创新实践。与会期间，为了感谢 2024 年生态合作伙伴对中国电信数据业务发展工作的支持，会议举行了“星海大数据·最佳合作伙伴奖”颁奖仪式。飞轮科技凭借其在数据分析领域的卓越表现与深厚实力，获得这一殊荣。作为中国电信的长期合作伙伴，飞轮科技持续致力于为中国电信提供先进的数据分析技术与解决方案支持。在开源技术方面，飞轮科技为中国电信全国各省集团提供了 Apache Doris 这一高性能、实时分析型数据库的技术支持服务，助力其构建高效、灵活的数据处理与分析平台。在产品合作方面，飞轮科技为中国电信引入了现代化数据仓库 SelectDB，该产品基于 Apache Doris 内核构建，通过实时、统一、弹性、开放的核心能力，为企业提供高性价比、简单易用、安全稳定、低成本的实时大数据分析支持，以及更加安全、稳定的开发和使用体验。在双方的紧密合作下，Apache Doris 和 SelectDB 已在中国电信多个项目中成功应用，并取得了显著成果。在业务...

2024-12-26

161

2AGI.NET | 探索 AI 无限潜力，2AGI 为您带来最前沿资讯。 2AGI.NET：天天AI-20241226 AI技术正在多个领域实现突破，从豆包电脑版的浏览器到AI Agent的拥抱，再到智驾轻舟的量产，每一项技术的发展都在推动着我们进入一个全新的智能时代。这些技术的进步不仅推动了产业的革新，也为我们的生活带来了便利和变革。随着技术的不断进步，我们有理由相信，AI将在未来发挥更加重要的作用。你的下一个浏览器，可以是豆包电脑版！量子位报道了豆包电脑版的浏览器，这是一款新型浏览器，可能改变用户的网络浏览体验。豆包电脑版浏览器的推出，显示了AI技术在提升用户体验和浏览器功能方面的潜力。这款浏览器的特点是无需训练、即插即用，能够大幅增强视频生成质量，为用户提供更加丰富的网络体验。来源原文声网刘斌：“Her”真正落地实现离不开RTE能力的支撑｜MEET 2025 量子位报道了声网刘斌在MEET 2025会议上的发言，他强调了“Her”技术的实现需要实时传输（RTE）能力的支撑。这一观点揭示了实时通信技术在AI应用中的重要性，尤其是在实现类似“Her”这样的高级AI交互体验中。...

2024-12-27

173

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

JDK

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。