开源日报 | 李彦宏内部讲话曝光；阿里25周年马云内部发声；今天的App必须要把自己AI化；软件有半衰期；开源大模型编程框架ell-低调大师

开源日报 | 李彦宏内部讲话曝光；阿里25周年马云内部发声；今天的App必须要把自己AI化；软件有半衰期；开源大模型编程框架ell

2024-09-11 430

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。

# 2024.9.11

今日要闻

Canonical 正在将 GraalVM 打包成 deb 格式引入 Ubuntu

Linux 发行版 Ubuntu 基础设施团队工程师最近在论坛中透露，他们正在为 GraalVM 制作 deb 软件包（不是 Ubuntu 优先支持的 snap）。

GraalVM 是一个高性能的 JDK 发行版。它旨在加速用 Java 和其他 JVM 语言编写的应用程序的执行，同时还为 JavaScript、Python、基于 LLVM 的语言（如 C 和 C++）以及许多其他流行编程语言提供运行时。

此外，GraalVM 为编程语言之间提供了高效互操作性，并将 Java 应用程序提前编译为本机可执行文件，从而加快启动时间并降低内存开销。

Oracle 提供了 GraalVM 的通用 Linux x86_64 和 ARM64 二进制包。但到目前为止，GraalVM 并未出现在 Debian/Ubuntu 的软件包仓库中，而 Debian 上的 GraalVM 软件包只有 GitHub 中的几个非官方包。

Reflection 70B AI 模型被曝第三方基准测试效果不佳

据 venturebeat 报道，上周推出的号称可与顶级商业大模型一较高下的开源大模型Reflection 70B今日被曝在第三方测试中表现不佳。

上周末独立的第三方评估人员和开源人工智能社区成员在 Reddit 和 Hacker News 上发帖，开始质疑该模型的性能，并表示无法自行复制。有些人甚至发现了一些回复和数据，表明该模型与 Anthropic 的 Claude 3.5 Sonnet 模型有关，也许只是一个薄薄的 “包装”。

在独立的人工智能评估机构Artificial Analysis在X上发布其对Reflection 70B的测试结果比HyperWrite最初声称的得分低得多之后，批评的声音越来越多。

Reflection 公司联合创始人兼首席执行官 Matt Shumer对此表示道歉，并表示这些差异归咎于模型上传到 Hugging Face 的过程中出现的问题，并承诺在上周修正模型权重，但至今仍未做到。

阿里25周年马云内部发声

这段话还是有水平的：“没有支付，我们创建支付；没有物流，我们参与物流；没有互联网支撑技术，我们投入云；信用不值钱，我们让信用变得无价。。。我们相信技术可以也必须帮助每一个普通人，让每一个普通的老百姓因为技术也获得尊严。”

李彦宏内部讲话曝光：谈大模型三大认知误区，未来模型之间的差距会变大

“外界对大模型有相当多的误解，” 近日据媒体报道，李彦宏的一则内部讲话曝光。在最近一次和员工交流中，李彦宏谈及三个大模型认知误区，涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。李彦宏谈到，未来大模型之间的差距可能会越来越大。他表示，大模型的天花板很高，现在距离理想情况还相差非常远，所以模型要不断快速迭代、更新和升级；需要能几年、十几年如一日地投入，不断满足用户需求，降本增效。

今日观察

社交观察

今天的 App 把自己 AI 化，是他们必须要做的事情

现有 app 生态，的确开放程度非常低。但是用户用自然语言控制硬件的需求是明确的，天然的，合理合法的。

任何阻挠这种进程的公司，再强大，也必将崩塌。甲骨文强大吗？今天 PostgreSQL 已经完全干掉了 oracle。

今天的 app 把自己 ai 化，然后提供和其他人或者 app 交互的自然语言问答接口，是他们必须要做的事情。如果不做，那么基于 01 app 这种框架新开发的 app ，会干掉他们。

软件的迭代是很快的，消费者不是不喜欢新鲜玩意，商业战场也不是不会新陈迭代，这都是天道。

唯一的问题是，需要一个足够强大的驱动力。比如，我可以用自然语言控制我的手机和电脑了。

- 微博 李楠或kkk

前 OpenAI 科学家 william 开源了 ell 项目

ell是一个轻量级、功能性的 LM 编程库。ell 是因为使用 LangChainAI 这样的框架时的挫败感而构建的，遵循三个原则：

提示是程序，而不是字符串
提示是机器学习模型的参数
每个调用语言模型都值得其重量的信用
提示应该可读且科学

有了合适的工具，提示工程从一门黑暗的艺术变成了科学。

项目地址：github.com/MadcowD/ell

- 微博 蚁工厂

最近又流行讨论AI程序员

其实开发大部分时候，理解业务上下文，流程上下文，小微构架，找人，对需求，等等各种交互，写代码是叶子节点这部分，但是不是全部。

而且代码这种东西，其实是有时效性的，就是你要是不持续更新维护，它很快就腐化不满足新的需求或者bug没人修复，就是软件是有半衰期的。

不要说AI写代码了，就算你有两个不错的真人小组员给你写代码，你也还是有一堆事情要做，而且还常常做了好久没解决问题。

当然，潮流有时候就是范式的转移，潮流说代码会更多的由AI来写，那就真是这样，只是你要颠覆传统程序员的价值，那就请用新的组织结构，新的组织结构才能用上新范式的生产力，目前还没有。

- 微博 幻灰龙

「SkyOS · 天枢」研发背后，还有哪些你不知道的故事？

蔚来为什么要研发整车全域操作系统？这个过程中克服了哪些困难？整车全域操作系统的研发成功，给蔚来、给行业带来了怎样的改变？今天我们用七个小故事，来告诉你「SkyOS · 天枢」背后的点点滴滴。

- 微博蔚来

开源微信机器人底层框架：wcf.js

GitHub 上一款强大、快速、开源的微信机器人底层框架：wcf.js。

github.com/wechatferry/wechatferry

具有如下特点：

- 为消息监听、发送以及群聊操作提供一站式解决方案；
- 内置强大且易用的 Agent 库，涵盖大部分常用操作；
- 内置开发者工具包，包括数据库管理、机器人技能列表以及日志记录；
- 具备强大的处理能力，高效管理数据与任务，确保系统稳定可靠；
- 可自由控制发消息的频率，降低风险；
- 项目完全开源免费且可自由定制。

- 微博 GitHubDaily

媒体观察

深圳机器人企业数量全国居首

随着人工智能浪潮的爆发，人形机器人有望深入各细分消费端，成为AI下一个重要落地应用场景。公开数据显示，目前国内现存机器人相关企业74.17万家，广东省机器人企业数量高达14.15万家。从城市分布来看，深圳市共有5.11万家相关企业，数量稳居全国首位，产业链总产值超过1700亿元，实现了从关键核心技术攻关到应用场景拓展的全过程创新发展。

- 深圳特区报记者

阿里巴巴走过1/4世纪马云最骄傲的是什么？

阿里25岁再出发，承载着各界对它的期待。媒体人秦朔在一篇写阿里的文章里有一段表述：“这一过程（阿里三年整改）带来的朴素启示是，即使在某个时点看起来再强大的公司，其命运也是螺旋式的，既有筚路蓝缕、无畏探索，也有高歌猛进、汹涌澎湃，还有调整变革、熵增熵减。一次次地出发、试错与重构，一次次地改变世界与被世界改变，这才是完整的故事。”

如今的阿里蜕去了少年的稚气，它对“取舍”的理解也更加自如和自信。当电商平台“卷低价”“仅退款”伤及中小商家权益时，阿里电商平台果断反对内卷，率先优化政策。

- 财经故事荟

生态问题依然是盘旋在RISC-V头顶最大的乌云。从发展历程来看，RISC-V是从物联网起家。IoT嵌入式场景适合“单兵”突破，对于生态的需求低，软硬件切换的代价小。但是，由于IoT是低曝光度领域，尽管RISC-V架构芯片的出货量已经突破百亿颗，但普通消费者对其感知度不高，生态也难以复用。向前推进，手机、电脑、服务器等强生态场景对于生态的要求很高，软硬件切换的代价大，需要广泛协同生态链。这方面国内虽有企业在发力，持续朝着高性能方向走，出现了一些芯片，让基于RISC-V的高性能芯片成为可能，但是还不够，高势能尚未形成。

因此，RISC-V发展如何更进一步？解决碎片化问题，搭建属于自己的生态，仍然是一个老大难题。弱生态场景感知度低、强生态场景尚待突破，能否找到合适目前RISC-V发展的生态场景？基于此，奕斯伟提出了：RDI（RISC-V Digital Infrastructure，RISC-V数字基础设施）的产业概念。

- 半导体产业纵横

为什么这家公司的芯片推理速度比英伟达快20倍？

OpenAI 在 2024 年初发布的文生视频大模型 Sora 以其惊艳的演示效果震撼了科技界。然而，由于模型复杂度带来的巨大计算量，其推理成本难以压缩至可控范围，以致这一突破性技术迟迟无法公开上线。据悉，OpenAI 正在探索更先进的芯片设计方案，以降低推理成本、提升推理速度，已初步展示出潜力的存算一体技术，很可能成为其重点研究的方向。存算一体不仅有望大幅提升推理速度，还可能彻底改变 AI 系统的设计理念，使得更复杂、更强大的 AI 应用成为现实，成为撬动下一代 AI 革命的支点，为人工智能的未来发展开辟一条全新的道路。通过持续的技术创新和市场验证，存算一体有望成为推动 AI 应用更广泛落地的关键推手，为人类社会带来更智能、更高效的技术体验。

- 腾讯研究院

李彦宏戳破大模型“跑分”假象：榜单不代表所有实力，未来模型的差距会变大

李彦宏是闭源大模型的坚定支持者，"在大模型时代之前，大家习惯了开源意味着免费、意味着成本低。" 他解释说，比如开源的Linux，因为已经有了电脑，所以使用Linux是免费的。但这些在大模型时代不成立，大模型推理是很贵的，开源模型也不会送算力，还得自己买设备，无法实现算力的高效利用。

"效率上开源模型是不行的。" 他表示，" 闭源模型准确讲应该叫商业模型，是无数用户分摊研发成本、分摊推理用的机器资源和GPU，GPU的使用效率是最高的，百度文心大模型3.5、4.0的GPU使用率都达到了90%多。"

- 一财网

今日推荐

开源项目

ikun-svelte / ikun-ui

https://github.com/ikun-svelte/ikun-ui

ikun-ui 是基于 Svelte.js 的 UnoCSS UI 库，可用于制作网站。

特性

组件化设计 - 提供整洁美观的 UI 组件
预设 CSS - 有 UnoCSS 预设包可供使用，轻松渲染 UI
主题配置 - 使用 unocss 等属性模式进行设计。支持主题配置，自定义主题。

开源之声

用户观点

NGINX 项目迁移到 GitHub

观点 1：从一个404仓库搬到另一个404仓库

观点 2：最伟大的开源软件之一

观点 3：与时俱进

---END---

最后，欢迎扫码下载「开源中国 APP」，阅读海量技术报告、程序员极客分享！

微信关注我们

原文链接：https://www.oschina.net/news/311520

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

说说唯一 ID 与 CAS

一、从数据的唯一标识开讲数据区分与标识表现数据和算法组成了我们现有的应用软件，当然互联网应用也不例外。为了区分应用系统收集和运行所必要的这些数据，我们通过各种方法，来组织其存储形式，方便其为我们所用。从数据结构、文件、到专业数据库等工具，无一不是方便数据存储和访问的利器。但无论如何，我们对数据存储，都要通过唯一的标识来对其进行区分，以确保我们根据这个标识来定位到它。在不同的系统中，这个标识的表现也各不相同：在编程语言中，它表现为变量名称、常量名称等；在文件系统中，它表现为目录以及目录下的文件名等；在数据库表中，它表现为库名、表名、主键或唯一索引；在网络通信中，它表现为IP地址、MAC地址等；在计算机内存中，它表现为物理内存地址等。标识的生成与组织客观现实要求我们必须要做每一份数据的唯一性区分，在数据量少的时候，我们尚可以简单的命名方式来实现，但是当存在海量数据的时候，我们若想要将其区分标记出来，除了命名，还要相应地进行组织结构的变更，来降低命名的复杂度，否则海量杂乱的数据名称会加大我们管理和获取的难度。最常见的几种区分方式通常有如下几类：全随机（可读性差，文字...

2024-09-11

371

导语自2024年9月6日起，TDMQ Pulsar 版专业集群支持消息、元数据两级跨地域复制功能，消息级复制解决用户全球地域的数据统一归档问题，元数据级复制提供解决用户核心业务跨地域容灾的场景。用户在跨地域场景遇到的疑问和挑战在跨地域相关场景下，通常有两大类原始需求：跨地域容灾 TDMQ Pulsar 版目前支持在同一地域下进行跨可用区部署，这种部署方式能够在一定程度上提高系统的可用性和容灾能力。如上图所示，在广州地域内的3个可用区部署了 TDMQ Pulsar 版集群。如果广州的某个可用区无法使用，系统仍然可以依靠其他两个可用区继续提供服务。然而，金融级客户通常需要更高的容灾标准，希望能够通过跨地域部署来实现跨地域的容灾，以确保在极端情况下，比如发生自然灾害或网络故障时，也能保证业务的连续性和数据的安全性。如上图展示的架构，用户业务可以在主地域进行日常的生产和消费，同时在其他地域进行数据备份和灾备。这种架构能够实现当一个数据中心发生故障时，迅速切换到另一个地域的数据中心，确保业务不中断，以保护数据的完整性和可用性。全球数据归档这类需求一般来源于国际站用户，例如某客户...

2024-09-09

341

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。