开源日报 | 李彦宏内部讲话曝光;阿里25周年马云内部发声;今天的App必须要把自己AI化;软件有半衰期;开源大模型编程框架ell
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.9.11
今日要闻
Canonical 正在将 GraalVM 打包成 deb 格式引入 Ubuntu
Linux 发行版 Ubuntu 基础设施团队工程师最近在论坛中透露,他们正在为 GraalVM 制作 deb 软件包(不是 Ubuntu 优先支持的 snap)。
GraalVM 是一个高性能的 JDK 发行版。它旨在加速用 Java 和其他 JVM 语言编写的应用程序的执行,同时还为 JavaScript、Python、基于 LLVM 的语言(如 C 和 C++)以及许多其他流行编程语言提供运行时。
此外,GraalVM 为编程语言之间提供了高效互操作性,并将 Java 应用程序提前编译为本机可执行文件,从而加快启动时间并降低内存开销。
Oracle 提供了 GraalVM 的通用 Linux x86_64 和 ARM64 二进制包。但到目前为止,GraalVM 并未出现在 Debian/Ubuntu 的软件包仓库中,而 Debian 上的 GraalVM 软件包只有 GitHub 中的几个非官方包。
Reflection 70B AI 模型被曝第三方基准测试效果不佳
据 venturebeat 报道,上周推出的号称可与顶级商业大模型一较高下的开源大模型Reflection 70B今日被曝在第三方测试中表现不佳。
上周末独立的第三方评估人员和开源人工智能社区成员在 Reddit 和 Hacker News 上发帖,开始质疑该模型的性能,并表示无法自行复制。有些人甚至发现了一些回复和数据,表明该模型与 Anthropic 的 Claude 3.5 Sonnet 模型有关,也许只是一个薄薄的 “包装”。
在独立的人工智能评估机构Artificial Analysis在X上发布其对Reflection 70B的测试结果比HyperWrite最初声称的得分低得多之后,批评的声音越来越多。
Reflection 公司联合创始人兼首席执行官 Matt Shumer对此表示道歉,并表示这些差异归咎于模型上传到 Hugging Face 的过程中出现的问题,并承诺在上周修正模型权重,但至今仍未做到。
阿里25周年马云内部发声
李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型之间的差距会变大
“外界对大模型有相当多的误解,” 近日据媒体报道,李彦宏的一则内部讲话曝光。 在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。 李彦宏谈到,未来大模型之间的差距可能会越来越大。他表示,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。
今日观察
社交观察
今天的 App 把自己 AI 化,是他们必须要做的事情
现有 app 生态,的确开放程度非常低。但是用户用自然语言控制硬件的需求是明确的,天然的,合理合法的。
任何阻挠这种进程的公司,再强大,也必将崩塌。甲骨文强大吗?今天 PostgreSQL 已经完全干掉了 oracle。
今天的 app 把自己 ai 化,然后提供和其他人或者 app 交互的自然语言问答接口,是他们必须要做的事情。如果不做,那么基于 01 app 这种框架新开发的 app ,会干掉他们。
软件的迭代是很快的,消费者不是不喜欢新鲜玩意,商业战场也不是不会新陈迭代,这都是天道。
唯一的问题是,需要一个足够强大的驱动力。比如,我可以用自然语言控制我的手机和电脑了。
- 微博 李楠或kkk
前 OpenAI 科学家 william 开源了 ell 项目
ell是一个轻量级、功能性的 LM 编程库。ell 是因为使用 LangChainAI 这样的框架时的挫败感而构建的,遵循三个原则:
提示是程序,而不是字符串
提示是机器学习模型的参数
每个调用语言模型都值得其重量的信用
提示应该可读且科学
有了合适的工具,提示工程从一门黑暗的艺术变成了科学。
项目地址:github.com/MadcowD/ell
- 微博 蚁工厂
最近又流行讨论AI程序员
- 微博 幻灰龙
「SkyOS · 天枢」研发背后,还有哪些你不知道的故事?
开源微信机器人底层框架:wcf.js
GitHub 上一款强大、快速、开源的微信机器人底层框架:wcf.js。
github.com/wechatferry/wechatferry
具有如下特点:
- 为消息监听、发送以及群聊操作提供一站式解决方案;
- 内置强大且易用的 Agent 库,涵盖大部分常用操作;
- 内置开发者工具包,包括数据库管理、机器人技能列表以及日志记录;
- 具备强大的处理能力,高效管理数据与任务,确保系统稳定可靠;
- 可自由控制发消息的频率,降低风险;
- 项目完全开源免费且可自由定制。
- 微博 GitHubDaily
媒体观察
深圳机器人企业数量全国居首
随着人工智能浪潮的爆发,人形机器人有望深入各细分消费端,成为AI下一个重要落地应用场景。公开数据显示,目前国内现存机器人相关企业74.17万家,广东省机器人企业数量高达14.15万家。从城市分布来看,深圳市共有5.11万家相关企业,数量稳居全国首位,产业链总产值超过1700亿元,实现了从关键核心技术攻关到应用场景拓展的全过程创新发展。
- 深圳特区报记者
阿里巴巴走过1/4世纪 马云最骄傲的是什么?
阿里25岁再出发,承载着各界对它的期待。媒体人秦朔在一篇写阿里的文章里有一段表述:“这一过程(阿里三年整改)带来的朴素启示是,即使在某个时点看起来再强大的公司,其命运也是螺旋式的,既有筚路蓝缕、无畏探索,也有高歌猛进、汹涌澎湃,还有调整变革、熵增熵减。一次次地出发、试错与重构,一次次地改变世界与被世界改变,这才是完整的故事。”
如今的阿里蜕去了少年的稚气,它对“取舍”的理解也更加自如和自信。当电商平台“卷低价”“仅退款”伤及中小商家权益时,阿里电商平台果断反对内卷,率先优化政策。
- 财经故事荟
碎片的RISC-V生态江湖,RDI指明方向
生态问题依然是盘旋在RISC-V头顶最大的乌云。从发展历程来看,RISC-V是从物联网起家。IoT嵌入式场景适合“单兵”突破,对于生态的需求低,软硬件切换的代价小。但是,由于IoT是低曝光度领域,尽管RISC-V架构芯片的出货量已经突破百亿颗,但普通消费者对其感知度不高,生态也难以复用。向前推进,手机、电脑、服务器等强生态场景对于生态的要求很高,软硬件切换的代价大,需要广泛协同生态链。这方面国内虽有企业在发力,持续朝着高性能方向走,出现了一些芯片,让基于RISC-V的高性能芯片成为可能,但是还不够,高势能尚未形成。
因此,RISC-V发展如何更进一步?解决碎片化问题,搭建属于自己的生态,仍然是一个老大难题。弱生态场景感知度低、强生态场景尚待突破,能否找到合适目前RISC-V发展的生态场景?基于此,奕斯伟提出了:RDI(RISC-V Digital Infrastructure,RISC-V数字基础设施)的产业概念。
- 半导体产业纵横
为什么这家公司的芯片推理速度比英伟达快20倍?
- 腾讯研究院
李彦宏戳破大模型“跑分”假象:榜单不代表所有实力,未来模型的差距会变大
李彦宏是闭源大模型的坚定支持者,"在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。" 他解释说,比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,无法实现算力的高效利用。
"效率上开源模型是不行的。" 他表示," 闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。"
- 一财网
今日推荐
开源项目
ikun-svelte / ikun-ui
https://github.com/ikun-svelte/ikun-ui
ikun-ui 是基于 Svelte.js 的 UnoCSS UI 库,可用于制作网站。
特性
- 组件化设计 - 提供整洁美观的 UI 组件
- 预设 CSS - 有 UnoCSS 预设包可供使用,轻松渲染 UI
- 主题配置 - 使用 unocss 等属性模式进行设计。支持主题配置,自定义主题。
开源之声
用户观点
NGINX 项目迁移到 GitHub
- 观点 1:从一个404仓库搬到另一个404仓库
- 观点 2:最伟大的开源软件之一
- 观点 3:与时俱进
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
说说唯一 ID 与 CAS
一、从数据的唯一标识开讲 数据区分与标识表现 数据和算法组成了我们现有的应用软件,当然互联网应用也不例外。为了区分应用系统收集和运行所必要的这些数据,我们通过各种方法,来组织其存储形式,方便其为我们所用。从数据结构、文件、到专业数据库等工具,无一不是方便数据存储和访问的利器。 但无论如何,我们对数据存储,都要通过唯一的标识来对其进行区分,以确保我们根据这个标识来定位到它。 在不同的系统中,这个标识的表现也各不相同: 在编程语言中,它表现为变量名称、常量名称等; 在文件系统中,它表现为目录以及目录下的文件名等; 在数据库表中,它表现为库名、表名、主键或唯一索引; 在网络通信中,它表现为IP地址、MAC地址等; 在计算机内存中,它表现为物理内存地址等。 标识的生成与组织 客观现实要求我们必须要做每一份数据的唯一性区分,在数据量少的时候,我们尚可以简单的命名方式来实现,但是当存在海量数据的时候,我们若想要将其区分标记出来,除了命名,还要相应地进行组织结构的变更,来降低命名的复杂度,否则海量杂乱的数据名称会加大我们管理和获取的难度。 最常见的几种区分方式通常有如下几类: 全随机(可读性差,文字...
- 下一篇
基于 TDMQ for Apache Pulsar 的跨地域复制实践
导语 自2024年9月6日起,TDMQ Pulsar 版专业集群支持消息、元数据两级跨地域复制功能,消息级复制解决用户全球地域的数据统一归档问题,元数据级复制提供解决用户核心业务跨地域容灾的场景。 用户在跨地域场景遇到的疑问和挑战 在跨地域相关场景下,通常有两大类原始需求: 跨地域容灾 TDMQ Pulsar 版目前支持在同一地域下进行跨可用区部署,这种部署方式能够在一定程度上提高系统的可用性和容灾能力。 如上图所示,在广州地域内的3个可用区部署了 TDMQ Pulsar 版集群。如果广州的某个可用区无法使用,系统仍然可以依靠其他两个可用区继续提供服务。 然而,金融级客户通常需要更高的容灾标准,希望能够通过跨地域部署来实现跨地域的容灾,以确保在极端情况下,比如发生自然灾害或网络故障时,也能保证业务的连续性和数据的安全性。 如上图展示的架构,用户业务可以在主地域进行日常的生产和消费,同时在其他地域进行数据备份和灾备。这种架构能够实现当一个数据中心发生故障时,迅速切换到另一个地域的数据中心,确保业务不中断,以保护数据的完整性和可用性。 全球数据归档 这类需求一般来源于国际站用户,例如某客户...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块