开源日报 | xAI正式发布API;Ubuntu发布二十周年;苹果AI产品落后2年;七十年编程语言发展漫谈;电子鹦鹉解剖图
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.10.22
今日要闻
马斯克xAI正式发布API
埃隆・马斯克的人工智能公司 xAI 正式发布了其应用程序编程接口(API),允许开发者将 Grok 集成到其他应用程序中。马斯克在周一宣布了这一消息,并同时在 xAI 网站上发布了该接口的链接。此前,马斯克曾在 8 月份确认将为 Grok 提供 API 的计划,并在 3 月份开源了该软件的权重。
要查看和使用 API,用户必须登录他们的 xAI 账户,并在个人资料设置中选择“Request Access”来申请访问 PromptIDE 和 API。目前,API 只有一个模型,名为“grok-beta”,其价格为每百万输入 token 为 5 美元(IT之家备注:当前约 35.6 元人民币),每百万输出 token 为 15 美元(当前约 107 元人民币)。
API 还允许用户执行函数调用,以便 Grok 可以与数据库、搜索引擎和其他外部软件工具集成。
Ubuntu 发布二十周年
2004 年 10 月 20 日,Canonical 创始人 Mark Shuttleworth 在邮件列表上宣布发布 Ubuntu 发行版的第一个版本 Ubuntu 4.10 "The Warty Warthog Release",他表示新发行版每半年发布一次,每个版本支持 18 个月,除了提供下载外,感兴趣的用户可以申请免费光盘。他称 Ubuntu 是基于 Debian,提供了更简单易用的安装程序。Ubuntu 推动了 Linux 的普及,虽然二十年后在桌面领域 Linux 的份额仍然很小,但它基本上统治了服务器市场,Ubuntu 也成为最流行的 Linux 发行版之一。
https://lists.ubuntu.com/archives/ubuntu-announce/2004-October/000003.html
智源发布原生多模态世界模型 Emu3
智源研究院宣布正式发布原生多模态世界模型 Emu3。该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。目前 Emu3 已开源了关键技术和模型。
公告称,Emu3 在图像生成、视频生成、视觉语言理解等任务中超过了 SDXL 、LLaVA、OpenSora 等知名开源模型,但是无需扩散模型、CLIP 视觉编码器、预训练的 LLM 等技术,只需要预测下一个 token。
苹果内部判断AI产品落后领跑者至少2年
在上周日的最新专栏文章里,知名科技爆料人马克·古尔曼透露,苹果内部的一些人认为,公司自家的人工智能技术,落后于行业领先者的程度已经超过两年。公司内部的一些研究也反映,与OpenAI的ChatGPT相比,苹果Siri的准确率要低25%,同时能够回答的问题也要少30%。
这种尴尬也出现在新品发布的节奏上。古尔曼也强调,现状并不意味着苹果会被排除在“AI竞赛”之外。这家公司拥有一个受人喜爱的品牌,以及近乎无限的资源。到某个时刻,苹果将通过开发、并购、招聘等方式进入顶级人工智能公司的行列。
对于苹果而言,还有一个独特的优势:统一的硬件生态。
阿里达摩院开源DocOwl1.5文档处理模型
阿里巴巴达摩院与中国人民大学联合开源了mPLUG-DocOwl1.5文档处理模型。
据悉,该模型无需OCR即可理解文档内容,在多个视觉文档理解基准测试中表现领先。mPLUG-DocOwl1.5 强调结构信息的重要性,提出“统一结构学习”来提升MLLM性能。目前,mPLUG-DocOwl1.5的代码、模型和数据集已在 GitHub 上公开发布。https://github.com/X-PLUG/mPLUG-DocOwl
今日观察
社交观察
Meta 开源端到端的语音模型 Spirit LM
这个模型有两个版本:
- 基础版: 适合进行一般的语音识别和生成,不包含情感变化;
- 高表现力版:可以捕捉语音中的情感特征,能够生成包含快乐、愤怒或兴奋等情感的语音。
主要特点有:
- Spirit LM 直接使用语音标记、音高标记和声调标记 来保留语音中的表现力要素,不需要先转文本描述。
- 能够在不需要大量数据的情况下,完成自动语音识别、文本转语音和语音分类等复杂任务。
项目地址:speechbot.github.io/spiritlm/
- 微博 歸藏的AI工具箱
Sandy Munro 是一个美国的逆向工程专家
Sandy Munro 是一个美国的逆向工程专家,因为拆过很多特斯拉车型,和特斯拉高层对话过,有了一些影响力。
Joe Tegtmeyer 是一个美国德州的航拍博主,自特斯拉和 SpaceX 在德州开建两个工厂以来,天天用无人机直播两个工厂的施工进度。
Sandy Munro 在拆 Cybertruck 的时候,发现上面有一块电路板写着 Hi Sandy! 特斯拉的电气工程师用这种形式和他打了个招呼。
Joe Tegtmeyer 在最近的航拍里发现,Giga Texas 工厂门口旗杆的顶部被画了一只刺猬,写着 Hi Joe,这可能是基建部门整的活儿。
不拆开就看不到了,不用无人机凑近了发现不了。类似这样的彩蛋在特斯拉是怎么落到不同部门的?这肯定没有 KPI 吧。
- 微博 不是郑小康
电子鹦鹉解剖图
七十年编程语言发展漫谈
- 微博 鹅厂程序员
媒体观察
智能化下半场 中国汽车产业如何破局
“智能网联汽车是一个技术交叉、产业跨界的领域,真正要把这个产业做实,第一是形成共识,第二是做好复杂系统工程。”“产业要想快速发展,还需加快完善相关政策标准和法律法规的制定。”
- 中国青年报
引领区看未来:上海浦东抢抓大模型“风口” 欲让“模力”焕发“魔力”
在上海浦东张江科学城的城市副中心,总建筑面积超20万平方米的大模型产业生态集聚区“模力社区”已拔地而起,这里依托张江30多年的产业基础,将集中化布局垂模产业发展生态,打造AI新的制高点。
- 中国新闻网
硬核航天“老兵”张海明:商业航天是一场长跑
AI现在在很多领域都有应用。首先,我个人的理解是提高设计的效率。我们现在设计一颗卫星、设计火箭、设计一个卫星网络,需要考虑各种因素,而AI经过足够的训练后,考虑的因素可能比我们更全面、更细致。
- 经济观察报
Q3大模型中标项目超360个,业界仍在解决落地难
大模型落地面临人才和生态断层,大模型落地带来的价值不明显等问题,中标项目内容也反映出,业界在着手解决这一系列问题。如一些项目进入核心业务场景进行探索,一些项目涉及人才培训,另一些项目涉及端到端产品、软硬件一体等。
- 数智前线
年轻人的好友列表,AI越来越多
如此发展下去,年轻人好友列表会扩列越来越多 AI ——与 80 后、90 后社交基于某些物理连接(现实身份信息)不同,00 后社交更倾向构建一个赛博分身——他们对于互联网怀着一种热烈的期待,渴望被看见,却又固执地选择画地为牢、圈地自萌(圈层化)成为这个世代赛博社交最显性社交共性。
- 虎嗅
字节豆包直面AI视频降本难题,压力给到了谁?
“由于AI大模型高昂的模型训练与推理成本,加之C端用户对AI工具的需求相对分散,付费意愿不足,视频大模型在C端市场的商业化仍然会面临一个较长的培育期”。
AI视频的时代来到了,但如何降本增效、拿下更多市场也将成为互联网大厂和科技企业面对的重要命题。
- 每日经济新闻
今日推荐
开源项目
VSCodium/vscodium
https://github.com/VSCodium/vscodium
VSCodium 是微软编辑器 VS Code 的社区驱动、自由许可的二进制发行版。VSCodium 项目的存在是为了让用户不必从源代码下载+构建。该项目包括特殊的构建脚本,可克隆 Microsoft 的 vscode repo、运行构建命令并将生成的二进制文件上传到 GitHub 发布。这些二进制文件是根据 MIT 许可证授权的。遥测功能已禁用。
每日一博
淘宝 AI 试衣素材高效写入 IC 实践
随着电商行业的快速发展,用户对于在线购物体验的要求也在不断提高。特别是在服装领域,用户希望能够更加直观地了解商品的实际穿着效果。为此,淘宝试衣项目应运而生,通过 AI 技术为用户提供个性化的试衣体验。本文将详细介绍淘宝试衣项目的背景、现状、合作场景以及技术实现,特别是如何通过定时任务驱动的试衣素材高效写入 IC(商品中心)拓展结构,提升用户体验和转化率。
开源之声
用户观点
Rust重写万物之——从头开始编写浏览器引擎
- 观点 1:这给rust忙活的,一会要写前端,一会要进内核,这会又去写浏览器,这么急着攻城掠地还是没找到自己的定位
- 观点 2:定位就是什么都能写,就像C++
- 观点 3:恩 新语言的目的就是用来重写轮子的
- 观点 4:好样的,天下苦Chrome久矣
- 观点 5:“这对 Web 来说并非好事,Web 应该是开放的,每个人都可以自由使用。”听到这句话,我差点压不住自己的火,我可不希望这世上再出一个IE
- 观点 6:重复造轮子,已经有 Servo 这样的纯 Rust 浏览器引擎了,此外 Firefox 也有一些使用 Rust 重写了
- 观点 7:Servo本身就是实验性质的,只有样式和排版,开发了十多年了,转给Linux基金会后就不活跃了
- 观点 8:虽说确实不满大公司的垄断乱改,但是作为开发,我其实更希望引擎大一统,浏览器大一统,开发的代价会低很多
- 观点 9:统一且不受大公司掌控是最好的模式
- 观点 10:统一了就一定会被大公司控制,区别只是这个大公司的各种所有制成分
- 观点 11:天下苦c艹久矣,还是rust省心,直接cargo build就完事了,在环境配置方面太轻松了
- 观点 12:怎么没人用moonbit重写一下
- 观点 13:一目前电脑的性能用 Firefox 也可以,没必要非要用 chrome,但是有人造轮子就造吧,反正前端这个娱乐圈折腾出啥都不稀奇。
- 观点 14:只要遵循w3c标准,性能更优秀,就非常欢迎!
- 观点 15:大家是不是好了伤疤忘了痛,才刚统一浏览器端没几年,就忘了兼容 ie 的苦了吗?
- 观点 16:这对 Web 开发者来说可是好事,以前兼容搞得难受一匹
- 观点 17:出吧,Chrome能出来的效果能适配过来就行
- 观点 18:说浏览器兼容问题被解决的,是不是没看见这几年互联网开始一汪死水的情况……垄断就意味着内卷与原地踏步
Python 3.13与Python 3.12的性能测试对比——起飞了吗?
- 观点 1:这不是没变化嘛,每次测试都有偶然性
- 观点 2:看来只有asyncio有一些提升,其它的都可以忽略不计
- 观点 3:好像就3.11有显著性能提升,直接写在了发布说明里,所以一直在用3.11。不知道下一次无争议的显著性能提升会在哪个版本
- 观点 4:如果用了free-threading,性能变化是啥样的呢?
---END---

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
QUIC 在高速网络下不够快
研究者发表了一份报告表明,QUIC 在高速网络下的性能不足,可能导致数据传输速度下降,尤其是在文件传输、视频流媒体和网页浏览等应用场景中。 研究表明,与传统的 TCP+TLS+HTTP/2 协议栈相比,UDP+QUIC+HTTP/3 协议栈在高速网络下的数据率可能降低至多 45.2%。性能差距随着底层带宽的增加而扩大,这种现象在不同的数据传输客户端、主流 Web 浏览器、不同类型的主机(桌面、移动)和多样化的网络(有线宽带、无线)上都能观察到。 这不仅影响了文件传输,还影响了视频流媒体(在高速以太网和 5G 下,视频比特率降低至多 9.8%)和网页浏览(平均页面加载时间比 HTTP/2 长 3.0%)。通过深入的数据包追踪分析和内核与用户空间的性能分析,研究者们确定了性能瓶颈主要在于接收端的处理开销,特别是对于数据包和 QUIC 的用户空间 ACK 处理。 简单来讲,当网络带宽超过一定阈值(大约在 500 Mbps 至 600 Mbps 之间)时,QUIC 的性能开始落后于 HTTP/2。在 Chrome 浏览器上的测试显示,当带宽达到 1 Gbps 时,QUIC 的性能比 HTTP/...
- 下一篇
升级上线!送你一份全新 PieCloudDB 社区版上手“秘籍”
为方便社区用户体验领先的数仓虚拟化技术,PieCloudDB Database 社区版已于8月完成改版。全新社区版版本针对社区用户特点,提供了 PieCloudDB 内核搭载集群管理器(PieCloudDB Cluster Controller,PDBCC)的全容器化一键式部署方案, 简化安装部署过程,支持在线和离线两种安装方式,让用户能够快速体验 PieCloudDB 主要功能。 细心的小伙伴们可能已经发现了,PieCloudDB 社区版网站「PieStore」于近期完成升级,“穿”上了全新的“皮肤”!针对不同语言需求,打造了中英文双语界面,赶快来官方社区一探究竟吧! 网址:piestore.openpie.com 全新改版后的「PieStore」页面提供了六大内容模块,方便大家轻松便捷地上手 PieCloudDB 社区版。 安装部署 PieCloudDB 社区版提供免费下载,可通过 Docker 镜像一键部署。在网页的安装部署模块,我们准备了简洁的安装部署命令,一键复制,无论是在线安装还是离线安装,均可轻松完成部署! 一键复制轻松完成部署 查询体验 为了帮助大家快速上手,我们精心准...
相关文章
文章评论
共有0条评论来说两句吧...