欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.4.30
今日要点
就在昨夜,整个AI社区都被一个神秘大模型震撼到了:它名为gpt2-chatbot,性能直接超越很多开源模型和GPT-4!网友们展开猜测,有说它是GPT-4.5的,有说是GPT-5的,还有人猜它是GPT-4+Q*,或GPT-2+Q*。奥特曼也卖起了关子:「我确实对gpt-2gpt2情有独钟。」
![]()
Ubuntu 24.04 LTS 才刚刚发布,下一个版本 Ubuntu 24.10 近日也已确定了代号 —— Oracular Oriole(神谕黄鹂)。Ubuntu 24.10 大概率会采用 Linux 6.11 内核、GNOME 47 桌面、GCC 14.1 编译器以及其他升级。
![]()
一款开源模型火不火,看生态中的产品对他的支持有多快就知道了。
4 月 26 日,通义千问一言不合又开源了,直接甩出1100亿参数的王炸模型Qwen1.5-110B ,刷新开源模型性能新高。模型发布还不到 24 小时,Ollama 便火速上线了对 110B 的支持。这意味着你除了在魔搭社区和 HuggingFace 上白嫖 Demo 以外,能在模型发布的第一时间,就将它部署到你自己的电脑上。
在发布当天,Qwen1.5-110B 占领了 Hacker News 热度榜首一段时间,上一次有这么多热度和讨论,还是去年8月通义千问首次宣布开源的时候。不过,人们讨论的方向,已经从当时的“这是什么?”转变为认真的讨论“这有多强?”。质疑的噪声随着 Qwen 的实力增强逐渐消散。
![]()
今日观察
社交观察
一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。
它就是“gpt2-chatbot”。(注意啊,是gpt2不是GPT-2)
它有多强?IMO国际数学奥林匹克竞赛的题目,一次答对。
在GPT-4标志性能力“画独角兽”上,还能轻松秒杀LLaMA-3-70B。
推理方面更是表现出了惊艳效果,常见逻辑陷阱可以轻松绕过,而且回答时还带有合适的语气。
如此好的表现,但是又没明说身份……
这不是更让大伙兴奋了!
难道是传说中的GPT-4.5?
- 微博 量子位
![]()
- 微博 stage1st宅社区
开源大模型,已经开启大卷特卷模式。
全球范围,太平洋两岸,双雄格局正在呼之欲出。
Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。
![]()
不仅相较于自家720亿参数模型性能明显提升,在MMLU、C-Eval、HumanEval等多个基准测试中,Qwen1.5-110B都重返SOTA开源模型宝座,超越Llama 3 70B,成最强开源大模型。
值得关注的是,这已经是3个月内通义千问开源的第8款大模型。
- 微博 量子位
微软 Edge 用着别人谷歌的 Chromium 开源引擎,又利用平台霸主的地位挤兑 Chrome,真的难怪火狐当时挤破脑袋都要自己开发系统平台,最起码谷歌有 Android 和 Google Chrome OS,后路都给自己留着呢。同样,这个说法也能延伸至华为的鸿蒙系统,有自己的系统平台真的可以硬气很多。
- 微博 小啤Derek
从SaaS行业的需求侧、供给侧和资本市场来看,当前的SaaS行业正处于低谷期。
需求侧,受宏观经济影响,企业或多或少缩减了数字化转型开支,SaaS企业面临新客户增长放缓和现有客户订购量减少的风险。
资本市场,SaaS产业投融资环境正在变得更为成熟和理性。投资人从关注增长速度转向关注企业的盈利能力和持续性,更倾向于投资那些已经在市场上证明自身拥有清晰盈利路线图的企业。
截至目前,SaaS市场最新的融资消息来自于微盟。近日,微盟集团发布三则公告,其新股配售协议下的所有条件均已达成,公司成功完成配售,所得款项净额约为3.08亿港元;此外,微盟已成功发行8500万美元可转债。两者叠加,在原21年cb持有的投资者、公司现有股东腾讯及新投资者的合力支持下,微盟集团总计募得款项1.25亿美元。
供给侧,SaaS企业感受到行业寒潮,逐渐回归价值本质。“降本增效”成为SaaS企业普遍认同的策略,但不同的企业走出了不同的降本增效路径。有的SaaS企业只关注短期利益,手拿降本增效的大刀砍向“裁员”、“降薪”、“关停业务”。也有的SaaS企业注重长期价值,多措并举打好降本增效“组合拳”,而微盟正是其中的一员。
微盟集团年度报告显示,2023年微盟集团实现了总营收22.28亿元,同比增长21.1%。毛利润达到14.84亿元,毛利率提升至66.6%。经调整EBITDA大幅收窄至-0.75亿元,同比减亏93.1%;经调整净亏损同比大幅减少73.4%。
同一赛道,不同选择会有不同境遇,看来如何高质量的降本增效也是一门学问,微盟这个例子值得考量。
- 刘旷
1、WinMerge是一个在Windows系统下运行的开源差异比较和合并工具。软件从官网(winmerge.org)下载,安装好以后,打开可以支持中文。它可以比较文件夹和文件,支持文本、图片、表格、网页、二进制文件等多种格式,并以可视化的方式呈现差异,非常易于理解和处理。
2、Diffchecker:www.diffchecker.com,只需上传两个文件,即可进行文档对比。它支持文本、图像、PDF、Excel等多种格式。对比文件夹需要用Pro版。
3、Meld:meldmerge.org,是一款开源的跨平台文档对比软件,适用于 Windows、Linux 和 macOS 等操作系统,支持比较文本文件、文件夹和图像文件。
4、KDiff3:kdiff3.sourceforge.net,也是一款跨平台的文档对比软件,同样支持文本文件、文件夹和图像文件的比较,适用于多种操作系统。
5、ExamDiff:prestosoft.com,可用于比较文件夹、文件和文本内容。整体效果不如WinMerge,可以留作本用的选择。
6.云库工具:libkit.cn/compare,可以比较PDF和Word。除了提供文档比较外,还可以转换文件格式和CAD预览。
- 微博 班叔
媒体观察
纵观Meta、Alphabet、Microsoft新一轮的财报表现,不难看出生成式人工智能已经全面渗透到业务管道的方方面面,成为驱动企业增长的核心引擎。
微软的成功尤为典型,凭借多个AI软硬件前瞻布局稳居头把交椅,各项业务高速起飞。
Meta的巨额AI投入虽然令投资者心惊肉跳,能否尽快实现商业化盈利仍是未知数,但AI助推下广告收入已成效初显。有了Llama大模型和算力加持,扎克伯格打造全球AI领军企业的决心与雄心不容小觑。
至于老大哥谷歌,终于在AI大战中找到了自己的节奏。Gemini、TPU等武器已磨刀霍霍,准备在AI浪潮中加速寻找新的增长点。
三大巨头对人工智能发展方向的判断出奇一致,且都祭出了真金白银投入这场未来科技变革的豪赌。站在时代风口,AI最终能带他们飞得多高多远,全球科技行业的目光都将望向这里。
- 硅星人
今年一季度,深圳规模以上工业增加值同比增长11.5%,比上年同期提高7.0个百分点。规模以上制造业增加值同比增长11.8%,高技术制造业增加值同比增长13.1%。作为全国“工业第一城”,在庞大基数下实现这一成就颇为不易。
这得益于深圳牢牢扭住新型工业化这个关键任务,不断夯实市场主体、产业投资、产业生态基础,不断完善产业链,集聚创新资源,塑造新优势,注入新活力,勇闯新赛道,持续攀向全球产业链价值链高端,画出“第二增长曲线”。
- 深圳特区报
“技术派与市场派并不矛盾,他们是在创新链条的不同层面考虑问题。大家不能只做技术研究,也不能只关注市场变现,这两件事是相辅相成的。”4月26日,在2024中关村论坛“硬科技投资与发展论坛”期间,智谱AI总裁王绍兰在接受21世纪经济报道记者专访时,谈到对这个时下热点话题的看法。他认为,整个创新的链条是从思想、理论、方法、技术到产品、市场。市场派关注后端的产品和市场,技术派关注前端的理论、方法和技术,这其实是整个链条上不同层面的事情,不存在说非此即彼的关系。
只是有的公司会选择将大部分精力放到产品和市场上,有的公司会把精力放在整个链条上,重视理论、方法、技术、产品、市场的全链条创新。不同公司会从自身角度出发,做出不同的选择。
- 21世纪经济报道
今日推荐
开源项目
![]()
https://github.com/immersive-translate/immersive-translate
沉浸式网页双语翻译扩展,完全免费使用,支持 Deepl/Google/ 腾讯 / 火山翻译等多个翻译服务,支持 Firefox/Chrome/ 油猴脚本,亦可在 iOS Safari 上使用。
每日一博
关于 LLM 的量化工作目前的 SOTA performance,基本上都是基于 weight-only 的量化模式,模型在 GPU 运行所需的显存降低是其主要的贡献。
总体来说,LLM 领域的量化工作还很初步,若在实际任务中对模型的表现精度要求十分高,更推荐单纯基于 KV cache 等方向提高单位显存吞吐量的算法和工具,如 Flash Attention-2、Paged Attention 等。
![]()
事件点评
近日,有关谷歌对 Flutter、Dart、Python 等关键团队进行了裁员一事在社交媒体上广为流传。对此,谷歌则向外媒 TechCrunch 证实,该公司确实已经进行了裁员,但没有透露具体的团队、角色以及裁员人数。
但谷歌方面澄清道,此次裁员并非全公司范围内的裁员,而是正常业务过程中的重组,受影响的员工将能够申请谷歌的其他空缺职位。
![]()
点评
这次裁员事件可能反映了科技行业内部的一些更广泛趋势,包括对效率和成本效益的追求,以及对特定技术或产品线的重新评估。同时,这也是谷歌在不断变化的市场环境中调整其资源分配和业务重点的一部分。
裁员事件反映了科技行业快速变化和波动的特性。随着市场和技术的不断演变,公司需要灵活调整其资源分配和业务重点。
而谷歌作为科技行业的领导者,其决策和战略调整受到市场的密切关注。这次裁员可能会影响投资者对谷歌未来发展和战略方向的看法。
谷歌报告称,该公司在 2023 年共阻止了 228 万款违反政策的 Android 应用在 Google Play 上架。以及发现并屏蔽了 333,000 个上传恶意软件、欺诈性应用程序或多次严重违反政策的 Google Play 帐户。
相较之下,在 2022 年谷歌共封杀了 150 万个 "不良" 应用,并封禁了 17.3 万个严重违反商店政策的开发者账户。
![]()
点评
这一数字反映了移动应用市场在安全、监管和用户信任方面面临的复杂挑战。随着移动设备的普及,移动应用市场迅速增长,但同时也带来了监管和安全的挑战。谷歌需要不断更新其审查机制,以应对新出现的威胁和违规行为。谷歌在保护用户安全的同时,也需要确保用户能够轻松获取所需的应用程序。这一事件显示了在安全性和用户便利性之间找到平衡点的重要性。
对于开发者来说,遵守 Google Play 的政策和标准是一个持续的挑战。谷歌对政策要求的更新和加强,意味着开发者需要不断学习和适应。虽然谷歌在 Google Play 上采取了严格的安全措施,但第三方应用商店可能没有类似的安全保障。这可能导致用户面临更高的安全风险。
随着技术的发展,恶意软件和违规应用的开发者也在不断寻找新的方法来规避审查。谷歌必须持续更新其安全措施,以保持领先。
OpenAI 宣布与英国《金融时报》达成合作,使其大型语言模型获得对《金融时报》文章的访问权。
作为合作的一部分,两家公司将向 ChatGPT 用户提供《金融时报》的一部分内容。 OpenAI 表示,通过此次合作,ChatGPT 用户将能够看到 “精选的摘要、引述以及《金融时报》新闻报道的链接,以回应相关查询”。不过 OpenAI 没有具体说明内容何时可以访问或在哪些版本的 ChatGPT 中进行访问。
![]()
点评
这一合作不仅为OpenAI的用户提供了更丰富的内容来源,还标志着人工智能在新闻领域应用的一个重要里程碑。通过与《金融时报》的合作,OpenAI能够提供更准确、更相关的信息检索服务,同时《金融时报》的内容也因此得到了更广泛的传播和利用。
还可能对新闻行业的商业模式产生影响。随着越来越多的媒体公司与AI公司合作,新闻内容的生产和分发方式可能会发生改变。这种合作可能为新闻机构带来新的收入来源,同时也为AI公司提供了更高质量的数据集来训练其模型。
以及可能促进OpenAI在人工智能领域的竞争。未来可能会出现更多类似的合作伙伴关系,推动人工智能和新闻行业的进一步融合和发展。
开源之声
媒体观点
通用智能的发展面临着技术性、生物性和社会性三大瓶颈。技术性瓶颈表现在人工智能系统需要具备更高的计算能力、更先进的算法和更有效的数据处理方法,以实现更复杂、更智能的功能;生物性瓶颈主要体现在我们对人类大脑认知能力运作机制的理解还非常有限,要实现类似的智能水平需要更深入的神经科学和认知研究;社会性瓶颈则包括了人工智能系统与人类社会的融合问题,例如文化差异、伦理道德、隐私保护等。“克服这些瓶颈需要跨学科的合作和持续的创新努力,只有在技术、生物和社会方面取得突破,通用智能才能迈向更加成熟和全面的发展,但极难实现。”
- 环球时报
2024 开年,海外互联网巨头开始兑现 AI 业务的商业化潜力。
过去一周,谷歌、微软、Meta 相继公布 2024 年一季度财报,三者有喜有忧。微软、谷歌财报发布后分别上涨 4%、15%,后者更是触及历史新高;相比之下 Meta 却遭遇滑铁卢,财报发布后股价一度跌幅达 19%。
- 极客公园
大模型时代到来,资本圈著名“风口捕手”周亚辉又毫不意外地将AI划入了自己的版图。他实控的昆仑万维股价在2023年扶摇直上,一度创下了暴涨四倍的“神话”。然而喧嚣之下,昆仑万维要在大模型市场中持续掘金,也并非易事。2024年一季度,昆仑万维归母净利润同比大跌188%,创下近十年最糟糕纪录。
- 市界
现如今在字节跳动,已近乎隐退的张一鸣,只重点关注两件事:其一,是风暴中的TikTok;其二,就是字节跳动正在全力追赶的AI战略业务。
提及字节的AI战略远望,多个接近字节的人士均认为,以Flow部门出品最为“正统”,“虽然很多子业务都在做相关的事情,比如飞书,但管理层层面还是认为AGI之战还是以Flow为主”。
- 凤凰网科技
用户观点
- 观点 1:把flutter和compose团队合并,发力compose吧,flutter的绘制引擎也可以移植到compose了
- 观点 3:flutter不应该走邪门歪道 用个dart
- 观点 4:本来就是半只脚进入棺材的语言,硬是拽出来,现在来这一出,前景又变得不明朗。不知道谷歌那帮人是怎么想的。
- 观点 5:因为可控啊,dart 自己说了算,如果ts 没那么快那么火,dart 还是有机会的,但是败给了ts
- 观点 6:"Flutter EngProd team 整个被裁了。劈柴真有你的👍" / ...
- 观点 7:其实从2前flutter总部团队的大部分招聘工作就已经停止了,但flutter和dart不会消亡
- 观点 8:还不如收购uniapp
- 观点 1:虽然法国是 OCCT 母社区,但 GitHub 上 OCCT 的核心开发者都是俄罗斯人,离了俄罗斯人,法国母社区也运营不下去。于是华为出手收编,迁移到中国,修改名字恢复开源和社区运营,有什么问题呢?平时很少夸华为,但这个工作的确做得不错。
- 观点 2:华子这波是白嫖计算机皇冠上的明珠啊
- 观点 3:懂开源世界不, 请保持谦虚,否则暴露的就是自己的无知,自己像个小丑在众目睽睽下乱蹦哒,还不自知。
- 观点 4:这个就是捡漏,算不上什么自研
- 观点 5:有什么精神洁癖,虽然中途接手,但是团队是花钱养着专职写代码,讲道理可以闭源转商用专供自己卖产品
- 观点 6:华为:来得早不如来得巧,感谢美国老铁送来的助攻
- 观点 7:我这两年就在用OCCT搞开发,资料少,布尔操作性能差,缺少一些关键算法等问题,需要自己去搞,如果华为能把这些问题解决了,中国的工业软件发展会更顺利
- 观点 8:这个是牛掰了
- 观点 1:完备的语言是不存在的
- 观点 2:处理可能存在的错误是必须的,语言层面上没有问题。
- 观点 3:这个提法本就有问题,一个不愿意处理错误的人,你只要有忽略的办法他总是会忽略,而且这个增加会让忽略变得更复杂,代码看起来也更复杂,_就已经是最好的方案
- 观点 4:简单有效的,各取所需的解决方案:用检查工具或者编译器属性来检查
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!
![]()