开源日报 | 微软开源GraphRAG;AI不仅仅是大模型;开源语音模型接近人类水平;中国寻求人类“开源”新方式
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.3
今日要闻
Fedora 41 要和 Python 2.7 说再见
红帽工程师 Miro Hrončok 提交了一份变更提案,建议在 Fedora 41 中退役 Python 2.7,并放弃仍然依赖 Python 2 的软件包。
Python 2 已于 2020 年 1 月 1 日退出生命周期,CentOS 7 也已退出生命周期,RHEL 8 的 Python 2.7 应用程序支持也将退出,红帽开发人员认为现在是时候从 Fedora 中移除 Python 2.7 软件包了。除了 PyPy 之外,Fedora 将不再支持 Python 2。
微软 WSL2 过渡至 Linux 6.6 LTS 内核
一直以来,微软 Windows Subsystem for Linux 2(WSL2)的内核使用的都是 Linux 5.15 LTS 内核。现如今,它终于从那个已经老化了的 LTS 版本升级到了当前的 Linux 6.6 LTS 系列。
日前发布的 linux-msft-wsl-6.6.36.3 内核是第一个使用 Linux 6.6.36 作为基础的 WSL2 内核。除了升级内核版本外,还对 x86_64/ARM64 内核配置进行了修改,包括支持可加载模块。
科技巨头的开源 AI 模型是“假开源”
《Nature》的一篇报道指出,很多科技巨头宣称他们的 AI 模型是开源的,但实际上并不完全透明。这些模型的数据和训练方法往往没有公开,这种做法被称为 “开源洗白”,严重妨碍了科学研究的可复现性和创新。
研究发现,在资源有限的情况下,小公司和研究团队往往能做到更加透明和开放。真正的开源应该包括代码、数据和训练方法的全面公开。
微软基于图的检索增强型生成(RAG)系统,GraphRAG,开源了!
GraphRAG通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方面优于传统 RAG。
与使用纯文本片段的简单语义搜索不同,GraphRAG 从原始文本中提取知识图谱、构建知识模块结构、生成摘要,帮助大模型更好地捕捉文本中的复杂联系和交互,来增强其生成、检索等能力。
今日观察
社交观察
开源语音模型接近人类水平
Fish Speech是一款已经开源的文本到语音(TTS)模型。
这个模型使用了三语数据进行训练,经过约15万小时语音数据的锤炼,Fish Speech的语音处理能力已接近人类水平,并且可以完美支持中英日文三种语言,目前它在Github上的标星数已达2.9k!
腾讯的多智能体翻译工具免费在线试用
腾讯的多智能体翻译工具已经可以免费在线试用了,而且是使用的 GPT-4 的 API,你可以上传txt或者pdf文件,然后会自动帮你翻译,并且整个过程都可以从右边的 Chatbox 看到。
注意上传后要手动选一下目标语言。使用地址:transagents.ai
- 微博 宝玉xp
对话腾讯汤道生:AI不仅仅是大模型
过去1年,腾讯集团高层间,新增了一个重要的企业微信群聊。腾讯公司董事会主席兼CEO马化腾、总裁刘炽平、高级执行副总裁卢山和汤道生等,悉数进入该群。这个群专门针对大模型技术变革,用于分享和讨论最新前沿并跟进业务进展。
很多人说,对大模型,腾讯“不着急”。对此,汤道生表达了不同看法:“着急啊。我们在群里经常讨论,不能说不着急。”
在汤道生看来,对于腾讯这样体量的公司,资源上必须确保投入和跟进,做“类OpenAI”的研究与研发;但同时也要保持清醒,“不要把AI等同于大模型,要看得更全面”。
“不是只有做大模型的玩家才是做AI。这就等于认为,只有做手机的企业才在移动时代重要,是很狭隘的。”他说。
- 腾讯新闻《潜望》
结合开源图片与相关视频,天龙三这事大概能明晰了
- 微博 归零工作室RTZT
媒体观察
中国脑机接口发展提速:“机智”上新,从实验室走向市场
7月1日,工业和信息化部就《脑机接口标准化技术委员会筹建方案》(下称《方案》)公示征求公众意见,以推动脑机接口技术发展。此举说明我国脑机接口技术标准的制定有望提速。
- 一财网
爱奇艺限制投屏案落槌,算计用户不能“层层叠buff”
事实一再证明,吃相难看,势必难堪;积极解“套”,才有未来。会员花式加价并非解决长视频平台营收可持续增长的长久之道,靠不断降低用户体验感来增加营收与利润,只能是竭泽而渔。靠修改规则来收割老用户,终究是搬起石头砸自己的脚。只有以用户为中心,提高内容质量、提升服务体验,视频平台才能走得更远。
- 上游新闻
大模型吞了谁?程序员彷徨,产品经理消失
大模型呼啸而至,互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人,和前线大模型公司,这两块拼图要完全吻合,难度超乎想象。
- 36氪
太空探索,中国寻求人类“开源”新方式
中国正在西方式现代化道路外另辟蹊径,走中国特色的和平、绿色、可持续发展的现代化道路,并积极寻求另一种“开源”方式——外太空探索,来突破地球资源上限,与各国共享发展红利。
- 环球时报新媒体
码农们的AI焦虑:交15万元上班,不卷就被“毕业”
但现阶段,社会普遍对AI产生了深刻焦虑,大学报志愿时,大家都会思考一个问题:什么专业以后不会被AI替代。有人说,正是职业焦虑让张雪峰们动辄上万元的高考志愿填报咨询火了。
程序员抢到了互联网爆发的红利,毕业几年就能拿到50万甚至上百万的年薪,一度触发了“文转码”的职业潮流,但如今,最怕被AI抢了“金饭碗”的人群也正是码农们,他们因此而“卷”。
- IT时报
成为巨头的“烦恼”,英伟达将在法国面临反垄断指控
除CUDA外,英伟达的其他护城河也面临对手挑战。此前据多家媒体报道,AMD、英特尔、谷歌、微软、博通、思科、Meta等企业已组建了UALink(Ultra Accelerator Link)联盟,旨在对抗英伟达另一项硬件互联技术NVLink。
- 界面新闻
谁卡了OpenAI的脖子?
当前OpenAI遭遇了“卡脖子”风波:一方面谷歌、亚马逊、Meta以及其合作伙伴英伟达等总市值超过8.7万亿美元(约合人民币63.3万亿元)的科技巨头对 AI 大模型领先地位“虎视眈眈”,借助自身流量和资本等优势强势加入赛道,促使美国 AI 市场竞争愈加激烈;另一面,OpenAI自身也遭遇“滑铁卢”,推出的GPT-4o语音助手功能测试时间不断推迟。
- 钛媒体AGI
今日推荐
开源项目
zombodb/zombodb
https://github.com/zombodb/zombodb
ZomboDB 通过使用 Elasticsearch 作为索引类型,为 Postgres 带来了强大的文本搜索和分析功能。其全面的查询语言和 SQL 函数支持以新颖和创造性的方式来查询你的关系数据。
每日一博
把飞书云文档变成 HTML 邮件:问题挑战与解决历程
要被邮件客户端识别,飞书云文档内容需要转译成 HtmlEmail 格式,该格式为了兼容各种版本的邮箱客户端(特别是 Windows Outlook),对于现代 HTML5 和 CSS3 的很多特性是不支持的,飞书云文档的多种富文本块格式都需要转译,且部分格式完全不支持,造成编辑和预览发送不一致的情况。
开源之声
用户观点
完全开源的现代化IDE正式发布:支持云端和桌面、兼容VS Code扩展、全球最大开源基金会打造
- 观点 1:所以他比VS Code好在哪里?
- 观点 2:号称完全开源
- 观点 3:eclipse,曾经多么辉煌的呀
- 观点 4:我先来,套壳 vsc
- 观点 5:ide换来换去有毛用,代码写的垃圾依旧垃圾
- 观点 6:这玩意不会又是个 Electron吧?
- 观点 7:完全兼容vsc扩展,你说呢
- 观点 8:很好,vscode有竞争对手了
- 观点 9:现在是Debian下eclipse+vscode+kate,后面是不是可以eclipse全家桶了
- 观点 10:有idea 要它干嘛?支持AI编程助手
- 观点 11:所以为什么不用codium呢
- 观点 12:已经在用了
- 观点 13:很好!但是我放不下自己DIY后的vim,吹上天都没用
- 观点 14:之前看vitis新ide风格像vscode,以为xilinx也转向vscode,结果是eclipse的新玩意
- 观点 15:vscode的浏览器版本,除了微软自己用的以外,功能基本都是残血的,托管过的都知道。 所以有个新的挺好的。
- 观点 16:完全兼容vsc,目前好像并不是,连jdp的实现Java debugger都没兼容上。Java Debugger的github仓库上有相关issue 最扯的是你标假快捷键是啥意思,样子产品。
- 观点 17:所有云端的web IDE,纯粹是前端卷得没地卷了,强行把CICD绑到了一起搞出来的kpi项目。始终理解不了用它们图啥。如果一定要个牵强的理由:我们能ai自动补全,但我想用个高端一点的好理由来收你的钱。
- 观点 18:它能开发java微服务大型项目吗?曾经是了vs跑java微服务,根本跑不起来
科技巨头的开源AI模型是“假开源”
- 观点 1:早就对此感到奇怪了... 作为一个开源软件,至少能让用户自己编译(ai这里应该是训练)一个相同的软件(模型)吧,但是很多所谓的开源模型只是给出了一个可商用的预训练模型而没有给训练集以及相关的代码 这和闭源的免费软件好像也没什么区别...
- 观点 2:OpenAI啥时候改名叫ClosedAI
- 观点 3:其它好说,数据基本上就别想了,除了护城河,还可能有版权问题
- 观点 4:这是哪个无耻之徒说出来的?人家都请你吃饭,把锅打开,递给你饭碗,难道还要给你喂饭?算法、算力、数据,人家不可能把三样全部都给你的,尤其是数据,要是连数据都给你,你岂不是第二天就立马选择自研?要点B脸不?
- 观点 5:在 Google 之后,社媒平台 Reddit 与 OpenAI 达成了内容协议,这一消息推动其股价上涨逾十分之一。根据该协议,OpenAI 将获得 Reddit 内容的访问权限,同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似,Reddit 的内容都是用户创造和管理的,它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼,通过与 Reddit 等公司达成协议,AI 公司正试图合法化其训练数据。
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
小明的代码
第一章 · 神之眷顾 灯火辉煌的都市背景下,隐藏着无数平凡而又微不足道的梦想。小明,一名普通的前端开发者,就在这座钢铁丛林中,在一家不起眼的初创公司里日复一日地敲打着键盘,为那些冰冷的网页赋予生命的色彩。他的办公室位于一栋老旧写字楼的顶层,窗外的风景尽是这座城市繁忙的呼吸,而他的世界,似乎只有这方寸屏幕内的代码。 夜已深沉,办公室的同事们都已陆续离开,只剩下小明还坚守在电脑前,与一个棘手的 BUG 奋战。屏幕发出的蓝光映照在他的脸上,显得格外专注而孤独。这段时期对小明充满着挑战,项目截止日期逼近,压力如影随形,但小明总是能从解决问题中找到一丝乐趣,那或许就是属于程序员独有的满足。 窗外突然雷声大作,一道闪电刺破长空,小明的编辑器内闪烁了一下,一行从未见过的代码自行出现在光标处。这行代码既不像 JavaScript,也不符合任何他所熟悉的编程语言,仿佛来自另一个维度的信息,带着不可名状的魔力。 小明下意识怀疑自己的眼睛,他揉了揉疲惫的双眼,确认这不是幻觉。好奇心驱使着他决定运行这段神秘代码。手指轻轻敲下回车键的瞬间,整个房间像是被一股无形的力量轻轻拂过,空气中的尘埃在光线下舞动,一切都静...
- 下一篇
StarRocks 3.3 重磅发布,Lakehouse 架构发展进入快车道!
StarRocks 3.3 的发布标志着 Lakehouse 架构在数据分析领域迈向了一个新的高度。作为下一代 Lakehouse 架构的代表,StarRocks 3.3 在稳定性、计算性能、缓存设计、物化视图、存储优化和 Lakehouse 生态系统等方面进行了全方位的优化和创新。本文将逐一介绍 StarRocks 3.3 的这些新特性,带你深入了解这款强大的数据分析工具如何提升你的数据处理效率和分析能力。 成熟稳定:全面提升的成熟度级别和大查询稳定性 为了帮助用户更好地理解和使用新功能,StarRocks 3.3 对各项新特性进行了成熟度级别的划分,并采用了更清晰的标记体系:Experimental(实验性质)、Preview(公测阶段)和 GA(生产可用)。这种分级体系使用户能够根据功能的成熟度来决定是否在生产环境中使用。 Experimental (实验性质) :这些功能的接口可能会变动,甚至可能被调整或放弃,部分刚合入社区的代码覆盖率尚未达到标准的功能也会先放入这一类别。此类功能需要用户手动打开或主动调用,不会影响其他功能。 Preview (公测阶段) :接口基本稳定,但部...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,CentOS8安装Elasticsearch6.8.6