您现在的位置是:首页 > 文章详情

开源日报 | 德国也要 “自主可控”;搞AI的是真没钱了;JetBrains全家桶2024.1;FFmpeg 7.0

日期:2024-04-07点击:32

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.4.7

今日要点

首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作

来自UC berkeley的研究人员开源了首个世界模型,多模态性能优秀,长视频理解吊打GPT-4,同时将上下文长度增加到百万级别。

上图展示了LWM的多模态训练。第一阶段是上下文扩展,重点是使用Books3数据集扩展上下文大小,从32K增长到1M。第二阶段,视觉语言培训,重点是对不同长度的视觉和视频内容进行培训。饼图详细说明了训练数据的分布情况,包括495B的文本-视频数据,以及33B的文本数据。

FFmpeg 7.0 “Dijkstra” 发布

FFmpeg 7.0 “Dijkstra” 现已发布。此版本以荷兰计算机科学家 Edsger W. Dijkstra 的名字命名,一些值得注意的变化包括原生 VVC 解码器(目前处于实验阶段)、IAMF 支持以及多线程 ffmpegCLI 工具。

该版本并不向后兼容,删除了 6.0 之前废弃的 API。对大多数 library callers 来说,最大的变化是删除了旧的 bitmask-based channel layout API,取而代之的是允许自定义通道排序或 Ambisonics 等功能的 AVChannelLayout API。某些过时的 ffmpegCLI 选项也已被移除,现在需要使用兼容 C11 的编译器来构建代码。

Redict 首个稳定版 7.3.0 发布,基于 Redis 7.2.4 的社区分支

Redict 首个稳定版 7.3.0 已发布。此版本 fork 自 Redis 7.2.4,采用 LGPL 开源协议 —— 团队称这是为了确保云厂商可以继续向其客户提供 Redict,而无需遵守繁琐的合规条款。

Redict 团队还表示他们的重心是保证项目稳定性和长期可维护,这区别于 Valkey。Valkey 得到了商业公司的支持,因此能投入更多资源开发更激进的创新。而 Redict 对创新更为保守,追求长期稳定性而不是长期增长,这对现有用户更有价值。

微软完成 Azure RTOS 的开源迁移:更名为 Eclipse ThreadX,采用 MIT 开源协议

2023 年 11 月,微软宣布 Azure RTOS 将在 Eclipse 基金会的管理下过渡到开源模式,Eclipse 基金会是托管开源物联网项目的公认领导者。

近日,微软宣布自 2023 年 11 月启动过渡计划以来,不断推进 Azure RTOS 的开源工作,对 Eclipse 基金会的贡献近期终于完成,并发布了 Eclipse ThreadX 6.4.1 版本。最新发布的 Eclipse ThreadX 6.4.1 版本(前身 Azure RTOS)和中间件组件采用 MIT 许可,其功能等同于 Azure RTOS 6.4,而后者正是已经部署在全球数十亿嵌入式系统上的优秀产品。

Eclipse ThreadX 还包括一些中间件组件,如 FileX、GUIX、NetX Duo 和 USBX,这些组件也可以独立于 RTOS 使用。这意味着开发者可以将这些组件与其他实时操作系统一起使用,甚至可以在没有 RTOS 的情况下使用。


今日观察

社交观察

「22岁的火狐,市占率被3岁的自己超了」

从螺旋起飞到求给机会,从 30% 到 3% 不到,火狐到底发生啥了?

从 2010 年开始,火狐一直在丢失市场,市占率每 4 年跌 10%,前几年辛苦攒的用户全跑了。在 2017 年,Mozilla 的 CEO 也承认说:Firefox 没有跟上市场发展,没能及时满足用户需求,很多 Firefox 铁粉都成了 Chrome 用户。

- 差评

「你混淆过的JS代码将和“开源代码”没什么区别」

- 微博  程序员那些破事

「 华尔街这篇生成式AI的文章,让我想起若干年前与网吧老板的闲聊」

华尔街这篇生成式AI的文章,让我想起若干年前与网吧老板的闲聊,我问他一年能挣多少,他说挣的钱都用来换电脑了,向我倒苦水。那时候正是网吧最火爆的时候也是电脑硬件飞速发展的时候。如果不及时更新硬件,就玩不了新游戏,玩不了新游戏就没人来了,于是很大一部分利润不得不投入到电脑的升级换代上。

现在生成式AI的情况更糟,因为它还不能赚钱,却要求投资者不断增大投入,而未来该怎么变现的影子都还看不到。

嗯,但无论如何这种狂热利好硬件公司,做GPU的可是实实在在的挣到钱了,只要AI热潮再维持两三年,那股价再涨三五倍可能也没啥压力。

- 微博 三思逍遥

「弱智吧成最佳中文AI训练数据」

对于这类现象,研究人员在分析中也给出简单猜测:可能是弱智吧问题增强了AI的逻辑推理能力,从而使指令遵循任务受益。当然弱智吧并不是这项研究的全部,它的真正贡献在于为中文大模型开发提供了一个高质量的指令微调数据集COIG-CQIA。

- 微博 观察者网

媒体观察

「人工智能未来之路:开源与闭源之争 社区创办者力挺开源之路」

目前,“开源”模式获得不少知名公司和机构的支持,例如元宇宙旗下的利亚马(LLaMA)、斯坦福大学旗下阿尔帕卡(Alpaca)等都已经公开了“算法”。

在很多专家看来,开源技术可以加速人工智能创新。在利亚马开源的说明中,他们还认为,开源可以让“开发者和研发者对人工智能进行压力测试,作为一个社区,快速识别和解决问题。”

- 央视新闻

「AI人才争夺战,马斯克直呼“史上最疯狂” 」

近日,特斯拉CEO马斯克在社交媒体平台上发帖称:“OpenAI一直在高薪挖特斯拉工程师,不幸的是,经常有成功挖人的例子。”

上个月,机器学习科学家Ethan Knight成为第三位投身xAI的特斯拉工程师。马斯克透露,在Knight即将转向Open AI之际,自己出手了,为xAI截胡了Ethan Knight。

“AI人才争夺战是我见过的最疯狂人才争夺战。”马斯克如此感叹!

- 证券时报

「为大模型定制一颗芯片?」

想要训练一个大模型,代表算力的芯片就是最关键的一环,也是成本最高的一环。

这也导致了一个问题,如果AI照着现在这幅样子发展下去,那么成本就会越来越高,高到绝大部分公司都难以承受的地步,根据外媒估计,如今正在开发的大模型,平均每个需要花费约 10 亿美元,而下一代大模型呢,平均每个需要花费 100 亿美元来训练,这个天文数字,在硅谷买下几十家有潜力的初创公司都还有得找。

在美国硅谷,迈克-冈特(Mike Gunter)和雷纳-波普(Reiner Pope)这两位从谷歌出走的工程师,他们成立了一家名为 MatX 的公司,而这家公司的目标,就是设计专门用于LLM(大型语言模型)的,更便宜、更快速、更适合人工智能的芯片。

半导体行业观察

「华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用」

李博杰在这篇文章中表示,AI 的发展目前有两个方向,一个是有趣的 AI,也就是更像人的 AI;另外一个方向就是更有用的 AI,也就是更像工具的 AI。但目前的 AI 技术,要么是只有趣但没用,要么是只有用但是不像人,“不好玩”。

李博杰指出,通用人工智能(AGI)的目标是,兼具慢思考和类人属性的 AI Agent,然而当前 AI Agent 和人类梦想之间存在巨大的差距。

李博杰坦言,Video Diffusion 是一个更为终极的技术路线。尽管大模型的成本一定会快速降低,但他不建议贸然自己去做基础模型。

“如果没有拳打 OpenAI、脚踢 Anthropic 的实力,在效果上比不过最好的闭源模型,成本上也比不上开源模型。”李博杰表示。

- 钛媒体

「10万美元训出Llama-2级大模型!全华人打造新型MoE」

“只需”10万美元,训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了:它叫JetMoE,来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Llama-2。JetMoE发布即完全开源,且学术界友好:仅使用公开数据集和开源代码,用消费级GPU就能进行微调。

传送门:https://github.com/myshell-ai/JetMoE

量子位
 

今日推荐

开源项目

toeverything/AFFiNE

https://github.com/toeverything/AFFiNE

AFFiNE 是开源协作知识库软件,注重隐私保护,面向专业人士打造。

特性

  • 隐私保护:AFFiNE 能够让用户控制自己的数据、存储数据,同时按需自由编辑和查看数据
  • 离线优先:支持离线使用,无论是查看还是编辑,当重新联网时支持无冲突合并
  • 简洁直观的设计
  • 支持 Markdown
  • 支持多语言

推荐理由

AFFiNE是一个注重隐私保护的开源个人笔记软件,提供了一个简洁直观的用户界面和Markdown支持,方便用户进行内容创作和格式化。作为一个离线优先的解决方案,AFFiNE让用户能够完全控制自己的数据,并在离线状态下工作,数据在重新联网时可以无冲突合并。AFFiNE的设计理念和对隐私的重视,使其成为Notion等在线笔记应用的优秀替代品。

每日一博

前端架构设计的一点考究

本文总结了作者在日常 / 大促业务的 “敏捷” 开发过程中产生的疑惑,并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中,梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题,并实践在项目迭代中。


事件点评

首例,美国法官裁定 AI 增强视频不足以作为法庭证据

美国全国广播公司 (NBC) 报道称,在美国华盛顿州的一项三重谋杀案判决中,法官 Leroy McCullogh 判定使用 AI 增强过后的视频不足以作为证据呈现。这是行业中的首例此类裁决。

McCullogh 法官认为此类软件依赖于 "不透明的方法来表现 AI 模型认为应该显示的内容"。

裁决书写道:“本庭认为,采纳这一 AI 增强证据会导致问题混淆,混淆目击证人的证词,并可能导致一场耗时的审判中的审判,涉及 AI 模型所使用的不可同行评议的程序。”

点评

此裁决标志着AI技术在法庭证据领域的应用受到了限制,同时也引发了关于技术在法律程序中角色的重要讨论。此案例的影响深远,它不仅影响了当前的法庭实践,也为未来的法律和技术发展提供了重要的参考。对于法律界和科技界来说,这起案件是对如何在法律框架内合理应用新技术的考验,同时也突显了技术在司法领域应用的复杂性和潜在风险。

此外,这一事件还可能对公众对AI技术的看法产生影响,尤其是在法律和证据采集领域的应用。公众可能会更加关注AI技术的透明度和公正性,以及在法律程序中使用AI技术的潜在偏见和误导性。

总体而言,这一事件不仅是一个法律案例,也是对AI技术在法律和司法领域应用的深刻反思,其影响将波及到法律实践、技术发展和公众意识等多个方面。

德国也要 “自主可控”,州政府将 3 万台 PC 从 Windows 迁移到 Linux

在试点成功之后,德国北部州 Schleswig-Holstein(石勒苏益格 - 荷尔斯泰因)决定将政府机构使用的 3 万台 PC 从 Microsoft Windows 和 Microsoft Office 迁移到 Linux 和 LibreOffice

不过该政府做出这一决定并不是因为 Linux 和 LibreOffice 的技术优势,而是因为看重 “数字主权”。

州政府总理表示该州成为德国第一个引入数字主权 IT 工作场所的州。数字主权 (Digitally Aovereign) 是指相对于封闭的私有软件,公共管理部门对开源软件构成的 IT 解决方案有更多的控制权。政府部门可以有更多的选择,可以资助当地的程序员改进开源软件,可以根据需要进行修改以部署在自己的基础设施中。

点评

德国石勒苏益格-荷尔斯泰因州的决策体现了对数字自主性的重视,同时也是对全球软件供应链依赖性的一次重要反思。虽然开源软件提供了更大的灵活性和控制权,但历史案例表明,此类迁移并非没有挑战。长远来看,这一举措可能会对开源软件的发展和政府IT策略产生深远影响。

超 4000 应用加入鸿蒙生态

华为官宣目前已有超 4000 个应用加入鸿蒙生态,鸿蒙生态进入第二阶段。值得注意的是,从今年 1 月 18 日华为宣布首批 200 多家应用厂商正在加速开发鸿蒙原生应用,到 3 月底超 4000 个应用,短短两个月时间增长幅度高达 20 倍。

点评

这一成就对于华为来说,不仅显示了其在推动鸿蒙生态系统方面的迅速进展,也反映了鸿蒙在业界的影响力和吸引力。对于华为而言,鸿蒙生态的快速扩张是其技术战略的重要里程碑,有助于提升其在操作系统领域的竞争力。

对于开发者来说,鸿蒙生态的快速增长意味着更多的机会和挑战。开发者可以利用鸿蒙平台开发出更多创新的应用,满足用户需求,同时也要面对更加激烈的竞争。对于整个操作系统市场来说,鸿蒙生态的快速发展可能改变现有的市场格局。


开源之声

媒体观点

中国围棋协会主席:人工智能很强大 但无法取代“手谈”

在常昊看来,人工智能的确给如今的棋手带来了颠覆性的体验:“从AlphaGo击败李世石和柯洁开始,人工智能的围棋就已经进入了大家的视线。尤其是2018年,深度学习的技术开源之后,利用人工智能训练已经是每一个职业棋手必备的。这个过程颠覆了很多大家对围棋的认识。尤其是我,我小的时候学习的下法,很多都已经被人工智能给颠覆了。”

在承认人工智能“威力”的同时,常昊并不认为科技会让围棋失去魅力。“我觉得围棋的本质并没有变化。其实我们人类一直也在探索围棋的奥妙,围棋太难了,可以说,即便我们的高手也只是懂一点点。所以我也很希望人工智能这样一种科技的力量,可以帮助我们进一步探索围棋的奥妙,把围棋更深层的魅力展现出来。”

- 羊城晚报

搞AI的是真没钱了

尽管现在 AI PC、AI 手机是噱头成分居多,真正在 C 端有决定意义的价值点较少。但这趟列车已经绑定了太多的人:高通、英特尔、三星、联想……以及一系列基础模型厂商、模型中间件厂商。某种意义上,这是“元宇宙 Plus”版的概念列车,必须找到终点,也必须驶到终点。与当年元宇宙的情况不同的是,大模型当下的技术发展曲线,仍在陡峭上升中——

至少在 GPT-5 发布前,所有的商业故事,都会如约讲下去。

- 虎嗅APP

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

清华大学、新加坡国立大学和中国科学院大学的发布了一篇题为《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的论文。该工作对当前最强的商业大模型 GPT-4V 和最受欢迎的开源模型 LLaVA-1.5 进行了实验,揭示了目前多模态大模型中的视觉编码漏洞。。

LLaVA-UHD 将图像分辨率限制在最大 672×1008。但是在未来,考虑到其具有潜力的效率和可扩展性,将探索更高分辨率的图像以及更具挑战性的任务,如小目标检测和分割。此外,目前图像片段是独立编码的,只在 LLMs 中进行交互。计划通过改进的视觉编码策略,在图像片段之间建立高效的连接,实现细粒度全局信息交互。

- 机器之心Pro

“弱智贴吧”的数据,居然是最强中文语料库

中国科学院、北大、中国科技大学、滑铁卢大学、01.ai等10家机构联合推出了,专用于中文的高质量指令调优数据集——COIG-CQIA。

COIG-CQIA几乎抓取了中文互联网的论坛、网站、百度贴吧、问答社区等高质量数据集。用COIG-CQIA对Yi-6B、Yi-34B进行指令调优,再用GPT4在BELLE-EVAL上评估在各种数据集上训练的大模型性能。

有趣的一幕出现了,“弱智贴吧”的数据质量,居然大幅度超过知乎、豆瓣、是否等知名知识社区,还真是大智若愚啊~

- AIGC开放社区

用户观点

德国政府“又”从Windows迁移到Linux

  • 观点 1:建议安装双系统
  • 观点 2:建议别建议
  • 观点 3:还要再迁回去
  • 观点 4:Linux为基础的系统和服务必定是未来趋势
  • 观点 5:完全正确的选择。

JetBrains 全家桶 2024 首个大版本更新 (2024.1)

  • 观点 1:Docker插件好像有点问题,Docker部署不能用。提示:Cannot run program "docker.exe"
  • 观点 2:数据库的导出指定了mysqldump的路径,下次导出还得继续指定路径
  • 观点 3:更新了,挺不错,没发现问题

超 4000 应用加入鸿蒙生态

  • 观点 1:我就问一条:这么多app里有微信吗?
  • 观点 2:没有微信天也塌不了,正好不用加入工作群了。

程序员梗图

  • 笔记本散热天才方案

我直接垫四个瓶盖,还有谁!

---END---

原文链接:https://www.oschina.net/news/286542
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章