首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/396697

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

​初创实验室 Thinking Machines 两位核心创始人重返 OpenAI

据 WIRED 消息,刚刚成立不久的 AI 实验室 Thinking Machines Lab 遭遇重创,其两位核心联合创始人 Barret Zoph 和 Luke Metz 已确认离开公司,并将重新加入他们的“老东家”OpenAI。 OpenAI 应用业务首席执行官 Fidji Simo 在周四下午的一份内部备忘录中向员工宣布了这一消息。Barret Zoph 曾是 OpenAI 后验对齐(Post-training)团队的重要负责人,负责过包括ChatGPT在内的多个核心项目的研发与优化;而 Luke Metz 同样是深度学习领域的顶尖专家。 两人此前离开 OpenAI 并参与创立 Thinking Machines Lab,曾被视为新兴实验室挑战巨头地位的标志性事件。然而,此次“闪电回归”引发了业内对于初创 AI 实验室生存现状的讨论。 目前,关于两人回归的具体原因,外界流传着两种截然不同的说法:一种观点认为初创公司在算力与资源上难以支撑其技术愿景,另一种则指向了 OpenAI 内部重组后对核心人才的强力回流策略。

印度版“DeepSeek”大模型 Alpie:性能超越 GPT-4o、Claude 等

印度 169PI 公司最近发布的 Alpie 大模型被称为印度版的DeepSeek,目前已经开源在多个平台,并开放了API。 这款模型只是一个320亿参数的小模型,主打4bit量化,但AI榜单上表现非常强,GSM8K数学榜单上超过了DeepSeek V3,跟GPT-4o、Qwen 2.5-30B一个档次,略低于Cluade 3.5。 在SWE软件工程榜单上则力压其他大模型,包括Claude 3.5等,表现非常强。BBH榜单上也超过了GPT-4o、Qwen 2.5、Calude 3.5等大模型,略低于DeepSeek V3。 不过 Alpie 的争议也不少,因为它其实不是印度工程师自己训练出来的大模型,而是DeepSeek-R1-Distill-Qwen-32B二次深度开发的,是中国开源大模型基础上蒸馏+量化出来的。 这样做的好处不少,比如大幅降低了成本,只有GPT-4o的1/10,显存占用降低了75%,16-24GB的显卡就能流畅运行。

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

用户登录
用户注册