天天 AI-20250219
官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
前OpenAI首席技术官Mira Murati宣布成立新公司——Thinking Machines Lab。该团队由29名成员组成,其中三分之二来自OpenAI,包括前研究副总裁Barret Zoph和联合创始人John Schulman。Mira Murati担任CEO,团队的目标是帮助人们调整AI系统以满足特定需求,开发强大的基础模型,并培养开放的科学文化。Thinking Machines Lab旨在构建一个人人都能获得知识和工具的未来,让AI能够为人类的独特需求服务。该团队强调科学共享的重要性,计划定期发布技术博客和论文,以促进研究文化的改善。
来源 原文
ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
离开OpenAI的John Schulman和Barret Zoph公开了ChatGPT后训练方法的PPT,分享了他们在斯坦福的演讲内容。后训练阶段是模型开发的最后一步,旨在让模型更像助手,确保其适合实际生产环境。PPT中详细介绍了后训练的三个主要组成部分:监督微调、奖励模型训练和强化学习。两位前高管回顾了ChatGPT的早期发展历程,强调了在功能扩展和公司规模增长背景下,如何通过主线模型设置来整合变化并降低风险。这一分享为AI开发者提供了宝贵的经验和见解。
来源 原文
全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
OpenAI推出了新的评估大模型代码能力的基准——SWE-Lancer,包含1488个真实开发任务,价值高达100万美元。SWE-Lancer采用端到端测试方法,模拟真实用户的工作流程,验证应用程序的完整行为。与传统的单元测试不同,SWE-Lancer能够更全面地评估模型的解决方案。测试结果显示,当前主流模型在面对这些复杂任务时表现不佳,尤其是在高价值任务中,模型的通过率普遍低于30%。这一基准测试为AI模型的实际应用提供了重要参考。
来源 原文
清华、中南开源3D交互实体AI Agent LEGENT
清华大学和中南大学的研究团队联合开源了一款可视化3D交互实体AI Agent模型——LEGENT。该模型允许用户在3D虚拟空间中与实体AI代理进行互动,具有高度的交互性和灵活性。LEGENT的场景模块通过实时物理模拟,为智能体的学习和决策提供了逼真的环境。该模型不仅支持用户与AI的直接交互,还允许开发人员导入自定义的3D对象,适用于多种业务场景。LEGENT的推出标志着AI Agent技术向更高层次的进化。
来源 原文
生成式AI营销平台Tofu,获1200万美元A轮融资
生成式AI平台Tofu宣布获得1200万美元的A轮融资,由SignalFire领投,HubSpot Ventures等多家投资机构参与。Tofu致力于为营销团队提供个性化的AI工具,能够根据特定的人物角色或行业定制营销内容。该平台在过去一年实现了爆发式增长,收入增长了12倍,用户涵盖各种规模的营销团队。Tofu的成功反映了生成式AI在营销领域的巨大潜力。
来源 原文
从黑盒到透明:AI Agent 运行监控实战!
为了提高AI Agent的透明度,监控其运行过程变得至关重要。传统的对话系统难以追踪决策过程,而AI Agent则需要实时监控其性能指标、决策链路和输入输出。通过使用OpenTelemetry等工具,可以实现对AI Agent的全面监控,帮助开发者快速定位问题并优化性能。监控的关键在于保持适当的粒度,确保能够及时发现问题,同时不增加系统负担。
来源 原文
雷军:决心把AI用到手机汽车和智能家居上
小米科技董事长雷军表示,小米将致力于将AI技术应用于手机、汽车和智能家居等多个领域,以提升消费者的生活质量。雷军强调,AI技术的落地将为用户带来更好的体验,并提升中国产品在全球市场的影响力。
来源 原文
20万卡吞金兽Grok 3炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
xAI发布了新一代AI模型Grok 3,声称其性能超过DeepSeek R1。Grok 3的训练依赖于20万张GPU,结合了推理能力,能够在数学、科学和编码任务中表现优异。马斯克表示,Grok 3将用于SpaceX的火星任务计算,并预测其将实现诺贝尔级别的突破。尽管Grok 3在性能上表现出色,但其开源计划尚未确定。
来源 原文
重估中国科技股:“十姐妹”呼之欲出
进入2025年,全球科技公司的境遇发生了显著变化。中国科技股在DeepSeek的推动下表现出色,阿里巴巴、比亚迪、小米、拼多多、网易、京东、腾讯等公司股价大幅上涨。DeepSeek-R1推理模型的发布进一步助推了恒生科技指数的上涨,引发了华尔街投资者对美国科技股的恐慌情绪。美国科技股市值蒸发1万亿美元,而中国科技股则迎来了重估。德意志银行和美国银行的报告指出,DeepSeek的推出是中国经济的“斯普特尼克时刻”,将推动中国科技股的价值重估。
来源 原文
短期高估、长期低估——微信接入DeepSeek的冷思考
微信接入DeepSeek引发了广泛关注,但其产品层面的准备显得仓促。微信搜索接入DeepSeek后,用户体验增量被夸大,许多功能尚未完善,如历史记录、上下文联动、文件上传等。微信团队的初衷可能是低调练兵,快速获得用户反馈。微信选择搜索作为切入点,是因为搜索在心智上属于“短平快”,用户更倾向于搜完即走,从而节省Token成本。
来源 原文
DeepSeek行情,后续怎么看?
DeepSeek宣布推出NSA(Native Sparse Attention)技术,这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。NSA技术显著优化了AI模型的训练和推理过程,提升了长上下文的推理能力,并有效降低了预训练成本。DeepSeek的NSA技术使AI模型训练更加降本增效,推动了AI应用的普及。
来源 原文
🔥 热门文章推荐(2AGI.NET)
- 天天AI-20250219
作者:2AGI
2025年2月19日 - 天天AI-20250218
作者:2AGI
2025年2月18日 - 天天AI-20250217
作者:2AGI
2025年2月17日 - 10W+爆款 AI 流水线:Coze深度写作×DeepSeek算法洞察×HTML极速排版
作者:2AGI
2025年2月16日 - 探索世界模型奥秘
作者:2AGI
2025年2月16日 - 如何理解智能涌现(emergence)
作者:2AGI
2025年2月15日 - 天天AI-20250214
作者:2AGI
2025年2月14日 - 天天AI-20250213
作者:2AGI
2025年2月13日 - 天天AI-20250212
作者:2AGI
2025年2月12日
扫码加入社群,参与讨论
AGI(102)AI Agent(3)AI App(1)AI Celebrity(9)AIGC(127)AI 名人堂(9)AI 搜索(1)AI教程(7)
