您现在的位置是:首页 > 文章详情

天天 AI-20250219

日期:2025-02-20点击:105

官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI

前OpenAI首席技术官Mira Murati宣布成立新公司——Thinking Machines Lab。该团队由29名成员组成,其中三分之二来自OpenAI,包括前研究副总裁Barret Zoph和联合创始人John Schulman。Mira Murati担任CEO,团队的目标是帮助人们调整AI系统以满足特定需求,开发强大的基础模型,并培养开放的科学文化。Thinking Machines Lab旨在构建一个人人都能获得知识和工具的未来,让AI能够为人类的独特需求服务。该团队强调科学共享的重要性,计划定期发布技术博客和论文,以促进研究文化的改善。
来源 原文

ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~

离开OpenAI的John Schulman和Barret Zoph公开了ChatGPT后训练方法的PPT,分享了他们在斯坦福的演讲内容。后训练阶段是模型开发的最后一步,旨在让模型更像助手,确保其适合实际生产环境。PPT中详细介绍了后训练的三个主要组成部分:监督微调、奖励模型训练和强化学习。两位前高管回顾了ChatGPT的早期发展历程,强调了在功能扩展和公司规模增长背景下,如何通过主线模型设置来整合变化并降低风险。这一分享为AI开发者提供了宝贵的经验和见解。
来源 原文

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

OpenAI推出了新的评估大模型代码能力的基准——SWE-Lancer,包含1488个真实开发任务,价值高达100万美元。SWE-Lancer采用端到端测试方法,模拟真实用户的工作流程,验证应用程序的完整行为。与传统的单元测试不同,SWE-Lancer能够更全面地评估模型的解决方案。测试结果显示,当前主流模型在面对这些复杂任务时表现不佳,尤其是在高价值任务中,模型的通过率普遍低于30%。这一基准测试为AI模型的实际应用提供了重要参考。
来源 原文

清华、中南开源3D交互实体AI Agent LEGENT

清华大学和中南大学的研究团队联合开源了一款可视化3D交互实体AI Agent模型——LEGENT。该模型允许用户在3D虚拟空间中与实体AI代理进行互动,具有高度的交互性和灵活性。LEGENT的场景模块通过实时物理模拟,为智能体的学习和决策提供了逼真的环境。该模型不仅支持用户与AI的直接交互,还允许开发人员导入自定义的3D对象,适用于多种业务场景。LEGENT的推出标志着AI Agent技术向更高层次的进化。
来源 原文

生成式AI营销平台Tofu,获1200万美元A轮融资

生成式AI平台Tofu宣布获得1200万美元的A轮融资,由SignalFire领投,HubSpot Ventures等多家投资机构参与。Tofu致力于为营销团队提供个性化的AI工具,能够根据特定的人物角色或行业定制营销内容。该平台在过去一年实现了爆发式增长,收入增长了12倍,用户涵盖各种规模的营销团队。Tofu的成功反映了生成式AI在营销领域的巨大潜力。
来源 原文

从黑盒到透明:AI Agent 运行监控实战!

为了提高AI Agent的透明度,监控其运行过程变得至关重要。传统的对话系统难以追踪决策过程,而AI Agent则需要实时监控其性能指标、决策链路和输入输出。通过使用OpenTelemetry等工具,可以实现对AI Agent的全面监控,帮助开发者快速定位问题并优化性能。监控的关键在于保持适当的粒度,确保能够及时发现问题,同时不增加系统负担。
来源 原文

雷军:决心把AI用到手机汽车和智能家居上

小米科技董事长雷军表示,小米将致力于将AI技术应用于手机、汽车和智能家居等多个领域,以提升消费者的生活质量。雷军强调,AI技术的落地将为用户带来更好的体验,并提升中国产品在全球市场的影响力。
来源 原文

20万卡吞金兽Grok 3炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源

xAI发布了新一代AI模型Grok 3,声称其性能超过DeepSeek R1。Grok 3的训练依赖于20万张GPU,结合了推理能力,能够在数学、科学和编码任务中表现优异。马斯克表示,Grok 3将用于SpaceX的火星任务计算,并预测其将实现诺贝尔级别的突破。尽管Grok 3在性能上表现出色,但其开源计划尚未确定。
来源 原文

重估中国科技股:“十姐妹”呼之欲出

进入2025年,全球科技公司的境遇发生了显著变化。中国科技股在DeepSeek的推动下表现出色,阿里巴巴、比亚迪、小米、拼多多、网易、京东、腾讯等公司股价大幅上涨。DeepSeek-R1推理模型的发布进一步助推了恒生科技指数的上涨,引发了华尔街投资者对美国科技股的恐慌情绪。美国科技股市值蒸发1万亿美元,而中国科技股则迎来了重估。德意志银行和美国银行的报告指出,DeepSeek的推出是中国经济的“斯普特尼克时刻”,将推动中国科技股的价值重估。
来源 原文

短期高估、长期低估——微信接入DeepSeek的冷思考

微信接入DeepSeek引发了广泛关注,但其产品层面的准备显得仓促。微信搜索接入DeepSeek后,用户体验增量被夸大,许多功能尚未完善,如历史记录、上下文联动、文件上传等。微信团队的初衷可能是低调练兵,快速获得用户反馈。微信选择搜索作为切入点,是因为搜索在心智上属于“短平快”,用户更倾向于搜完即走,从而节省Token成本。
来源 原文

DeepSeek行情,后续怎么看?

DeepSeek宣布推出NSA(Native Sparse Attention)技术,这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。NSA技术显著优化了AI模型的训练和推理过程,提升了长上下文的推理能力,并有效降低了预训练成本。DeepSeek的NSA技术使AI模型训练更加降本增效,推动了AI应用的普及。
来源 原文

🔥 热门文章推荐(2AGI.NET)

扫码加入社群,参与讨论

2AGI 技术社区,欢迎扫码加入

AGI(102)AI Agent(3)AI App(1)AI Celebrity(9)AIGC(127)AI 名人堂(9)AI 搜索(1)AI教程(7)

原文链接:https://www.oschina.net/news/334813
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章