西湖大学教授：AI 是可控的，鼓励使用 AI 探索人机协同合作-低调大师

西湖大学教授：AI 是可控的，鼓励使用 AI 探索人机协同合作

2025-10-27 90

近日，西湖大学张岳教授团队研发了一款AI科学家系统——DeepScientist，引起不少网友关注。

据介绍，DeepScientist是首个具有完整科研能力，且在无人工干预下，展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。

https://arxiv.org/abs/2509.26603

不过，也有许多网友担心，一个无需人类干预的AI系统，是否存在研究方向失控或被误导的风险呢？

对此，张岳表示：“AI安全问题一直是我们重视的问题，所以DeepScientist公之于众，我们也采取了审慎的策略。”在他看来，AI本身的研究和AI安全研究一定是齐头并进的，并且张岳深信AI是可控的。

他还表示：“作为一位AI语言模型学者，我们对语言模型的工作机理相对比较了解，所以对于AI的可控程度我是持比较积极的态度，我也十分鼓励学生们尽早、更多地使用AI工具，毕竟未来人一定要和AI协同工作。”

微信关注我们

原文链接：https://www.oschina.net/news/379756

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

大量 “垃圾” 数据影响大语言模型推理能力

一项新研究表明，大语言模型（LLM）在持续接触无意义的在线内容后，可能会出现显著的性能下降。这项研究表明，这些模型的推理能力和自信心都受到影响，引发了对它们长期健康的担忧。研究团队来自多个美国大学，提出了 “LLM 脑衰退假说”，借鉴了人类在过度接触无脑在线内容时可能造成的认知损害。为验证这一理论，研究人员进行了控制实验，使用2010年的 Twitter 数据。他们训练了四个较小的模型，包括 Llama3-8B-Instruct 和 Qwen 系列模型，采用不同比例的 “垃圾” 数据与高质量的控制数据进行对比。研究者们以两种方式定义 “垃圾” 数据。第一种方法（M1）通过互动量来筛选，认为短于30个字且高互动(超过500个赞、转发或评论)的帖子为垃圾内容，而长于100个字但互动少的帖子则作为控制内容。第二种方法(M2)则使用 GPT-4o-mini 根据内容质量进行排序，标记阴谋论、夸大说法和吸引眼球的标题为垃圾内容，更深思熟虑的材料则被视为高质量内容。研究发现，随着垃圾数据比例的增加，模型在推理准确性上的表现急剧下降。例如，在 ARC 挑战基准测试中，推理准确率从74.9% 降...

2025-10-27

127

MiniMax M2 正式开源上线，宣称专为 Agent 和代码而生，以仅 Claude Sonnet 8% 的价格实现了 2 倍速度，并限时免费。“我们目前在免费提供 MiniMax Agent，直到我们的服务器撑不住为止。” 顶级代码能力：专为端到端开发工作流打造，在Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越强大Agentic表现：出色规划并稳定执行复杂长链条工具调用任务，协同调用Shell、Browser、Python代码执行器和各种MCP工具极致性价比&速度：通过高效的激活参数设计，实现智能、速度与成本的最佳平衡 MiniMax M2 与市场上的一些其他Agent 的能力对比结果如下：官方将模型 API 价格定在每百万Token输入0.3美金/2.1元人民币，以及输出1.2美金/8.4元，同时在线上提供TPS（每秒输出Token数）在100左右的推理服务（还在快速提升）。“这个价格是Claude Sonnet 4.5 的8%，而推理速度快了接近一倍。” 价格 VS 效果：价格VS 推理速度：除了这些标...

2025-10-27

97

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。