最新研究:AI 已经能在几分钟内通过 CFA 最难级别考试
纽约大学斯特恩商学院与金融科技公司GoodFin最新发布的研究成果显示,包括Gemini 2.5 Pro、Claude Opus 4等尖端推理模型,都能在原生状态下仅用数分钟就轻松通过CFA三级考试。部分顶尖模型的准确率已经远远超过通过这项考试的要求。
而人类考生要通过这个级别的金融行业考试,通常需要数百至一千个小时的学习。
作为对比,摩根大通和加拿大女王大学在去年的一项研究中发现,当时领先的AI大模型已经能够通过CFA一级和二级考试,但无法通过三级考试——特别是在三级考试的论述题中表现不佳。
最新的研究也发现,**大多数一线模型都能在选择题上表现良好,所以需要综合逻辑推理的论述题成为拉开区分度的分水岭。**研究人员也发现,使用链式思维提示(CoT prompting)——即要求模型推理并给出思路,能够将论述题的准确率提高15个百分点。
对于这项研究的成果,各方也一致认为,AI的确展现出“答对考试题”的能力,但未必就能完全取代专业金融工作者。
CFA协会教育常务董事Chris Wiese回应称:“在不了解该研究具体如何进行的情况下,我们只能指出,CFA 协会仍然认为,在金融市场中,信任、人际关系、健全的道德判断和专业精神依然至关重要。”
特恩商学院教授Srikanth Jagabathula也指出,现在很难预测这些AI模型会发展出哪些能力。但他提及另一项正在进行的研究,要求用户分别与AI模型和一名人类就理财建议进行互动。
Jagabathula表示:“我们的发现是,AI模型对那些有明确答案的具体问题通常能给出非常精准的回答。但它们在捕捉用户没有明确表述的上下文时往往会困难,有些情况下甚至都做不到。因此,终端用户有点难以信任这些系统。”(财联社)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
谷歌高管暗示正在开发 Android 系统个人电脑;高通CEO称“见过实物,效果惊人”
9 月 24 日,谷歌设备与服务高级副总裁里克・奥斯特罗出席高通骁龙 2025 峰会,与高通 CEO 克里斯蒂亚诺・安蒙对谈公司未来方向、布局。其中奥斯特罗表示,双方正在合作开发一款神秘产品,它结合了 PC 和智能手机的优点,可能具备新形态。 奥斯特罗表示,该产品结合了两类设备的优点,并可能呈现全新形态。安蒙称,该项目旨在为电脑和桌面级计算系统建立统一的技术基础,实现手机与 PC 的深度融合。 安蒙透露已见过设备原型,形容其 “令人难以置信”,并表达了强烈的购买意愿。不过两人关于这款神秘设备的讨论止步于此,峰会现场也没有展示这款设备的外观。 科技媒体 Wccftech 分析认为,此次对话暗示谷歌与高通正在联合打造一款整合 ChromeOS 与 Android 系统的 “安卓电脑”。 Android 系统此前已长期应用于平板电脑,向更多计算平台扩展被视为必然趋势。目前尚无关于该设备发布时间、功能细节或操作系统架构的进一步信息。 ChromeOS 是谷歌基于 ChromiumOS 开发的操作系统,以 Chrome 浏览器为核心界面,强调云端应用,自 2016 年起逐步支持安卓 App 与 ...
-
下一篇
上下文工程实施过程中会遇到什么挑战?有哪些优化策略?
编者按: 您是否曾感觉到,尽管精心设计了提示词,AI 的表现却依然不尽如人意?甚至随着上下文越来越长,模型反而更容易"胡言乱语"? 我们今天为大家带来的这篇文章,作者的核心观点是:"提示词工程"已经不够用了,下一代 AI 应用的核心竞争力在于"上下文工程"(Context Engineering)。 文章系统地阐述了为何在智能体(Agent)时代,单纯堆砌信息的"提示词工程"思维会导致性能下降、成本飙升。作者提出,上下文工程是一套系统级的架构方法,它强调动态地、有策略地为模型组合信息,包括系统指令、对话历史、用户记忆、检索结果和工具定义等,从而在有限的上下文窗口中实现最优性能。文章还深入分析了生产环境中实施上下文工程面临的四大挑战,并提供了五项关键优化策略,最后通过一个医疗健康领域的实例展示了如何构建一个真正的上下文驱动型 AI 系统。 作者 | Paul Iusztin 编译 | 岳扬 开门见山地说:如果你现在还在只谈论"提示词工程",那你就已经落后了。 在大语言模型(LLM)的发展初期,精心设计提示词确实是核心任务。 对于 2022 年的简单聊天机器人(chatbots)来说,这已...
相关文章
文章评论
共有0条评论来说两句吧...