AI 大模型投资赛落幕,Qwen3-Max 以 22.32% 收益率夺冠
11月4日,美国研究机构 Nof1的首届 AI 大模型真实投资比赛 Alpha Arena 正式落下帷幕。这场激烈的竞赛旨在探索六大顶级人工智能大语言模型(LLM)在真实市场中的表现。
结果显示,阿里巴巴的通义千问 Qwen3-Max 以22.32% 的收益率成功夺冠。
此次比赛的独特之处在于,每个参赛模型都被赋予了1万美元的起始资金,允许它们在 Hyperliquid 交易平台上自主交易加密货币的永续合约,如比特币(BTC)、以太坊(ETH)等。所有模型的决策只能基于数值市场数据,例如价格、成交量和技术指标,而无法参考新闻或其他外部信息。目标是最大化盈亏(PnL),并根据夏普比率评估其风险调整后的表现。
尽管所有模型在相同的条件下运作,但它们在交易风格、风险偏好和持仓时间等方面展现出显著差异。有的模型在交易频率上表现活跃,而有些则偏好长线持仓。此外,实验团队还发现,数据格式的敏感性对模型表现有直接影响,简单调整提示的 “数据顺序” 便能修复一些模型的错误解读。
不过,研究人员也指出,此次实验存在一定的局限性,例如样本数量有限和测试时间较短。团队计划在下一季引入更多的控制因素和特征,以增强实验的统计实力。
通过这次实验,Nof1希望能够推动 AI 研究从静态的基准测试转向更真实和动态的决策场景,探讨大型语言模型在无特定微调的情况下能否有效地进行交易。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
字节 AI 编程工具 Trae 下架 Claude 模型
11 月 4 日,字节跳动旗下 AI 编程工具 Trae 发布公告称,平台内置模型已完成更新,但将不再提供 Claude 的访问权限。公告提到: Due to a service interruption, we will no longer offer access to Claude. 由于服务中断,我们将不再提供 Claude 的访问权限。 Trae 表示向 Pro 会员提供补偿:自即日起至 2026 年 1 月 31 日,Pro 会员每月将获得 50% 的额外快速请求——每月300 次。 虽然字节官方没有解释下架 Claude 模型的原因,但相信 Trae 此举应该是 Anthropic 公司在 9 月份对中资公司的限制令所导致,这份限制令明确表示,凡是直接或间接由中国实体控制(占股比例超过 50%)的企业,不再被允许使用 Anthropic 的服务。该政策不仅适用于中国大陆公司,也包括那些在境外设立的子公司、云服务中转实体或具有中国背景投资主体的组织。
-
下一篇
微软 CEO 纳德拉:公司或在一年内重启招聘,前提是现有员工掌握与 AI 协作技能
据媒体报道,近日,美国微软公司首席执行官纳德拉公开表示,公司可能在未来一年内重启招聘,但前提是现有员工必须学会与人工智能协作的新工作模式。 他强调,首先要对现有员工的工作方式进行彻底变革,他对这一过程概括为“忘却”和重新学习。 具体来说,“忘却”是要淘汰低效的旧习惯和思维模式,重复性的任务将交给AI工具来完成;重新学习则是掌握与AI协作的新技能,比如员工需要学会如何向AI下达精准指令,如何审核与优化向AI输出的结果,并将更多精力投入到战略决策、创意构思和解决复杂问题上。 纳德拉强调,微软将确保员工全面考核学习该公司旗下的AI工具,从而完成这一模式的升级,完成升级后,公司将根据现有团队需要完成定向,招聘新员工。 值得一提的是,微软最近一年多来大举押注AI,并进行多轮裁员,最近一次是在今年7月份,裁掉约9000名员工。公司现有员工21.9万人。
相关文章
文章评论
共有0条评论来说两句吧...



微信收款码
支付宝收款码