数百项 AI 安全测试存在严重缺陷
来自英国政府 AI 安全研究所和多所知名大学的计算机科学家们发现,当前用于评估新一代人工智能(AI)模型安全性和有效性的测试存在广泛的缺陷。这项研究分析了超过440个基准测试,发现几乎所有的测试在某个方面都有弱点,这些弱点可能会影响到最终结论的有效性。
研究的主要作者、牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)表示,这些基准测试是检查新发布 AI 模型安全性和是否符合人类利益的重要工具。然而,由于缺乏统一的标准和可靠的测量方法,很难判断这些模型是否真正取得了进展,或者只是表面上看起来在进步。
在目前英国和美国尚未出台全国性 AI 监管法规的背景下,基准测试成了技术公司推出新 AI 时的安全网。近期,一些公司因其 AI 模型造成的危害而不得不收回或收紧其产品。例如,谷歌最近撤回了一款名为 Gemma 的 AI,因为该模型虚构了关于一位美国参议员的不实指控,这引发了广泛的争议。
谷歌表示,Gemma 模型是为 AI 开发者和研究人员设计的,而不是供普通消费者使用,并在得知非开发者尝试使用后将其撤回。研究还发现,许多基准测试并未使用不确定性估计或统计测试,仅有16% 的测试具备这样的措施。此外,在评估 AI 的 “无害性” 等特征时,相关定义往往存在争议或模糊,进一步降低了基准测试的实用性。
该研究呼吁建立共享标准和最佳实践,以提升 AI 安全性和有效性的评估能力。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Ubuntu 26.04 LTS 发布日程公布,代号“Resolute Raccoon”
Ubuntu 下一代长期支持版本 Ubuntu 26.04 LTS计划于 2026 年 4 月 23 日 正式发布,代号“Resolute Raccoon”,提供长达 5 年标准支持 + 5 年扩展支持(ESM)。 根据公布的路线图,Ubuntu 26.04 LTS版本的关键发布日程如下: 2 月 19 日:功能冻结(Feature Freeze) 3 月 12 日:界面冻结(UI Freeze) 3 月 19 日:内核功能冻结 3 月 26 日:Beta 版本发布 4 月 9 日:内核冻结(Kernel Freeze) 4 月 16 日:发布候选版本(RC) 4 月 23 日:Ubuntu 26.04 LTS 正式发布 8 月 6 日:Ubuntu 26.04.1 发布,开启从 24.04 LTS 的官方升级通道 官方强调该日程可能会随着开发进展做出调整。 在功能方面,Ubuntu 26.04 预计将默认搭载 GNOME 50 桌面环境、更新的 Linux 内核、更强的 TPM 与系统加密支持,以及更多以 Rust 重写的系统组件,提升安全性和可靠性。官方仍将提供传统的 amd64 ...
-
下一篇
苹果正式上线网页版 App Store,但意外泄露了完整前端代码
苹果公司现已正式推出网页版 App Store,为用户提供一个可在各类设备间浏览应用的中心枢纽。 用户无需持有 iPhone 等苹果设备,即可通过浏览器访问 apps.apple.com 体验完整的应用浏览、搜索和分享功能。该网页和苹果用户在 iPhone、iPad 或 Mac 上登陆使用的 App Store 高度相似,网站还包含了标志性的 “Today” 标签页、官方编辑推荐、各类应用排行榜以及 Apple Arcade 游戏专区。 此次网页版还内置了原生的浏览器搜索功能,支持用户直接查找和发现应用。此外,网站还支持无缝跨平台发现,用户通过顶部左边的下拉菜单,可以轻松切换浏览 iPhone、iPad、Mac、Apple Watch、Apple TV 甚至 Vision Pro 的应用。 然而开发者发现苹果忘记对 App Store 网站禁用生产环境下的 sourcemaps,因此只需使用 Chrome 扩展 Save All Resources 即可保存该网站的完整前端代码: 代码已上传至 GitHub:https://github.com/rxliuli/apps.apple.c...
相关文章
文章评论
共有0条评论来说两句吧...

微信收款码
支付宝收款码