历史手稿破译,Gemini 3 首次逼近“人类专家”
一位历史学家对 Gemini3Pro 进行了严苛测试:50份约1万词的英文学术手写样本,涵盖多种复杂书写体与成像条件。结果显示,Gemini3在字符错误率(CER)和词错误率 (WER) 上实现惊人突破,CER 仅0.56%、WER1.22%,已接近或达到专业人类转录水平。 Gemini3不仅识别出未经训练的复杂手写字体表格,甚至优于受过专业训练的学生。在严格计分下,前代 Gemini-2.5-Pro 的 CER 为4%、WER11%;若排除标点与大小写,降至2%/4%。而 Gemini3直接将错误率压至原模型的1/7至1/9,提升幅度达50%–70%。 面对一处模糊数字,Gemini3自主补全缺失语境,完成跨越历史货币与重量单位的多步换算,最终得出需对文档世界进行抽象建模的正确结论 —— 这些符号从未在训练中被明确定义。 作者称,Gemini3 似乎跨越了专家长期认为“当前架构无法逾越”的界限。

