破译水平接近专家 Google AI解读古籍核心错误率仅0.56%

Google旗下AI Studio平台正在测试一款未命名的AI模型，在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为0.56%，准确率已接近该领域的专业研究人员水平。

历史学家Mark Humphries利用专门构建的基准数据集对模型进行了系统评估。在测试涵盖的五份18至19世纪高难度手稿中，模型整体字符错误率约为1.7%，其中大部分错误出现在标点符号和大小写规范等非核心问题上，并未影响单词本身的正确识别。

若排除这些非关键性错误，模型的字符错误率可进一步降至0.56%，相当于每转写200个字符仅出现一处实质性错误，其表现已与专注于文献转写的专业工作者相当。

测试手稿涵盖了多样化的书写风格，包括字迹潦草、拼写非标准和语法不一致等复杂情况，充分验证了模型的强适应能力。更值得注意的是，该模型不仅能完成文字转写，还展现出一定的上下文推理能力。

例如，在处理一份18世纪商人日记时，模型遇到一条未标注单位的购糖记录“145”。它通过反向核对账目总额，结合当时英国的货币与重量单位体系，成功推断出该数字代表“14磅5盎司”。

Humphries也指出当前评估仍存在一定局限。由于该模型仅以A/B测试形式零星出现，难以进行大规模系统性验证，目前仅完成基准数据集中约10%样本的评估工作。

最新资讯