破译水平接近专家 Google AI解读古籍核心错误率仅0.56%

2025年11月16日 16:17 次阅读 稿源:快科技 条评论

Google旗下AI Studio平台正在测试一款未命名的AI模型,在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为0.56%,准确率已接近该领域的专业研究人员水平。

历史学家Mark Humphries利用专门构建的基准数据集对模型进行了系统评估。在测试涵盖的五份18至19世纪高难度手稿中,模型整体字符错误率约为1.7%,其中大部分错误出现在标点符号和大小写规范等非核心问题上,并未影响单词本身的正确识别。

若排除这些非关键性错误,模型的字符错误率可进一步降至0.56%,相当于每转写200个字符仅出现一处实质性错误,其表现已与专注于文献转写的专业工作者相当。

测试手稿涵盖了多样化的书写风格,包括字迹潦草、拼写非标准和语法不一致等复杂情况,充分验证了模型的强适应能力。更值得注意的是,该模型不仅能完成文字转写,还展现出一定的上下文推理能力。

例如,在处理一份18世纪商人日记时,模型遇到一条未标注单位的购糖记录“145”。它通过反向核对账目总额,结合当时英国的货币与重量单位体系,成功推断出该数字代表“14磅5盎司”。

Humphries也指出当前评估仍存在一定局限。由于该模型仅以A/B测试形式零星出现,难以进行大规模系统性验证,目前仅完成基准数据集中约10%样本的评估工作。


对文章打分

破译水平接近专家 Google AI解读古籍核心错误率仅0.56%

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘

      created by ceallan