连续测试了 5 款 OCR 工具后,我发现真正的问题根本不是识别率

发布时间:2026/7/1 14:49:35
连续测试了 5 款 OCR 工具后,我发现真正的问题根本不是识别率 前段时间因为一个教育项目我花了几天时间连续测试了几款 OCR 工具。一开始我的目标其实很简单。找一个识别准确率高一点的方案后面接自动评分就结束了。结果真正测下来我发现自己一开始的思路就是错的。真正的问题根本不是 OCR 的识别率。最开始我也和很多人一样以前看到各种产品介绍都会写OCR 准确率 99%OCR 准确率 99.5%OCR 准确率 99.8%当时我也觉得99% 和 99.8%差距应该挺大的。后来真正拿真实试卷测试之后我发现一个很有意思的现象。很多时候99% 的准确率对真实业务来说可能还是不够。我做了一个很简单的测试为了尽量接近真实场景我没有用公开 Demo。而是直接找了几份高中数学试卷。原因也很简单。数学试卷比普通文档更容易暴露问题。测试内容包括普通文字数学公式分数结构根号积分符号上下标第一轮测试下来普通文字几乎都没有问题。真正开始翻车的是公式。一个字符错了后面全错举个例子。下面这个表达式x² 2x 1有的工具识别成x2 2x 1如果只是阅读其实大家都知道什么意思。但如果后面要接自动评分。系统已经认为这是两个完全不同的表达式。还有一次更离谱。一条分数公式直接被拆成了上下两行。OCR本身没有报错。但是后面的评分逻辑完全失效。这时候我突然意识到很多时候不是 AI 不会判断。而是它收到的数据已经错了。我后来开始换一个角度看 OCR以前我总喜欢问识别率是多少后来我开始问另外几个问题。第一复杂公式还能不能识别第二识别之后能不能直接用于业务第三是不是还需要人工重新检查如果第三个问题的答案还是需要。那其实识别率再高意义也没有想象中那么大。教育场景可能是 OCR 最难落地的行业之一后来查了一些资料也和做教育产品的朋友聊了聊。大家几乎都提到同一个问题教育不是普通文档。普通 OCR 更关注合同发票表格PDF但教育场景完全不同。特别是数学、物理、化学。里面有大量上下标根号分数矩阵特殊符号这些内容真正难的不是识别字符而是理解字符之间的位置关系。所以很多产品在办公场景表现不错一进入教育场景就开始掉准确率。后来我开始关注教育场景专门优化的产品也是在继续调研的时候我接触到了一个叫闪阅的产品。官网https://shanyue.jotoai.com/最开始吸引我的并不是AI阅卷几个字。而是它一直强调公式识别。因为我前面踩的坑几乎都发生在公式上。后来又看了一些公开介绍发现它关注的重点不是单纯提高 OCR 数字而是希望让识别结果能够直接进入后面的评分流程。这一点其实挺符合我这几天测试下来的感受。真正决定体验的不只是 OCR而是整个流程是否跑得通。顺便聊聊它背后的团队继续查资料的时候我发现闪阅背后的研发团队是聚托科技JOTO。如果平时关注 AI Agent 或 Dify 的朋友应该对这个名字不陌生。聚托科技本身长期做企业级 AI 应用也是Dify 企业版服务商和Dify 钻石合作伙伴。官网www.jotoai.com从这个角度来看他们把 OCR、公式识别、自动评分放到同一个工作流里其实和现在很多 AI Agent 产品的发展方向比较一致。我后来重新理解了识别率做完这几天测试之后我最大的变化就是以后看到99% OCR 准确率这种宣传我不会第一时间相信也不会第一时间怀疑。我更想知道的是用什么数据测出来的有没有数学公式有没有真实试卷后面的自动评分还能不能正常工作因为真正影响体验的往往不是那几个小数点。而是整个业务流程是否能够顺利跑通。对于教育行业来说这一点尤其明显。写在最后以前我一直觉得OCR 已经是一个非常成熟的技术。真正开始做教育场景之后才发现成熟的是通用 OCR而不是所有 OCR。特别是在涉及公式识别、自动评分和 AI 工作流时真正的挑战才刚刚开始。如果你最近也在做教育 AI、智能阅卷或者 OCR 相关项目我建议不要只看官方给出的准确率数字。找几份真实的数学试卷亲自跑一遍。很多问题跑完第一轮测试就会有答案。至少对我来说这几天最大的收获不是找到了某一个工具而是终于知道了真正需要优化的从来都不是那一个99%。