OCR 怎么提高准确率？

This topic created in 720 days ago, the information mentioned may be changed or developed.

最近有一大批图片需要识别，都是一个样式的，算是很标准的图片。
上面 16 个字符（数字大写字母）
下面 6 个数字
暂时就是用 umi-ocr 工具
发现默认的英文中文，识别出来都有些问题。1000 多张会有 10 个左右有问题。
识别出来上面不是 16 个字符。
求解怎么弄好点。

OCR

准确率

识别

15 replies • 2024-08-05 09:57:54 +08:00

busier

Aug 4, 2024 via iPhone

你都确定是一个样式了先将图片除了那 16 个字符外面，多余的部分裁剪掉啊

Daybyedream

Aug 4, 2024

@busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ，有些 YL 之类的识别错。

trungdieu031

Aug 4, 2024

标注或合成一部分数据，自己训练/微调一个模型

akira

Aug 4, 2024

试试传统 ocr + 大语言模型的方案，例如 llama index 这些

tool2dx

Aug 4, 2024

提不了，类似 GPT 回答 100%正确率一样，不太可能。

可以多个模型交叉验证，或者做一次识别后文字的 rasterization ，对比图片前后相似度。

miaomiao888

Aug 4, 2024

想要高精度就别用离线了，试试合合 OCR ，业界精度最高。

weiwoxinyou

Aug 4, 2024

如果是标准的数字和字母，不需要什么高级算法，纯按传统的图片识别方式就行，python 直接调 opencv 的 api 就行

uTOmOuk3L6sb4MSI

Aug 4, 2024 via iPhone

@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api

paopjian

Aug 4, 2024

固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?

Les1ie

Aug 4, 2024

paddleocr 效果很棒，资源占用少，离线部署简单

Daybyedream

Aug 4, 2024

@weiwoxinyou 大概懂了，直接一个个字符截出来然后识别？这样？反正就那么几个

Daybyedream

Aug 4, 2024

@trungdieu031 我去研究下

seeu2ex

Aug 4, 2024 via iPhone

如果是线条加数字英文的话可以试试调对比度等，直接给去除无用线条，在加深可用部分的颜色深度

SWALLOWW

Aug 5, 2024

微信有没有接口

yaleyu

Aug 5, 2024

图片剪裁一下，然后二值化一下，paddleocr, easyocr, rapidocr 都识别一次，再对比一下识别结果，应该不会出错。