这种类型的,有高人指点下思路没?
1
allenx 2016-12-22 09:53:56 +08:00
大量样本+神经网络 , 切分加识别或者 end2end 解决
|
2
yanzixuan 2016-12-22 09:54:18 +08:00
打码平台。。。
|
5
harry890829 2016-12-22 09:58:09 +08:00
一般就是 opencv 来个二值化,然后再去噪点,然后再来大量样本
|
6
jpyl0423 2016-12-22 11:10:49 +08:00
https://www.showapi.com/api/lookPoint/184
刚才试了一下, 大概 1.2s 能识别完成. |
7
imcocc 2016-12-22 11:11:38 +08:00 via iPhone
|
8
enenaaa 2016-12-22 11:19:19 +08:00
楼主想问的是切割粘连字符的思路吧。 看这图等比例切也行啊
|
9
fffflyfish 2016-12-22 11:21:14 +08:00
|
10
Tyanboot 2016-12-22 11:22:16 +08:00 via Android
tesseract 训练一下?对应 pytesseract
|
11
harry890829 2016-12-22 11:24:42 +08:00
@enenaaa 其实不需要等比例切啊,二值化之后,去掉部分噪点,然后通过一个算法,名字我忘记了,大致意思就是,一个黑像素点附近如果再没有别的像素点的话,可以判定这个是无效点,于是就将他置白。
省下的就是一个相对好的图片了,再进行有效字符的截取,就是单个字符了,再去识别 |
12
enenaaa 2016-12-22 11:29:58 +08:00
@harry890829 如果字符不粘连,那投影后在空白处直接切割就可以。
但楼主这图片里面, m 和 z , h 和 n 两两粘连, 就不能直接切割了。 |
13
harry890829 2016-12-22 11:44:57 +08:00
@enenaaa 这倒是,对于验证码这样多字体的匹配,我也和楼上一样推荐 tesseract
|
14
annian 2016-12-22 14:33:35 +08:00
提供 90%以上识别率,速度 1s 内的服务,需要可以联系
|
15
TaMud 2016-12-22 17:16:29 +08:00
opencv find obj
可以满足你的,准确率非常高 只是对 cpu 要求也高 返回对像含坐,按 x 坐标排一下就是结果 |
16
mingyun 2016-12-25 14:13:20 +08:00
PIL pytesseract
|