V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
gamecreating
V2EX  ›  程序员

现在有什么开源项目 能识别图片中的文字的么?

  •  
  •   gamecreating · 2016-10-09 14:12:00 +08:00 · 5031 次点击
    这是一个创建于 2958 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如截图后 能识别图片中的所有文字 (当然文字都是规范的) 能识别到文字所在图片相对位置.

    有什么开源的代码么? C/C++/python 都可

    8 条回复    2016-10-11 09:54:02 +08:00
    kenshinji
        1
    kenshinji  
       2016-10-09 18:11:14 +08:00 via iPhone
    Pyteract?
    slysly759
        2
    slysly759  
       2016-10-09 19:00:44 +08:00 via Android
    @kenshinji 好像拼错了吧⊙▽⊙
    @题主 以前用汉皇还是一些 OCR 工具感觉除了拍照中书的字可以识别,其他手写啊倒着啊都不行
    你这个需求有点小困难啊,先不说草书 行书 单是什么瘦金体 旋转 你就需要训练模型| ू•ૅω•́)ᵎᵎᵎ
    现在流行的也不过识别验证码 或者图片归类什么的
    你看百度这么大公司那个图片搜索做的啥德行你就明白了(⁄ ⁄•⁄ω⁄•⁄ ⁄)
    reus
        3
    reus  
       2016-10-09 19:26:46 +08:00
    百度的 ocr 还可以,就是贵。这个东西如果做得好,赚钱很容易,不会轻易开源的
    rogerchen
        4
    rogerchen  
       2016-10-09 22:49:54 +08:00
    深度学习 again
    sutra
        5
    sutra  
       2016-10-09 23:39:18 +08:00
    tesseract
    sigroma
        6
    sigroma  
       2016-10-10 00:08:47 +08:00
    你说的截图是指随便拍照,还是电脑上的截图

    如果是第一种,这在 CV 上叫自然场景文字检测与识别( scene text localization and recognition ),是个挺难的问题,有个国际比赛 ICDAR 专注这方面问题,你可以看看这个比赛的历史论文,找作者要要源码
    google 翻译里就有这个功能

    如果是电脑截图,也可以利用这个方面的一些成果
    文字定位可以使用 SWT 算法,这个算法实现简单,效果还不错, github 上能找到很多源代码
    我比较推荐 ccv 这个库带的
    http://libccv.org/doc/doc-swt/
    文字的识别目前基本上就楼上提到的 tesseract 是能用的,如果你只限英文的话倒是还有些开源项目可选
    likuku
        7
    likuku  
       2016-10-10 11:21:04 +08:00
    隔壁也有个类似话题:
    https://www.v2ex.com/t/311454
    gamecreating
        8
    gamecreating  
    OP
       2016-10-11 09:54:02 +08:00
    @sutra 现在用的这个 识别速度很慢.. 而且需要训练后 才识别率高..
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1897 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:29 · PVG 00:29 · LAX 08:29 · JFK 11:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.