V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
HashV2
V2EX  ›  程序员

如何做本地的 latex 公式 ocr 识别?

  •  
  •   HashV2 · 2022-01-10 14:23:29 +08:00 · 2149 次点击
    这是一个创建于 1077 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前看的在线 ocr 识别接口,myscript 和 mathpix 效果都不错

    我们产品一年接口请求量大概 200-400w ,算了一下 myscript 贵的离谱,mathpix 大概一年在 20w-30w 的费用

    使用在线 ocr 还有并发和带宽相关的问题需要测试

    想问有没有本地化按年卖 license 的产品?进行本地化部署

    10 条回复    2022-01-11 08:58:02 +08:00
    heqing
        1
    heqing  
       2022-01-10 15:41:32 +08:00
    现在有不少基于深度学习的 OCR 模型, 你们如果有大量的数据, 可以尝试自己训练一个试试
    HashV2
        2
    HashV2  
    OP
       2022-01-10 16:32:08 +08:00
    @heqing 我们没有大量的数据集,而且我们尝试使用开源的 ocr 识别 latex 模型,找了一些数据集进行训练,识别准确率真的差太多了,基本上就是除非照着数据集的样子写,其它全错 [哭]
    HashV2
        3
    HashV2  
    OP
       2022-01-10 16:35:36 +08:00
    目前就是希望大家可以推荐一款可以本地部署、按年出售 license 或永久 license 的 ocr 数学公式的产品

    实在不行可以有在线按年出售无数量限制的 sdk ,不过在线 api 需要测试一下并发
    HashV2
        4
    HashV2  
    OP
       2022-01-10 17:01:57 +08:00
    https://ai.100tal.com/dataset
    用的是这个里面的手写数据集
    Juszoe
        5
    Juszoe  
       2022-01-10 21:35:54 +08:00
    你们尝试了哪些模型呢?我看数据集有十万张图片,应该不至于一点效果没呀,可能还需要多调调参数。
    我搜了下发现一个 2019 的工作,https://github.com/JianshuZhang/TAP 当时的效果打败了 MyScript 等商业公司。
    团队是中科大的,如果自己搞不来的话,建议你联系他们付费购买一些技术服务。
    Scirocco
        6
    Scirocco  
       2022-01-11 01:51:16 +08:00 via Android
    之前个人用过百度飞桨的开源 ocr ,直接用的现成的没训练,效果还算不错
    dayeye2006199
        7
    dayeye2006199  
       2022-01-11 03:23:33 +08:00
    你们的量这么大,建议联系那些公司的销售单独谈价钱。
    HashV2
        8
    HashV2  
    OP
       2022-01-11 08:55:19 +08:00
    @Juszoe 团队里没人系统学习过机器学习,都是跑起来就算成功 [无奈] ,需要研究一下,成功的话每年倒是能给公司省几十个 w
    HashV2
        9
    HashV2  
    OP
       2022-01-11 08:57:28 +08:00
    @Scirocco 效果不错吗?我这几天先自己跑起来试试,如果有问题的话后面可以联系你做一个资讯和技术支持吗?付费的
    HashV2
        10
    HashV2  
    OP
       2022-01-11 08:58:02 +08:00
    @dayeye2006199 看了上面大家的回复,想自己搞搞试试了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   904 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:14 · PVG 06:14 · LAX 14:14 · JFK 17:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.