V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
mydingyan
V2EX  ›  问与答

orc 图片识别文字自动记录的构想

  •  
  •   mydingyan · 2022-02-25 10:18:57 +08:00 · 1572 次点击
    这是一个创建于 763 天前的主题,其中的信息可能已经有所发展或是发生改变。
    需求描述:通过手机截图自动上传服务器,根据图片相似度进行比对,(例如京东、淘宝订单页面截图比对,服务器可提前预设对比样式),自动 ORC 识别图片所需要的文字字段填写至对应表格字段。
    或者有没有类似已经实现的工具。

    难点:
    1.手机截图自动上传至服务器,目前 WIFI 自动同步工具有,流量同步工具暂时没发现
    2.根据图片相似度识别比对原预设图片,不知是否可以实现
    3.识别图片文字,并根据文字内容自动填写至预设字段,图片
    4.非预设图片(或者没有识别到对应关键字),不填写至数据库
    5.文字识别成功后,部分内容根据识别成功的文字,自动发送邮件

    实现功能:
    1.经常不同平台购物,通过截图记录不同平台订单,随手截图后自动记录
    2.公司打卡等,完成某件常规任务后,随手截图后自动记录并邮件提醒已完成。(如规定时间未完成也自动邮件提醒)
    10 条回复    2022-02-25 17:14:57 +08:00
    mydingyan
        1
    mydingyan  
    OP
       2022-02-25 10:23:35 +08:00
    每件小事记录做起来很难,但是截图是很随手的操作,突然想着能不能把截图的图片用起来,实现常规化、日常化
    princelai
        2
    princelai  
       2022-02-25 10:32:26 +08:00
    没有,但一木记账支持手动上传支付宝和微信支付截图,然后自动识别金额,具体类别还是要自己选择的。
    nalr
        3
    nalr  
       2022-02-25 12:14:34 +08:00 via Android
    安卓的话装个 termux 然后用脚本同步到对象存储? orc 后再按关键字识别截取应该不难吧
    nalr
        4
    nalr  
       2022-02-25 12:16:30 +08:00 via Android
    OCR
    Juszoe
        5
    Juszoe  
       2022-02-25 12:26:15 +08:00
    1. 不了解,但我觉得这种涉及隐私的在本地识别比较好
    234 其实是一个需求,用模板 OCR 即可,有很多现成的服务,https://cloud.tencent.com/product/custom-ocr
    5. 发个邮件不难
    crokily
        6
    crokily  
       2022-02-25 13:14:55 +08:00
    最近刚为朋友的小工厂做了一个类似的 Ocr 系统,订单上传,Ocr 提取订单信息需求信息填入数据库,并进行后续的运算与生成相应送货单月结单等物料。
    大致上需求跟 OP 的其实很像。主要烦点在于多家客户的订单样式不同,数据格式不同(类比 OP 的多个平台截图样式不同、数据格式不同),于是没法通用一套代码提取出关键信息,要针对不同的订单样式与数据格式各写一套适用的提取代码(或许会有更好的方法但我没有想到)。难倒是不难,但工作量变得很大,而且系统的通用性适用性很低,得作者对不同的图片一套套去写。
    mydingyan
        7
    mydingyan  
    OP
       2022-02-25 14:01:42 +08:00
    @nalr 找到了 ,腾讯云 COS 客户端可以直接自动上传备份。
    mydingyan
        8
    mydingyan  
    OP
       2022-02-25 14:04:18 +08:00
    @Juszoe 腾讯云的这个还没有公测,百度 OCR 有相关的识别。但是图片样式类似 @crokily 描述, 不能用通用代码匹配模板, 截图在于随意性,如果每一张截图都需要单独匹配就非常复杂了。
    简易版本应该可以实现
    jifengg
        9
    jifengg  
       2022-02-25 16:35:15 +08:00
    百度的 ocr 有自定义模型的,之前看过但是没有具体研究过,楼主可以看看。
    fanyingmao
        10
    fanyingmao  
       2022-02-25 17:14:57 +08:00
    之前给老爸开发了基于 ocr 填表的工具你看下,后端用的百度的 ocr 接口,不过好像没人用,没维护优化了。
    https://github.com/fanyingmao/ocr-electron
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5525 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 06:38 · PVG 14:38 · LAX 23:38 · JFK 02:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.