V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
shyrock
V2EX  ›  程序员

微信的文字识别

  •  
  •   shyrock · 2023-06-15 16:34:38 +08:00 · 654 次点击
    这是一个创建于 520 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不知道大家有没有感受,微信的文字识别准确率比市面上收费的各种 OCR 软件都高。 比苹果、华为手机自带的识别准确率也高不少。

    这说明腾讯的识别算法独树一帜吗?

    我怀疑是腾讯利用了微信用户上传的原始文本,比如原始文本是微信里的一段对话(这时不是图片,而是文字编码),截图分享后变成图片。但是微信知道这个图片跟文字的对应关系,所以可以非常准确的从图片还原出文字。

    或者,根据分享的热度和用户相关性。找到相关性最高的文字内容作为 OCR 的矫正依据。

    有人知道答案吗?

    AoEiuV020JP
        1
    AoEiuV020JP  
       2023-06-15 16:42:46 +08:00
    有没有对照实验,
    我没用微信的识别但经常用 qq 的,没感觉有比较强,
    shyrock
        2
    shyrock  
    OP
       2023-06-15 16:45:07 +08:00
    @AoEiuV020JP 对照微信跟苹果、华为吗?有啊。几个月前一次群里分享的桃色八卦新闻,是很模糊的截图,苹果华为错误率大概在 20%,而微信感觉只有 3%。具体截图懒得找了。
    shyrock
        3
    shyrock  
    OP
       2023-06-15 16:48:56 +08:00
    找到了,这个图片 https://imgur.com/N7Eu1a5
    wangxiaobo775
        4
    wangxiaobo775  
       2023-06-15 17:12:27 +08:00
    微信 OCR ,我主观感觉识别率确实比其他厂商的高一些。具体技术细节就不是很了解了。
    hatw
        5
    hatw  
       2023-06-15 17:25:06 +08:00
    瞎说:估计微信后台用用户发的文字图片(例如新闻啥的公开页面截图)训练了好久的 AI 了。。。
    shyrock
        6
    shyrock  
    OP
       2023-06-15 17:50:02 +08:00
    @wangxiaobo775 重点是,如果微信是 OCR 算法比其他长都牛逼,完全可以出独立的 OCR 产品大杀四方。

    现实没有这样干,是不是说明微信的 OCR 其实没法脱离微信分享内容这个场景。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2881 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 13:04 · PVG 21:04 · LAX 05:04 · JFK 08:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.