V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Jackhuang
V2EX  ›  Apple

用 mac 来做个人的 OCR 和翻译服务器可行吗

  •  
  •   Jackhuang · 2022-07-18 00:29:34 +08:00 · 2511 次点击
    这是一个创建于 863 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近想要搞个 Mac Mini M1 来作为自己的个人服务器。 日常有一些 OCR 和文本翻译的需求。本人会一些 Pytorch, 考察了一下大概的可能性

    1. Github 找 OCR 的 torch/tensorflow 的预训练好的模型,然后自己 load 进来,然后起一个 server 。(水平参差不齐,灌水文比较多,而且普遍都是学术数据训练出来的,换场景和数据很难有效)
    2. 调用云服务 (由于涉及收费和数据隐私,否定 X )
    3. 直接用 API 调用实况文本,或者苹果的翻译服务

    由于之前没有开发过 ios 或者 mac 的应用,但是感觉苹果的 OCR 效果很不错,所以想要问问 3 的可行性,麻烦有经验的朋友分享一下。

    9 条回复    2022-08-09 18:31:54 +08:00
    Jackhuang
        2
    Jackhuang  
    OP
       2022-07-18 00:35:43 +08:00
    @ecnelises 感谢你的回复,正如我提到的,没有开发过 ios ,请问这个 swift 的 api(我没理解错的话)可以封装成一个 binary 的可执行文件吗?
    ecnelises
        3
    ecnelises  
       2022-07-18 00:38:41 +08:00
    @Jackhuang
    可以的,在命令行程序里 Import 这个系统框架就可以了。理论上甚至可以封装成 Python/JavaScript 等语言的 API
    Jackhuang
        4
    Jackhuang  
    OP
       2022-07-18 01:05:57 +08:00
    @ecnelises 如果有相关的 github 的链接教程就更好了,感觉似乎可行。
    找到一个类似的 https://gist.github.com/RhetTbull/1c34fc07c95733642cffcd1ac587fc4c
    ericFork
        5
    ericFork  
       2022-07-18 02:31:30 +08:00   ❤️ 1
    @Jackhuang https://github.com/schappim/macOCR 这里有个带选区截图的样例
    justin2018
        6
    justin2018  
       2022-07-18 09:07:39 +08:00
    smartdone
        7
    smartdone  
       2022-07-18 10:49:49 +08:00
    苹果的 ocr 是挺不错的,而且也就几行代码
    LeeeSe
        8
    LeeeSe  
       2022-07-18 12:39:33 +08:00
    文本翻译可以参考软件 Bob 的思路,通过创建“快捷指令”,来实现本地翻译。
    具体实现方法参考 Bob 官网
    rming
        9
    rming  
       2022-08-09 18:31:54 +08:00
    根据你的需求,做了个类似的功能 https://github.com/baimiaoapp/baimiao-desktop
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3109 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 14:33 · PVG 22:33 · LAX 06:33 · JFK 09:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.