rerender's recent timeline updates
rerender

rerender

V2EX member #576116, joined on 2022-03-20 11:29:07 +08:00
rerender's recent replies
@hanguofu whisper 官方有给一个表,中文是 14.7 ,英文是 4.2 。链接: https://github.com/openai/whisper
@iX8NEGGn whisper 那个是语音翻译,这里是指使用 whisper 生成字幕后,对字幕翻译,是另一个工具了,将英文文本的 srt 文件,翻译为中文文本的 srt 文件
@hanguofu 它介绍可以识别中文来着,不过我没试过;但是我试过 paddle speech ,百度的,感觉还可以
@guaike 是的,语音识别也是离线的,用的 vosk: https://alphacephei.com/vosk/
@fkthiswordw 只会 windows 。。
@lander 我试过看用这个看英文视频了。。不过还没试过游戏,应该也可以: https://www.v2ex.com/t/917231
Feb 12, 2023
Replied to a topic by rerender 分享创造 一个简单的 windows 桌面 ocr 应用前端
Feb 12, 2023
Replied to a topic by rerender 分享创造 一个简单的 windows 桌面 ocr 应用前端
@ila 找到简单的方式了,windows 上可以直接一个 exe 启动 ocr 的服务器: https://github.com/YongJie-Xie/PaddleocrAPI
Feb 8, 2023
Replied to a topic by rerender 分享创造 一个简单的 windows 桌面 ocr 应用前端
@s127 😀手机还可以这样用,开眼界了。。
Feb 8, 2023
Replied to a topic by rerender 分享创造 一个简单的 windows 桌面 ocr 应用前端
@Ocean810975 我好像用错语言模型了。。我换了个就能准确识别了: https://user-images.githubusercontent.com/87927336/217553905-2f04c79d-8fde-4b73-8c10-920a65791947.png

然而正当我高兴,发现换的那个模型,这个复杂的可以识别,但更简单的 demo 图片反而不能了。。

https://github.com/rerender2021/ocr/issues/1
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2910 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 12:46 · PVG 20:46 · LAX 05:46 · JFK 08:46
♥ Do have faith in what you're doing.