AI 开发了个《武林外传》全台词检索对应截图网站

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

https://wulinwaizhuan.hugo2233.dpdns.org/ 文本提取：PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。数据归档：构建台词-时间戳-图片路径的索引。抽帧处理：FFmpeg 获取关键帧。图像预处理：OpenCV + NumPy 提高识别率。

难题攻克：针对 TV 录制版没有软字幕的问题，OCR 是唯一解。通过批量推理，将 80 集海量素材转化为可检索的 JSON 文件

一开始 win 直接运行代码好慢 80min 一集现在在 wsl 上运行 5-8min 一集舒服了

参考项目 github 的 Cicada000/VV 感谢指导

OCR

检索

字幕

7 条回复 • 2026-02-10 17:29:11 +08:00