国庆长假写了一个免费服务。Slide.ftqq.com 。
它是专门为不喜欢或者没时间说话 /演讲,但又有视频制作需求的同学们准备的。
具体的说就是,上传一份 PPT,它会自动分析里边的演讲者注释,用人工智能生成语音,然后再合成视频。非常适合用来做产品介绍、流程介绍、以及技术课程。
欢迎大家试用。https://slide.ftqq.com/
- 用到的 ffmpeg 命令: https://weibo.com/1088413295/HjEVbpVmV
- 接口是讯飞的,一峰那个发音人本来是收费的,后来赞助了一年。
- 合成效果预览: https://weibo.com/tv/v/IaGN6d9vB?fid=1034:4425476001997216 ( 40 秒后
之前还有一个 docker 版,支持百度的接口和字幕。