V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yoiteshaw
V2EX  ›  发音

有没有什么思路可以训练一个纠正口语发音的 AI

  •  
  •   yoiteshaw · 140 天前 · 741 次点击
    这是一个创建于 140 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想一改几十年的哑巴英语,希望境外出行的时候避免尴尬,与老外开会的时候避免结巴。
    ---------------------------------------------------------------

    市面上其实已经有很多这样可以练习的成品 AI 了。
    目前尝试了一个 Pronounce 的网页,谷歌就能搜到,每天有在练习它的任务,是用 AI 纠正你的发音的,但是比较坑的点在于它能纠正的点太少,我明明感觉一篇短文起码十几个错误,它只给我点出来四五个,再更完全的口语分析需要交费,包月是每个月 8 刀好像。

    在手机上也试过一个练习口语的叫 TalkAI ,试了一下确实蛮 nb 的,但是需要收费,而且问题和前面一样,免费版的体验有限,收费也比较贵,不过是买断式。

    ----------------------------------------------------------------
    于是萌生了一个念头,即我猜测这些软件的原理是“录音的分词”+“语库发音的比对”。
    那么目前条件如下:

    1.我可以随意找到一篇英语短文练习(互联网上到处都是)
    2.我可以轻易将这篇英文转为标准的口语语音(无论是翻译 app 还是 chatGPT 帮我朗读、或者有专业的读文章的软件)

    那么我需要一个算法:
    1.将我的录音以及标准发音的音频进行分词。
    2.在 1 的基础上,假设分词的数量是一致的,那么只需要匹配上我发音的单词的置信度,告知我置信度即可告知我的发音是否标准。


    我对这块并不是很熟悉,但是愿意稍微花点时间去了解一下,请问大家伙是否有合适的思路或者现有的开源项目可以推荐呢?如果最后实现了,我也可以反馈社区分享给大家。
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2509 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 15:48 · PVG 23:48 · LAX 07:48 · JFK 10:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.