首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

V2EX 提问指南

这是一个创建于 1630 天前的主题，其中的信息可能已经有所发展或是发生改变。

需求

比如有一句语音“开始”，先用 Google 翻译的标准音。
然后获取用户的声音。
然后比较语音的近似程度。
排除音高男女之类的差异，有点像图片比较，可以接受一定的模糊。
不知道有没有这类轮子。

PS：以前还找过视频去广告的方法，也尝试过一些音频的轮子，不过都是 python 的。这次想在网页上使用（感觉服务器反馈的延迟会影响体验），所以来请教一下大家。

3 条回复 • 2020-07-30 15:17:37 +08:00

1

leekafai

2020-07-30 13:58:19 +08:00

https://www.ixueshu.com/document/c4f2b9945cd46f3d.html

2

shenyu1996

2020-07-30 14:30:25 +08:00

https://ml5js.org/reference/api-soundClassifier/

3

DJQTDJ

2020-07-30 15:17:37 +08:00

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 5289 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 24ms · UTC 07:01 · PVG 15:01 · LAX 23:01 · JFK 02:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.