老铁们好!最近搞了一个 AI 克隆声音产品,只需要 3 秒的原始语音,就可以克隆音色!在这里想跟大家分享一下。
事情是这样的: 我一个朋友老给我发语音,我想调戏一下她,想着能不能用她自己的声音回复她?正好现在 AI 技术成熟了,我就做了一个,哈哈哈,可好玩了。
来试试看吧
只需 3 秒音频就可以复刻! 没错,就是这么简单。你在网页界面里录个"今天天气真好,我们晚上去吃火锅吧"的就够了,随便说点什么都行。网上其他方案动辄要求录音几十句话,谁有耐心啊...
支持中日韩英四种语言:测试下来,中文效果特别自然,连我朋友听到这个声音时,自己都吓傻了,觉得是被电话诈骗了
调戏朋友:用朋友的声音,回复她的语音消息。你只需要把她的语音录下来(一般来说一条语音信息是超过 3 秒的吧?),然后在网站里录音,就直接复刻好了。 小窍门:根据我的实战经验,你用两台手机操作比较方便。手机 A 播放朋友声音、手机 B 打开 https://anyvoice.net/ai-voice-cloning 录制和复刻声音;复刻好后,手机 B 播放声音,手机 A 长按微信发送语音,朋友立马吓傻。
短视频配音:做视频的朋友们应该懂,配音要么找人要么自己来,累。如果从剪映或者其他地方想找一些自己喜欢的声音,往往是收费的。我们主打全免费、任何声音你都可以得到!
语言学习:把外语课文用自己的声音念出来,感觉特别神奇,激发了不少学习兴趣。
假装自己会说外语:你用中文录音,复刻自己的声音,装 x 。然后输入英文、日文、韩文,你就可以得到用你的音色说的外文了。
界面设计得很简洁,就三步:
https://anyvoice.net/ai-voice-cloning
目前处于公测阶段,完全免费,没有做任何收费功能!欢迎各位 V2EX 的朋友试用反馈。如果觉得好用请帮忙点个赞 ❤️
有什么建议或者遇到问题都可以在下面留言,我会一一回复。
|  |      1DigitaIOcean      295 天前 (我有点怕这种技术) | 
|  |      24BVL25L90W260T9U      295 天前  3 不建议提供中文版,更不建议在中文社区宣传。你这个东西万一被诈骗团伙用了,抓不到诈骗分子,还抓不到你吗?分分钟用你的项上人头冒功。 | 
|      3pol      295 天前 我很想知道这些是不是套的那种 gpts-vits ,这种东西 | 
|      6Eddiegaao      295 天前 字符限制太严格了,不够玩,一次只能生成一句话 | 
|  |      7sakujo      295 天前 有点意思 玩玩看 | 
|  |      10ChefIsAwesome      295 天前  5 "妈,我出车祸受伤了,现在在医院,你给我转 5 万。" “王会计,你往这个账户打 30 万。” 这个世界有点疯狂。 | 
|      11spiffing      295 天前 可别让诈骗团伙看到 | 
|  |      12server      295 天前 CosyVoice ? | 
|  |      13RobinzzZ      295 天前 感觉离进去不远了,OP 肉身应该不在国内吧 | 
|      14sunmacarenas      295 天前 通过免费体验方式,采集声纹? | 
|  |      15rick2c      295 天前 大家防范意识还挺强的,但其实这类的 ai 应用已经一搜一大把了,所以别想太多 | 
|  |      16panxi      295 天前 你有备案吗? 没有的话请规避钱还没到手,银手镯先到手 | 
|      17shmilypeter      295 天前  3 克隆了前女友的声音。 哎~ | 
|  |      18barantt01      295 天前 @sunmacarenas 细思极恐,但应该不至于哈哈 | 
|  |      19zlife116      295 天前 你以为园区的技术人员,都是那里来的?都是我们 v 站的,谢谢你了,技术可以升级了 | 
|  |      20idblife      295 天前 @shmilypeter  出息 | 
|  |      21yushuxin OP PRO  1 @shmilypeter 我隔着屏幕感到了你的心酸 | 
|  |      22liqinliqin PRO @yushuxin #21 我有订制需求,可以加 V 吗 andy433928 | 
|  |      23barantt01      295 天前 想请问一下,这个服务是你自己搭的吗?租的 GPU 吗? | 
|  |      24meeop      295 天前 这个技术基本没啥有价值的合法的使用场景 | 
|      26damonzhang      295 天前  1 有点可怕,用这个过了微信的声音锁验证。。 | 
|      27guisheng      295 天前 要是能私有部署就好了,好家伙现在还不能泄漏自己的声音了。 | 
|  |      28cat      294 天前  2 @damonzhang 于是楼主也拥有了你的声音…… | 
|      31securityCoding      294 天前 @meeop 这个市场已经非常非常卷了,比如阅读类应用 | 
|  |      32tangping      294 天前 via iPhone 能克隆新闻联播中那个人物的声音吗 狗头🐶 | 
|  |      34yushuxin OP PRO @damonzhang  …… 快收起你的虎狼之词,我感觉,你离踩缝纫机越来越近了 😂 | 
|  |      35lwldcr      294 天前 能提供对方言的支持就好了 我把父亲生前的语音上传,尝试生成了一个语音,效果感觉还有很大提升空间 | 
|  |      36x86      294 天前 睿声那个平台八成因为克隆这玩意给整治了,维护了 1 个多月 | 
|  |      37meeop      294 天前 @securityCoding 这类应用的重点在于生成语音,而不是模拟语音呀 模拟语音,或者说复制某个人的声音,更直白一点,假装某个人的声音说话,通常都不是啥正经用途 | 
|      38coshawn      294 天前 via iPhone 在 ios17 和 ios18 上面录音,即使允许了 safari 的麦克风权限,录音还是没有声音,导致复制的声音也没有声音。这是为何 | 
|  |      39wyman222      294 天前 @yushuxin #5  说实话,不支持中文,我觉得你在国内就不好卖,当然你在国外卖当我没说。 支持中文,你应该添加内容审查,所有敏感词都该限制,打钱,银行卡,账户, 出车祸等等等 | 
|  |      41Kolar      294 天前 就是不知道成本咋样 | 
|  |      44sublime8      294 天前 之前国内唯一提供音频上传克隆的公司“睿声”目前处于无限期停业整顿状态,其他大大小小的类似服务提供商都只能读固定文本来克隆,就是为了避免克隆其他人的声音 | 
|  |      45gletec      294 天前 via Android 这很刑,楼主却挺有成就感的 | 
|  |      46twinsant      294 天前 Coys? F5 ? GPT-Sovits? | 
|  |      47SaltyMouse      294 天前 @shmilypeter 哎~ | 
|  |      49liyafe1997      294 天前 via Android @ospider 要是 op 不在中国/非中国籍呢 | 
|      52ZsmHub      294 天前 @ospider 完全没必要说这种。工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~ | 
|      53ZsmHub      294 天前 @yushuxin 工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~ | 
|      54ynwx      294 天前 这个太强了,给楼主点赞 | 
|  |      554BVL25L90W260T9U      294 天前 @ZsmHub 不是我担心啊,是有人钳住我们的手脚。我也没说这个东西不好,我是说在国内没法弄。大公司大不了接受下窗口指导下架就行了,或者罚酒三杯,小公司可能就得牢狱之灾了。你搞清楚源头是啥比较好,怼我没用的…… | 
|  |      57zhangsimon      294 天前 关注了,最近在玩影视配音的恶搞 在用 GPT-soVoice ,但是太繁琐了 请问楼主的效果和 GPT-soVoice 比,会更好吗? 还有就是能模仿语气吗? GPT-soVoice 比较烦人的是,不能自定义语气 如果想要某个语气,就要用某个语气来训练,这样一个人就要训练好几次 | 
|  |      59yushuxin OP PRO @zhangsimon 可以一定程度模仿语气,您可以试试看。每个语气你录几秒钟就行 | 
|  |      60nimingyonghu      294 天前 楼上那么多说刑的怎么回事?与技术脱节这么久了? 各种 XXTTS 都出来多长时间了 | 
|      62zuotun      294 天前 @nimingyonghu #60 那么类似的技术到底有没有先例呢?在特色国是肯定有的而且不止一种技术一个先例。 | 
|  |      63cowcomic      294 天前 这种东西不敢用个人制作的 | 
|  |      64dvz      294 天前 大佬牛逼,试了一下,跟我九成相似,普通话比我还标准 | 
|  |      65nimingyonghu      294 天前 @zuotun #62 太多了,GPT-SoVITS ,GPT-SoVITS ,FireRedTTS ,F5TTS ,CosyVoice op 这个就是无法调整任何参数的 WebUI 整合包。 | 
|  |      66Jaeger      294 天前 第一次觉得一项新技术并不是很酷的事 | 
|      67KimiArthur      294 天前 via Android @yushuxin 感觉怎么保证数据安全,可信计算(用完销毁)是个大头😂 | 
|  |      68Fruktozka      294 天前 之前做过这一块的调研,睿声已经凉了,微软的 responsible AI 团队对这块也很谨慎 | 
|  |      70beiguo      294 天前 @nimingyonghu #65 剪映就可以录,但仅限于固定的文本并且需要人脸识别证明是你本人。为什么这么多门槛?就是因为在国内,你不得不这么设计。你说的这么多 TTS 都需要具备一定技术能力的人自己用用。你一旦封装成产品,给大众用,然后发生诈骗案件,你根本跑不了 | 
|      71sn0wdr1am      294 天前 你想喝最苦的咖啡了?😅 | 
|  |      72nimingyonghu      294 天前 @beiguo #70 op 这个也就是玩票,搞不好一个月之内就打不开了 😅 关于技术门槛你可以在 B 站搜一下这些 TTS 的教程,里面都有别人做好的整合包,一张 20 系以上的 N 就能本地一键启动开玩了,整合包是没什么门槛的。 | 
|      73fyq      294 天前 @shmilypeter 好汉不提当年勇,好男不提前女友 | 
|      74lance07      293 天前 这也太哈人了, 用户语音特征你拿了直接开盒诈骗怎么搞, 如何让最终用户信任你。。 | 
|      75xiaohusky      293 天前 via iPhone 楼主请问可以透露一下怎么做到的吗?我做视频剪辑有用 | 
|  |      76nasa      293 天前 | 
|  |      78yushuxin OP PRO @nimingyonghu 您向大家教科书级别的演示了什么叫「以小人之心度君子之腹」,相比未来你自己如果有能力做产品的话,你一定会做一款一个月内跑路的产品。 | 
|      79lthero      293 天前 试了下英文输入+英文输出的效果,还是不错的;您是自行训练的模型吗?我有试过 E2-tts 它的效果也挺好的 | 
|  |      80TellMeWHY      293 天前 还是可以做中文市场的,仅支持 USDT 充值不就行了(手动摊手) 再建个 TG 频道,等网站被墙之后,群里告诉我们回家的路 | 
|  |      81nimingyonghu      293 天前 @yushuxin #78 误会误会,对你的产品无任何意见。你可以翻一下 [分享创造] 节点下其他的帖子,看看以 web 形式发布的 side project 的平均存活时间,我自己以前是收藏了不少,但是偶尔再翻看的时候很多就打不开了。再加上这个不是多少有点灰色地带游走的意思。 | 
|  |      82devtk      293 天前 太刑了 | 
|      83skyonedot      292 天前 有意思,蛮不错的。 | 
|  |      84yushuxin OP PRO 大家太踊跃了,晚上 8 点的时候 GPU 爆炸了,过去 3 个小时使用起来会慢。  刚才我新增了 GPU 。谢谢大家的支持 | 
|  |      85coderwink      290 天前 大佬太强了 | 
|  |      87xming      289 天前 有群吗 | 
|      88lht1936      259 天前 现在好像不能用了 | 
|      89yszz      252 天前 好像不能用了 | 
|  |      90zhangsimon      244 天前 楼主,你的服务我前一阵试用了,感觉很棒 不过最近是不是改算法了,感觉克隆出来的音色没有以前那么像了 |