V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
yushuxin
V2EX  ›  分享创造

AnyVoice - 3 秒语音即可克隆的任何声音,用你朋友的声音回复她的语音消息

  •  
  •   yushuxin · 1 天前 · 3969 次点击

    老铁们好!最近搞了一个 AI 克隆声音产品,只需要 3 秒的原始语音,就可以克隆音色!在这里想跟大家分享一下。

    事情是这样的: 我一个朋友老给我发语音,我想调戏一下她,想着能不能用她自己的声音回复她?正好现在 AI 技术成熟了,我就做了一个,哈哈哈,可好玩了。

    来试试看吧

    https://anyvoice.net/ai-voice-cloning

    是什么让 AnyVoice 与众不同?

    • 只需 3 秒音频就可以复刻! 没错,就是这么简单。你在网页界面里录个"今天天气真好,我们晚上去吃火锅吧"的就够了,随便说点什么都行。网上其他方案动辄要求录音几十句话,谁有耐心啊...

    • 支持中日韩英四种语言:测试下来,中文效果特别自然,连我朋友听到这个声音时,自己都吓傻了,觉得是被电话诈骗了

    实际使用场景分享

    1. 调戏朋友:用朋友的声音,回复她的语音消息。你只需要把她的语音录下来(一般来说一条语音信息是超过 3 秒的吧?),然后在网站里录音,就直接复刻好了。 小窍门:根据我的实战经验,你用两台手机操作比较方便。手机 A 播放朋友声音、手机 B 打开 https://anyvoice.net/ai-voice-cloning 录制和复刻声音;复刻好后,手机 B 播放声音,手机 A 长按微信发送语音,朋友立马吓傻。

    2. 短视频配音:做视频的朋友们应该懂,配音要么找人要么自己来,累。如果从剪映或者其他地方想找一些自己喜欢的声音,往往是收费的。我们主打全免费、任何声音你都可以得到!

    3. 语言学习:把外语课文用自己的声音念出来,感觉特别神奇,激发了不少学习兴趣。

    4. 假装自己会说外语:你用中文录音,复刻自己的声音,装 x 。然后输入英文、日文、韩文,你就可以得到用你的音色说的外文了。

    使用体验

    界面设计得很简洁,就三步:

    1. 上传/录制语音样本( 3-10 秒)
    2. 选择想要生成的文本,每次不超过 200 字符 (毕竟是免费服务,大家请理解,未来如果我做收费版,会加长)
    3. 等待生成(一般几秒钟就好)

    体验地址

    https://anyvoice.net/ai-voice-cloning

    最后

    目前处于公测阶段,完全免费,没有做任何收费功能!欢迎各位 V2EX 的朋友试用反馈。如果觉得好用请帮忙点个赞 ❤️

    有什么建议或者遇到问题都可以在下面留言,我会一一回复。

    78 条回复    2025-01-10 21:40:54 +08:00
    DigitaIOcean
        1
    DigitaIOcean  
       1 天前
    (我有点怕这种技术)
    ospider
        2
    ospider  
       1 天前   ❤️ 1
    不建议提供中文版,更不建议在中文社区宣传。你这个东西万一被诈骗团伙用了,抓不到诈骗分子,还抓不到你吗?分分钟用你的项上人头冒功。
    pol
        3
    pol  
       1 天前
    我很想知道这些是不是套的那种 gpts-vits ,这种东西
    yushuxin
        4
    yushuxin  
    OP
       1 天前
    @pol 类似的,但不是,现在技术都差不多
    yushuxin
        5
    yushuxin  
    OP
       1 天前
    @ospider 谢谢建议,你说得有道理。
    Eddiegaao
        6
    Eddiegaao  
       1 天前
    字符限制太严格了,不够玩,一次只能生成一句话
    sakujo
        7
    sakujo  
       1 天前
    有点意思 玩玩看
    pol
        8
    pol  
       1 天前
    @yushuxin #4 大佬。不会是自己开发的吧
    yushuxin
        9
    yushuxin  
    OP
       1 天前
    @Eddiegaao 是啊,成本有点高,所以做了限制。回头我想想办法。谢谢反馈
    ChefIsAwesome
        10
    ChefIsAwesome  
       1 天前   ❤️ 4
    "妈,我出车祸受伤了,现在在医院,你给我转 5 万。"
    “王会计,你往这个账户打 30 万。”

    这个世界有点疯狂。
    spiffing
        11
    spiffing  
       1 天前
    可别让诈骗团伙看到
    server
        12
    server  
       1 天前
    CosyVoice ?
    RobinzzZ
        13
    RobinzzZ  
       1 天前
    感觉离进去不远了,OP 肉身应该不在国内吧
    sunmacarenas
        14
    sunmacarenas  
       1 天前
    通过免费体验方式,采集声纹?
    rick2c
        15
    rick2c  
       1 天前
    大家防范意识还挺强的,但其实这类的 ai 应用已经一搜一大把了,所以别想太多
    panxi
        16
    panxi  
       1 天前
    你有备案吗? 没有的话请规避钱还没到手,银手镯先到手
    shmilypeter
        17
    shmilypeter  
       1 天前   ❤️ 2
    克隆了前女友的声音。
    哎~
    barantt01
        18
    barantt01  
       1 天前
    @sunmacarenas 细思极恐,但应该不至于哈哈
    zlife116
        19
    zlife116  
       1 天前
    你以为园区的技术人员,都是那里来的?都是我们 v 站的,谢谢你了,技术可以升级了
    idblife
        20
    idblife  
       1 天前
    @shmilypeter
    出息
    yushuxin
        21
    yushuxin  
    OP
       1 天前   ❤️ 1
    @shmilypeter 我隔着屏幕感到了你的心酸
    liqinliqin
        22
    liqinliqin  
       1 天前
    @yushuxin #21 我有订制需求,可以加 V 吗 andy433928
    barantt01
        23
    barantt01  
       1 天前
    想请问一下,这个服务是你自己搭的吗?租的 GPU 吗?
    meeop
        24
    meeop  
       1 天前
    这个技术基本没啥有价值的合法的使用场景
    ixcode
        25
    ixcode  
       1 天前
    @panxi 域名和服务器都在国外的话,不需要备案
    damonzhang
        26
    damonzhang  
       1 天前   ❤️ 1
    有点可怕,用这个过了微信的声音锁验证。。
    guisheng
        27
    guisheng  
       1 天前
    要是能私有部署就好了,好家伙现在还不能泄漏自己的声音了。
    cat
        28
    cat  
       1 天前   ❤️ 2
    @damonzhang 于是楼主也拥有了你的声音……
    woorz
        29
    woorz  
       1 天前 via Android
    @guisheng 自已可部署啊,一大把
    guisheng
        30
    guisheng  
       1 天前 via iPhone
    @woorz 你说的是使用付费的 sdk 套一层么
    securityCoding
        31
    securityCoding  
       1 天前
    @meeop 这个市场已经非常非常卷了,比如阅读类应用
    tangping
        32
    tangping  
       1 天前 via iPhone
    能克隆新闻联播中那个人物的声音吗 狗头🐶
    yushuxin
        33
    yushuxin  
    OP
       1 天前
    @tangping 当然可以啊。你试试看。
    yushuxin
        34
    yushuxin  
    OP
       1 天前
    @damonzhang …… 快收起你的虎狼之词,我感觉,你离踩缝纫机越来越近了 😂
    lwldcr
        35
    lwldcr  
       1 天前
    能提供对方言的支持就好了

    我把父亲生前的语音上传,尝试生成了一个语音,效果感觉还有很大提升空间
    x86
        36
    x86  
       1 天前
    睿声那个平台八成因为克隆这玩意给整治了,维护了 1 个多月
    meeop
        37
    meeop  
       1 天前
    @securityCoding 这类应用的重点在于生成语音,而不是模拟语音呀
    模拟语音,或者说复制某个人的声音,更直白一点,假装某个人的声音说话,通常都不是啥正经用途
    coshawn
        38
    coshawn  
       1 天前 via iPhone
    在 ios17 和 ios18 上面录音,即使允许了 safari 的麦克风权限,录音还是没有声音,导致复制的声音也没有声音。这是为何
    wyman222
        39
    wyman222  
       1 天前
    @yushuxin #5 说实话,不支持中文,我觉得你在国内就不好卖,当然你在国外卖当我没说。 支持中文,你应该添加内容审查,所有敏感词都该限制,打钱,银行卡,账户, 出车祸等等等
    vfx666
        40
    vfx666  
       1 天前 via iPhone
    @yushuxin 楼主可以透露一下用了什么技术吗?
    Kolar
        41
    Kolar  
       22 小时 22 分钟前
    就是不知道成本咋样
    Donaldo
        42
    Donaldo  
       21 小时 41 分钟前
    @spiffing #11 早就有了
    yushuxin
        43
    yushuxin  
    OP
       20 小时 42 分钟前
    @wyman222 有道理
    sublime8
        44
    sublime8  
       17 小时 38 分钟前
    之前国内唯一提供音频上传克隆的公司“睿声”目前处于无限期停业整顿状态,其他大大小小的类似服务提供商都只能读固定文本来克隆,就是为了避免克隆其他人的声音
    gletec
        45
    gletec  
       14 小时 17 分钟前 via Android
    这很刑,楼主却挺有成就感的
    twinsant
        46
    twinsant  
       13 小时 45 分钟前
    Coys? F5 ? GPT-Sovits?
    SaltyMouse
        47
    SaltyMouse  
       13 小时 44 分钟前
    vfx666
        48
    vfx666  
       13 小时 18 分钟前 via iPhone
    @twinsant 这些工具想要克隆的好最少要几条样本一起训练,他这个就一条音频,效果还是很不错的
    liyafe1997
        49
    liyafe1997  
       13 小时 9 分钟前 via Android
    @ospider 要是 op 不在中国/非中国籍呢
    panxi
        50
    panxi  
       12 小时 50 分钟前
    @vfx666 #40 开源的主要还是 sovits 和 cosyvoice 吧, 其他的或多或少技术方向和这两个差不多
    Seanfuck
        51
    Seanfuck  
       12 小时 48 分钟前
    @twinsant 是 GPT-Sovits 拉
    ZsmHub
        52
    ZsmHub  
       11 小时 53 分钟前
    @ospider 完全没必要说这种。工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ZsmHub
        53
    ZsmHub  
       11 小时 52 分钟前
    @yushuxin 工具都是一把双刃剑,只看用的人怎么使用。比如一把菜刀,如果担心别人用菜刀杀人而不卖菜刀,你能接受吗?现在所有大平台都在开发声音克隆技术,没必要畏手畏脚的。中国人就是太保守,这样只会离先进越来越远~
    ynwx
        54
    ynwx  
       11 小时 37 分钟前
    这个太强了,给楼主点赞
    ospider
        55
    ospider  
       11 小时 34 分钟前
    @ZsmHub 不是我担心啊,是有人钳住我们的手脚。我也没说这个东西不好,我是说在国内没法弄。大公司大不了接受下窗口指导下架就行了,或者罚酒三杯,小公司可能就得牢狱之灾了。你搞清楚源头是啥比较好,怼我没用的……
    zbowen66
        56
    zbowen66  
       11 小时 9 分钟前
    @spiffing #11 AI 视频诈骗早就有了。
    zhangsimon
        57
    zhangsimon  
       11 小时 0 分钟前
    关注了,最近在玩影视配音的恶搞
    在用 GPT-soVoice ,但是太繁琐了
    请问楼主的效果和 GPT-soVoice 比,会更好吗?
    还有就是能模仿语气吗?
    GPT-soVoice 比较烦人的是,不能自定义语气
    如果想要某个语气,就要用某个语气来训练,这样一个人就要训练好几次
    yushuxin
        58
    yushuxin  
    OP
       10 小时 40 分钟前
    @ZsmHub 谢谢鼓励
    yushuxin
        59
    yushuxin  
    OP
       10 小时 39 分钟前
    @zhangsimon 可以一定程度模仿语气,您可以试试看。每个语气你录几秒钟就行
    nimingyonghu
        60
    nimingyonghu  
       10 小时 36 分钟前
    楼上那么多说刑的怎么回事?与技术脱节这么久了?
    各种 XXTTS 都出来多长时间了
    ZsmHub
        61
    ZsmHub  
       10 小时 25 分钟前
    @yushuxin 你官网这个字数限制对中文很不友好,一个中文就占了 3 个字符,200 字符最多支持 66 个中文
    zuotun
        62
    zuotun  
       10 小时 3 分钟前
    @nimingyonghu #60 那么类似的技术到底有没有先例呢?在特色国是肯定有的而且不止一种技术一个先例。
    cowcomic
        63
    cowcomic  
       10 小时 0 分钟前
    这种东西不敢用个人制作的
    dvz
        64
    dvz  
       9 小时 49 分钟前
    大佬牛逼,试了一下,跟我九成相似,普通话比我还标准
    nimingyonghu
        65
    nimingyonghu  
       8 小时 23 分钟前
    @zuotun #62 太多了,GPT-SoVITS ,GPT-SoVITS ,FireRedTTS ,F5TTS ,CosyVoice
    op 这个就是无法调整任何参数的 WebUI 整合包。
    Jaeger
        66
    Jaeger  
       8 小时 18 分钟前
    第一次觉得一项新技术并不是很酷的事
    KimiArthur
        67
    KimiArthur  
       8 小时 7 分钟前 via Android
    @yushuxin 感觉怎么保证数据安全,可信计算(用完销毁)是个大头😂
    Fruktozka
        68
    Fruktozka  
       7 小时 29 分钟前
    之前做过这一块的调研,睿声已经凉了,微软的 responsible AI 团队对这块也很谨慎
    ZsmHub
        69
    ZsmHub  
       7 小时 6 分钟前
    @Fruktozka 在国内做这块技术,就需要投入内容审核的人力,在国外就自由很多。睿声凉就是因为用户乱搞导致的。
    beiguo
        70
    beiguo  
       6 小时 32 分钟前
    @nimingyonghu #65 剪映就可以录,但仅限于固定的文本并且需要人脸识别证明是你本人。为什么这么多门槛?就是因为在国内,你不得不这么设计。你说的这么多 TTS 都需要具备一定技术能力的人自己用用。你一旦封装成产品,给大众用,然后发生诈骗案件,你根本跑不了
    sn0wdr1am
        71
    sn0wdr1am  
       6 小时 12 分钟前
    你想喝最苦的咖啡了?😅
    nimingyonghu
        72
    nimingyonghu  
       5 小时 45 分钟前
    @beiguo #70 op 这个也就是玩票,搞不好一个月之内就打不开了 😅

    关于技术门槛你可以在 B 站搜一下这些 TTS 的教程,里面都有别人做好的整合包,一张 20 系以上的 N 就能本地一键启动开玩了,整合包是没什么门槛的。
    fyq
        73
    fyq  
       5 小时 42 分钟前
    @shmilypeter 好汉不提当年勇,好男不提前女友
    lance07
        74
    lance07  
       5 小时 23 分钟前
    这也太哈人了, 用户语音特征你拿了直接开盒诈骗怎么搞, 如何让最终用户信任你。。
    xiaohusky
        75
    xiaohusky  
       2 小时 0 分钟前 via iPhone
    楼主请问可以透露一下怎么做到的吗?我做视频剪辑有用
    nasa
        76
    nasa  
       1 小时 23 分钟前
    我之前用过 https://dash.reecho.ai/overview

    至今还在维护中....
    yushuxin
        77
    yushuxin  
    OP
       36 分钟前
    @ZsmHub 好的,为了方便大家体验,我放宽了限制: 每次可以生成 200 个中文字,仍然免费! 希望大家玩得开心
    yushuxin
        78
    yushuxin  
    OP
       19 分钟前
    @nimingyonghu 您向大家教科书级别的演示了什么叫「以小人之心度君子之腹」,相比未来你自己如果有能力做产品的话,你一定会做一款一个月内跑路的产品。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2712 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:00 · PVG 22:00 · LAX 06:00 · JFK 09:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.