V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Frankcox
V2EX  ›  问与答

有没有什么根据音频对话区分说话者的工具

  •  
  •   Frankcox · 16 天前 · 736 次点击
    我想找一个工具,可以尽量区分对话中不同人物,根据人物进行音频分割。如果做不到这种层次,简单区分男女声进行分离的也可以。
    11 条回复    2024-11-25 12:14:19 +08:00
    wweerrgtc
        1
    wweerrgtc  
       16 天前
    语音转文字的工具, 都可以区分是谁在说话
    fengci
        2
    fengci  
       16 天前
    一些公司的成品,有会议记录功能,都有看到这个功能。
    Frankcox
        3
    Frankcox  
    OP
       16 天前
    @wweerrgtc Whisper 命令行直接运行可以进行区分吗?我之前用 whisper 只语音转文字过,没试过区分。
    fengci
        4
    fengci  
       16 天前
    @fengci 好像最近发布的手机 支持 AI 的 都支持好像。
    Frankcox
        5
    Frankcox  
    OP
       16 天前
    @fengci #4 我主要还是想运行在 PC 上,同时执行其他代码逻辑
    raydied
        6
    raydied  
       16 天前 via Android
    模仿飞书或腾讯会议吗?一般用声纹识别的方案。
    Frankcox
        7
    Frankcox  
    OP
       16 天前
    @raydied 不是商业或者公司方面,单纯个人玩的项目,所以想找些本地能跑的开源方案。
    cyp0633
        8
    cyp0633  
       16 天前
    whisper.cpp 应该支持 NER ,但应该是需要搭配特定模型的,然后还有这篇文章 https://arxiv.org/abs/2409.08107 或许也相关
    sighforever
        9
    sighforever  
       16 天前
    阿里出的 funasr 工具包
    mumbler
        10
    mumbler  
       16 天前
    就是说话人识别,用 whisperX, win 桌面直接用 https://github.com/Purfview/whisper-standalone-win 即可,Faster-Whisper-XXL.exe 命令行工具,免安装部署
    yelc668
        11
    yelc668  
       16 天前
    好像目前 ai 就阿里做的还可以,还免费 叫通义听悟
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   865 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:10 · PVG 05:10 · LAX 13:10 · JFK 16:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.