1
z7356995 17 天前
目的是什么,再有感情也比不过电影
|
2
julyclyde 17 天前
不就 TTS 么,咋就 AI 了?
|
3
SantinoSong 17 天前
晚了, 豆包已经在做了
|
6
Shawn5 OP @SantinoSong 啊,这样的吗,我去看看,哈哈哈哈,之前有搜到,火山语音在做,但是搜了下,貌似没有这个应用,不知道是不是合并到番茄里面进去了
|
7
odirus 17 天前
这块字节做得很好了吧,有声小说重点还是落在 “小说” 上面,内容吸引人才行
|
8
chairuosen 17 天前
最好是外挂,一个录屏软件 OCR+TTS ,可以不依赖文字内容的版权
|
9
love060701 17 天前
技术是支持的,看我用 GPT-4o 实现的效果
1 、模仿老友记的珍妮丝和武林外传的佟掌柜: https://x.com/Gorden_Sun/status/1838895315514204375 2 、唱生日歌: https://x.com/Gorden_Sun/status/1839170329262047682 3 、说情话: https://x.com/Gorden_Sun/status/1839252597687071212 |
11
SylarQAQ 17 天前
可以了解一下 mutliTTS 然后引入 TTS 源后就可以了,我前段时间折腾了一下,虽然抑扬顿挫都有了,但是缺乏了一点儿场景对应的语气,不如真人说书的那种感觉
|
14
xz410236056 17 天前
@Shawn5 #5 你抖音搜小说,做得很好了
|
15
z7356995 17 天前
如果要我为多模态语音付费的话,我觉得应该是练习口语中的语音纠正,你这样发音不对,正确的这个发音是
|
16
clemente 17 天前
套一个模型的事 ....
|
18
pkoukk 17 天前 1
没搞头,微信阅读、喜马拉雅、起点 等已经大规模开始搞了。
这个事情最重要的不是 AI ,而是这些内容的版权,没内容你找个 AI 读 1 2 3 4 5 6 7 啊? |
19
liu731 17 天前
|
21
zoharSoul 17 天前
成本很高吧
|
22
wyd011011daniel 17 天前
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/speech-synthesis-markup-voice#use-speaking-styles-and-roles
你说的就是用大语言模型生成 SSML 标记过后的文本内容 看你是要实时还是预先训练好 实时的话,可以做个阅读器让用户自己导入小说。 起步等待要久一点 然后上下文联系可能会出错。 预训练的话版权问题基本只能大公司做 我自己用阅读/爱阅记 azure tts 听书很久了,也挺听喜马拉雅的有声书。 喜马拉雅真人配的有声书(哈利波特系列/三体系列)除了情感以外 还会模仿角色音色,配音功夫下的很多,而且还有环境配乐和各种实时动作的配乐。 现在 ai 配环境声不知道做的怎么样。感觉可以朝着对标这种有声剧想想办法。 |
23
lance07 17 天前
番茄, 讯飞, 微信读书一堆应用都有, 目前我听着最舒服的是微信
|
24
wyd011011daniel 17 天前
@wyd011011daniel 不过我是不太报希望,因为这种听的东西,人对错误的容忍程度应该不是那么高的。譬如男女声音,不同情感。如果配错了,人会很敏感的察觉到,对主要受众来说会很出戏。 不像图片那么好糊弄人
|
25
Shawn5 OP @wyd011011daniel 受教了!!!
|
26
PaulSamuelson 17 天前
除非,除非,这个 AI 能把某些小说里的:呕,呕,阿,阿,读出感情,读出力量来。
否则,你这个 AI 没有壁垒,同质化严重。 |
27
Libby520 17 天前
步非烟
|
28
murmur 17 天前
你都入场晚了,现在 b 站营销号 抖音大部分都是 AI 配音
|
30
Shawn5 OP @PaulSamuelson 我好像悟了
|
31
yufeng0681 17 天前
以后应该是起步 AI 语音做有声阅读。
如果内容有火的趋势(某些指标达标了),马上就会上真人来重新录制。 把这个作品做到最佳体验。 或者是优质内容,起步就是真人录制,达到最佳效果。 |
32
bigjie910 16 天前
可以参考卢卡故事机得方案。 摄像头识别书本内容,需要手动翻页。 不过他这个目前都是录制好的内容, 很多新书或者杂志都识别不到。 可以尝试下这方面得
|