V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  CMLab  ›  全部回复第 1 页 / 共 3 页
回复总数  51
1  2  3  
https://chirper.ai/
AI 组成的社区
大佬能出一个 GUI 应用吗,类似 sonic 的,这样分析音频更方便些
362 天前
回复了 diagnostics 创建的主题 Android iOS 换成安卓,都是槽点
原厂 android 可能会相应好些吧
@seers 哈哈,可以看下他推特,有些内容挺幽默的
erogol 确实是大神啊,他的 TTS 项目早已关注
2023-04-25 16:54:56 +08:00
回复了 829939 创建的主题 程序员 这样的速度,还有提升空间吗?一个 issue 引发的性能大跃进
@james0517 确实,干爆 torchaudio 估计不太容易,torchaudio 本身就是针对 CPU 和 GPU 高度优化的库。

加油继续优化!!!
2023-04-25 11:12:19 +08:00
回复了 829939 创建的主题 程序员 这样的速度,还有提升空间吗?一个 issue 引发的性能大跃进
@829939 厉害了,看数据大尺寸差异还是挺明显的
2023-04-25 10:49:15 +08:00
回复了 829939 创建的主题 程序员 这样的速度,还有提升空间吗?一个 issue 引发的性能大跃进
@829939 macOS 13.1 intel 这个数据正常吗?
2023-04-25 10:42:15 +08:00
回复了 829939 创建的主题 程序员 这样的速度,还有提升空间吗?一个 issue 引发的性能大跃进
project:audioflux-0.1.5
runtimes:1
time_steps:1,5,10,100,500,1000,2000,3000
feature_name:mel
radix2_exp:11
slide_length:512
----------
audioflux mel 1 0.23315906
audioflux mel 5 0.18369913
audioflux mel 10 0.19328594
audioflux mel 100 0.59645653
audioflux mel 500 1.74749613
audioflux mel 1000 3.57704639
audioflux mel 2000 6.67310715
audioflux mel 3000 9.54481602
==========
project:torchaudio-0.13.1/torch-1.13.1
runtimes:1
time_steps:1,5,10,100,500,1000,2000,3000
feature_name:mel
radix2_exp:11
slide_length:512
----------
torchaudio mel 1 0.13180018
torchaudio mel 5 0.14314651
torchaudio mel 10 0.17399549
torchaudio mel 100 1.42241955
torchaudio mel 500 9.03672457
torchaudio mel 1000 16.18315935
torchaudio mel 2000 17.63835192
torchaudio mel 3000 28.65790367
==========
project:librosa-0.8.0
runtimes:1
time_steps:1,5,10,100,500,1000,2000,3000
feature_name:mel
radix2_exp:11
slide_length:512
----------
librosa mel 1 2.81565189
librosa mel 5 2.44408846
librosa mel 10 2.65174866
librosa mel 100 4.51287270
librosa mel 500 12.60835171
librosa mel 1000 23.84555340
librosa mel 2000 36.47141218
librosa mel 3000 49.74691391
==========
考一个吧,今时不如往日
2023-04-03 18:24:08 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@findex 可以分享一下这款软件,我看之前是否有体验过
2023-04-03 17:49:59 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@829939 @insmoin 转录这块,我发现台湾某一个大学出的一个 omnizart 项目还算能出一些效果,和弦识别这块貌似只有大小三和弦,转录这块要成熟应用还有不少差距(实测节奏、音高这些都或多或少有问题),本项目是基于现有音轨分离、chord 识别一些开源项目基础上二次训练而成的,大佬研究这块可以借鉴一下
2023-04-03 17:41:53 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@insmoin 这个早起有关注过,网络结构上采用常用的 CRNN+联合损失函数,给的 demo 也不错,之前录了一把小星星实测一把,效果不理想,比 demo 差远了,我怀疑是不是某种过拟合了,还是真实录制的钢琴( the one )就是有问题,大佬有实测使用过感受效果吗?
2023-04-03 16:10:41 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@james0517 找二手 A100 试试
2023-04-03 15:18:44 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@james0517 goole 免费的 Colab 可以白嫖,就是有时候可能不太稳定
2023-04-03 14:36:38 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@collinmehle 音轨分离这些可能对老师或 B 端这样的用户有用,调音器单说吉他这一块,做出智能的模型和 chat 相结合,全球吉他用户估计都会碾压式测试,和音轨分离目标用户不是量级
2023-04-03 14:22:58 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@ManxCat 成年人,爱音乐的话, 我觉得可能调音器最重要😃
2023-04-03 14:20:48 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
@829939 我觉得音乐生成这个业务和方向,是个热点,楼主可以考虑下这个点的研发
2023-04-03 14:00:33 +08:00
回复了 829939 创建的主题 程序员 基于这个开源小项目,做哪些受欢迎的 ChatGPT 插件模型?
给 chat 一个 mp3 , 使用你的插件模型 音轨分离 --->旋律提取(人声)+和弦估算(伴奏)---->钢琴转率(不一定钢琴乐器),这些走通,估计 chat 上会飘起来
2023-04-03 11:48:14 +08:00
回复了 829939 创建的主题 程序员 感谢论坛里大佬们的支持,目前汇总了些业务需求
@829939 分析论文的好东西,感谢!!!
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2907 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 12:30 · PVG 20:30 · LAX 05:30 · JFK 08:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.