jianchang512's repos on GitHub
Python · 17392 watchers
pyvideotrans
Translate the video from one language to another and embed dubbing & subtitles.
Python · 8951 watchers
clone-voice
A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
Python · 7553 watchers
ChatTTS-ui
一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.
Python · 4530 watchers
stt
Voice Recognition to Text Tool / 一个离线运行的本地音视频转字幕工具,输出json、srt字幕、纯文字格式
Python · 1971 watchers
vocal-separate
an extremely simple tool for separating vocals and background music, completely localized for web operation, using 2stems/4stems/5stems models 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网
Python · 482 watchers
ott
Api tool for local offline text translation supporting multiple languages/支持多语言的本地离线文字翻译api
Python · 113 watchers
zh_recogn
将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型
Python · 67 watchers
ai2srt
利用 GeminiAI 一键为长视频创建解说短视频,并支持音视频转录字幕
Python · 64 watchers
f5-tts-api
一个用于F5-TTS的api和webui项目
JavaScript · 56 watchers
ffmpegweb
基于ffmpeg.wasm的在线视频处理工具
JavaScript · 54 watchers
translate-api
在cloudflare上基于m2m100创建完全免费的翻译API服务
Python · 45 watchers
remove-noise
一个简单的音频降噪工具,提高web UI界面和api接口
Python · 45 watchers
sense-api
用于SenseVoice的api项目,输出带时间戳字幕
Python · 40 watchers
kokoro-uiapi
用于kokoro TTS的webui界面和兼容openai api
Python · 28 watchers
parakeet-api
一个基于 NVIDIA Parakeet-tdt-0.6b 模型的本地语音转录服务。它提供了一个与 OpenAI API 兼容的接口和一个简洁的 Web 用户界面
HTML · 19 watchers
chatterbox-api
一个基于 Chatterbox-TTS的文字转语音(TTS)服务。提供与 OpenAI TTS 兼容的 API 接口并支持声音克隆,附带简洁的 Web 用户界面。
Python · 15 watchers
gvs
基于 AI 视觉大模型 的视频硬字幕提取工具。
HTML · 11 watchers
whisperx-api
一个适用于WhisperX 的web界面,兼容 OpenAI API 转录接口
JavaScript · 4 watchers
onJava8
《On Java 8》中文版,又名《Java编程思想》 第5版
Python · 1 watchers
astock
qlib助手, 每日自动预测a股 👇
Python · 1 watchers
investment_data
Scripts and doc for https://www.dolthub.com/repositories/chenditc/investment_data
Python · 1 watchers
VibeVoice
Open-Source Frontier Voice AI
0 watchers
CloudFlare-ImgBed
基于 CloudFlare Pages 的开源文件托管解决方案,支持 Telegram Bot 、R2、S3 等多种存储方式!
0 watchers
sherpa
Speech-to-text server framework with next-gen Kaldi
0 watchers
transformers
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
Python · 0 watchers
VoxCPM
VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning