RapidTTS 安装后会提供 rapidtts 命令。CLI 适合下载模型、检查环境、查看模型能力,以及从文本生成音频文件。
rapidtts download [MODEL] [--save-dir DIR] [--group GROUP] [--no-base-files] [--no-progress] [--quiet]
rapidtts check [MODEL] [--model-dir DIR] [--group GROUP] [--no-base-files] [--init-backend] [--quiet]
rapidtts info [MODEL] [--model-dir DIR] [--quiet]
rapidtts voices [MODEL] [--model-dir DIR] [--quiet]
rapidtts text TEXT OUTPUT [--model MODEL] [--model-dir DIR] [--language ZH|EN|ZH_MIX_EN] [--voice VOICE] [--speed SPEED] [--sample-rate SAMPLE_RATE] [--quiet]MODEL 可选:
kokoro_onnx:默认后端melo_onnx:MeloTTS ONNX 后端moss_nano_onnx:MOSS Nano ONNX 后端
最小示例:
rapidtts text "你好,RapidTTS" outputs/1.wav指定模型:
rapidtts text "你好,RapidTTS" outputs/kokoro.wav --model kokoro_onnx
rapidtts text "你好,RapidTTS" outputs/melo.wav --model melo_onnx
rapidtts text "你好,RapidTTS" outputs/moss_nano.wav --model moss_nano_onnx指定语言:
rapidtts text "hello world" outputs/en.wav --language EN
rapidtts text "你好,RapidTTS" outputs/zh.wav --language ZH
rapidtts text "我在学习machine learning" outputs/mix.wav --language ZH_MIX_EN指定音色:
rapidtts voices kokoro_onnx
rapidtts text "你好,RapidTTS" outputs/zm_009.wav --model kokoro_onnx --voice zm_009--voice 对应 Python API 中的 SynthesisRequest.voice。
MeloTTS ONNX 当前只暴露 zf_001:
rapidtts text "你好,RapidTTS" outputs/melo_zf_001.wav --model melo_onnx --voice zf_001MOSS Nano ONNX 的内置音色来自模型 manifest,默认音色是 Junhao:
Junhao, Zhiming, Weiguo, Xiaoyu, Yuewen, Lingyu, Trump, Ava, Bella, Adam, Nathan, Soyo, Saki, Mortis, Umiri, Mei, Anon, Arisa
rapidtts voices moss_nano_onnx
rapidtts text "你好,RapidTTS" outputs/moss_nano_ava.wav --model moss_nano_onnx --voice Ava当前 CLI 的 text 子命令支持 MOSS Nano 内置音色合成;参考音频克隆需要使用 Python API 的 SynthesisRequest.extras["prompt_audio_path"]。
指定语速和采样率:
rapidtts text "你好,RapidTTS" outputs/fast.wav --speed 1.2 --sample-rate 16000注意:MOSS Nano ONNX 当前按模型输出返回 48000 Hz 音频,不做 --speed 变速处理。
使用自定义模型目录:
rapidtts text "你好,RapidTTS" outputs/1.wav --model kokoro_onnx --model-dir /path/to/kokoro_onnx
rapidtts text "你好,RapidTTS" outputs/moss_nano.wav --model moss_nano_onnx --model-dir /path/to/moss_nano_onnx查看模型支持的语言、默认语言、音色数量和默认音色:
rapidtts info kokoro_onnx查看模型可用音色:
rapidtts voices kokoro_onnx查看 MeloTTS ONNX:
rapidtts info melo_onnx
rapidtts voices melo_onnx查看 MOSS Nano ONNX:
rapidtts info moss_nano_onnx
rapidtts voices moss_nano_onnx下载默认模型:
rapidtts download kokoro_onnx下载 MOSS Nano ONNX:
rapidtts download moss_nano_onnx下载到自定义目录:
rapidtts download kokoro_onnx --save-dir /path/to/kokoro_onnx
rapidtts download moss_nano_onnx --save-dir /path/to/moss_nano_onnx关闭进度条:
rapidtts download kokoro_onnx --no-progress下载可选模型文件组:
rapidtts download moss_nano_onnx --group prompt_audio_encoderprompt_audio_encoder 是 MOSS Nano 参考音频克隆所需的可选文件组。只使用内置音色时不需要下载这个文件组;Python API 首次使用 extras["prompt_audio_path"] 时也会按需自动下载。
只下载可选模型文件组,不重复处理基础模型文件:
rapidtts download moss_nano_onnx --group prompt_audio_encoder --no-base-files检查默认模型和依赖:
rapidtts check检查指定模型:
rapidtts check melo_onnx
rapidtts check moss_nano_onnx检查自定义模型目录:
rapidtts check kokoro_onnx --model-dir /path/to/kokoro_onnx同时初始化后端:
rapidtts check kokoro_onnx --init-backend检查可选模型文件组:
rapidtts check moss_nano_onnx --group prompt_audio_encoder --no-base-files所有子命令都支持 --quiet:
rapidtts text "你好,RapidTTS" outputs/1.wav --quiet