声音克隆

声音名称

本地上传 (10-15秒最佳)

点击或拖拽文件到此区域上传

格式: mp3/wav/m4a/mp4/mov, 大小: 不超过 500MB
时长: 最少 10秒，最多 60秒

录制音频

开始录音

单次录音最少10秒

去除背景噪音/音乐

训练费用：0

TTS使用费用：1 / 10s

我的结果

使用说明

API

声音克隆要求

【操作流程】 1. 选择克隆模型：A2E、Cartesia、MiniMax、Elevenlabs四种模型可选 2. 选择目标语言：系统会根据您的界面语言自动选择，也可手动调整 3. 上传音频文件：单人、人声清晰、无背景噪音、音量一致，建议使用无背景噪音的高采样率wav文件 4. 设置基本信息：输入声音名称 5. 开始训练：通常在2分钟内完成【支持语言】 • A2E（13种）：中文、英语、日语、德语、法语、西班牙语、韩语、阿拉伯语、俄语、荷兰语、意大利语、波兰语、葡萄牙语 • Cartesia（15种）：英语、法语、德语、西班牙语、葡萄牙语、中文、日语、印地语、意大利语、韩语、荷兰语、波兰语、俄语、瑞典语、土耳其语 • MiniMax（24种）：中文、粤语、英语、西班牙语、法语、俄语、德语、葡萄牙语、阿拉伯语、意大利语、日语、韩语、印尼语、越南语、土耳其语、荷兰语、乌克兰语、泰语、波兰语、罗马尼亚语、希腊语、捷克语、芬兰语、印地语 • Elevenlabs（35种）：英语（美、英、澳、加）、中文、日语、德语、印地语、法语（法、加）、韩语、葡萄牙语（巴西、葡萄牙）、意大利语、西班牙语（西班牙、墨西哥）等35种语言和方言