声音克隆
声音名称
克隆模型
A2E
目标语言(支持 13 种语言)
Chinese (中文)
本地上传 (10-15秒最佳)
点击或拖拽文件到此区域上传
格式: mp3/wav/m4a/mp4/mov, 大小: 不超过 500MB
时长: 最少 10秒,最多 60秒
录制音频
开始录音
单次录音最少10秒
我的结果
使用说明
API
声音克隆要求
【操作流程】
1. 选择克隆模型:A2E、Cartesia、MiniMax、Elevenlabs四种模型可选
2. 选择目标语言:系统会根据您的界面语言自动选择,也可手动调整
3. 上传音频文件:单人、人声清晰、无背景噪音、音量一致,建议使用无背景噪音的高采样率wav文件
4. 设置基本信息:输入声音名称
5. 开始训练:通常在2分钟内完成
【支持语言】
• A2E(13种):中文、英语、日语、德语、法语、西班牙语、韩语、阿拉伯语、俄语、荷兰语、意大利语、波兰语、葡萄牙语
• Cartesia(15种):英语、法语、德语、西班牙语、葡萄牙语、中文、日语、印地语、意大利语、韩语、荷兰语、波兰语、俄语、瑞典语、土耳其语
• MiniMax(24种):中文、粤语、英语、西班牙语、法语、俄语、德语、葡萄牙语、阿拉伯语、意大利语、日语、韩语、印尼语、越南语、土耳其语、荷兰语、乌克兰语、泰语、波兰语、罗马尼亚语、希腊语、捷克语、芬兰语、印地语
• Elevenlabs(35种):英语(美、英、澳、加)、中文、日语、德语、印地语、法语(法、加)、韩语、葡萄牙语(巴西、葡萄牙)、意大利语、西班牙语(西班牙、墨西哥)等35种语言和方言