多语言大型语音生成模型,提供推理、训练和部署全栈能力。