语音生成算法工程师
北京
硕士及以上
电子信息类·自动化类
使用简历深度优化功能,快速提升简历质量
职位介绍
阿里巴巴-高德-语音合成算法(实习生) 岗位职责: 1. 参与语音合成大模型的应用研发与落地、语音端到端等大模型效果优化,包括但不限于:数据体系设计、模型架构设计、训练优化等; 2.关注和推进技术在业务场景中的广泛应用,参与语音合成、语音增强、说话人识别、上下文管理、多模态问答等相关核心技术的研发; 3.跟踪和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。 职位要求: 1. 硕士及以上学历,计算机相关专业; 2. 熟悉 ASR/TTS/LLM/端到端语音大模型等语音技术。 加分项: 1.具备大规模语音数据处理、语音相关打模型的预训练、后训练(Post-training) 经验者优先; 2. 具备语音多模态大模型(如Qwen-Audio、Qwen-Omni等)实际调优经验者优先; 3. 在 ICASSP、Interspeech、NeurIPS 等顶会发表过相关论文,或参与过开源语音项目贡献优先。

