语音合成算法工程师
深圳
硕士及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位描述
1. 负责QQ音乐/长音频有声书中语音合成相关工作,应用场景包括QQ音乐中的播客解读、AI助手、AI伴听、AI互动聊天等场景,以及QQ音乐电台/懒人听书等长音频平台中AI有声书生产、声播AIGC制作工具等落地场景;
2. 负责最前沿的语音合成大模型的模型训练,算法优化,推理提速,业务上线等工作;
3. 负责音频理解大模型;
4. 负责全双工通信语音大模型的算法研究和实现。
岗位要求
1. 博士学历,计算机、信息、通信、信号类及相关专业;
2. 熟悉语音合成相关技术,理解Diffusion,Transformer,LLM原理,对于VITS,VALLE,cosyvoice等语音合成模型熟悉;
3. 具备良好的音频理论和信号理论基础,具备机器学习理论基础;
4. 熟悉linux系统,擅长python编程,代码风格严谨;
5. 良好的中英文文献阅读能力,能够快速使用开源框架;
6. 沟通良好,对技术有热情,勤奋学习,积极向上。
1. 负责QQ音乐/长音频有声书中语音合成相关工作,应用场景包括QQ音乐中的播客解读、AI助手、AI伴听、AI互动聊天等场景,以及QQ音乐电台/懒人听书等长音频平台中AI有声书生产、声播AIGC制作工具等落地场景;
2. 负责最前沿的语音合成大模型的模型训练,算法优化,推理提速,业务上线等工作;
3. 负责音频理解大模型;
4. 负责全双工通信语音大模型的算法研究和实现。
岗位要求
1. 博士学历,计算机、信息、通信、信号类及相关专业;
2. 熟悉语音合成相关技术,理解Diffusion,Transformer,LLM原理,对于VITS,VALLE,cosyvoice等语音合成模型熟悉;
3. 具备良好的音频理论和信号理论基础,具备机器学习理论基础;
4. 熟悉linux系统,擅长python编程,代码风格严谨;
5. 良好的中英文文献阅读能力,能够快速使用开源框架;
6. 沟通良好,对技术有热情,勤奋学习,积极向上。


