算法工程师-语音算法
杭州
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
应用声纹识别、语音合成、情绪迁移等音频技术处理阿里大文娱集团海量音频数据,紧跟业界前沿技术方向,在真实的语音场景进行落地应用,实现音色适配、情绪饱满、高自然度拟人的音频合成,期待追求卓越、自我驱动、聪明乐观的优秀人士加入阿里大文娱集团,共同开创影视工业化的商业新格局
具体职责包括但不限于:
1、负责基于海量数据和复杂业务场景,和团队其他成员一起构建面向多语言多说话人多情绪的一流语音合成系统
2、负责语音合成相关算法设计,包括Emotional TTS、Speaker Recognition、Instant Voice Clone等模块的算法优化和在实际场景上的落地
3、跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,解决资源受限场景的实际问题,持续提升语音合成核心能力
职位要求
1、在语音合成、情绪迁移、音频检索、音频分类、声纹识别、语音增强等方面有相关的项目经验,并能够对其中某一领域的算法深入研发并努力创新
2、熟悉传统机器学习基础理论,熟悉深度学习开源框架,深入理解DNN/RNN/CNN/lstm原理,掌握至少一个深度学习框架(如tensorflow, pytorch)
3、拥有良好的数学及信号处理基础,熟练掌握C/C++,python编程语言
4、学习能力强,逻辑思维清晰; 较强的文献阅读能力,能够快速实现或设计音频相关的算法
5、在相关方向知名国际会议发表过论文者优先
应用声纹识别、语音合成、情绪迁移等音频技术处理阿里大文娱集团海量音频数据,紧跟业界前沿技术方向,在真实的语音场景进行落地应用,实现音色适配、情绪饱满、高自然度拟人的音频合成,期待追求卓越、自我驱动、聪明乐观的优秀人士加入阿里大文娱集团,共同开创影视工业化的商业新格局
具体职责包括但不限于:
1、负责基于海量数据和复杂业务场景,和团队其他成员一起构建面向多语言多说话人多情绪的一流语音合成系统
2、负责语音合成相关算法设计,包括Emotional TTS、Speaker Recognition、Instant Voice Clone等模块的算法优化和在实际场景上的落地
3、跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,解决资源受限场景的实际问题,持续提升语音合成核心能力
职位要求
1、在语音合成、情绪迁移、音频检索、音频分类、声纹识别、语音增强等方面有相关的项目经验,并能够对其中某一领域的算法深入研发并努力创新
2、熟悉传统机器学习基础理论,熟悉深度学习开源框架,深入理解DNN/RNN/CNN/lstm原理,掌握至少一个深度学习框架(如tensorflow, pytorch)
3、拥有良好的数学及信号处理基础,熟练掌握C/C++,python编程语言
4、学习能力强,逻辑思维清晰; 较强的文献阅读能力,能够快速实现或设计音频相关的算法
5、在相关方向知名国际会议发表过论文者优先


