语音大模型算法研究员
北京
硕士及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1. 大规模语音模态预训练
研究如何用千万小时级别语音数据在百亿级别参数模型上进行高效预训练,有效提取与利用通用声学与语义特征,提升语言理解及语音生成的一致性和自然度。
2. 多语言语音理解与生成
研究跨语言语音数据的共享表示方法,提升语音模型对多语言、方言的适配能力。
3. 噪声环境及复杂声学场景下的处理能力
研究语音大模型在嘈杂、混响、远场等典型场景下的泛化性。
4.探索高效语音信息压缩方法
研究语音模态压缩方法,以实现长时理解,并适配不同类型的设备(云侧和端侧)的部署需求。
职位要求
多篇NLP&语音领域顶会论文发表

