Unified Audio Generation 研究员
上海
硕士及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
专注于统一音频生成模型的研究与开发,参与构建下一代语音、歌声、音乐、音效等多类型音频生成基础模型,探索大语言模型与音频生成的深度技术融合以及音频-视频联合生成,推动audio AI在语音/歌声合成、音乐创作、音效生成、视频配音等场景的技术突破。 核心职责 1、模型架构与训练:负责统一音频生成模型设计与分布式优化,实现语音/歌声合成+音效生成+音视频联合生成的多任务统一建模 2、Audio Tokenization:研究连续/离散token的音频表征,优化压缩效率与重建质量的最优平衡 3、跨模态融合:探索大语言模型与音频生成融合技术 4、数据管线:参与设计并落地大规模高质量多模态生成数据集,覆盖语音、歌声、音乐、音效及音视频同步数据处理pipeline

