返回简章2026-01-29 更新

Unified Audio Generation 研究员

上海

硕士及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

专注于统一音频生成模型的研究与开发，参与构建下一代语音、歌声、音乐、音效等多类型音频生成基础模型，探索大语言模型与音频生成的深度技术融合以及音频-视频联合生成，推动audio AI在语音/歌声合成、音乐创作、音效生成、视频配音等场景的技术突破。核心职责 1、模型架构与训练：负责统一音频生成模型设计与分布式优化，实现语音/歌声合成+音效生成+音视频联合生成的多任务统一建模 2、Audio Tokenization：研究连续/离散token的音频表征，优化压缩效率与重建质量的最优平衡 3、跨模态融合：探索大语言模型与音频生成融合技术 4、数据管线：参与设计并落地大规模高质量多模态生成数据集，覆盖语音、歌声、音乐、音效及音视频同步数据处理pipeline

职位来源

上海米哈游网络科技股份有限公司

民营企业 · 软件开发 · 成立14年

在招职位