返回简章2026-06-08 更新

【留用实习】音视频联合生成大模型算法工程师

北京

硕士及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述
1、负责可灵AI音视频联合生成大模型的关键算法研发和优化；
2、负责音视频数据的筛选，清洗和打标工作，为可灵AI音视频联合生成大模型提供数据支持；
3、负责跟进行业前沿技术发展趋势，跟踪国际最新技术发展方向；
4、推动音视频联合生成技术在可灵及快手各业务场景中的落地，探索新玩法和业务创新。
任职要求
1、计算机和数学相关专业，硕士及以上学历；
2、对VAE、扩散/AR模型、多模态等技术有深度理解，有较强的代码实现能力；
3、有较丰富的语音/音频/音乐生成大模型相关领域经验；
4、具有独立解决问题的能力，良好的表达能力、沟通能力和团队合作意识；
5、相关顶会或期刊上发表论文者优先（ICASSP，Interspeech，ISMIR，ICML，AAAI，NIPS等）。

职位来源

北京快手科技有限公司

民营企业 · 商业服务 · 成立11年

345

在招职位