【留用实习】音视频联合生成大模型算法工程师
北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1、负责可灵AI音视频联合生成大模型的关键算法研发和优化;
2、负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持;
3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
4、推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新。
任职要求
1、计算机和数学相关专业,硕士及以上学历;
2、对VAE、扩散/AR模型、多模态等技术有深度理解,有较强的代码实现能力;
3、有较丰富的语音/音频/音乐生成大模型相关领域经验;
4、具有独立解决问题的能力,良好的表达能力、沟通能力和团队合作意识;
5、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ISMIR,ICML,AAAI,NIPS等)。
1、负责可灵AI音视频联合生成大模型的关键算法研发和优化;
2、负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持;
3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
4、推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新。
任职要求
1、计算机和数学相关专业,硕士及以上学历;
2、对VAE、扩散/AR模型、多模态等技术有深度理解,有较强的代码实现能力;
3、有较丰富的语音/音频/音乐生成大模型相关领域经验;
4、具有独立解决问题的能力,良好的表达能力、沟通能力和团队合作意识;
5、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ISMIR,ICML,AAAI,NIPS等)。


