AI infra 研究员
北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
该职位考虑从算法优化、软件优化、服务优化等不同角度,实现模型服务的低成本、高效率部署,结合实际的业务需求解决业界面临的核心难点。 具体研究领域包括但不限于:大语言模型(LLM)、语音模型(TTS、ASR)、数字人模型。 岗位职责 1. 负责数字人服务ToC场景下,高吞吐、低延时的调度方案设计与实现,兼顾服务的可靠性和可扩展性; 2. 负责LLM模型、语音模型、数字人模型的深度优化,结合业务场景和模型特性,设计和实现优化方案。 岗位要求 1. 研究生及以上学历,计算机相关专业; 2. 积极主动有热情,具备良好的合作沟通能力; 3. 有大规模调度系统设计经验者优先; 4. 有LLM、语音模型、视觉模型 优化经验者优先 ; 5. 有MLSys方向顶会论文者优先; 6. 在计算机视觉顶会或期刊上发表过论文者优先; 7. 在计算机视觉知名竞赛取得优异名次者优先; 8. 有高质量Github项目经验者优先。

