Research Intern
深圳·北京·上海
博士
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:算法
【岗位职责】
岗位职责
面向通用人形机器人及更广泛的具身场景,构建可泛化、可拓展、可scaling的具身大模型,形成持续的技术影响力并引领行业发展。研究方向包括但不限于:
1、面向通用人形机器人,实现全身动作控制、场景及任务可泛化,可scaling的具身VLA大模型研究;
2、构建行业领先的世界模型,提升长程时空记忆与物理属性模拟能力, 为具身场景提供生成式仿真能力;
3、强化多模态大模型视觉细粒度感知,时空理解与推理能力,作为具身基模为下游提供更好的真实世界理解能力;
4、面向机器人具身交互场景,研发Omni大模型,联合建模视觉语音文本等模态,实现语音对话与视觉反馈的高度协同;
5、端侧优化与部署:探索多模态大模型在机器人/边缘设备上的高效推理与量化技术。
【任职要求】
职位要求
1、专业背景:计算机、机器人、电子工程、人工智能、信号处理、图形学等相关领域本科及以上学历在读;
2、算法基础:具有扎实的机器学习/深度学习算法基础,熟悉VLA、World model、多模态大模型、语音处理、计算机视觉、自然语言处理等方向前沿方法;
3、技术能力:熟练使用PyTorch/TensorFlow等深度学习框架,具备良好的代码实现能力;
4、综合素质:逻辑清晰,具备良好的自驱力、团队合作能力和沟通能力,能够积极参与前沿技术的探索与落地。
加分项
1、计算机、电子工程、人工智能、机器人等相关领域博士学历在读;曾以第一作者身份在CVPR/ECCV/ICCV/CoRL/ICRA/NeurIPS/ICLR/ICML/SIGGRAPH/ACL/Interspeech/ICASSP等顶会顶刊上发表过论文;
2、有机器人、多模态大模型相关研究和项目经验,有国际影响力的项目主导者:包括但不限于有工业级的大模型训练调优,数据处理与评测经验;机器人模型训练到仿真与真机验证全链路经验;音视频生成、虚拟人、情感交互等项目经验;
3、代码与竞赛能力:具有优秀的代码能力,曾获得ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛奖项者优先。

