LLM算法实习生(具身大脑方向)
深圳
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:互联网 / 电子 / 网游
【岗位职责】
【关于我们】
我们致力于探索基于 大模型作为具身大脑,能够让机器人在复杂环境中完成 长程、实时的交互任务。
我们关注的机器人在真实或模拟环境中持续分析、决策和行动的能力:模型需要根据多轮反馈维护历史状态,在动态变化的环境中进行任务规划,并在时间约束下做出合理决策。
【职位描述】
1、搭建长程实时交互任务的仿真任务:面向导购、厨房、家庭服务、工厂异常处理等场景,设计具有多步骤依赖、环境不确定性、动态反馈和时间约束的交互任务,用于激发和评测模型的具身决策能力;
2、研究基于环境交互的 agentic RL 训练:构造适用于 SFT / RL / RLHF / Agentic RL 的交互轨迹数据,设计环境反馈、奖励信号和任务验证机制,提升模型在复杂交互任务中的成功率和泛化能力;
3、撰写技术报告与研究总结:跟踪 LLM Agent、Embodied AI、Agentic RL、机器人基础模型等前沿进展,整理实验结果和技术分析,参与团队内部技术讨论与外部研究交流。
【任职要求】
1、具备扎实的机器学习基础和强悍的编码能力,能熟练使用 PyTorch;
2、了解大模型或者强化学习中的至少一个方向;
3、对 LLM Agent、多轮交互、长程任务规划、工具调用或机器人智能感兴趣;
4、具备较强的问题抽象能力,能够从真实场景中提炼出可交互、可验证、可扩展的任务。
【加分项】
1、有 ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先;
2、在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先;
3、主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。

