logologo
寻找工作
返回简章2026-06-01 更新

【Plan A】AI Infra系统研发-Asystem-27届

北京·上海·杭州
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
蚂蚁ASystem致力于打造下一代AI基础软件,并基于下一代的AI基础软件寻找通用智能的新方法,追求智能上限。
1.负责训推一体框架的设计与开发,服务蚂蚁内部的强化学习场景;
2.建设面向训推一体的显存管理体系和高性能数据存储方案;
3.负责实时高性能训推系统设计与开发,如分布式训练加速策略、算子融合、编译优化、模型量化、混合精度、异构硬件加速等;
4.负责整体性能优化与架构升级,持续提升训练/推理性能;
5.与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

职位要求
1.精通至少一门 Python/Go/C++ 等编程语言,并有良好的代码风格;
2.了解分布式系统服务/并行计算系统设计与优化;
3.熟悉主流深度学习框架及扩展库的使用及算子开发,例如TensorFlow/PyTorch/Megatron/Deepspeed/vLLM/Sglang等;
4.好奇心强,热爱技术且对系统领域有深入钻研优先。

加分项:
1. 熟悉至少一种主流的RLHF框架,如OpenRLHF/veRL/AReal/ChatLearn等;
2. 熟悉Ray框架或其他强化学习相关计算框架;
3. 在计算机系统网络顶会OSDI/SOSP/NSDI/ATC/EuroSys上有文章发表经验。