AI训练构架和优化实习生
北京·上海
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
招聘部门:算法
【岗位职责】
1、参与大规模分布式训练框架的研发与优化,支持VLA等多模态大模型的高效预训练,微调,强化学习,量化感知训练与推理;
2、设计并实现数据并行、模型并行、张量并行、序列并行等混合策略的自动编排系统;
3、进行端到端性能瓶颈分析(通信、计算、内存、IO),优化千卡/万卡集群的训练效率与稳定性;
4、构建训练容错、弹性伸缩、成本感知调度等企业级特性,支撑物理AI业务的快速迭代。
【任职要求】
1、27届-28届毕业的同学,计算机/软件工程等相关专业,硕博优先;
2、扎实的系统与工程能力:精通Python,扎实掌握数据结构与算法,能高质量实现高性能分布式训练逻辑或底层系统组件;
3、分布式训练深度:熟悉PyTorch/FSDP/Megatron等框架,掌握数据并行、模型并行、张量并行等分布式策略,可做端到端性能瓶颈分析与优化;
4、模型理解:熟悉LLM/VLM/扩散模型等主流架构的训练和推理动态,理解收敛性与效率的权衡。
【加分项】
1、极致性能优化:有AutoML、模型压缩、量化或推理加速经验,或在Kaggle/天池等竞赛中取得优异成绩;
2、学术影响力:在OSDI/SOSP/ISCA/MLSys/NeurIPS/ICML等顶会发表过分布式系统/机器学习系统相关论文,或有高质量GitHub开源项目/工具贡献(如PyTorch/JAX/DeepSpeed社区贡献);
3、软硬协同视野:深度参与过AI芯片、编译器或软硬协同优化,对算力调度与成本优化有实践积累。

