Torch训练工程师
北京
本科及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:
1、协助参与大语言模型或多模态模型的训练效率优化工作,包括代码调试、性能分析与实验跟踪。
2、在导师指导下,学习并实践混合精度训练、梯度检查点、分布式通信优化等基础技术。
3、使用 PyTorch Profiler、Nsight 等工具进行训练过程的性能剖析,定位显存或计算瓶颈。
4、参与训练任务监控、日志分析及实验数据整理,为模型迭代提供支持。
5、跟踪并复现业界前沿训练技术论文或开源项目,进行技术调研与总结。
任职要求:
必须项:
1、计算机、人工智能、数学等相关专业,具备扎实的算法与数据结构基础。
2、熟练掌握 Python 及 PyTorch 框架,有动手实现或调优深度学习模型的经验。
3、了解深度学习训练基本原理(如反向传播、优化器)及硬件常识(GPU/显存)。
4、具备优秀的学习能力和责任心,能快速融入团队,对大规模模型训练有浓厚兴趣。
加分项:
1、有使用 DeepSpeed、FSDP 等工具进行简单分布式训练的实验经验。
2、了解 CUDA 编程、算子融合或 Attention 优化 中的任一方向。
3、在 GitHub 上有深度学习相关项目或 Kaggle 等竞赛经验。
4、具备良好的英文文献阅读能力。

