logologo
寻找工作
返回简章2025-10-22 更新

训练框架研发工程师(上海)

上海
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述 1. 负责大模型分布式训练框架的设计和研发。 2. 负责异步数据加载模块的设计和研发。 3. 负责容器化开发环境的构建与维护。 4. 与算法工程师密切配合,提高训练效率,降低研发成本,提升交付能力。 职位要求 1. 具备坚实的 Python/C++ 编程基础。 2. 具备良好的代码规范和强烈的工程意识。 3. 至少熟悉 OpenMMLab / PyTorch Lightning / Hugging Face Transformers / Detectron2 / FastAI 其中一种训练研发框架。 4. 至少熟悉 Megatron-Core 或 Deepspeed 其中一种分布式训练框架。 5. 熟练掌握性能优化、量化、蒸馏等相关工具的使用。 6. 熟练掌握 Docker 等容器化工具的使用。 7. 具备相关领域的研发和交付经验,深刻理解训练研发框架的定位和意义。