AI Infra工程师-CUDA
杭州
硕士及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:
1.负责深度学习训练和推理框架中CUDA计算的优化和自定义算子的开发。
2.与算法研究员合作,进行模型结构和底层实现的协同优化。
任职要求:
1.熟悉CUDA编程,熟练使用Tensor Core、Shared Memory等优化技术。
2.熟悉至少一种训练框架(PyTorch / TensorFlow等),熟悉算子forward和backward的过程。
3.熟悉至少一种推理框架(TensorRT、ONNX等)者优先。
4.熟悉至少一种算子优化库(FlashAttention等)者优先。
5.熟悉Triton开发者优先。
6. 具备良好的工程素质;优秀的沟通和协作能力,能与算法研究员高效配合。

