公司简介:
燧原科技专注人工智能领域云端算力平台,致力为人工智能产业发展提供普惠的基础设施解决方案,提供自主知识产权的高算力、高能效比、可编程的通用人工智能训练和推理产品。其创新性架构、互联方案和分布式计算及编程平台,可广泛应用于云数据中心、超算中心、互联网、金融及智慧城市等多个人工智能场景。在招职位如下:
大模型推理引擎开发工程师
工作城市:北京
薪资:29k-35k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
薪资:29k-35k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
角色和团队介绍:
深度挖掘国产芯片算力潜能,专注于为国产AI芯片构建强大、高效的推理软件栈。
岗位职责:
1. vLLM/SGLang深度优化与定制开发:
*参与 vLLM 开源社区的新特性对vLLM-gcu进行定制化改造和功能开发。
*撰写详细的技术文档和最佳实践,赋能业务团队高效使用。
2.生态建设与模型落地
*参与开源社区建设(如vLLM/SGLang),推动GCU芯片生态与AI基础设施的融合。
*参与主流大模型在GCU上的Day-0适配,实现“发布即支持”的自动化适配工具链。
*与芯片特性结合,实现低比特硬件-aware量化工具(FP8、INT8、INT4等 )。
任职要求:
*学历专业:本科及以上学历,计算机、软件工程、人工智能等相关专业;
*扎实的编程功底,掌握Python/C++,有良好的数据结构和算法基础;
*了解Transformer /Llama/DeepSeek/Qwen等常见模型结构;
*对系统优化有浓厚兴趣,了解并行计算、CUDA编程或Triton者优先;
*有vLLM/SGLang等项目实践或二次开发经验者优先;
加分项:
*了解GPU架构(NVIDIA/AMD),有CUDA性能优化经验;
*开源贡献:在GitHub上个人项目,或为vLLM/SGLang及其他AI开源项目提交过Issue甚至Pull Request。
*系统级思维:在课程项目或研究中,设计并实现过具有挑战性的系统级项目。
*论文发表:在MLSys、ASPLOS、OSDI等系统与机器学习交叉的顶会上发表过论文。
个人特质
*极强的技术好奇心与钻研精神:不满足于黑盒调用,渴望理解技术背后的“为什么”。
*动手能力极强:乐于动手实验,用代码和数据来验证自己的想法。
*系统思维:能够从系统(模型、算法、硬件)的角度全局性地思考性能问题。
*良好的沟通能力:能够清晰地向他人解释复杂的技术问题。
地点:北京/成都/上海/西安
深度挖掘国产芯片算力潜能,专注于为国产AI芯片构建强大、高效的推理软件栈。
岗位职责:
1. vLLM/SGLang深度优化与定制开发:
*参与 vLLM 开源社区的新特性对vLLM-gcu进行定制化改造和功能开发。
*撰写详细的技术文档和最佳实践,赋能业务团队高效使用。
2.生态建设与模型落地
*参与开源社区建设(如vLLM/SGLang),推动GCU芯片生态与AI基础设施的融合。
*参与主流大模型在GCU上的Day-0适配,实现“发布即支持”的自动化适配工具链。
*与芯片特性结合,实现低比特硬件-aware量化工具(FP8、INT8、INT4等 )。
任职要求:
*学历专业:本科及以上学历,计算机、软件工程、人工智能等相关专业;
*扎实的编程功底,掌握Python/C++,有良好的数据结构和算法基础;
*了解Transformer /Llama/DeepSeek/Qwen等常见模型结构;
*对系统优化有浓厚兴趣,了解并行计算、CUDA编程或Triton者优先;
*有vLLM/SGLang等项目实践或二次开发经验者优先;
加分项:
*了解GPU架构(NVIDIA/AMD),有CUDA性能优化经验;
*开源贡献:在GitHub上个人项目,或为vLLM/SGLang及其他AI开源项目提交过Issue甚至Pull Request。
*系统级思维:在课程项目或研究中,设计并实现过具有挑战性的系统级项目。
*论文发表:在MLSys、ASPLOS、OSDI等系统与机器学习交叉的顶会上发表过论文。
个人特质
*极强的技术好奇心与钻研精神:不满足于黑盒调用,渴望理解技术背后的“为什么”。
*动手能力极强:乐于动手实验,用代码和数据来验证自己的想法。
*系统思维:能够从系统(模型、算法、硬件)的角度全局性地思考性能问题。
*良好的沟通能力:能够清晰地向他人解释复杂的技术问题。
地点:北京/成都/上海/西安
AI算子开发工程师(26年毕业生可投)
工作城市:南京
薪资:25k-45k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
薪资:25k-45k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
Base:上海,成都,深圳,北京,杭州,西安,南京(26年毕业应届生可投)
【岗位描述】
- 基于燧原编程模型,在燧原自研AI芯片上开发实现各种AI算子。
- 在功能上泛化支持完整算子语义,包括但不限于任意算子形状和数据类型的支持;
- 在性能上能够将芯片算力发挥至极致;
- 在算子融合上,能够高效率支持开源框架定义的通用算子融合场景。
【职位要求】
- 有扎实的C/C++/Python编程能力
- 良好的算法基础,熟悉时间复杂度和空间复杂度的计算方法
- 软件Debug能力出众,能够高效的定位bug范围。
- 有CPU/GPU/DSP上底层函数库的功能开发和性能优化经历者优先
- 理解深度学习理论,熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle等至少一种开源深度学习框架
- 有较强的快速学习能力,良好的团队合作能力和沟通能力
- 具备大模型生成算子相关经验者优先
- 使用过pythonic语法来手写/生成算子者优先
【(加分项)有汇编优化经验】
- (加分项)有CUDA, RDMA, TensorRT, OpenCL或其他MPI并行计算/HPC开发经验
- (加分项)有在基于深度学习的目标识别、目标检测、机器视觉、NLP领域有过工程经验
【岗位描述】
- 基于燧原编程模型,在燧原自研AI芯片上开发实现各种AI算子。
- 在功能上泛化支持完整算子语义,包括但不限于任意算子形状和数据类型的支持;
- 在性能上能够将芯片算力发挥至极致;
- 在算子融合上,能够高效率支持开源框架定义的通用算子融合场景。
【职位要求】
- 有扎实的C/C++/Python编程能力
- 良好的算法基础,熟悉时间复杂度和空间复杂度的计算方法
- 软件Debug能力出众,能够高效的定位bug范围。
- 有CPU/GPU/DSP上底层函数库的功能开发和性能优化经历者优先
- 理解深度学习理论,熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle等至少一种开源深度学习框架
- 有较强的快速学习能力,良好的团队合作能力和沟通能力
- 具备大模型生成算子相关经验者优先
- 使用过pythonic语法来手写/生成算子者优先
【(加分项)有汇编优化经验】
- (加分项)有CUDA, RDMA, TensorRT, OpenCL或其他MPI并行计算/HPC开发经验
- (加分项)有在基于深度学习的目标识别、目标检测、机器视觉、NLP领域有过工程经验

