logologo
寻找工作
2025-09-29 更新

上海燧原科技股份有限公司

人工智能硬件 · 民营企业 · 成立8年
简章详情

在招职位如下:

【2026校招】架构建模工程师

工作城市:上海
薪资:28k-30k
岗位性质:全职
岗位描述:
角色和团队介绍 你会作为架构建模团队的一员,会和产品团队紧密协作,参与产品性能预估及竞品分析;
同时你和软硬件、及系统架构师一起参与架构方案讨论。
团队希望你带来什么 希望你可以建立起对于架构建模和benchmark分析的知识体系,并使用我们自研的工具进行性能分析。
希望你在这个过程中能逐步提出优化架构建模平台效率,准确率的方案。
因为你的工作会涉及数据分析,以及跨团队协作,需要你有出色的数据分析能力(敏感性,严谨性,逻辑),以及对于建模所需的抽象理解力。
岗位职责 • 负责将与时俱进的AI模型(benchmark)导入架构平台,并分析benchmark特征 • 负责针对不同架构方案的性能分析 • 负责整理性能分析报告,技术方案说明 岗位要求 • 软件工程/计算机科学2026届硕士或博士,有AI相关的科研经验 • 擅长数据分析,出色沟通能力和演讲能力,良好的文档习惯 • 熟练掌握C++, Python • 具备一定的创新性思维,乐于尝试新方法、新工具 优选经验 • 有主流AI框架的使用经验 • 对于AI芯片,GPU等高性能芯片架构有一定理解,并熟悉所需的性能建模及分析方法 • 有Triton或Cuda等AI相关的编程经验

【2026校招】大模型推理算法工程师

工作城市:北京
薪资:28k-30k
岗位性质:全职
岗位描述:
角色和团队介绍: 作为大模型推理算法工程师(应届生),你将直接参与核心技术的研发,让百亿、千亿参数的大模型变得更快、更便宜、更易用。
你将在一对一的导师指导下,学习并应用最前沿的推理算法优化技术,解决真实世界中的复杂工程问题,在这里,你将有机会深入vLLM内核,解决最极致的性能、吞吐与稳定性挑战。
你的工作将直接推动大模型及其相关技术的发展,影响亿万用户的大模型体验。
你的代码将服务于公司核心产品并且直接影响亿万用户的产品体验。
岗位职责和内容:
1、模型推理与部署 l 负责基于vLLM部署和优化各类主流及前沿的大语言模型支持将各类开源和自研的大语言模型 l 研究和落地Attention、并行等核心推理技术,显著提升服务吞吐量并降低延迟 l 设计和实现高可用、高扩展性的大模型推理服务架构,满足生产级应用的需求
2、性能极致优化 l 深入研究并集成最新的性能优化算法与技术,将其应用于生产环境,实现性能突破 l 针对特定硬件平台,进行深度的算子优化和内核开发,最大化硬件计算效率 l 利用自研Profiler等性能分析工具,进行全链路瓶颈分析,定位并解决性能热点问题
3、工具链与自动化 l 开发和维护模型量化、模型压缩、等编译加速工具链
4、技术研究与前瞻 l 紧密跟踪学术界与工业界在LLM推理优化领域的最新进展,进行技术调研、原型验证和可行性评估 l 将验证成功的SOTA技术快速集成到现有平台,保持技术栈的先进性和竞争力 岗位要求:
1、学历专业:2026届应届硕士或博士毕业生,计算机、人工智能、电子工程等相关专业。
2、vLLM浓厚兴趣与初步实践: l 对vLLM的核心原理(PagedAttention, KV Cache管理, Continuous Batching)有深刻理解,并能清晰阐述其优势与 trade-offs。
l 有实际使用或测试vLLM的经验(课程设计、科研项目、实习、个人项目均可)。
3、强大的工程实现能力: l 熟练掌握Python,具备扎实的编程基础和良好的代码风格。
l 具备C++/CUDA能力者优先,这是我们深度优化的关键。
4、扎实的理论根基: l 深入理解Transformer架构及自注意力机制的计算与内存复杂度。
l 熟悉计算机系统结构、操作系统、并行计算等基础知识。
* 加分项: l 源码级贡献:阅读过vLLM、FlashAttention或相关项目(如trt-llm, lm-deploy)的源代码,并对其关键模块有清晰认识,甚至有过提交Issue或Pull Request的经历。
l 量化部署经验:亲手实践过LLM的量化(如GPTQ, AWQ)、剪枝或蒸馏技术,并成功部署。
l 开源贡献:在GitHub上有过优秀的个人项目,或为vLLM及其他AI开源项目(如HF Transformers, FlashAttention)提交过Issue甚至Pull Request。
l 系统级思维:在课程项目或研究中,设计并实现过具有挑战性的系统级项目。
l 论文发表:在MLSys、ASPLOS、OSDI等系统与机器学习交叉的顶会上发表过论文。
个人特质 l 极强的技术好奇心与钻研精神:不满足于黑盒调用,渴望理解技术背后的“为什么”。
l 动手能力极强:乐于动手实验,用代码和数据来验证自己的想法。
l 系统思维:能够从系统(模型、算法、硬件)的角度全局性地思考性能问题。
l 良好的沟通能力:能够清晰地向他人解释复杂的技术问题。
地点:北京

【2026校招】Triton编译器工程师

工作城市:上海
薪资:28k-30k
岗位性质:全职
岗位描述:
岗位职责:
1、负责openai triton编译器开发工作,适配自研AI芯片;
2、芯片指令集在自研芯片上的功能验证及性能调优;
3、适配/优化基于triton的高性能算子库;
4、与编译器及硬件团队合作,共同优化芯片架构及性能。
任职要求:
1、计算机相关专业,精通C++及python;
2、熟悉triton编程,有triton编译器开发经验;
3、熟悉MLIR及LLVM编译器框架;
4、熟悉GPGPU架构及cuda,精通体系结构及编译原理。
5、了解深度学习算法,对大模型推理和训练框架vllm, sglang, megatron的应用或开发经验;
具有以下条件者优先:
1、计算机领域相关的编程大赛获奖者优先;
2、熟悉AI领域常见框架、模型,有过实战调优经验者优先;
3、熟悉大模型算法和优化方法者优先;
4、熟悉MLIR, TVM, XLA, LLVM优先。
5、在国产芯片厂商(寒武纪,璧仞,燧原,华为,沐曦,天数)性能优化经验优先

【2026校招】AI芯片诊断软件开发工程师

工作城市:上海
薪资:25k-28k
岗位性质:全职
岗位描述:
产品系统部门简介 燧原科技产品系统部负责打造基于自研深度学习芯片的加速产品系统和硬件设计,系统验证和测试,功耗和性能优化,以及最终产品化的完整过程,为云端人工智能产品提供完整的芯片到系统级的解决方案。
工作职责 • 芯片验证、测试、诊断以及Debug等系列软件的开发 • 芯片和产品量产工具以及产品运维支持工具的开发 • 和芯片设计团队以及验证团队一起定义芯片Emulation和Post-Silicon的测试验证计划,实现IP层面和系统层面的测试算法以及在Simulation/Emulation/ASIC三种环境的开发验证 • 芯片的bring-up, 功能验证,支持芯片性能和功耗测试以及调优 • 芯片和产品量产测试程序开发以及测试覆盖率的持续优化和改进 职位基本要求 • 电子,计算机,机械电子等相关专业本科及以上学历 • 较好的快速学习能力,良好的团队合作能力和沟通能力,积极主动,有责任心 • 扎实的编程技能,精通C/C++ 以及Python编程语言, 有Linux环境下底层软件(如驱动,bootloader)开发经验 • 熟练使用Linux作为开发环境, 熟悉 CMake/Make编译系统 • 熟练使用Git, Subversion, CVS版本管理工具 • 熟练使用Linux下调试工具如GDB 优选技能 • 熟悉PCIe/Memory (GDDR, HBM)/Power Management/Video Codec/RAS/Security的一种或几种,有相关开发经验的优先 • 熟悉深度学习软件架构和框架,包括Tensorflow、MxNet、Caffe、Caffe
2、PyTorch等 • 有GFX驱动(OpenGL, DirectX),CUDA或AI加速卡等领域背景和工作经验的优先

鼠鼠求职首页