AI算法-芯片协同工程师
深圳
硕士及以上
自动化类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
我们希望你接触过/研究过以下方向之一:
模型权重量化(INT8/FP16/AWQ/GPTQ等)
模型部署(TensorRT/OpenVINO/TVM等,或多个芯片平台)
算子开发/集成(CUDA/昇腾/昆仑芯/RKNN等)
你会做什么:
参与大模型在自研芯片上的量化、部署、算子适配工作
配合架构团队完成模型→芯片的落地验证
搭建多芯片/多机互联的性能测试环境,分析带宽/延迟瓶颈
学习并实践模型拆分、算子融合、内存排布等软硬协同技术
我们希望你:
数学/应用数学/计算机/电子/自动化等相关专业,硕士/博士
对大模型结构(Transformer/Attention/KV Cache)有基础了解
有PyTorch/TensorFlow使用经验,写过至少一个完整推理demo
对CUDA或芯片部署有一定了解(哪怕只是课设/开源项目)
好学、动手能力强,愿意从0到1搭建系统
加分项:
有量化/剪枝/蒸馏等模型压缩经验
有TensorRT/TVM/ONNX等部署工具使用经验
对CUDA或芯片部署有一定了解(课设/开源项目)
了解CUDA算子,对GPU架构熟悉,对现阶段的AI推理芯片有一定的研究
了解多机互联/数据带宽/延迟优化
我们提供:
直接参与AI推理芯片从0到1落地的机会
与资深芯片架构师、RTL团队紧密协作
高速成长通道,可接触核心项目

