python量化工程师
杭州
本科及以上
不限专业
使用简历深度优化功能,快速提升简历质量
职位介绍
一、岗位职责
1. 参与量化压缩sf的研发与落地,协助完成主流开源大模型的量化部署。
2. 复现并实现业界主流 PTQ 量化sf,参与sf在低比特场景下的精度与吞吐优化。
3. 参与新型低比特数据格式的量化sf预研与实验验证。
4. 跟踪学术前沿(量化、稀疏、蒸馏、QAT),协助将 SOTA sf工程化落地。
5. 参与量化精度问题分析,包括校准数据策略、敏感层识别、sf组合选型等。
6. 协助团队完成代码开发、单元测试、文档编写以及开源社区贡献。
二、任职要求
1. 计算机、电子、自动化、数学等相关专业在读,本科大三及以上、硕士、博士优先。
2. 熟练掌握 Python 与 PyTorch,对 Transformer、Attention 等大模型基础结构有清晰理解。
3. 了解至少 1 种主流 PTQ 或 QAT 量化sf的原理,具备阅读英文论文的能力。
4. 对低比特数值表示有基本认知,了解量化的基本概念与误差来源。
5. 具备良好的代码风格(遵循 PEP8)与工程习惯,能独立完成小规模算法复现。
6. 学习能力强,主动性高,能保证稳定的实习时长。
三、加分项
1. 在量化、压缩、推理加速方向有论文发表或在投。
2. 有大模型相关项目经验(微调、推理、部署任一方向)。
3. 有 GitHub、GitCode 等平台的开源贡献记录。
4. 熟悉主流推理框架或国产 AI 芯片相关开发经验。
5. ACM、Kaggle 等竞赛获奖者优先。
四、实习收获
1. 深度参与一线大模型量化方案的研发工作,积累稀缺的工程与量化经验。
2. 接触从论文复现到芯片部署的完整技术链路。
3. 与资深量化工程师 1 对 1 mentor 合作,快速成长。
4. 表现优秀者可获得校招提前批 offer 或转正机会。
5. 工作产出可贡献至开源社区,形成个人技术影响力。

