大模型算法部署优化工程师
上海
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
【岗位职责】
1. 参与前沿大模型(LLM\VLM\VLA\VTLA)算法的板端部署与推理加速工作
2. 参与相关应用 Agent 开发工作,收集用户需求改进用户体验
3. 参与大模型性能评估与精度调优等相关工作
4. 参与前沿端到端和大模型算法的在异构嵌入式平台的推理引擎开发
5. 参与开发维护算法优化加速工具链,并实现对 AI 算法的自动化部署
【任职要求】
1. 计算机科学、人工智能、软件工程等相关专业本科及以上学历
2. 熟悉 Python、Shell、C++ 中的一到多种编程语言,熟悉 Linux 开发环境
3. 使用过TensorRT、PyTorch、vLLM、TVM、MLIR等至少一种框架
4. 具备大模型在嵌入式平台或SOC端侧进行部署、性能优化和精度调优的实践经验者优先
5. 熟悉Llama、Qwen、DeepSeek等主流开源大模型架构及其特点
6. 了解KV Cache、模型量化(如INT4/INT8)、投机采样等推理加速技术
7. 对前沿大模型技术落地与应用开发有强烈的兴趣
8. 具备工程化与工具链思维,对开发自动化部署、模型优化工具链有浓厚兴趣或实践经验。

