logologo
寻找工作
返回简章2026-04-29 更新

大模型算法部署优化工程师

上海
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
【岗位职责】 1. 参与前沿大模型(LLM\VLM\VLA\VTLA)算法的板端部署与推理加速工作 2. 参与相关应用 Agent 开发工作,收集用户需求改进用户体验 3. 参与大模型性能评估与精度调优等相关工作 4. 参与前沿端到端和大模型算法的在异构嵌入式平台的推理引擎开发 5. 参与开发维护算法优化加速工具链,并实现对 AI 算法的自动化部署 【任职要求】 1. 计算机科学、人工智能、软件工程等相关专业本科及以上学历 2. 熟悉 Python、Shell、C++ 中的一到多种编程语言,熟悉 Linux 开发环境 3. 使用过TensorRT、PyTorch、vLLM、TVM、MLIR等至少一种框架 4. 具备大模型在嵌入式平台或SOC端侧进行部署、性能优化和精度调优的实践经验者优先 5. 熟悉Llama、Qwen、DeepSeek等主流开源大模型架构及其特点 6. 了解KV Cache、模型量化(如INT4/INT8)、投机采样等推理加速技术 7. 对前沿大模型技术落地与应用开发有强烈的兴趣 8. 具备工程化与工具链思维,对开发自动化部署、模型优化工具链有浓厚兴趣或实践经验。