返回简章2026-04-14 更新

【校】算法工程师 J13465

北京

本科及以上

计算机类·数学类

使用简历深度优化功能，快速提升简历质量

职位介绍

工作职责 1、大模型轻量化与部署：负责在现有开源大模型（如LLaMA、ChatGLM、Qwen等）基础上，进行模型裁剪（Pruning）、知识蒸馏（Distillation）和量化（Quantization），以降低模型推理成本，提升部署效率； 2、模型训练与微调：负责大模型的高效微调（如LoRA、P-Tuning）和全参数微调，针对特定垂直领域任务优化模型性能； 3、数据集构建与评估：主导训练集、验证集和测试集的设计与构建，包括数据清洗、数据增强、指令微调数据的格式设计，以及制定科学的评估标准来验证模型效果； 4、算法落地与优化：将训练好的模型（包括大模型及传统深度学习模型）部署到实际业务中，解决落地过程中遇到的性能和效果问题； 5、基础模型研发：根据业务需求，搭建和训练基础的神经网络模型（如CNN、RNN、Transformer），处理自然语言处理（NLP）或计算机视觉（CV）的相关子任务。任职资格 1. 本科及以上学历，计算机、数学、人工智能等相关专业； 2. 大模型核心技术能力：模型裁剪：熟悉大模型的结构化或非结构化裁剪原理，了解如何在不严重损害性能的情况下压缩模型体积；训练与微调：熟悉至少一种大模型训练框架（如DeepSpeed、Megatron-LM），熟练掌握LoRA、Adapter等高效微调技术；工具链：熟练使用Transformers、PEFT、vLLM等主流大模型工具库； 3. 数据与评估能力：深刻理解数据对于模型的重要性，能够独立完成训练集/测试集的构建工作流；熟悉针对大模型生成任务的自动评估指标（如BLEU, ROUGE）和人工评估方法，能够设计合理的测试集来发现模型短板； 4. 基础理论与框架基础模型：扎实的深度学习基础，熟悉常见的网络结构（如Transformer, BERT, ResNet, LSTM等）；多模态认知：具备NLP或CV的基本项目经验，能够根据需求快速搭建 baseline 模型；编程框架：精通Python，熟练掌握PyTorch或TensorFlow； 5.有在边缘端部署大模型的经验；在GitHub上有高质量开源项目，或参与过知名大模型的社区贡献；熟悉ONNX、TensorRT等推理加速引擎优先。

职位来源

北京华宇信息技术有限公司

民营企业 · 互联网服务 · 成立16年

在招职位