【校】算法工程师 J13465
北京
本科及以上
计算机类·数学类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责 1、大模型轻量化与部署: 负责在现有开源大模型(如LLaMA、ChatGLM、Qwen等)基础上,进行模型裁剪(Pruning)、知识蒸馏(Distillation)和量化(Quantization),以降低模型推理成本,提升部署效率; 2、模型训练与微调: 负责大模型的高效微调(如LoRA、P-Tuning) 和全参数微调,针对特定垂直领域任务优化模型性能; 3、数据集构建与评估: 主导训练集、验证集和测试集的设计与构建,包括数据清洗、数据增强、指令微调数据的格式设计,以及制定科学的评估标准来验证模型效果; 4、算法落地与优化: 将训练好的模型(包括大模型及传统深度学习模型)部署到实际业务中,解决落地过程中遇到的性能和效果问题; 5、基础模型研发: 根据业务需求,搭建和训练基础的神经网络模型(如CNN、RNN、Transformer),处理自然语言处理(NLP) 或计算机视觉(CV) 的相关子任务。 任职资格 1. 本科及以上学历,计算机、数学、人工智能等相关专业; 2. 大模型核心技术能力: 模型裁剪: 熟悉大模型的结构化或非结构化裁剪原理,了解如何在不严重损害性能的情况下压缩模型体积; 训练与微调: 熟悉至少一种大模型训练框架(如DeepSpeed、Megatron-LM),熟练掌握LoRA、Adapter等高效微调技术; 工具链: 熟练使用Transformers、PEFT、vLLM等主流大模型工具库; 3. 数据与评估能力: 深刻理解数据对于模型的重要性,能够独立完成训练集/测试集的构建工作流; 熟悉针对大模型生成任务的自动评估指标(如BLEU, ROUGE)和人工评估方法,能够设计合理的测试集来发现模型短板; 4. 基础理论与框架 基础模型: 扎实的深度学习基础,熟悉常见的网络结构(如Transformer, BERT, ResNet, LSTM等); 多模态认知: 具备NLP或CV的基本项目经验,能够根据需求快速搭建 baseline 模型; 编程框架: 精通Python,熟练掌握PyTorch或TensorFlow; 5.有在边缘端部署大模型的经验;在GitHub上有高质量开源项目,或参与过知名大模型的社区贡献;熟悉ONNX、TensorRT等推理加速引擎优先。

