返回简章2026-06-25 更新

【基座模型】大模型测试开发工程师

北京

硕士及以上

计算机类·电子信息类

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述： 1. 深入理解语言、多模态大模型的原理及应用场景，设计算法评测方案，参与编写并执行算法评测工作，对算法的准确性、安全性等方面进行评估，记录并分析测试过程中出现的异常情况，撰写评测报告。 2. 协助开展性能测试、稳定性测试等工作，使用专业工具或自建工具模拟高并发场景，测试大模型在不同负载下的响应速度、吞吐量等性能指标，分析测试结果，产出测试报告。 3. 负责测试资产的整理与维护，包括迭代测试方案、构造测试数据集、归档测试报告等。 4. 对标国内外主流评测基准，基于行业通用 Benchmark 评测体系，搭建大模型 / 智能体算法基准测试框架，设计标准化评测数据集与指标体系，开展模型版本回归、准出验收与效果对比，输出 Benchmark 横向评测报告，支撑算法迭代与上线决策。 5. 学习并掌握大模型相关技术和测试方法，跟踪行业前沿动态，结合业务场景优化测试流程与方法，提升评测效率、精准度与整体质量。职位要求： 1. 计算机、人工智能等相关专业，应届生有相关算法评测经验。 2. 具有优秀的代码能力，至少熟悉Java/Python中的一门编程语言，并能够使用相应的类库进行数据处理。 3. 对人工智能和大模型技术有一定了解，熟悉常见的大模型架构和工作原理，如 Transformer 架构、GPT 系列模型等。 4. 工作认真负责，注重细节，有良好的沟通协作能力，能够规范标准化执行结果产出物。

职位来源

北京罗克维尔斯科技有限公司

民营企业 · 商业服务 · 成立8年

在招职位