logologo
寻找工作
返回简章2026-06-25 更新

【基座模型】大模型测试开发工程师

北京
硕士及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述: 1. 深入理解语言、多模态大模型的原理及应用场景,设计算法评测方案,参与编写并执行算法评测工作,对算法的准确性、安全性等方面进行评估,记录并分析测试过程中出现的异常情况,撰写评测报告。 2. 协助开展性能测试、稳定性测试等工作,使用专业工具或自建工具模拟高并发场景,测试大模型在不同负载下的响应速度、吞吐量等性能指标,分析测试结果,产出测试报告。 3. 负责测试资产的整理与维护,包括迭代测试方案、构造测试数据集、归档测试报告等。 4. 对标国内外主流评测基准,基于行业通用 Benchmark 评测体系,搭建大模型 / 智能体算法基准测试框架,设计标准化评测数据集与指标体系,开展模型版本回归、准出验收与效果对比,输出 Benchmark 横向评测报告,支撑算法迭代与上线决策。 5. 学习并掌握大模型相关技术和测试方法,跟踪行业前沿动态,结合业务场景优化测试流程与方法,提升评测效率、精准度与整体质量。 职位要求: 1. 计算机、人工智能等相关专业,应届生有相关算法评测经验。 2. 具有优秀的代码能力,至少熟悉Java/Python中的一门编程语言,并能够使用相应的类库进行数据处理。 3. 对人工智能和大模型技术有一定了解,熟悉常见的大模型架构和工作原理,如 Transformer 架构、GPT 系列模型等。 4. 工作认真负责,注重细节,有良好的沟通协作能力,能够规范标准化执行结果产出物。