北京阶跃星辰智能科技有限公司_2026校园招聘最新信息

公司简介：

北京阶跃星辰智能科技有限公司成立于2023-05-17，法定代表人为李璟，注册资本为100万元，统一社会信用代码为91110108MACK6CK69Q，企业注册地址位于北京市海淀区苏州街3号9层902，所属行业为科技推广和应用服务业，经营范围包含：一般项目：技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广；人工智能行业应用系统集成服务；人工智能应用软件开发；信息系统集成服务；人工智能理论与算法软件开发；人工智能基础软件开发；人工智能双创服务平台；软件开发；人工智能通用应用系统；人工智能硬件销售；互联网数据服务；人工智能公共数据平台；人工智能基础资源与技术平台；软件销售；计算机软硬件及辅助设备零售；互联网销售（除销售需要许可的商品）；信息技术咨询服务；信息系统运行维护服务。（除依法须经批准的项目外，凭营业执照依法自主开展经营活动）许可项目：第二类增值电信业务；互联网信息服务。（依法须经批准的项目，经相关部门批准后方可开展经营活动，具体经营项目以相关部门批准文件或许可证件为准）（不得从事国家和本市产业政策禁止和限制类项目的经营活动。）。企业当前经营状态为存续。

在招职位如下：

vibe coding实习生-北京

工作城市：北京
薪资：9k-15k
学历要求：硕士,博士
岗位性质：实习
岗位描述：

【岗位描述】 1.负责通用语言大模型的评测算法调研、优化、工程建设； 2.调研公开评测数据集、评测平台的实现细节和评估接入现有内部评测体系的成本； 3.负责接入内部/外部评测数据集、评测算法； 4.维护和优化现有评测算法、设计实现新的评测算法，以提高评测的客观性、合理性。【岗位要求】 1.国内外高校研究生在读，具有良好的计算机/数学基础； 2.熟悉现有的大模型评测方式，有大模型评测使用或开发经验； 3.熟悉大语言模型的算法架构，包括instructGPT, LLaMA等主流架构算法； 4.熟悉python使用，有语言模型方面开源项目/评测算法/web开发经验者优先。

【实习】Agent RL 算法研究员

工作城市：北京
薪资：9k-15k
学历要求：本科,硕士,博士
岗位性质：实习
岗位描述：

【岗位职责】 1. RL-enhanced LLM Agent：结合强化学习环境，构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。 2. Multi-Agent systems：研究多个智能体如何高效协作，以完成超越单个智能体能力范围的任务。 3. Omni-LLM-based Agent：开发融合文本、语音、图像多模态的智能体。 4. World Model：探索AI系统如何构建自身与外部世界的认知与期望模型。 5. 数据迭代流程优化：深入理解数据需求，推动人机协同的数据迭代流程，实现从人工到半自动化再到自动化的转变。【岗位要求】 1. 教育背景：国内外高校研究生在读，具备良好的计算机或数学基础，拥有较强的编码能力。 2. 技术背景：具有LLM（大语言模型）、强化学习、推理模型等相关背景，熟悉主流大语言模型的算法架构。 3. 对齐方法：了解Alignment领域的常用方法，包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。 4. 能力要求：具备卓越的实验分析与问题解决能力，拥有创新思维，能够进行良好的沟通，并与团队成员高效协作。 5. 实习时间：一周三天以上，实习时间3个月以上【加分项】 1. 深度学习基础：具备深度学习、机器学习的基础知识，熟悉有监督学习、自监督学习等基本训练范式。 2. 项目经验：在大语言模型方面有开源项目经验者优先，或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。 3. 竞赛奖项：在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。 4. 学术成果： ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先

【实习】Post-Train & Agent 算法工程师

工作城市：北京
薪资：9k-15k
学历要求：硕士,博士
岗位性质：实习
岗位描述：

【岗位描述】 1、研究实用的后对齐RL算法，打造稳定鲁棒的reasoning+agent的RL训练体系； 2、探索超大规模模型，并进行极致系统优化； 3、基础模型后训练端到端指标优化 4、Code Agent与通用Agent的数据建设和模型优化； 5、Agent真实应用场景的优化探索。【岗位要求】 1、国内外高校研究生在读，人工智能、计算机、自动化、数学相关专业优先； 2、扎实的机器学习基础，熟悉NLP、RL领域的技术，在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先； 3、优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先； 4、在大模型领域、Agent领域或RL领域，主导过大影响力的项目或论文者优先； 5、出色的问题分析和解决能力，能深入解决大模型训练和应用存在的问题，有自主探索解决方案的能力； 6、良好的沟通协作能力，能和团队一起探索新技术，推进技术进步。

鼠鼠求职首页