公司简介:
北京阶跃星辰智能科技有限公司成立于2023-05-17,法定代表人为李璟,注册资本为100万元,统一社会信用代码为91110108MACK6CK69Q,企业注册地址位于北京市海淀区苏州街3号9层902,所属行业为科技推广和应用服务业,经营范围包含:一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;人工智能行业应用系统集成服务;人工智能应用软件开发;信息系统集成服务;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能双创服务平台;软件开发;人工智能通用应用系统;人工智能硬件销售;互联网数据服务;人工智能公共数据平台;人工智能基础资源与技术平台;软件销售;计算机软硬件及辅助设备零售;互联网销售(除销售需要许可的商品);信息技术咨询服务;信息系统运行维护服务。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)许可项目:第二类增值电信业务;互联网信息服务。(依法须经批准的项目,经相关部门批准后方可开展经营活动,具体经营项目以相关部门批准文件或许可证件为准)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)。企业当前经营状态为存续。在招职位如下:
vibe coding实习生-北京
工作城市:北京
薪资:9k-15k
学历要求:硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-15k
学历要求:硕士,博士
岗位性质:实习
岗位描述:
【岗位描述】 1.负责通用语言大模型的评测算法调研、优化、工程建设; 2.调研公开评测数据集、评测平台的实现细节和评估接入现有内部评测体系的成本; 3.负责接入内部/外部评测数据集、评测算法; 4.维护和优化现有评测算法、设计实现新的评测算法,以提高评测的客观性、合理性。 【岗位要求】 1.国内外高校研究生在读,具有良好的计算机/数学基础; 2.熟悉现有的大模型评测方式,有大模型评测使用或开发经验; 3.熟悉大语言模型的算法架构,包括instructGPT, LLaMA等主流架构算法; 4.熟悉python使用,有语言模型方面开源项目/评测算法/web开发经验者优先。
【实习】Agent RL 算法研究员
工作城市:北京
薪资:9k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
【岗位职责】 1. RL-enhanced LLM Agent:结合强化学习环境,构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。 2. Multi-Agent systems:研究多个智能体如何高效协作,以完成超越单个智能体能力范围的任务。 3. Omni-LLM-based Agent:开发融合文本、语音、图像多模态的智能体。 4. World Model:探索AI系统如何构建自身与外部世界的认知与期望模型。 5. 数据迭代流程优化:深入理解数据需求,推动人机协同的数据迭代流程,实现从人工到半自动化再到自动化的转变。 【岗位要求】 1. 教育背景:国内外高校研究生在读,具备良好的计算机或数学基础,拥有较强的编码能力。 2. 技术背景:具有LLM(大语言模型)、强化学习、推理模型等相关背景,熟悉主流大语言模型的算法架构。 3. 对齐方法:了解Alignment领域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。 4. 能力要求:具备卓越的实验分析与问题解决能力,拥有创新思维,能够进行良好的沟通,并与团队成员高效协作。 5. 实习时间:一周三天以上,实习时间3个月以上 【加分项】 1. 深度学习基础:具备深度学习、机器学习的基础知识,熟悉有监督学习、自监督学习等基本训练范式。 2. 项目经验:在大语言模型方面有开源项目经验者优先,或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。 3. 竞赛奖项:在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。 4. 学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先
【实习】Post-Train & Agent 算法工程师
工作城市:北京
薪资:9k-15k
学历要求:硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-15k
学历要求:硕士,博士
岗位性质:实习
岗位描述:
【岗位描述】 1、研究实用的后对齐RL算法,打造稳定鲁棒的reasoning+agent的RL训练体系; 2、探索超大规模模型,并进行极致系统优化; 3、基础模型后训练端到端指标优化 4、Code Agent与通用Agent的数据建设和模型优化; 5、Agent真实应用场景的优化探索。 【岗位要求】 1、国内外高校研究生在读,人工智能、计算机、自动化、数学相关专业优先; 2、扎实的机器学习基础,熟悉NLP、RL领域的技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先; 3、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 4、在大模型领域、Agent领域或RL领域,主导过大影响力的项目或论文者优先; 5、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力; 6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。

