logologo
寻找工作
2026-06-18 更新

北京三快在线科技有限公司

互联网平台 · 民营企业 · 成立15年
简章详情

公司简介:

美团的使命是“帮大家吃得更好,生活更好”。作为中国生活服务电子商务平台,公司拥有美团、大众点评、美团外卖、美团打车、摩拜单车等消费者熟知的App,服务涵盖餐饮、外卖、打车、共享单车、酒店旅游、电影、休闲娱乐等200多个品类,业务覆盖全国2800个县区市。2018年Q3,美团的总交易金额达1457亿元人民币,同比增加40%。截至2018年9月30日止过去十二个月,美团年度交易用户总数达3.8亿,平台活跃商家总数达550万。2018年9月20日,美团点评(股票代码:3690.HK)正式在港交所挂牌上市。当前,美团战略聚焦 Food + Platform,正以“吃”为核心,建设生活服务业从需求侧到供给侧的多层次科技服务平台。与此同时,美团正着力将自己建设成为一家社会企业,希望通过和党政部门、高校及研究院所、主流媒体、公益组织、生态伙伴等的深入合作,构建智慧城市,共创美好生活。

在招职位如下:

前端开发工程师

工作城市:北京
薪资:8k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
岗位职责:
1. 负责客户端/前端开发工作,参与履约平台技术部相关业务开发;
2. 积极应用AI工具(如Claude Code、OpenClaw、Cursor等)提升开发效率与代码质量;
3. 参与到家事业群前端技术体系建设与优化,支持业务快速迭代;
4. 组内技术栈丰富,包括 react native,web,小程序;
5. 有 Android/iOS/鸿蒙 原生开发经验更佳

任职要求:
1. 熟悉前端或客户端开发技术栈,具备相关项目实践经验;
2. 具备较强的学习能力,能够快速掌握并落地前沿AI开发工具;
3. 对技术有热情,具备良好的沟通协作能力,适应团队技术发展节奏



【北斗】广告大模型训练推理工程师

工作城市:北京
薪资:50k-80k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
岗位职责:
1.生成式广告训练系统设计:基于前沿大模型(如Transformer、HSTU等),设计生成式推荐模型的分布式训练框架,优化数据/模型的高效并行处理和混合精度训练策略。
2.高性能推理引擎建设:既有大稀疏(Embedding),又有大稠密(LLM)的模型结构下,优化延迟、吞吐量和显存占用,支持千亿/万亿参数模型的实时推理需求。
3.低进度优化:基于结构化和非结构化模型进行低进度训推协同优化,从源头解决模型性能与精度的平衡难题。
4.广告链路端到端重塑:超长行为序列与超大候选Item情况下,优化传统的多阶段网络传输架构,需要一体化硬件支撑的召回/排序/机制统一服务。
任职要求:
1. 工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目,熟悉PyTorch、Megatron、vLLM/SGLang等机器学习框架,有大规模分布式系统开发经验。
2. 竞赛大神:在ACM-ICPC(国际大学生程序设计竞赛)、Kaggle、数学建模竞赛(如MCM/ICM)、奥赛(数学、物理、信息学等)等取得显著成绩。
3. 学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。重点关注ICLR,NeurIPS,ACL, EMNLP, ICML, TPAMI, TASLP, TKDD上有一作论文的候选人。
4. 社区达人:社区(github、知乎、CSDN等)活跃者、有开源项目并被较多引用者优先。

【北斗】多模态理解后训练+Agent算法研究员

工作城市:北京
薪资:60k-90k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
岗位职责

我们正在构建具备物理世界感知、理解、仿真能力与支撑数字世界高质量呈现的本地生活视觉技术引擎,让每一次连接更智能,让物理世界的烟火气更美好。

团队介绍:

作为美团官方的视觉AI基础模型团队,负责数字世界和物理世界等本地生活全场景多模态技术的前沿探索和应用,在AIGC生成、虚拟人交互、多模态理解等领域持续沉淀行业领先的技术成果。

研究方向包括但不限于:

1、基于多模态预训练和后训练相关技术创新,提升多模态大模型在OCR、文档图表解析、Visual Grounding、细粒度感知、视觉问答等核心视觉理解任务上的能力上限;

2、索多模态强化学习方案创新设计,实现视觉感知、多模态理解等场景下的高性能可信输出和幻觉抑制;

3、增强模型的视觉推理能力(Visual CoT、PRM等)、工具调用与Agent能力、长上下文视觉理解能力和GUI能力,提升模型在视觉感知、理解、规划决策的长程复杂任务上的综合表现。

任职要求

1、具备视觉多模态大模型的预训练或后训练研究经历;

2、熟悉PyTorch,有充分的动手实践经验。

加分项:

1、社区影响力:在多模态大模型领域有影响力的开源项目中做出过核心贡献

2、学术影响力:发表过高水平论文(如ICLR、CVPR、ICCV等),有相关竞赛经历并取得名次

岗位吸引力:

1、依托本地生活领域海量的物理世界数字化和线上多模态信息重构任务,提升模型的视觉多模态理解能力上限。

2、立足美团本地生活应用场景,布局前沿的多模态决策智能路线,驱动长程复杂视觉任务中的表现优化和标杆级视觉Agent应用。

工作城市

北京市、上海市、深圳市



【27届北斗】广告大模型应用算法工程师

工作城市:上海
薪资:50k-80k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【岗位职责】
广告系统目前正站在从多级漏斗到端到端大模型的范式跃迁起点,传统的多级漏斗架构(召回→粗排→精排→混排)因各阶段目标割裂、信息截断,存在系统性效率损耗。随着 LLM 表征能力与 Scaling 特性日趋成熟,以端到端生成式模型统一广告全链路决策已成为行业的核心探索方向。本岗位面向美团广告 OneModel 方向,核心任务是研究并落地端到端广告大模型,以统一大模型完成从用户行为信号到最终展示序列的全链路决策,最大化用户体验和平台收益。
【核心研究方向】
1. 端到端广告大模型架构设计。基于 Causal Transformer、MLA、MoE 等架构技术,设计突破多级漏斗限制的端到端广告决策框架,支持融合用户行为序列与实时上下文、直接输出具备位置价值感知的展示序列;探索 Semantic ID、动态候选索引等广告生成式检索关键技术。
2. 广告场景多阶段训练范。结合广告数据稀疏特性,设计"海量用户交互 pre-training + 多目标商业价值 post-training"的分阶段训练体系;研究适配广告约束的 RLHF/价值对齐方法,在用户体验与平台收益之间建立可持续的优化路径。
3. 广告场景 Scaling Law 研究。探索广告场景下"参数量/数据规模/训练算力 → 业务效果"的转化规律;研究 inference-time scaling、process reward model 等推理阶段增效方向,推动团队迭代范式从人工特征设计向算力驱动跃迁。
【任职要求】
1. 本科及以上学历,计算机、人工智能、数学、统计学等相关专业优先;
2. 在搜广推、大语言模型、序列建模、强化学习等一个或多个方向具有系统性研究积累,并有工业级落地经验;
3. 在 KDD、SIGIR、WWW、NeurIPS、ICML、ICLR、ACL、EMNLP 等国际顶级会议有论文发表,或主导过具有行业影响力的工业级算法系统研发;
4. 熟悉 Python 或 C++,具备大规模分布式训练与在线推理系统的独立研发能力;有千亿参数级模型训练经验者优先;

具备出色的问题分析与拆解能力,具有强烈的自驱力,能在模糊问题空间中独立探索并推进方案落地者优先。

【27届北斗计划】广告大模型算法工程师

工作城市:上海
薪资:50k-80k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【课题说明】
1. 广告系统长期采用"召回→粗排→精排→出价→拍卖"的多级漏斗架构,各模块独立优化导致目标不一致,前链路制约后链路上限,漏斗效率折损大。
2. 随着大模型与生成式技术的快速发展,工业界已在端到端生成式广告方向进行了系统性布局,验证了生成式框架在候选生成、全链路排序、创意生成和机制设计等环节的技术可行性,其强大的表征能力和良好的Scaling特性为广告系统的范式跃迁提供了新的可能性。本研究旨在探索如何利用生成式技术重塑整个广告系统,通过端到端的生成式广告大模型完成所有决策,打破多级漏斗框架,打开模型联合决策空间。

【建议研究方向】
1. 生成式召回:突破传统检索范式,探索广告场景下的生成式候选生成方案,包括层次化语义ID设计(RQ-VAE/VQ-VAE)、以及召回与排序联合端到端优化。
2. 生成式预估:设计支持大规模候选端到端打分的生成式排序框架,探索"预训练+业务对齐(RLHF/DPO)"的分阶段训练范式,解锁广告模型的Scaling规律,驱动系统从人工调参向算力堆叠迭代跃迁。
3. 生成式创意:基于多模态大模型实现广告创意的自动生成与动态组合,结合用户实时意图的个性化创意定制,以及创意与广告主商业目标的对齐优化,提升创意与用户的匹配深度。
4. 生成式机制:构建端到端可学习的广告拍卖机制,将出价、分配、计费纳入统一生成框架,建模广告外部性(排列位置、上下文交互对转化率的影响),在保证近似激励相容性(IC)的同时最大化平台RPM。



【北斗】多模态后训练及Agent能力研究员

工作城市:北京
薪资:45k-75k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
岗位职责
我们致力于用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升,依托生活服务领域多样化且复杂的业务场景,聚焦基座技术与公司战略级应用方向的深度融合,持续推动前沿技术的落地,同时积极探索和挑战技术的无人区,不断定义并刷新行业的最先进技术标准。
1、跟踪SFT/DPO/GRPO等后训练前沿方法,快速完成技术预研与可行性验证
2、面向多轮交互、长序列推理等复杂场景进行垂域数据建设与指令微调
3、建设后训练评估体系与数据飞轮,驱动评测-数据-训练闭环迭代
4、探索多模态大模型与Claude Code/OpenClaw深度结合,研究工具调用与多步规划能力边界
任职要求
【岗位要求】
1、对前沿技术有强烈探索欲,有出色的团队协作精神
2、有OpenClaw/Claude Code深度使用经验与产出优先
3、发表过顶级会议文章(NeurIPS/ICML/ICLR/ACL/Interspeech/ICASSP等)优先
4、ACM竞赛获奖者优先
【岗位吸引力】
1、交叉前沿赛道:聚焦多模态大模型、Agent 等核心方向,探索技术边界——不只是执行,你可以主导关键技术模块的设计与落地
2、顶级研究氛围 + 充足资源保障:团队26年上半年在ICML/ICLR/ACL/EMNLP发表论文9篇,与顶尖高校长期联合研究;充足GPU集群 + Token供给,实验不被资源卡脖子
3、AI-Native 研发文化:团队把 AI 当日常工具,用它加速研究的同时,也把"怎么用好 AI"本身当作研究课题——不设条条框框,鼓励大胆尝试
工作城市
北京市

【北斗】下一代Agent前沿技术研究员

工作城市:北京
薪资:45k-75k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
岗位职责
我们致力于用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升,依托生活服务领域多样化且复杂的业务场景,聚焦基座技术与公司战略级应用方向的深度融合,持续推动前沿技术的落地,同时积极探索和挑战技术的无人区,不断定义并刷新行业的最先进技术标准。
1、更聪明:通过Agentic RL、自适应推理等技术提升Agent长程规划与自我纠错能力
2、好复用:探索Skill的表示、组织与调度机制,让能力可组合可进化
3、低成本:攻克推理成本控制、上下文治理与长期记忆等核心难题
4、能应用:从0到1探索C端Agent社区等产品
任职要求
【岗位要求】
1、有好奇心,敢想敢做,学习能力强,具备复杂问题深度思考与拆解能力
2、顶会论文(ACL/EMNLP/NeurIPS/ICLR/KDD等)、开源贡献或算法竞赛成果突出者优先
3、有OpenClaw/Claude Code深度使用经验与产出优先
4、GitHub高Star AI原生项目或向OpenClaw/OpenCode提交过核心PR者优先
【岗位吸引力】
1、聚焦下一代Agent核心技术:聚焦Agentic RL、自适应推理、长程规划与自我纠错、Skill体系、Agent架构、推理成本优化等——这是当前Agent从"能用"到"好用"的核心技术壁垒,也是全球顶级研究团队正在攻坚的方向
2、顶会学术氛围:团队同学26年上半年在ICML/ICLR/ACL/EMNLP等顶会发表论文9篇,与多所顶尖高校保持长期联合研究,内部有完善的学术氛围
3、资源与自由度双保证:充足GPU集群 + Token供给,不以短期业务KPI为导向,共同商定研究问题,弹药和方向都不是瓶颈
工作城市
北京市、上海市



美团跑腿-商家运营

工作城市:成都
薪资:10k-13k
学历要求:本科,硕士,博士
岗位性质:全职
岗位描述:
【美团正编,双休、六险一金;无需新签陌拜商家,主要针对存量商户进行提频和长期合作维护】
工作内容:
负责所在区域的商户拓展工作,包括:
1、执行公司的销售策略和政策,达成业绩目标;
2、商户开发、激活和维护,拓展和维护新老商户,与各商户建立长期稳定的区域商户关系,并不断开拓业务渠道;
3、收集并分析所在区域市场信息,发现问题并提出相应解决方案;
4、协助制定符合提升跑腿业务的营销方案,对负责区域内指定品类订单和远单订单有明显提升。

任职要求:
1、本科以上学历,***销售经验,有互联网物流销售或同城配送相关从业经验者优先考虑;
2、具备较强的人际沟通能力,认真负责,对目标有强烈的达成意向;
3、较快融入团队,精力充沛,具备出色完成任务的能力;
4、熟悉电脑操作,熟练使用各类办公软件。



【北斗-27应届】大模型训推引擎工程师

工作城市:北京
薪资:60k-90k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【愿景】
打造全球领先的本地生活智能平台,让每一次搜索和推荐都精准理解用户需求,从被动匹配走向主动认知推理。我们致力于成为大模型在搜索与推荐场景落地的标杆团队,推动行业从传统深度模型向生成式智能的范式跃迁,用AI能力重新定义下一代生活服务入口。

【你将参与】
方向一:面向Agent RL的LLM分布式后训练系统
1.多模态与超长上下文训练优化:针对万级以上超长序列(Long Context)及多模态输入,研究高效的上下文并行(CP/SP)、序列并行策略及分布式通信拓扑,优化内存足迹,支撑长文本与复杂多模态后训练。
2.计算资源弹性调度与容错容灾:研究超大规模集群下的弹性训练技术(Elastic Training),实现节点动态加入/退出、无感故障自动恢复(Fault Tolerance)与训练超参数自动寻优,提升集群算力有效利用率(MFU)。
3.Agent RL算法基础设施:构建面向Agent强化学习的高效Rollout引擎、多模型(Policy/Value/Reward/Reference)多阶段流水线编排及动态负载均衡机制;设计并建设支持高并发、低延迟的工具调用(Tool-use)虚拟环境/沙箱模拟器交互系统。
4.训推一致性协同设计(Co-design):打通训练与推理底层架构,研究在后训练阶段(如在线RL、Iterative DPO)如何实现训练框架与高性能推理引擎的深度融合,降低在线反馈延迟,实现训推一体化高效演进。

方向二:大模型高效推理与加速技术
1.面向Agent场景的动态推理架构:针对Agent多轮对话、工具调用等复杂交互带来的极致动态性,研究智能KV Cache管理优化策略(如动态复用、分级存储、长短时记忆重组),解决长序列及高并发下的显存瓶颈。
2.极致模型压缩:研究前沿的模型压缩技术,包括先进的高比例量化(INT4/FP4/低比特混合精度)、结构化/非结构化稀疏(Sparsity),并开发对应的硬件友好型Mega算子,压榨硬件极限性能。
3.下一代投机采样技术: 深入研究并落地最前沿的解码加速技术,包括Draft-Target分离部署架构、Structured Speculative Decoding等异构投机采样方案;探索多Token预测(MTP)在线联合验证、无轻量模型依赖的自投机(Self-Speculative)等免草稿模型加速路径。
4.前沿推理系统深度开发:跟踪并引领AI Infra业界最新进展,深度参与并优化主流开源推理框架,进行架构级的核心代码重构、极致的通信优化与算子融合,推动最新infra成果在核心业务的高效落地。

【任职资格】
必备项:
1.2027届本科及以上学历,计算机、人工智能等相关专业;
2.具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C/C++或Python编程语言;
3.学习能力强,对AI Infra方向有技术热情,富有极客精神;
4.具备扎实的机器学习和深度学习基础,熟悉GPU、NPU硬件架构,熟悉CUDA,CCL,RDMA或者任意机器学习DSL;
5.具有良好的沟通协作能力,工作积极主动。
加分项:
1.具备有影响力的大规模分布式系统、高性能计算项目经验;
2.在OSDI、SOSP、NSDI、MLSys、ICML、ICLR、NeurIPS等等顶级会议上有论文发表;
3.在高影响力开源项目(如vLLM/SGLang/Megatron/verl等)有核心代码贡献。

【为什么是我们】
1.顶级算力资源:超大规模GPU集群,充足的算力支持你的大胆想法;
2.极致技术挑战:工作内容直面AI Infra方向最前沿的技术问题;
3.强化开源影响:支持深度参与AI Infra方向顶级开源项目,建设开源社区影响力;
4.开放研究氛围:鼓励论文发表,支持参加顶会,与学术界保持紧密合作。

大模型推理系统工程师

工作城市:北京
薪资:25k-50k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
团队介绍:
基座大模型AI Infra团队,以支撑前沿基础模型持续演进为目标,面向大模型研发与生产全链路,构建高性能、高稳定性、可持续扩展的AI基础设施体系。围绕高效率实验平台、大规模训练生产能力,以及模型结构与芯片架构协同优化, 沉淀软硬一体、训推贯通的关键基础能力,提升模型迭代效率、训练资源利用率与系统上限。
岗位职责:
1)投机推理(Speculative Decoding),研究基于预测性执行的动态推理优化方法,参与设计低延迟推理框架,通过概率模型预生成候选序列以降低解码计算开销。
2)分布式系统优化,探索多节点协同推理中的通信-计算负载均衡策略,提出基于异构硬件的混合并行调度方案,实现吞吐量提升。
3)稀疏Transformer优化与模型压缩,通过稀疏Transformer优化以及模型压缩技术提升模型的计算效率。
4)算子优化,熟悉最新硬件架构的算子优化方法,通过更高效的算子优化模型的吞吐和延时。
任职要求:
1.熟悉PyTorch等深度学习框架。
2.熟悉sglang、vLLM、trt-llm、FasterTransformer等开源框架。
3.能够熟练掌握Python、C++、CUDA等开发语言中的一种。
4.有比较强的数据结构、算法和统计分析、数学建模的能力。
加分项:
1.有大厂相关实习经历;
2.有优秀的科研成果。

【北斗-27应届】推荐大模型算法工程师

工作城市:北京
薪资:60k-90k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【愿景】
美团推荐系统日均处理数十亿次请求,是国内规模最大、场景最复杂的本地生活推荐引擎之一。当 Scaling Law 在语言模型上的成功已被充分验证,推荐系统正站在同等量级的范式跃迁临界点——我们已经落地了MTGR等具有影响力的推荐大模型成果;我们正在做的,是让推荐系统进一步进化,构建下一代生成式Agentic推荐系统。

【你将参与】
1.生成式推荐建模:探索具有 Scale Up 属性的端到端生成式推荐架构,突破传统判别式模型的效果天花板,对用户行为序列进行深度建模,全方位挖掘用户兴趣。
2.算法与工程协同:通过算法与系统的协同设计显著提升推荐链路 MFU 水平,解决大参数量模型在毫秒级在线服务下的效果-性能平衡难题。
3.Agentic Recommendation:打破传统协同过滤的被动匹配局限,设计具备领域专家经验、推理能力与主动规划能力的推荐 Agent,探索意图理解驱动的下一代推荐范式。
4.多模态内容理解:融合文本、图像、用户行为等多模态信号,构建统一表征体系,支撑跨业务线的个性化推荐能力复用。

【任职资格】
必要条件:
1.2027届本科及以上学历,计算机/人工智能/统计学等相关专业;
2.具备扎实的机器学习与深度学习理论基础;
3.具有优秀的科研能力与工程实现能力,在搜索、推荐或者大模型等方向具备有影响力的研究和落地成果。
加分项:
1.在 WWW/KDD/SIGIR/NeurIPS/ICML/ICLR 等顶会有较为丰富的论文成果;
2.ACM/ICPC、Kaggle 等竞赛获奖经历。

【为什么是我们】
1.顶级算力与数据:千卡 GPU 集群 + 亿级真实用户行为数据;
2.直接业务影响:服务于美团全平台亿级用户,技术价值即刻可见;
3.跨领域研究前沿:LLM × Recommendation 是当前最前沿的交叉研究方向,与学术界保持深度合作;
4.成长赛道稀缺:推荐大模型复合人才极度稀缺,在此领域积累的竞争壁垒将成为职业发展的强力护城河。

【北斗-27应届】大模型算法工程师

工作城市:北京
薪资:60k-90k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【愿景】
美团搜索服务日均处理数亿次查询,我们正在经历从“统计匹配”向“认知推理”的 Search 3.0 跨越。你将不仅是算法的优化者,更是搜索基座和业务应用的构建者(Builder)。通过构建高泛化、可扩展的算法基座,支撑医药、闪购等多元业务线的智能化升级,定义下一代生活服务搜索的本质规律。

【你将参与】
你将直接优化影响数亿用户的核心搜索链路,用大模型技术解决搜索的关键瓶颈。
1.意图理解基座:超越传统的分类与匹配,利用 LLM 构建具备认知能力的意图基座,深度解构口语化、省略表达及多意图混合等复杂场景。探索 Query 的语义改写、扩展与纠错技术,将非结构的“人话”精准转化为结构化的搜索逻辑,实现对用户深层需求的本质洞察。
2.排序预估基座:推动排序模型的 Scaling Up,探索大参数量模型在 Relevance 判断与 Ranking 中的性能边界,提升对复杂 Query-POI 关系的建模深度。负责 LLM-based Reranking、特征增强及神经符号 AI 的结合,利用 Scaling Law 提升排序逻辑的泛化性与预估精度。
3.生成式召回基座:构建基于大模型的语义表示学习体系,突破长尾 Query 与 POI 的匹配瓶颈。优化向量召回与混合召回策略,在海量候选集中精准平衡相关性、多样性与发现感,实现“所想即所得”。
4.引导增长基座: 研发下一代搜索引导与推荐算法,通过生成式技术优化搜索前/中的用户路径,提升用户发现价值的效率。探索搜索与推荐的深度融合,利用 AI Agent 能力引导用户决策,实现业务增长与用户体验的协同进化。
5.跨业务 Builder 型组织建设:作为 Builder,构建跨业务(餐饮、医药、即时零售、服务零售、酒旅等)的通用算法框架,确保技术底座能够快速适配不同垂直场景的特性。在毫秒级延迟的严苛约束下,主导大模型在线 Serving 优化,通过蒸馏、量化、缓存等手段实现效果与性能的极致平衡。

【任职资格】
1.有搜索、推荐、NLP相关实习或项目经验;
2.熟悉大模型训练、微调、prompt engineering等技术;
3.在KDD、SIGIR、WWW、ACL、EMNLP等顶会发表论文;
4.有向量检索、dense retrieval、reranking等方向研究经验;
5.ACM/ICPC、Kaggle等竞赛获奖者;
6.对本地生活场景有深入理解。

【为什么是我们】
1.顶级算力资源:千卡级GPU集群,充足的算力支持你的大胆想法;
2.海量真实数据:日均数亿次搜索query,覆盖全场景的本地生活数据;
3.极致技术挑战:毫秒级响应、亿级索引、复杂意图理解的工程难题;
4.直接业务影响:你的算法创新将服务数亿用户,快速验证技术价值;
5.开放研究氛围:鼓励论文发表,支持参加顶会,与学术界保持紧密合作;
6.成长空间广阔:搜索×大模型交叉领域,技术深度与业务广度兼具。

【北斗-27应届】Agent算法研究员

工作城市:北京
薪资:60k-90k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
【我们的愿景】
打造全球领先的本地生活智能平台,让每一次搜索和推荐都精准理解用户需求,从被动匹配走向主动认知推理。我们致力于成为大模型在搜索与推荐场景落地的标杆团队,推动行业从传统深度模型向生成式智能的范式跃迁,用AI能力重新定义下一代生活服务入口。

【你将参与】
方向一:个性化自进化与主动探索算法机制
1、探索与利用权衡:负责设计前沿的主动探索训练目标与触发机制,引入不确定性感知等机制,使Agent能够根据当前交互状态,上下文历史自主判断自适应进化方向;
2、高价值信息捕获:在极低用户打扰的约束下,设计高效的主动追问与澄清策略,精准,主动地获取用户深层高价值偏好信息。

方向二:多轮交互奖励建模与 RL策略优化
1、长期价值奖励建模:负责构建面向长期交互与用户留存的奖励模型体系,将用户显式反馈(追问,点击)与隐式行为(停留,改写)转化为高置信度的显式/隐式奖励信号;
2、强化学习策略对齐:运用先进的强化学习算法(如PPO, GRPO, 在线/交互式RL),优化模型在多轮对话与AI搜索场景下的样本效率与收敛性。基于严谨的理论框架(如收敛性保证,遗憾界分析),指导算法的原则性设计,确保策略在复杂,长尾多场景迁移时的可解释性与可靠性。

方向三:Agent闭环体系建设与全链路落地
1、可插拔个性化内化模块:研发高容量,强泛化性的个性化信息内化与记忆模块,动态攻克信息更新频率与偏好识别精度之间的权衡难题。

【我们希望你】
1、2027届本科及以上学历,计算机,人工智能等相关专业;
2、在大模型后训练等方面有深入实践,具备较强的动手能力;
3、扎实的深度学习和计算机理论基础,精通主流深度学习框架(如Tensorflow, Pytorch);
4、具备强悍的工程思维和代码能力,熟练使用 Python/C++等编程语言。

【加分项】
1、在ICLR/ICML/NIPS/ACL/CVPR等国际顶会有论文发表经历优先;
2、优秀的分析,解决问题能力,对AGI的未来趋势与挑战有浓厚兴趣;
3、对解决挑战性问题充满激情,较强的责任心,主动性和韧性,能良好的沟通协作。

【为什么选择我们】
1、拥有业界一流的团队,成员大多来自国内外名校,团队内有多位北斗、博士,可全方位支持前沿技术研究;
2、核心业务支撑,参与前沿的大型模型技术研究和落地,探索大模型技术在实际业务场景中的应用;
3、当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快;
4、创新型团队扁平化管理,研究成果直接连接数亿用户的实际生活。

鼠鼠求职首页