公司简介:
小红书是年轻人的生活方式平台和消费决策入口,由毛文超和瞿芳于2013年在上海创立,致力于让全世界的好生活触手可及。在小红书,用户通过短视频、图文等形式标记生活点滴。截至2019年3月,小红书用户数超过2.2亿,并持续快速增长,其中70%用户是90后。在招职位如下:
大模型 GPU 调度研发工程师
工作城市:北京
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
工作职责
1、参与内部大模型平台 QuickSilver 的 GPU 资源调度与治理模块研发,完成调度策略、后端服务和资源可视化功能交付。
2、参与 Quota 管理、资源配额、资源申请、资源回收、资源出借等能力建设,支持多业务、多团队、多集群资源管理。
3、参与万卡规模 GPU 集群调度优化,围绕资源分配率、GPU 利用率、任务等待时长、资源碎片等指标提升集群效率。
4、参与训练、后训练、推理等负载下的弹性调度建设,探索潮汐调度、抢占调度、在线 / 离线混部、低峰缩容、高峰预扩容等策略。
5、参与多机房、多集群、多卡型、GPU / NPU 等异构资源调度能力建设,结合网络、存储、通信拓扑优化调度策略。
6、参与 GPU 资源可观测体系建设,并将调度能力与大模型训练、推理、部署、评估链路结合,提升 AI 生产效率和平台稳定性。
任职要求
1、计算机、软件工程、人工智能等相关专业在校生,具备扎实的编程基础和计算机系统基础。
2、熟悉 Go / Python / Java 中至少一门语言,具备良好的代码能力和工程实现意识。
3、熟悉 Linux,了解 Docker / Kubernetes 等云原生技术栈,对 K8s Scheduler、Volcano、Kueue、Kubeflow、Argo Workflows 等调度系统有兴趣或实践经验。
4、理解分布式系统基本概念,了解服务发现、资源隔离、任务调度、故障恢复、弹性伸缩、监控告警等能力。
5、对大模型训练、后训练、推理、部署等流程有兴趣,愿意理解不同 AI 负载对 GPU、网络、存储和调度策略的差异化诉求。
6、具备较好的数据分析、问题定位、沟通协作和自驱能力,能熟练使用 Cursor、Claude Code、GitHub Copilot 等 AI 工具辅助研发。
加分项
1、接触过 Kubernetes Scheduler、Volcano、Kueue、Kubeflow、Ray、OpenKruise、联邦集群等云原生或调度系统。
2、有 GPU 集群、资源调度、Quota 管理、资源利用率分析、在线 / 离线混部、抢占调度、潮汐调度、弹性伸缩等实践经验。
3、有大模型训练、推理、部署平台使用或开发经验,了解 PyTorch、DeepSpeed、Megatron、vLLM、SGLang 等框架。
4、了解 RDMA、IB、RoCE、NCCL、网络拓扑、存储性能等基础知识,理解其对大规模训练和推理调度的影响。
5、有优秀个人开源项目、技术博客,或曾利用 AI 工具独立交付云原生、调度、平台类项目。
6、有资源利用率分析、监控指标看板、任务画像分析、调度策略评估等经验,能通过数据驱动系统优化。
1、参与内部大模型平台 QuickSilver 的 GPU 资源调度与治理模块研发,完成调度策略、后端服务和资源可视化功能交付。
2、参与 Quota 管理、资源配额、资源申请、资源回收、资源出借等能力建设,支持多业务、多团队、多集群资源管理。
3、参与万卡规模 GPU 集群调度优化,围绕资源分配率、GPU 利用率、任务等待时长、资源碎片等指标提升集群效率。
4、参与训练、后训练、推理等负载下的弹性调度建设,探索潮汐调度、抢占调度、在线 / 离线混部、低峰缩容、高峰预扩容等策略。
5、参与多机房、多集群、多卡型、GPU / NPU 等异构资源调度能力建设,结合网络、存储、通信拓扑优化调度策略。
6、参与 GPU 资源可观测体系建设,并将调度能力与大模型训练、推理、部署、评估链路结合,提升 AI 生产效率和平台稳定性。
任职要求
1、计算机、软件工程、人工智能等相关专业在校生,具备扎实的编程基础和计算机系统基础。
2、熟悉 Go / Python / Java 中至少一门语言,具备良好的代码能力和工程实现意识。
3、熟悉 Linux,了解 Docker / Kubernetes 等云原生技术栈,对 K8s Scheduler、Volcano、Kueue、Kubeflow、Argo Workflows 等调度系统有兴趣或实践经验。
4、理解分布式系统基本概念,了解服务发现、资源隔离、任务调度、故障恢复、弹性伸缩、监控告警等能力。
5、对大模型训练、后训练、推理、部署等流程有兴趣,愿意理解不同 AI 负载对 GPU、网络、存储和调度策略的差异化诉求。
6、具备较好的数据分析、问题定位、沟通协作和自驱能力,能熟练使用 Cursor、Claude Code、GitHub Copilot 等 AI 工具辅助研发。
加分项
1、接触过 Kubernetes Scheduler、Volcano、Kueue、Kubeflow、Ray、OpenKruise、联邦集群等云原生或调度系统。
2、有 GPU 集群、资源调度、Quota 管理、资源利用率分析、在线 / 离线混部、抢占调度、潮汐调度、弹性伸缩等实践经验。
3、有大模型训练、推理、部署平台使用或开发经验,了解 PyTorch、DeepSpeed、Megatron、vLLM、SGLang 等框架。
4、了解 RDMA、IB、RoCE、NCCL、网络拓扑、存储性能等基础知识,理解其对大规模训练和推理调度的影响。
5、有优秀个人开源项目、技术博客,或曾利用 AI 工具独立交付云原生、调度、平台类项目。
6、有资源利用率分析、监控指标看板、任务画像分析、调度策略评估等经验,能通过数据驱动系统优化。
大模型 GPU 调度研发工程师
工作城市:上海
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
工作职责
1、参与内部大模型平台 QuickSilver 的 GPU 资源调度与治理模块研发,完成调度策略、后端服务和资源可视化功能交付。
2、参与 Quota 管理、资源配额、资源申请、资源回收、资源出借等能力建设,支持多业务、多团队、多集群资源管理。
3、参与万卡规模 GPU 集群调度优化,围绕资源分配率、GPU 利用率、任务等待时长、资源碎片等指标提升集群效率。
4、参与训练、后训练、推理等负载下的弹性调度建设,探索潮汐调度、抢占调度、在线 / 离线混部、低峰缩容、高峰预扩容等策略。
5、参与多机房、多集群、多卡型、GPU / NPU 等异构资源调度能力建设,结合网络、存储、通信拓扑优化调度策略。
6、参与 GPU 资源可观测体系建设,并将调度能力与大模型训练、推理、部署、评估链路结合,提升 AI 生产效率和平台稳定性。
任职要求
1、计算机、软件工程、人工智能等相关专业在校生,具备扎实的编程基础和计算机系统基础。
2、熟悉 Go / Python / Java 中至少一门语言,具备良好的代码能力和工程实现意识。
3、熟悉 Linux,了解 Docker / Kubernetes 等云原生技术栈,对 K8s Scheduler、Volcano、Kueue、Kubeflow、Argo Workflows 等调度系统有兴趣或实践经验。
4、理解分布式系统基本概念,了解服务发现、资源隔离、任务调度、故障恢复、弹性伸缩、监控告警等能力。
5、对大模型训练、后训练、推理、部署等流程有兴趣,愿意理解不同 AI 负载对 GPU、网络、存储和调度策略的差异化诉求。
6、具备较好的数据分析、问题定位、沟通协作和自驱能力,能熟练使用 Cursor、Claude Code、GitHub Copilot 等 AI 工具辅助研发。
加分项
1、接触过 Kubernetes Scheduler、Volcano、Kueue、Kubeflow、Ray、OpenKruise、联邦集群等云原生或调度系统。
2、有 GPU 集群、资源调度、Quota 管理、资源利用率分析、在线 / 离线混部、抢占调度、潮汐调度、弹性伸缩等实践经验。
3、有大模型训练、推理、部署平台使用或开发经验,了解 PyTorch、DeepSpeed、Megatron、vLLM、SGLang 等框架。
4、了解 RDMA、IB、RoCE、NCCL、网络拓扑、存储性能等基础知识,理解其对大规模训练和推理调度的影响。
5、有优秀个人开源项目、技术博客,或曾利用 AI 工具独立交付云原生、调度、平台类项目。
6、有资源利用率分析、监控指标看板、任务画像分析、调度策略评估等经验,能通过数据驱动系统优化。
1、参与内部大模型平台 QuickSilver 的 GPU 资源调度与治理模块研发,完成调度策略、后端服务和资源可视化功能交付。
2、参与 Quota 管理、资源配额、资源申请、资源回收、资源出借等能力建设,支持多业务、多团队、多集群资源管理。
3、参与万卡规模 GPU 集群调度优化,围绕资源分配率、GPU 利用率、任务等待时长、资源碎片等指标提升集群效率。
4、参与训练、后训练、推理等负载下的弹性调度建设,探索潮汐调度、抢占调度、在线 / 离线混部、低峰缩容、高峰预扩容等策略。
5、参与多机房、多集群、多卡型、GPU / NPU 等异构资源调度能力建设,结合网络、存储、通信拓扑优化调度策略。
6、参与 GPU 资源可观测体系建设,并将调度能力与大模型训练、推理、部署、评估链路结合,提升 AI 生产效率和平台稳定性。
任职要求
1、计算机、软件工程、人工智能等相关专业在校生,具备扎实的编程基础和计算机系统基础。
2、熟悉 Go / Python / Java 中至少一门语言,具备良好的代码能力和工程实现意识。
3、熟悉 Linux,了解 Docker / Kubernetes 等云原生技术栈,对 K8s Scheduler、Volcano、Kueue、Kubeflow、Argo Workflows 等调度系统有兴趣或实践经验。
4、理解分布式系统基本概念,了解服务发现、资源隔离、任务调度、故障恢复、弹性伸缩、监控告警等能力。
5、对大模型训练、后训练、推理、部署等流程有兴趣,愿意理解不同 AI 负载对 GPU、网络、存储和调度策略的差异化诉求。
6、具备较好的数据分析、问题定位、沟通协作和自驱能力,能熟练使用 Cursor、Claude Code、GitHub Copilot 等 AI 工具辅助研发。
加分项
1、接触过 Kubernetes Scheduler、Volcano、Kueue、Kubeflow、Ray、OpenKruise、联邦集群等云原生或调度系统。
2、有 GPU 集群、资源调度、Quota 管理、资源利用率分析、在线 / 离线混部、抢占调度、潮汐调度、弹性伸缩等实践经验。
3、有大模型训练、推理、部署平台使用或开发经验,了解 PyTorch、DeepSpeed、Megatron、vLLM、SGLang 等框架。
4、了解 RDMA、IB、RoCE、NCCL、网络拓扑、存储性能等基础知识,理解其对大规模训练和推理调度的影响。
5、有优秀个人开源项目、技术博客,或曾利用 AI 工具独立交付云原生、调度、平台类项目。
6、有资源利用率分析、监控指标看板、任务画像分析、调度策略评估等经验,能通过数据驱动系统优化。
分布式KVCache研发工程师
工作城市:杭州
薪资:11k-12k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:11k-12k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
工作职责
1、负责面向多轮对话、多模态等场景的大规模KVCache研发,实现AI推理阶段以查代算
2、探索软硬一体化、推理框架KVCache Manager的元数据卸载等极致的性能加速手段
3、学习和吸纳业界优秀技术成果,积极探索和拓展创新的产品能力,构建行业第一梯队的产品和服务;
任职资格
1、计算机相关专业,熟练使用AI coding类工具,具备扎实的工程能力并有成型的作品;
2、有Redis、KV数据库、表格数据库、全闪存高性能分布式存储等产品相关经验者优先;
3、具备良好的分析和解决问题能力,对技术有强烈的好奇心和热情,具备优秀的自驱力和心力;
4、具备良好的英文写作能力,熟练阅读英文论文,有科研经验或顶会Paper发表者优先
1、负责面向多轮对话、多模态等场景的大规模KVCache研发,实现AI推理阶段以查代算
2、探索软硬一体化、推理框架KVCache Manager的元数据卸载等极致的性能加速手段
3、学习和吸纳业界优秀技术成果,积极探索和拓展创新的产品能力,构建行业第一梯队的产品和服务;
任职资格
1、计算机相关专业,熟练使用AI coding类工具,具备扎实的工程能力并有成型的作品;
2、有Redis、KV数据库、表格数据库、全闪存高性能分布式存储等产品相关经验者优先;
3、具备良好的分析和解决问题能力,对技术有强烈的好奇心和热情,具备优秀的自驱力和心力;
4、具备良好的英文写作能力,熟练阅读英文论文,有科研经验或顶会Paper发表者优先
ai应用工程师
工作城市:上海
薪资:9k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
1、参与构建业界领先的商业运营平台,负责架构/设计与开发,帮助销售/运营/代理商提升客户(广告主与商家)服务能力;
2、参与推动AI的落地,结合对商业的深入理解,将最新的AI技术应用到平台中,不断提升客户的商业效率与效果;
3、参与复杂系统的架构演进,持续在交付效率、稳定性、性能、成本追求卓越;
4、数据驱动、技术驱动,通过科学分析与技术创新为业务发展提供有效判断与决策依据。
任职要求:
1、本科及以上学历,计算机理论扎实,良好的Java/Type script/Java script开发习惯,熟悉Spring生态/React;
2、关注AI发展,且在AI infra、后训练(SFT/RLHF/DPO/CPT等)、AI应用(Agent / Multi-Agent / Openclaw)、AI coding(vibe/spec/SDD)某一方面有深入思考/实践;
3、具备一定的系统架构能力,有广告/电商/大数据领域的复杂平台经验者优先;
4、良好的协同,持续学习,喜欢思考,对行业有热情。
2、参与推动AI的落地,结合对商业的深入理解,将最新的AI技术应用到平台中,不断提升客户的商业效率与效果;
3、参与复杂系统的架构演进,持续在交付效率、稳定性、性能、成本追求卓越;
4、数据驱动、技术驱动,通过科学分析与技术创新为业务发展提供有效判断与决策依据。
任职要求:
1、本科及以上学历,计算机理论扎实,良好的Java/Type script/Java script开发习惯,熟悉Spring生态/React;
2、关注AI发展,且在AI infra、后训练(SFT/RLHF/DPO/CPT等)、AI应用(Agent / Multi-Agent / Openclaw)、AI coding(vibe/spec/SDD)某一方面有深入思考/实践;
3、具备一定的系统架构能力,有广告/电商/大数据领域的复杂平台经验者优先;
4、良好的协同,持续学习,喜欢思考,对行业有热情。
【27届实生】PE产品工程师(AI与全栈方向)
工作城市:北京
薪资:7k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:7k-15k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
小红书社区工程团队正在寻找一群 “AI时代的原生工程师” —— 你们不仅是写代码的人,更是用 AI 赋能创造力、直接面向产品交付价值的超级个体。
工作内容:
1、系统性专业培训:参与定制的技术课程,系统掌握AI原生应用开发、端到端全栈技术及业务思维方法论,夯实能力基础。
2、沉浸式实战项目:加入项目小组,在资深导师指导下,全程参与真实业务功能从0到1的设计、开发与交付,完整经历产品开发的生命周期。
3、核心能力锻造:在项目中深度实践数据驱动决策,培养敏锐的用户与业务洞察力,并熟练运用AI工具提升研发与创新效率,最终交付可衡量的业务价值。
4、持续复盘与分享:积极参与项目复盘、团队分享,将实践经验沉淀为可复用的知识,推动个人与团队的共同成长。
任职资格:
1、本科及以上学历,扎实的计算机基础:熟悉数据结构、算法、操作系统、网络等基础知识,具备良好的编码习惯和调试能力;
2、一定的全栈开发兴趣或实践:接触过前端(如 HTML/CSS/Java script、React/Vue)或后端(如 Go/Java/Python/Node.js)开发,做过课程项目、实习项目、个人作品或开源贡献均可;
3、AI 前沿技术的爱好者:对AI时代前沿技术发展有敏锐嗅觉。关注生成式 AI、智能编程工具(如 Copilot)、AI 辅助产品设计等新趋势,愿意尝试将 AI 能力融入开发与产品探索过程;
4、对产品有热情和好奇心:是小红书或其他内容/社交产品的活跃用户,喜欢思考“这个功能为什么这样设计?”“如果我来做会怎么改?”;
5、基本的数据意识:了解 SQL 或数据分析的基本概念,知道 A/B 测试是什么,愿意用数据辅助判断;
6、良好的沟通与协作意愿:能清晰表达想法,乐于倾听他人意见,在团队中积极贡献。
岗位职责:
工作内容:
1、系统性专业培训:参与定制的技术课程,系统掌握AI原生应用开发、端到端全栈技术及业务思维方法论,夯实能力基础。
2、沉浸式实战项目:加入项目小组,在资深导师指导下,全程参与真实业务功能从0到1的设计、开发与交付,完整经历产品开发的生命周期。
3、核心能力锻造:在项目中深度实践数据驱动决策,培养敏锐的用户与业务洞察力,并熟练运用AI工具提升研发与创新效率,最终交付可衡量的业务价值。
4、持续复盘与分享:积极参与项目复盘、团队分享,将实践经验沉淀为可复用的知识,推动个人与团队的共同成长。
任职资格:
1、本科及以上学历,扎实的计算机基础:熟悉数据结构、算法、操作系统、网络等基础知识,具备良好的编码习惯和调试能力;
2、一定的全栈开发兴趣或实践:接触过前端(如 HTML/CSS/Java script、React/Vue)或后端(如 Go/Java/Python/Node.js)开发,做过课程项目、实习项目、个人作品或开源贡献均可;
3、AI 前沿技术的爱好者:对AI时代前沿技术发展有敏锐嗅觉。关注生成式 AI、智能编程工具(如 Copilot)、AI 辅助产品设计等新趋势,愿意尝试将 AI 能力融入开发与产品探索过程;
4、对产品有热情和好奇心:是小红书或其他内容/社交产品的活跃用户,喜欢思考“这个功能为什么这样设计?”“如果我来做会怎么改?”;
5、基本的数据意识:了解 SQL 或数据分析的基本概念,知道 A/B 测试是什么,愿意用数据辅助判断;
6、良好的沟通与协作意愿:能清晰表达想法,乐于倾听他人意见,在团队中积极贡献。
岗位职责:
iOS
工作城市:上海
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
岗位职责:
1. 负责iOS平台应用程序的设计、开发与维护;
2. 参与客户端架构优化和技术方案设计;
3. 与产品、设计、测试等团队协作,推进功能迭代与体验优化;
4. 持续提升应用性能、稳定性及用户体验;
5. 参与关键技术问题的攻关与解决方案制定。
任职要求:
1. 具备扎实的编程基础和良好的代码规范;
2. 熟悉iOS开发技术体系,掌握常用设计模式与开发框架;
3. 具备良好的沟通能力和团队协作意识;
4. 有较强的学习能力与问题解决能力;
5. 对移动应用开发保持热情,追求技术卓越。
1. 负责iOS平台应用程序的设计、开发与维护;
2. 参与客户端架构优化和技术方案设计;
3. 与产品、设计、测试等团队协作,推进功能迭代与体验优化;
4. 持续提升应用性能、稳定性及用户体验;
5. 参与关键技术问题的攻关与解决方案制定。
任职要求:
1. 具备扎实的编程基础和良好的代码规范;
2. 熟悉iOS开发技术体系,掌握常用设计模式与开发框架;
3. 具备良好的沟通能力和团队协作意识;
4. 有较强的学习能力与问题解决能力;
5. 对移动应用开发保持热情,追求技术卓越。

