公司简介:
快手是北京达佳互联信息技术有限公司旗下品牌。快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。在招职位如下:
【快Star】AI搜算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、探索AI搜场景下的LLM技术创新和落地,包括但不限于后训练算法优化、长文本奖励模型优化、个性化答案生成等,持续提高AI搜的效果;
2、探索解决复杂问题的agent相关技术落地,包括但不限于Plan模型、function call、memory构建等,建设更智能的agent能力;
3、探索多模态大模型在AI搜场景的落地,包括但不限于视频理解、多模态交互等,给用户提供更丰富的搜索体验。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉大模型基本原理以及SFT和强化学习等大模型后训练技术,熟悉常用的大模型训练和推理框架;
3、在大语言模型或多模态大模型方向有较深入的研究经验,熟悉相关方向的技术发展,善于利用各类技术解决复杂的实际问题。
1、探索AI搜场景下的LLM技术创新和落地,包括但不限于后训练算法优化、长文本奖励模型优化、个性化答案生成等,持续提高AI搜的效果;
2、探索解决复杂问题的agent相关技术落地,包括但不限于Plan模型、function call、memory构建等,建设更智能的agent能力;
3、探索多模态大模型在AI搜场景的落地,包括但不限于视频理解、多模态交互等,给用户提供更丰富的搜索体验。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉大模型基本原理以及SFT和强化学习等大模型后训练技术,熟悉常用的大模型训练和推理框架;
3、在大语言模型或多模态大模型方向有较深入的研究经验,熟悉相关方向的技术发展,善于利用各类技术解决复杂的实际问题。
【快Star】大模型应用算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等;
2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景;
3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践;
4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉LLM及MLLM基本原理、大模型微调/RLHF等技术,熟悉C/C++、Python、Java等至少一门主流编程语言;
3、对计算机视觉、自然语言处理、多模态、知识图谱、机器学习等相关领域有深入的理解,且有相关实际项目经验;
4、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等;
2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景;
3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践;
4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉LLM及MLLM基本原理、大模型微调/RLHF等技术,熟悉C/C++、Python、Java等至少一门主流编程语言;
3、对计算机视觉、自然语言处理、多模态、知识图谱、机器学习等相关领域有深入的理解,且有相关实际项目经验;
4、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力。
【快Star】多模态大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。
任职要求
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验;
3、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展;
1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。
任职要求
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验;
3、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展;
数据分析师
工作城市:北京
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
薪资:9k-10k
学历要求:本科,硕士,博士
岗位性质:实习
岗位描述:
快手国际化数据分析实习 #快手 #实习 #数据科学 #数据分析
职位描述
1、构建全面的、准确的、能反映服务业务线特征的宏观、微观指标体系,并基于业务监控指标体系,及时发现与定位业务问题;
2、通过专题分析,对业务问题进行深入分析,对公司内外部数据进行挖掘,在深入的产品理解与用户洞察基础上,自主发掘课题,提出有实效的建议;
3、沉淀分析思路与框架,通过工具化/流程化已被沉淀的方法论及分析技巧,提升自身工作效率及影响力 ;
4、通过科学的设计&分析AB实验迭代现有策略,获得收益及业务洞察;
5、与相关团队协作进行数据建模工作,推动业务部门的数据化运营,能够基于数据分析、量化建模、市场调研等工具对产品和市场进行理解和刻画,解决各种复杂商业分析问题,能独立完成从方案设计、数据加工与分析,到结论展示的整个流程。
任职要求
1、本科及以上学历,具有一定概率统计基础,了解常用的机器学习算法、AB testing,有数据分析、挖掘、清洗和建模的经验者优先;
2、熟练使用SQL(重要)、Python或者R、Tableau、Excel等常用数据编程语言或工具;
3、较强的逻辑分析与数据洞察能力,对数据敏感;沟通能力强,能快速地理解各方诉求,并有效传达战略建议。
4、北京职场长期实习,每周保证工作4天及以上
职位描述
1、构建全面的、准确的、能反映服务业务线特征的宏观、微观指标体系,并基于业务监控指标体系,及时发现与定位业务问题;
2、通过专题分析,对业务问题进行深入分析,对公司内外部数据进行挖掘,在深入的产品理解与用户洞察基础上,自主发掘课题,提出有实效的建议;
3、沉淀分析思路与框架,通过工具化/流程化已被沉淀的方法论及分析技巧,提升自身工作效率及影响力 ;
4、通过科学的设计&分析AB实验迭代现有策略,获得收益及业务洞察;
5、与相关团队协作进行数据建模工作,推动业务部门的数据化运营,能够基于数据分析、量化建模、市场调研等工具对产品和市场进行理解和刻画,解决各种复杂商业分析问题,能独立完成从方案设计、数据加工与分析,到结论展示的整个流程。
任职要求
1、本科及以上学历,具有一定概率统计基础,了解常用的机器学习算法、AB testing,有数据分析、挖掘、清洗和建模的经验者优先;
2、熟练使用SQL(重要)、Python或者R、Tableau、Excel等常用数据编程语言或工具;
3、较强的逻辑分析与数据洞察能力,对数据敏感;沟通能力强,能快速地理解各方诉求,并有效传达战略建议。
4、北京职场长期实习,每周保证工作4天及以上
【快Star】AI Infra工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
【团队介绍】作为大模型与搜推广业务的 AI 基础设施核心团队,业务支撑包括可灵 AI 视频/图像生成、内容推荐与商业化。覆盖 AI Infra 全栈:万卡级 GPU 调度(训推一体、多云联邦)、大模型数据引擎(Ray 万卡规模、DataLake 自研存储、DataFlow 编排)、搜推广样本/特征引擎、端到端 MLOps 与 AI-Agent 平台化探索。我们做的是业界没有现成答案的事——对标字节 MegaScale、Meta Llama 3、Databricks Mosaic、Anthropic Constitutional AI 的真实工程实践,配业界前沿的真实场景与资源支持。
1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。
【团队介绍】作为大模型与搜推广业务的 AI 基础设施核心团队,业务支撑包括可灵 AI 视频/图像生成、内容推荐与商业化。覆盖 AI Infra 全栈:万卡级 GPU 调度(训推一体、多云联邦)、大模型数据引擎(Ray 万卡规模、DataLake 自研存储、DataFlow 编排)、搜推广样本/特征引擎、端到端 MLOps 与 AI-Agent 平台化探索。我们做的是业界没有现成答案的事——对标字节 MegaScale、Meta Llama 3、Databricks Mosaic、Anthropic Constitutional AI 的真实工程实践,配业界前沿的真实场景与资源支持。
1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。
【快Star】AI Agent大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责 AI Agent 核心能力的研发与优化,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具调用(Tool Use)、长期/短期记忆(Memory)、RAG 增强、Workflow 编排、多智能体协同(Multi-Agent)及复杂长链路任务执行;
2、负责 Agent Framework 与 Agent Runtime 的设计与研发,包括 Tool Calling、Memory System、Workflow Engine、Sandbox、Agent Gateway、Skill System 等核心模块,探索长期运行(Persistent Agent)与自我进化(Self-improving Agent)能力;
3、应用强化学习(RL)、SFT、Preference Alignment(DPO/PPO/GRPO/RLVR 等)等技术,提升 Agent 在复杂任务中的推理、规划、执行与泛化能力;
4、参与构建 Agent 数据闭环与评测体系,包括 Agent Benchmark、Tool-use Evaluation、Long-horizon Evaluation、Trajectory Dataset 等,通过数据驱动持续优化模型与系统效果;
5、推动 AI Agent 在办公、创作、Coding、R&D、企业 Workflow Automation 等真实场景中的产品化落地与持续迭代。
任职要求
1、硕士及以上学历,计算机、人工智能、数学、电子信息等相关专业优先;
2、精通 Python,具备扎实的 C/C++/Go/Java(至少一门)基础,具备优秀的软件工程能力与系统设计能力,追求高质量代码实现;
3、深入理解 Transformer 架构及大模型(LLM/VLM/Reasoning Model)原理;熟悉 PyTorch/TensorFlow 等深度学习框架;掌握强化学习、自然语言处理、搜索推荐或计算机视觉相关基础理论;
4、深入理解 Agent 核心范式,包括 Planning、Reasoning、Tool Use、Memory、RAG、Workflow、Multi-Agent 等;熟悉 MCP、Function Calling、Structured Output 等 Agent 生态技术;
5、熟悉 Linux、网络编程、异步系统、分布式系统、Docker/Kubernetes 等基础设施与工程技术栈;
6、具备极强的学习能力与技术热情,对 Agent、AGI 与 AI Native 应用方向有浓厚兴趣;逻辑清晰,具备良好的沟通协作能力与独立推进复杂项目的能力。
1、负责 AI Agent 核心能力的研发与优化,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具调用(Tool Use)、长期/短期记忆(Memory)、RAG 增强、Workflow 编排、多智能体协同(Multi-Agent)及复杂长链路任务执行;
2、负责 Agent Framework 与 Agent Runtime 的设计与研发,包括 Tool Calling、Memory System、Workflow Engine、Sandbox、Agent Gateway、Skill System 等核心模块,探索长期运行(Persistent Agent)与自我进化(Self-improving Agent)能力;
3、应用强化学习(RL)、SFT、Preference Alignment(DPO/PPO/GRPO/RLVR 等)等技术,提升 Agent 在复杂任务中的推理、规划、执行与泛化能力;
4、参与构建 Agent 数据闭环与评测体系,包括 Agent Benchmark、Tool-use Evaluation、Long-horizon Evaluation、Trajectory Dataset 等,通过数据驱动持续优化模型与系统效果;
5、推动 AI Agent 在办公、创作、Coding、R&D、企业 Workflow Automation 等真实场景中的产品化落地与持续迭代。
任职要求
1、硕士及以上学历,计算机、人工智能、数学、电子信息等相关专业优先;
2、精通 Python,具备扎实的 C/C++/Go/Java(至少一门)基础,具备优秀的软件工程能力与系统设计能力,追求高质量代码实现;
3、深入理解 Transformer 架构及大模型(LLM/VLM/Reasoning Model)原理;熟悉 PyTorch/TensorFlow 等深度学习框架;掌握强化学习、自然语言处理、搜索推荐或计算机视觉相关基础理论;
4、深入理解 Agent 核心范式,包括 Planning、Reasoning、Tool Use、Memory、RAG、Workflow、Multi-Agent 等;熟悉 MCP、Function Calling、Structured Output 等 Agent 生态技术;
5、熟悉 Linux、网络编程、异步系统、分布式系统、Docker/Kubernetes 等基础设施与工程技术栈;
6、具备极强的学习能力与技术热情,对 Agent、AGI 与 AI Native 应用方向有浓厚兴趣;逻辑清晰,具备良好的沟通协作能力与独立推进复杂项目的能力。
【快Star】大模型系统开发工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景;
2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果;
3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
任职要求
1、本科及以上学历,计算机相关专业;
2、计算机基础知识扎实,至少熟练掌握 Java/Python/C++/Go 语言中的一门;
3、有强烈好奇心,对前沿技术充满热情,具有良好的沟通能力、学习能力和团队合作能力;
4、对基于大语言模型、多模态模型的应用开发,或者 Langchain、LlamaIndex、RAGFlow 等开源 Agent 框架有了解者优先;
5、对文生图模型、文生视频模型的应用开发,或者 Midjourney、Stable Diffusion 等 AIGC 素材创作工具有了解者优先。
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景;
2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果;
3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
任职要求
1、本科及以上学历,计算机相关专业;
2、计算机基础知识扎实,至少熟练掌握 Java/Python/C++/Go 语言中的一门;
3、有强烈好奇心,对前沿技术充满热情,具有良好的沟通能力、学习能力和团队合作能力;
4、对基于大语言模型、多模态模型的应用开发,或者 Langchain、LlamaIndex、RAGFlow 等开源 Agent 框架有了解者优先;
5、对文生图模型、文生视频模型的应用开发,或者 Midjourney、Stable Diffusion 等 AIGC 素材创作工具有了解者优先。
【快Star】AIGC视觉生成算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等;
2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题;
3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果;
4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
任职要求
1、硕士及以上学历,计算机、人工智能、数学等相关专业;
2、熟悉AIGC视觉生成的算法原理,具备扎实数理基础,对VAE、扩散模型、ViT等相关技术有理解和经验。熟悉至少一种主流的图像生成框架或算法,如Stable Diffusion、DALL·E、DiT、ControlNet等;
3、有技术追求,责任感强,具备较强的学习能力和动手能力,清晰的逻辑思维能力和出色的沟通能力,有强烈的好奇心。
1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等;
2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题;
3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果;
4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
任职要求
1、硕士及以上学历,计算机、人工智能、数学等相关专业;
2、熟悉AIGC视觉生成的算法原理,具备扎实数理基础,对VAE、扩散模型、ViT等相关技术有理解和经验。熟悉至少一种主流的图像生成框架或算法,如Stable Diffusion、DALL·E、DiT、ControlNet等;
3、有技术追求,责任感强,具备较强的学习能力和动手能力,清晰的逻辑思维能力和出色的沟通能力,有强烈的好奇心。
【快Star】推荐大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新的能量,包括但不限于文本/ID生成式推荐、模型Scaling Law、用户超长序列端到端建模等;
2、探索视频、文本和语音等多模态信号的高效处理方式以及与推荐系统对齐的能力,让推荐系统看懂、听懂和理解世界;
3、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索;
4、紧跟行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践。
任职要求
1、硕士及以上学历,计算机、人工智能、统计学和数学相关专业;
2、有较强的工程实现能力,熟悉C/C++、Python、 Java等至少一门主流编程语言;
3、对搜广推算法、LLM(ChatGPT等)/多模态模型(LLaVa、BLIP2、instructBLIP等)模型或者量化/蒸馏/剪枝有深入研究经验;
4、熟悉常用机器学习和数据挖掘算法,优秀的分析和解决问题的能力,同时具有较好的团队协作能力。
1、探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新的能量,包括但不限于文本/ID生成式推荐、模型Scaling Law、用户超长序列端到端建模等;
2、探索视频、文本和语音等多模态信号的高效处理方式以及与推荐系统对齐的能力,让推荐系统看懂、听懂和理解世界;
3、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索;
4、紧跟行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践。
任职要求
1、硕士及以上学历,计算机、人工智能、统计学和数学相关专业;
2、有较强的工程实现能力,熟悉C/C++、Python、 Java等至少一门主流编程语言;
3、对搜广推算法、LLM(ChatGPT等)/多模态模型(LLaVa、BLIP2、instructBLIP等)模型或者量化/蒸馏/剪枝有深入研究经验;
4、熟悉常用机器学习和数据挖掘算法,优秀的分析和解决问题的能力,同时具有较好的团队协作能力。
【快Star】大语言模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、从事语言大模型、多模态大模型技术建设的研发工作;
2、从事大模型业务应用相关的技术研发工作。
任职要求
1、硕士及以上学历,计算机、人工智能等相关专业优先;
2、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
3、对大模型、NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识积累和洞察力;
4、动手能力强,编程能力强。
1、从事语言大模型、多模态大模型技术建设的研发工作;
2、从事大模型业务应用相关的技术研发工作。
任职要求
1、硕士及以上学历,计算机、人工智能等相关专业优先;
2、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
3、对大模型、NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识积累和洞察力;
4、动手能力强,编程能力强。
【快Star】基础大模型强化学习工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
从事快手多模态视频理解大模型的 Agentic RL 后训练基础设施建设,聚焦推理-训练协同系统优化,将 RL 训练的系统吞吐与样本效率做到业界领先水准,包括但不限于以下方向:
1、负责强化学习任务性能优化,提升模型训练效率;
2、负责构建Agent、Function Call、Sandbox以及其他环境交互场景下的强化学习下的分布式训练奖励评估系统;
3、负责构建Agent框架与平台,支持复杂交互下的强化学习模型训练;
4、负责强化学习环境下的可观测性、可解释性的系统建设;
5、负责强化学习任务性能优化,提升模型迭代效率。
任职要求
1、熟练掌握Linux环境下的Python/C++等1至2种以上语言;
2、熟悉Ray架构和生态,有Ray应用或者Ray Core开发经验;
3、掌握分布式系统原理,参与过分布式系统的设计、开发和维护;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动。
从事快手多模态视频理解大模型的 Agentic RL 后训练基础设施建设,聚焦推理-训练协同系统优化,将 RL 训练的系统吞吐与样本效率做到业界领先水准,包括但不限于以下方向:
1、负责强化学习任务性能优化,提升模型训练效率;
2、负责构建Agent、Function Call、Sandbox以及其他环境交互场景下的强化学习下的分布式训练奖励评估系统;
3、负责构建Agent框架与平台,支持复杂交互下的强化学习模型训练;
4、负责强化学习环境下的可观测性、可解释性的系统建设;
5、负责强化学习任务性能优化,提升模型迭代效率。
任职要求
1、熟练掌握Linux环境下的Python/C++等1至2种以上语言;
2、熟悉Ray架构和生态,有Ray应用或者Ray Core开发经验;
3、掌握分布式系统原理,参与过分布式系统的设计、开发和维护;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动。
【27届快Star】AI Agent大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责 AI Agent 核心能力的研发与优化,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具调用(Tool Use)、长期/短期记忆(Memory)、RAG 增强、Workflow 编排、多智能体协同(Multi-Agent)及复杂长链路任务执行;
2、负责 Agent Framework 与 Agent Runtime 的设计与研发,包括 Tool Calling、Memory System、Workflow Engine、Sandbox、Agent Gateway、Skill System 等核心模块,探索长期运行(Persistent Agent)与自我进化(Self-improving Agent)能力;
3、应用强化学习(RL)、SFT、Preference Alignment(DPO/PPO/GRPO/RLVR 等)等技术,提升 Agent 在复杂任务中的推理、规划、执行与泛化能力;
4、参与构建 Agent 数据闭环与评测体系,包括 Agent Benchmark、Tool-use Evaluation、Long-horizon Evaluation、Trajectory Dataset 等,通过数据驱动持续优化模型与系统效果;
5、推动 AI Agent 在办公、创作、Coding、R&D、企业 Workflow Automation 等真实场景中的产品化落地与持续迭代。
任职要求
1、硕士及以上学历,计算机、人工智能、数学、电子信息等相关专业优先;
2、精通 Python,具备扎实的 C/C++/Go/Java(至少一门)基础,具备优秀的软件工程能力与系统设计能力,追求高质量代码实现;
3、深入理解 Transformer 架构及大模型(LLM/VLM/Reasoning Model)原理;熟悉 PyTorch/TensorFlow 等深度学习框架;掌握强化学习、自然语言处理、搜索推荐或计算机视觉相关基础理论;
4、深入理解 Agent 核心范式,包括 Planning、Reasoning、Tool Use、Memory、RAG、Workflow、Multi-Agent 等;熟悉 MCP、Function Calling、Structured Output 等 Agent 生态技术;
5、熟悉 Linux、网络编程、异步系统、分布式系统、Docker/Kubernetes 等基础设施与工程技术栈;
6、具备极强的学习能力与技术热情,对 Agent、AGI 与 AI Native 应用方向有浓厚兴趣;逻辑清晰,具备良好的沟通协作能力与独立推进复杂项目的能力。
1、负责 AI Agent 核心能力的研发与优化,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具调用(Tool Use)、长期/短期记忆(Memory)、RAG 增强、Workflow 编排、多智能体协同(Multi-Agent)及复杂长链路任务执行;
2、负责 Agent Framework 与 Agent Runtime 的设计与研发,包括 Tool Calling、Memory System、Workflow Engine、Sandbox、Agent Gateway、Skill System 等核心模块,探索长期运行(Persistent Agent)与自我进化(Self-improving Agent)能力;
3、应用强化学习(RL)、SFT、Preference Alignment(DPO/PPO/GRPO/RLVR 等)等技术,提升 Agent 在复杂任务中的推理、规划、执行与泛化能力;
4、参与构建 Agent 数据闭环与评测体系,包括 Agent Benchmark、Tool-use Evaluation、Long-horizon Evaluation、Trajectory Dataset 等,通过数据驱动持续优化模型与系统效果;
5、推动 AI Agent 在办公、创作、Coding、R&D、企业 Workflow Automation 等真实场景中的产品化落地与持续迭代。
任职要求
1、硕士及以上学历,计算机、人工智能、数学、电子信息等相关专业优先;
2、精通 Python,具备扎实的 C/C++/Go/Java(至少一门)基础,具备优秀的软件工程能力与系统设计能力,追求高质量代码实现;
3、深入理解 Transformer 架构及大模型(LLM/VLM/Reasoning Model)原理;熟悉 PyTorch/TensorFlow 等深度学习框架;掌握强化学习、自然语言处理、搜索推荐或计算机视觉相关基础理论;
4、深入理解 Agent 核心范式,包括 Planning、Reasoning、Tool Use、Memory、RAG、Workflow、Multi-Agent 等;熟悉 MCP、Function Calling、Structured Output 等 Agent 生态技术;
5、熟悉 Linux、网络编程、异步系统、分布式系统、Docker/Kubernetes 等基础设施与工程技术栈;
6、具备极强的学习能力与技术热情,对 Agent、AGI 与 AI Native 应用方向有浓厚兴趣;逻辑清晰,具备良好的沟通协作能力与独立推进复杂项目的能力。
【27届快Star】AI搜算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、探索AI搜场景下的LLM技术创新和落地,包括但不限于后训练算法优化、长文本奖励模型优化、个性化答案生成等,持续提高AI搜的效果;
2、探索解决复杂问题的agent相关技术落地,包括但不限于Plan模型、function call、memory构建等,建设更智能的agent能力;
3、探索多模态大模型在AI搜场景的落地,包括但不限于视频理解、多模态交互等,给用户提供更丰富的搜索体验。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉大模型基本原理以及SFT和强化学习等大模型后训练技术,熟悉常用的大模型训练和推理框架;
3、在大语言模型或多模态大模型方向有较深入的研究经验,熟悉相关方向的技术发展,善于利用各类技术解决复杂的实际问题。
1、探索AI搜场景下的LLM技术创新和落地,包括但不限于后训练算法优化、长文本奖励模型优化、个性化答案生成等,持续提高AI搜的效果;
2、探索解决复杂问题的agent相关技术落地,包括但不限于Plan模型、function call、memory构建等,建设更智能的agent能力;
3、探索多模态大模型在AI搜场景的落地,包括但不限于视频理解、多模态交互等,给用户提供更丰富的搜索体验。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉大模型基本原理以及SFT和强化学习等大模型后训练技术,熟悉常用的大模型训练和推理框架;
3、在大语言模型或多模态大模型方向有较深入的研究经验,熟悉相关方向的技术发展,善于利用各类技术解决复杂的实际问题。
【27届快Star】大语言模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、从事语言大模型、多模态大模型技术建设的研发工作;
2、从事大模型业务应用相关的技术研发工作。
任职要求
1、硕士及以上学历,计算机、人工智能等相关专业优先;
2、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
3、对大模型、NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识积累和洞察力;
4、动手能力强,编程能力强。
1、从事语言大模型、多模态大模型技术建设的研发工作;
2、从事大模型业务应用相关的技术研发工作。
任职要求
1、硕士及以上学历,计算机、人工智能等相关专业优先;
2、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
3、对大模型、NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识积累和洞察力;
4、动手能力强,编程能力强。
【27届快Star】AIGC视觉生成算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等;
2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题;
3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果;
4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
任职要求
1、硕士及以上学历,计算机、人工智能、数学等相关专业;
2、熟悉AIGC视觉生成的算法原理,具备扎实数理基础,对VAE、扩散模型、ViT等相关技术有理解和经验。熟悉至少一种主流的图像生成框架或算法,如Stable Diffusion、DALL·E、DiT、ControlNet等;
3、有技术追求,责任感强,具备较强的学习能力和动手能力,清晰的逻辑思维能力和出色的沟通能力,有强烈的好奇心。
1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等;
2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题;
3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果;
4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
任职要求
1、硕士及以上学历,计算机、人工智能、数学等相关专业;
2、熟悉AIGC视觉生成的算法原理,具备扎实数理基础,对VAE、扩散模型、ViT等相关技术有理解和经验。熟悉至少一种主流的图像生成框架或算法,如Stable Diffusion、DALL·E、DiT、ControlNet等;
3、有技术追求,责任感强,具备较强的学习能力和动手能力,清晰的逻辑思维能力和出色的沟通能力,有强烈的好奇心。
【27届快Star】大模型应用算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等;
2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景;
3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践;
4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉LLM及MLLM基本原理、大模型微调/RLHF等技术,熟悉C/C++、Python、Java等至少一门主流编程语言;
3、对计算机视觉、自然语言处理、多模态、知识图谱、机器学习等相关领域有深入的理解,且有相关实际项目经验;
4、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等;
2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景;
3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践;
4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
任职要求
1、硕士及以上学历,计算机、人工智能、数学相关专业;
2、有较强的工程实现能力,熟悉LLM及MLLM基本原理、大模型微调/RLHF等技术,熟悉C/C++、Python、Java等至少一门主流编程语言;
3、对计算机视觉、自然语言处理、多模态、知识图谱、机器学习等相关领域有深入的理解,且有相关实际项目经验;
4、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力。
【27届快Star】多模态大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。
任职要求
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验;
3、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展;
1、打造最适合短视频、直播、搜索推荐、电商、创作者玩法的多模态大模型,为快手的各项业务提供基座模型技术支持。多模态技术是通向AGI的重要方法和里程碑,期待和更多对多模态技术感兴趣的同学一起打造真正带来价值的模型算法技术;
2、深度探索多模态大模型的多阶段预训练、监督微调和RLHF等技术,打造业界第一梯队的多模态大模型,赶超GPT-4o、Gemini Pro等闭源模型的实际使用效果;
3、图片、语音、音频和视频多种模态信号的高效处理方式探索,提供对各类信号最精准的理解能力;
4、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索。
任职要求
1、硕士及以上学历,有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、熟悉计算机视觉相关的算法和技术,有自然语言处理和大模型训练经验;
3、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展;
【27届快Star】大模型系统开发工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景;
2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果;
3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
任职要求
1、本科及以上学历,计算机相关专业;
2、计算机基础知识扎实,至少熟练掌握 Java/Python/C++/Go 语言中的一门;
3、有强烈好奇心,对前沿技术充满热情,具有良好的沟通能力、学习能力和团队合作能力;
4、对基于大语言模型、多模态模型的应用开发,或者 Langchain、LlamaIndex、RAGFlow 等开源 Agent 框架有了解者优先;
5、对文生图模型、文生视频模型的应用开发,或者 Midjourney、Stable Diffusion 等 AIGC 素材创作工具有了解者优先。
1、基于快手自研的文生视频、文生图、文生文等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景;
2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并与算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果;
3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。
任职要求
1、本科及以上学历,计算机相关专业;
2、计算机基础知识扎实,至少熟练掌握 Java/Python/C++/Go 语言中的一门;
3、有强烈好奇心,对前沿技术充满热情,具有良好的沟通能力、学习能力和团队合作能力;
4、对基于大语言模型、多模态模型的应用开发,或者 Langchain、LlamaIndex、RAGFlow 等开源 Agent 框架有了解者优先;
5、对文生图模型、文生视频模型的应用开发,或者 Midjourney、Stable Diffusion 等 AIGC 素材创作工具有了解者优先。
【27届快Star】基础大模型强化学习工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
从事快手多模态视频理解大模型的 Agentic RL 后训练基础设施建设,聚焦推理-训练协同系统优化,将 RL 训练的系统吞吐与样本效率做到业界领先水准,包括但不限于以下方向:
1、负责强化学习任务性能优化,提升模型训练效率;
2、负责构建Agent、Function Call、Sandbox以及其他环境交互场景下的强化学习下的分布式训练奖励评估系统;
3、负责构建Agent框架与平台,支持复杂交互下的强化学习模型训练;
4、负责强化学习环境下的可观测性、可解释性的系统建设;
5、负责强化学习任务性能优化,提升模型迭代效率。
任职要求
1、熟练掌握Linux环境下的Python/C++等1至2种以上语言;
2、熟悉Ray架构和生态,有Ray应用或者Ray Core开发经验;
3、掌握分布式系统原理,参与过分布式系统的设计、开发和维护;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动。
从事快手多模态视频理解大模型的 Agentic RL 后训练基础设施建设,聚焦推理-训练协同系统优化,将 RL 训练的系统吞吐与样本效率做到业界领先水准,包括但不限于以下方向:
1、负责强化学习任务性能优化,提升模型训练效率;
2、负责构建Agent、Function Call、Sandbox以及其他环境交互场景下的强化学习下的分布式训练奖励评估系统;
3、负责构建Agent框架与平台,支持复杂交互下的强化学习模型训练;
4、负责强化学习环境下的可观测性、可解释性的系统建设;
5、负责强化学习任务性能优化,提升模型迭代效率。
任职要求
1、熟练掌握Linux环境下的Python/C++等1至2种以上语言;
2、熟悉Ray架构和生态,有Ray应用或者Ray Core开发经验;
3、掌握分布式系统原理,参与过分布式系统的设计、开发和维护;
4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动。
【27届快Star】推荐大模型算法工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
1、探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新的能量,包括但不限于文本/ID生成式推荐、模型Scaling Law、用户超长序列端到端建模等;
2、探索视频、文本和语音等多模态信号的高效处理方式以及与推荐系统对齐的能力,让推荐系统看懂、听懂和理解世界;
3、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索;
4、紧跟行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践。
任职要求
1、硕士及以上学历,计算机、人工智能、统计学和数学相关专业;
2、有较强的工程实现能力,熟悉C/C++、Python、 Java等至少一门主流编程语言;
3、对搜广推算法、LLM(ChatGPT等)/多模态模型(LLaVa、BLIP2、instructBLIP等)模型或者量化/蒸馏/剪枝有深入研究经验;
4、熟悉常用机器学习和数据挖掘算法,优秀的分析和解决问题的能力,同时具有较好的团队协作能力。
1、探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新的能量,包括但不限于文本/ID生成式推荐、模型Scaling Law、用户超长序列端到端建模等;
2、探索视频、文本和语音等多模态信号的高效处理方式以及与推荐系统对齐的能力,让推荐系统看懂、听懂和理解世界;
3、混合专家、蒸馏剪枝等兼顾模型性能和效果的技术探索;
4、紧跟行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践。
任职要求
1、硕士及以上学历,计算机、人工智能、统计学和数学相关专业;
2、有较强的工程实现能力,熟悉C/C++、Python、 Java等至少一门主流编程语言;
3、对搜广推算法、LLM(ChatGPT等)/多模态模型(LLaVa、BLIP2、instructBLIP等)模型或者量化/蒸馏/剪枝有深入研究经验;
4、熟悉常用机器学习和数据挖掘算法,优秀的分析和解决问题的能力,同时具有较好的团队协作能力。
【27届快Star】AI Infra工程师
工作城市:北京
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
薪资:40k-60k
学历要求:硕士,博士
岗位性质:全职
岗位描述:
职位描述
【团队介绍】作为大模型与搜推广业务的 AI 基础设施核心团队,业务支撑包括可灵 AI 视频/图像生成、内容推荐与商业化。覆盖 AI Infra 全栈:万卡级 GPU 调度(训推一体、多云联邦)、大模型数据引擎(Ray 万卡规模、DataLake 自研存储、DataFlow 编排)、搜推广样本/特征引擎、端到端 MLOps 与 AI-Agent 平台化探索。我们做的是业界没有现成答案的事——对标字节 MegaScale、Meta Llama 3、Databricks Mosaic、Anthropic Constitutional AI 的真实工程实践,配业界前沿的真实场景与资源支持。
1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。
【团队介绍】作为大模型与搜推广业务的 AI 基础设施核心团队,业务支撑包括可灵 AI 视频/图像生成、内容推荐与商业化。覆盖 AI Infra 全栈:万卡级 GPU 调度(训推一体、多云联邦)、大模型数据引擎(Ray 万卡规模、DataLake 自研存储、DataFlow 编排)、搜推广样本/特征引擎、端到端 MLOps 与 AI-Agent 平台化探索。我们做的是业界没有现成答案的事——对标字节 MegaScale、Meta Llama 3、Databricks Mosaic、Anthropic Constitutional AI 的真实工程实践,配业界前沿的真实场景与资源支持。
1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。

