阿里巴巴(中国)有限公司余杭分公司

商业服务 · 民营企业 · 成立13年2025-04-12


阿里巴巴集团旗下各集团/公司春季2026届实习生招聘正在陆续启动中点击????????阿里巴巴集团招聘官网大黄页可以直达各家招聘官网,投递心仪岗位。

毕业生可同时投递阿里巴巴旗下业务集团和公司的多个岗位,提高应聘“命中率”,期待你来和我们做同事呀!




高德π天才计划(研究型实习生)


     如果你怀有务实的浪漫主义,认为科技会改变世界,立志于投身人工智能、大模型、计算机视觉、音视频生成、机器学习等技术领域,欢迎你的加入。

你将获得

  • 与顶尖导师团队一起挑战世界级难题

  • 与优秀的同行定义AI模型与空间智能的融合

  • 丰富的技术落地场景,充足算力和数据资源

  • 含金量高的课题,充足的探索空间,助力SOTA级作品

<p>..............................................r  1.    ................................................. =</p>



2025高德科研合作课题



    欢迎学者浏览了解,期待联合学界科研团队开展关键技术攻关,聚焦大模型、人工智能、机器学习及地理空间智能等领域,共同培育具备顶级学术会议发表潜力的创新成果及可专利化核心技术。

    如感兴趣请将简历及意向合作课题名称发送至****,工作人员将尽快与您联系。




大模型及其应用研究


【课题1】下一代全双工端到端语音对话大模型

课题说明

    随着人工智能技术的快速发展,语音对话系统在多个领域得到了广泛应用,如智能助手、客户服务、医疗咨询等。传统的语音对话系统通常采用分阶段处理的方式,包括声学模型、语言模型和对话管理模块,这不仅增加了系统的复杂性,还限制了其性能。本课题旨在研究和开发一种全双工端到端语音对话大模型,该模型能够直接从原始音频输入生成自然流畅的对话响应,同时支持实时交互,即全双工的语音到语音的对话系统。通过引入最新的深度学习技术和大规模预训练方法,我们期望构建一个更加高效、准确和自然的语音对话系统。

建议研究方向

  1. 用于端对端对话系统的Speech Tokenizer:搭建适合端对端语音合成建模的Speech Token,作为大模型的输入和输出,提升模型的泛化性和效果;

  2. 语音-语音大模型基座模型搭建:通过预训练、对齐、后训练、强化学习等手段提升对话内容的准确度、语音的自然度和表现力,搭建一套业界SOTA系统;

  3. 推理模型搭建:搭建适合文本/语音的多模态建模方案,提升语音对话大模型的推理能力。


【课题2】红绿灯调控的大模型应用研究

课题说明

    针对城市交通拥堵问题,传统红绿灯配置非常依赖经验,缺少全局和实时的视角。本项目希望利用大模型的知识和深度推理能力,结合高德全局的红绿灯数据、实时和历史交通流量等信息,实现红绿灯调控的优化,提升路口通行效率,减少车辆等待时间与碳排放。

建议研究方向

  1. 交通数据的理解和推理:通过理解交通数据(包括红绿灯数据、交通流量等信息),推理出更高效的区域红绿灯配置。


【课题3】出行规划大模型

课题说明

    大模型在通用领域的智能化水平持续提升,但是其在地图出行领域的应用仍然存在着比较大的挑战。地图出行领域的垂类域内数据量庞大,数据结构复杂,并且相关应用要求大模型具备强大的空间推理能力。现有大模型往往存在着虚构POI和空间理解关系错乱的问题,无法为用户制定个性化、复杂的出行规划。本课题聚焦出行规划应用,通过领域数据后训练、空间语义对齐、强化学习等技术路径,重点突破大模型的时空推理出错、地理信息幻觉和个性化适配问题,满足用户的复杂出行与日程规划需求。

建议研究方向

  1. 领域知识增强:设计复杂数据结构的对齐方法,通过大模型后训练实现异构数据增量式知识注入,提升大模型对地图数据的理解能力;

  2. 多目标强化学习:设计多目标奖励函数,在强化学习架构下提升大模型的时空理解能力与出行/日程规划能力;

  3. 个性化偏好建模:研发用户画像系统,通过交互式对话实现出行场景理解。


【课题4】端到端全场景融合定位技术

课题说明

    在智能出⾏和空间智能时代,精准的定位技术是连接虚拟与现实的核⼼纽带。作为⾼德地图技术创新的重要⽅向之⼀,本课题旨在通过深度学习技术的全⾯赋能,推动定位技术从传统算法驱动向数据驱动、模型驱动的全新范式演进。我们希望构建⼀个⾯向全场景的统⼀融合⼤模型,实现技术升级和数据闭环,通过端到端深度学习模型化升级,构建⼀套全场景统⼀的定位技术框架,显著提升定位精度、鲁棒性和场景适应性;充分发挥⾼德地图的海量⽤户数据优势,构建数据驱动的定位技术闭环,形成“数据-模型-优化”的良性循环。系统性地解决当前定位技术⾯临的场景碎⽚化、误差累积以及复杂环境适应性不⾜等问题,为⽤户提供更加精准、稳定和智能化的定位体验。

建议研究⽅向

  1. 惯导定位模型:研究基于深度学习的IMU推演算法,通过端到端建模显著降低开环定位中的累积误差,提升⻓时间⽆外部信号情况下的定位稳定性。探索如何利⽤历史轨迹数据和多源传感器信息优化IMU参数估计,增强模型的泛化能⼒。

  2. 卫星定位模型:构建端到端的卫星定位算法,结合深度学习对信号传播特性进⾏建模,显著提升复杂环境(如城市峡⾕、⾼架桥)下的定位精度。重点优化⻋道级导航场景下的定位效果,为⾼德的⾼精地图服务提供强有⼒的技术⽀撑。

  3. 泛绝对定位技术:开发⾮卫星绝对定位技术,综合利⽤地磁、视觉特征、WiFi指纹等多源信息,在室内、隧道、地下停⻋场等丢星场景下实现⾼精度定位。探索跨场景迁移学习⽅法,使模型能够在不同环境中快速适应并保持⾼性能。

  4. 融合定位模型:构建多传感器融合的端到端定位模型,设计⾼效的特征提取与融合策略,实现全场景下的⽆缝切换与最优解算;研究如何在资源受限的设备上部署轻量化模型,兼顾性能与计算效率。

  5. 路⽹匹配技术模型:基于深度学习的离线路⽹匹配算法,为实时路⽹定位提供⾼质量真值参考。探索动态路⽹更新机制,确保模型能够适应不断变化的道路环境。

【课题5】基于大模型的广告重排算法的研究

课题说明
    在信息流广告系统中,广告重排(Re-ranking)是推荐流程中的关键环节。广告重排的目标是在初步排序结果的基础上,进一步优化广告展示顺序,以平衡点击率(CTR)、转化率(CVR)、多样性、用户体验等多维度目标。传统的广告重排算法通常依赖于规则或简单的机器学习模型,难以充分捕捉复杂的用户行为模式和多目标之间的权衡关系。近年来,随着大模型的快速发展,其强大的表征能力和上下文理解能力为广告重排提供了新的可能性。本研究旨在探索如何利用大模型设计高效的广告重排算法,提升广告投放的整体效果。

研究目标

  1. 提升广告投放效果:通过优化广告展示顺序,提高点击率、转化率等核心指标。

  2. 增强用户体验:避免广告内容过于单一或重复,增加广告展示的多样性和相关性。

  3. 实现多目标优化:在CTR、CVR、广告主收益、平台收益等多个目标之间找到最佳平衡点。

  4. 推动技术创新:探索大模型在广告重排领域的应用潜力,为行业提供新的解决方案。

【课题6】大模型后训练优化技术在地图行为画像中的创新应用

课题说明

    本课题聚焦大模型在地图行为分析场景的落地优化,用户画像在地图业务中具有核心战略价值,但在实际业务中存在大模型计算成本高的矛盾和大模型线上计算的延时挑战;期望重点研究四大后训练优化技术:混合精度量化压缩技术、动态结构化剪枝方案、多阶段蒸馏框架、基于强化学习的意图对齐。

建议研究方向

  1. 量化压缩技术:开发混合精度量化方案、设计自适应校准策略(EMA校准+温度调节)、验证量化感知训练(QAT)在轨迹预测中的有效性;

  2. 蒸馏技术优化:构建多教师蒸馏框架(轨迹预测教师+语义理解教师)、开发轨迹对比蒸馏损失函数等;

  3. 强化学习对齐:设计多维度奖励函数、构建基于PPO的策略优化器等。



时空大模型及其应用领域  

【课题1】面向复杂交通路网路况预测的时空大模型研究

课题说明

    时空大模型将前沿的多模态大模型设计思路和时空大数据融合,作为人工智能领域的前沿方向,在提升跨模态数据分析能力、优化决策支持系统及推动产业智能化转型等方面展现出显著潜力。其核心价值在于通过融合车辆轨迹、路况、车流量、文本、图像、视频等多模态数据,结合动态时空建模技术,实现对复杂场景的深度解析与预测。例如,在交通流量预测中,可以通过构建时空大模型,整合实时路况数据与历史交通影像,动态捕捉城市路网的时空演化规律。

建议研究方向

  1. 时空序列预训练大模型:通过高德超大规模时空数据,预训练基座大模型,用于下游任务(时空序列预测、时空推荐、轨迹分类等)。

  2. 多模态时空大模型:通过遥感影像、实景影像、社交媒体文本、拥堵聊天室中的知识,为时空序列预测任务引入更多额外信息,提升预测效果。

  3. 时序概率预测大模型:时空序列与图像/视频有较多相似点,将Diffusion Model、Flow Matching等图像/视频方法,引入到时序预测/时空预测中,从数据中学习复杂时空依赖关系的隐式分布,输出具有置信区间的概率预测结果,这种预测方式为风险评估(如极端天气预警)、鲁棒决策(如交通调度)提供了关键的不确定性量化支撑。

【课题2】基于时空大模型的生成式推荐系统研究

课题说明

    随着大模型技术的快速发展,生成式推荐系统逐渐成为推荐领域的前沿方向。传统推荐系统依赖静态的匹配与排序策略,难以生成动态、个性化且可解释的推荐内容。本课题基于前期“高德特有行为序列的时空大模型预训练”研究成果,进一步探索大模型在生成式推荐中的应用,结合高德特有行为序列中的时空信息与多模态数据(如POI评论、图像),构建能够动态生成个性化推荐内容(如推荐理由、场景化建议)的智能系统。通过融合时空感知、多模态理解与生成式模型技术,实现从“匹配式推荐”向“生成式推荐”的跨越,为高德地图用户提供更自然、更智能的推荐体验。

建议研究方向

  1. 时空感知的生成式推荐模型架构设计

    • 基于预训练的时空大模型(如时空Transformer),设计生成式推荐框架,支持根据行为、实时位置、时间上下文生成个性化推荐内容。

    • 开发多模态生成技术,结合POI图像、文本评论生成图文并茂的推荐理由(如“该景点近期樱花盛开,距离您当前位置仅1.2公里”)。

  2. 鼠鼠求职首页