返回简章2025-10-22 更新

语音算法工程师（ASR大模型）（上海）

上海

本科及以上

不限专业

使用简历深度优化功能，快速提升简历质量

职位介绍

职位描述 - 负责端到端语音识别大模型的训练、微调与优化，面向机器人语音交互场景、构建高鲁棒性识别能力； - 基于 Whisper、Parakeet 等大规模预训练模型，进行压缩（蒸馏、量化）、结构优化与风格适配，提升模型推理效率与产品适配性； - 研究并实现多模态融合识别方案，强化复杂场景下语音感知能力、推进先进训练范式落地； - 联合VAD、声纹模块，构建具备全链路协同优化能力的语音系统; - 关注生成式 AI 和多模态交互技术，对推动人形机器人智能化有热情。职位要求 - 本科及以上学历，计算机、人工智能、电子、数学等相关专业； - 出色的问题分析和解决能力，自主探索新解决方案的能力强； - 关注生成式 AI 和多模态交互技术，对推动人形机器人智能化有热情； - 熟悉当前主流语音大模型架构，具备 ASR 预训练/微调经验。加分项： - 有 Whisper 等大模型的蒸馏调优、参数高效微调（如 LoRA、Adapter）经验者 - 精通NeMo 等开源工具链，具备分布式训练与模型压缩能力; - 有机器人语音系统研发经验或复杂语音场景（噪声、多人、跨语种）实战经验者; - 在HCI、HRI、RSS、CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等会议/期刊上发表论文者； - 具有优秀的代码能力和竞赛精神，ACM/ICPC、RoboMaster等比赛获奖者。

职位来源

智元创新(上海)科技有限公司

民营企业 · 人工智能解决方案 · 成立3年

在招职位

语音算法工程师（ASR大模型 ）（上海）

语音算法工程师（ASR大模型）（上海）