返回简章2026-05-12 更新

27暑期-多模态语音算法工程师[北京]

北京

本科及以上

电子信息类·计算机类

使用简历深度优化功能，快速提升简历质量

职位介绍

岗位职责：

1. 参与语音算法核心能力建设，围绕语音识别、语音合成、多模态理解等方向，结合前沿模型与真实业务场景推进技术探索与能力落地。

2. 与产品、工程团队协同推进算法方案落地，持续优化模型效果、系统性能与用户体验，让模型能力真正转化为可感知的产品价值。

3. 跟踪语音与多模态方向前沿进展，结合业务问题参与技术选型、方案设计与实验迭代，将研究方法转化为实际可用的解决方案。

4. 参与训练数据、评测体系与实验流程建设，在完整研发链路中积累从模型探索到上线优化的实践经验。

任职资格：

1. 计算机、自动化、电子信息、人工智能等相关专业，硕士及以上学历。

2. 具备扎实的数学、算法与机器学习基础，对语音、语音合成、多模态等方向有持续兴趣。

3. 具备较强的编程与工程实践能力，熟练使用 C/C++、Python，熟悉至少一种主流开源深度学习框架。

4. 具备良好的问题分析与解决能力，能够围绕实际问题开展实验、分析结果并持续优化方案。

5. 具备良好的沟通能力与团队协作意识，能够在跨团队协作中高效推进工作。

优先条件：

1. 具备大规模 ASR / TTS 模型训练、优化或部署经验。

2. 在语音生成、语音克隆、语音理解、多模态建模等方向有项目、研究或工程实践积累。

3. 具备将研究方案推进到实际落地的经验，能够兼顾模型效果与工程可用性。

加分项：

- 在 Interspeech、ICASSP 等顶会或期刊发表过论文；

- 有语音相关竞赛获奖经历；

- 有高质量开源项目、研究实习或工程落地经验。

你将获得：

1. 直接参与前沿语音与多模态技术在真实业务场景中的落地机会。

2. 在研究、工程、产品协作的完整链路中积累经验，提升从技术探索到业务落地的综合能力。

3. 与算法、工程、产品团队密切合作，在高质量项目中快速成长。

职位来源

作业帮教育科技(北京)有限公司

民营企业 · 商业服务 · 成立10年

在招职位