logologo
寻找工作
返回简章2026-05-12 更新

27暑期-多模态语音算法工程师[北京]

北京
本科及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
岗位职责:

1. 参与语音算法核心能力建设,围绕语音识别、语音合成、多模态理解等方向,结合前沿模型与真实业务场景推进技术探索与能力落地。

2. 与产品、工程团队协同推进算法方案落地,持续优化模型效果、系统性能与用户体验,让模型能力真正转化为可感知的产品价值。

3. 跟踪语音与多模态方向前沿进展,结合业务问题参与技术选型、方案设计与实验迭代,将研究方法转化为实际可用的解决方案。

4. 参与训练数据、评测体系与实验流程建设,在完整研发链路中积累从模型探索到上线优化的实践经验。



任职资格:

1. 计算机、自动化、电子信息、人工智能等相关专业,硕士及以上学历。

2. 具备扎实的数学、算法与机器学习基础,对语音、语音合成、多模态等方向有持续兴趣。

3. 具备较强的编程与工程实践能力,熟练使用 C/C++、Python,熟悉至少一种主流开源深度学习框架。

4. 具备良好的问题分析与解决能力,能够围绕实际问题开展实验、分析结果并持续优化方案。

5. 具备良好的沟通能力与团队协作意识,能够在跨团队协作中高效推进工作。



优先条件:

1. 具备大规模 ASR / TTS 模型训练、优化或部署经验。

2. 在语音生成、语音克隆、语音理解、多模态建模等方向有项目、研究或工程实践积累。

3. 具备将研究方案推进到实际落地的经验,能够兼顾模型效果与工程可用性。

加分项:

- 在 Interspeech、ICASSP 等顶会或期刊发表过论文;

- 有语音相关竞赛获奖经历;

- 有高质量开源项目、研究实习或工程落地经验。

你将获得:

1. 直接参与前沿语音与多模态技术在真实业务场景中的落地机会。

2. 在研究、工程、产品协作的完整链路中积累经验,提升从技术探索到业务落地的综合能力。

3. 与算法、工程、产品团队密切合作,在高质量项目中快速成长。