音乐理解实习研究员
上海
本科及以上
计算机类·电子信息类
使用简历深度优化功能,快速提升简历质量
职位介绍
工作职责 1、Vocal understanding大模型搭建. 基于现有audio understanding模型框架 (例如qwen-audio), 针对歌声这一垂类进行优化, 在相应的理解维度得到更优的结果. 包括但不限于timbre tagging, gender/emotion/genre classification等. 2、Pretrain data pipeline搭建. 利用现有模型搭建一套数据预处理pipeline, 包括但不限于歌词识别, 歌词对齐, music source separation, vocal tran scription, beat tracking, key/mode detection等. 3、参数sft数据建设的讨论, 包括标准规范制定&优化, 协助数据验收交付. 4、验证和分析对比歌声生成模型的效果 任职要求 1、硕士及以上学历,计算机、数学、通信等相关专业;具备良好的学习能力、逻辑思维能力、沟通协作能力; 2、熟练使用Python和Pytorch/Tensorflow深度学习框架; 3、有顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等)优先。

