【快Star-X】多模态模型优化算法工程师
上海·北京
硕士及以上
电子信息类·计算机类
使用简历深度优化功能,快速提升简历质量
职位介绍
职位描述
1、diffusion步数压缩: 探索 diffusion 模型的 one-step / few-steps 的无损蒸馏算法, 跟进学术界最前沿的 few-steps diffusion 算法, 包括但不限于 consistency modeling, shortcut, score distillation等方案, 打造实时化的极致高效可灵/可图 大模型;
2、高效attention设计: 探索新一代注意力实现机制, 包括但不限于: sparse/quant-attention, linear-attention, mamba等, 打破 attention 计算平方复杂度限制, 解决 长序列视频/图像 引起的推理挑战, 推进 可灵/可图 大模型的长序列场景下的推理极限;
3、强化反馈优化: 应用 DPO/GRPO/PPO 等强化学习的手段调优模型效果, 在模型压缩的前置条件下探索强化学习与压缩算法的化学反应, 推动 可灵/可图 大模型的效果-效率帕雷托前沿新SOTA。
任职要求
1、 硕士及以上学历,数学、计算机、自动化、电子等专业优先;
2、 熟练掌握diffusion原理, 具备公式推理和证明的能力, 有过相关的研究经历和实践经验者优化;
3、 熟悉transformer结构及其变种, 熟悉attention的设计和多种变种实现, 掌握triton;
4、数理要求: 熟练掌握 线性线数, 概率论, 信息论, 凸优化等基础知识; 了解矩阵论, 随机过程等;
5、有较强的自驱力和学习力,对生成式模型有强烈的兴趣。
加分项:
1、有 NIPS/ICLR/ICML/CVPR 等顶会发表经历者优先;
2、有强化学习的实践经历优化。
1、diffusion步数压缩: 探索 diffusion 模型的 one-step / few-steps 的无损蒸馏算法, 跟进学术界最前沿的 few-steps diffusion 算法, 包括但不限于 consistency modeling, shortcut, score distillation等方案, 打造实时化的极致高效可灵/可图 大模型;
2、高效attention设计: 探索新一代注意力实现机制, 包括但不限于: sparse/quant-attention, linear-attention, mamba等, 打破 attention 计算平方复杂度限制, 解决 长序列视频/图像 引起的推理挑战, 推进 可灵/可图 大模型的长序列场景下的推理极限;
3、强化反馈优化: 应用 DPO/GRPO/PPO 等强化学习的手段调优模型效果, 在模型压缩的前置条件下探索强化学习与压缩算法的化学反应, 推动 可灵/可图 大模型的效果-效率帕雷托前沿新SOTA。
任职要求
1、 硕士及以上学历,数学、计算机、自动化、电子等专业优先;
2、 熟练掌握diffusion原理, 具备公式推理和证明的能力, 有过相关的研究经历和实践经验者优化;
3、 熟悉transformer结构及其变种, 熟悉attention的设计和多种变种实现, 掌握triton;
4、数理要求: 熟练掌握 线性线数, 概率论, 信息论, 凸优化等基础知识; 了解矩阵论, 随机过程等;
5、有较强的自驱力和学习力,对生成式模型有强烈的兴趣。
加分项:
1、有 NIPS/ICLR/ICML/CVPR 等顶会发表经历者优先;
2、有强化学习的实践经历优化。


