logologo
寻找工作
2025-03-04 更新

深圳市腾讯计算机系统有限公司

行业应用软件 · 民营企业 · 成立27年
简章详情

腾讯混元再度上新,正式发布自研快思考模型 Turbo S!吐字速度提升一倍,首字时延降低44%。现已在腾讯元宝APP上线,即刻可体验信息秒回的丝滑感。


不断探索技术突破的腾讯混元团队也在持续热招中!


我们有着充沛的算力资源、丰富的训练数据,以及腾讯业务生态下多元的应用场景。

期待更多热爱AI大模型领域的优秀人才加入腾讯混元,一同探索世界级前沿技术突破,开拓AI领域的无限未来!


社招岗位

  • 混元大模型算法工程师-大模型推理能力

  • 混元大模型推理加速工程师

  • 混元大模型预训练算法研究员/专家研究员

  • 混元深度学习框架高级研发工程师-预训练

  • 混元机器学习平台GPU调度研发工程师

  • 混元大语言模型精调算法工程师-代码方向 

  • 混元大模型数据专家工程师

  • 音频数据算法工程师

  • 大模型数据工程算法工程师

  • 混元大模型数据分析师

  • 混元大模型多模态算法研究员

  • 混元大模型数据运营

  • 混元大模型评测研究员

  • 大模型评测运营

  • 混元-AIGC算法研究员-文生图

  • 混元-AIGC算法研究员-文生3D

  • 混元-AIGC算法研究员-多模态基模

  • ……

点击查看混元社招岗位


校招&实习生招聘岗位

  • 技术研究-计算机视觉方向/自然语言处理方向/机器学习方向/多模态方向/多媒体处理方向/高性能计算方向/数据科学方向

  • 安全技术

点击查看混元实习生招幅


腾讯混元新一代快思考模型 Turbo S 正式发布。
区别于 Deepseek R1、混元T1等需要“想一下再回答”的慢思考模型,混元 Turbo S 能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低44%。

在知识、数理、创作等方面,混元 Turbo S 也有不错表现。

有研究表明,人类约90%—95%的日常决策依赖直觉。慢思考更像理性思维,通过拆解逻辑提供解决问题的思路;快思考正如人的“直觉”,为大模型提供了通用场景下的快速响应能力。

快思考和慢思考的结合和补充,可以让大模型更智能、更高效地解决问题。

通过长短思维链融合,混元 Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,显著改进了理科推理能力,实现模型整体性能明显提升。


在业界通用的多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude等一系列业界领先模型的效果表现。


架构方面,创新采用 Hybrid-Mamba-Transformer 融合模式,混元Turbo S有效降低了传统 Transformer 结构的计算复杂度,减少了KV-Cache缓存占用,实现训练和推理成本的下降。

新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面,发挥了 Mamba 高效处理长序列的能力;另一方面,也保留 Transformer 擅于捕捉复杂上下文的优势,最终构建了显存与计算效率双优的混合架构。

这也是工业界首次成功将 Mamba 架构无损地应用在超大型MoE模型上。

通过模型架构上的技术创新,混元 Turbo S 部署成本大幅下降,持续推动大模型应用门槛降低。

<p>Hunyuan-TurboS</p>
<p>GPT4o-0806</p>
<p>Knowledge</p>
<p>MMLU</p>
<p>MMLU-pro</p>
<p>GPQA-diamond<br/>SimpleQA</p>
<p>Chinese-SimpleQA</p>
<p>89.5</p>
<p>79.0</p>
<p>57.5</p>
<p>22.8</p>
<p>70.8</p>
<p>88.7</p>
<p>74.9</p>
<p>53.1</p>
<p>38.2</p>
<p>59.3</p>
<p>Claude-3.5<br/>Sonnet-1022<br/>88.3</p>
<p>78.0</p>
<p>65.0</p>
<p>28.4</p>
<p>51.3</p>
<p>Llama3.1-405B</p>
<p>88.6</p>
<p>73.3</p>
<p>51.1</p>
<p>17.1</p>
<p>50.4</p>
<p>DeepSeek V3<br/>88.5</p>
<p>75.9</p>
<p>59.1</p>
<p>24.9</p>
<p>68.0</p>
<p>BBH</p>
<p>92.2</p>
<p>91.7</p>
<p>92.,6</p>
<p>89.2</p>
<p>92.3</p>
<p>Reasoning</p>
<p>DROP</p>
<p>91.5</p>
<p>79.8</p>
<p>88.3</p>
<p>91.2</p>
<p>91.6</p>
<p>ZebraLogic</p>
<p>46.0</p>
<p>31.7</p>
<p>35.1</p>
<p>30.1</p>
<p>38.5</p>
<p>Math</p>
<p>MATH</p>
<p>AIME2024</p>
<p>89.7</p>
<p>43.3</p>
<p>75.9</p>
<p>23.3</p>
<p>78.3</p>
<p>16.0</p>
<p>73.8</p>
<p>23.3</p>
<p>87.8</p>
<p>39.2</p>
<p>Code</p>
<p>HumanEval</p>
<p>LiveCodeBench</p>
<p>91.0</p>
<p>32.0</p>
<p>90.0</p>
<p>35.1</p>
<p>95.0</p>
<p>38.7</p>
<p>89.0</p>
<p>30.2</p>
<p>89.0</p>
<p>37.6</p>
<p>Chinese</p>
<p>C-Eval<br/>CMMLU</p>
<p>90.9</p>
<p>90.8</p>
<p>76.0</p>
<p>77.3</p>
<p>80.0</p>
<p>81.2</p>
<p>72.7</p>
<p>75.4</p>
<p>86.5</p>
<p>83.5</p>
<p>LiveBench</p>
<p>61.0</p>
<p>56.0</p>
<p>60.3</p>
<p>53.2</p>
<p>60.5</p>
<p>Alignment</p>
<p>ArenaHard<br/>IF-Eval</p>
<p>88.6</p>
<p>88.6</p>
<p>74.9</p>
<p>85.7</p>
<p>85.2</p>
<p>89.3</p>
<p>69.3</p>
<p>86.0</p>
<p>85.5</p>
<p>86.1</p>
<p>100</p>
<p>90</p>
<p>80</p>
<p>70</p>
<p>60</p>
<p>50</p>
<p>40</p>
<p>30</p>
<p>20</p>
<p>10</p>
<p>0</p>
<p>MMLU-pro<br/>GPQA-diamond</p>
<p>DROP</p>
<p>Hunyuan-TurboS</p>
<p>GPT4o-0806</p>
<p>LiveCodeBench<br/>Claude-3.5-Sonnet</p>
<p>AIME2024</p>
<p>LiveBench</p>
<p>ArenaHard</p>
<p>Llama3.1-405B</p>
<p>DeepSeek V3</p>

作为旗舰模型,混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。

基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元也推出了具备深度思考的推理模型 T1。

该模型此前已在腾讯元宝全量上线腾讯混元T1模型面向所有用户开放用户可以选择Deepseek R1 或腾讯混元T1模型进行回答。

腾讯混元T1模型正式版也将很快上线,对外提供 API 接入等服务。





当前,开发者和企业用户已经可以在腾讯云上通过 API 调用腾讯混元 Turbo S ,即日起一周内免费试用。腾讯混元turbos模型API免费试用申请
https://cloud.tencent.com/apply/p/i2zophus2x8

定价上,Turbo S 输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元 Turbo 模型价格下降数倍。


腾讯元宝已正式上线「混元Turbo S」。
鼠鼠求职首页