近日,为了赋能更多开发者基于国产全功能GPU进行AI应用创新,继火速支持DeepSeek开源周“全家桶”之后,摩尔线程又在不到两个小时的时间里,迅速高效完成了对阿里云团队开源全新推理模型通义千问QwQ-32B的Day0级支持。

据介绍,通义千问QwQ-32B是阿里探索推理模型的最新成果。在一系列权威基准测试中,千问QwQ-32B 模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。尽管该模型仅包含32B参数,但通过大规模强化学习训练,其在数学、编程及通用能力等领域实现了显著突破,展现了卓越的智能化水平。
为了更好地服务用户,此次摩尔线程将通义千问QwQ-32B开放上线至模型广场“夸娥工场”。夸娥(KUAE)是摩尔线程智算中心全栈解决方案,是以全功能GPU为底座,软硬一体化、完整的系统级算力解决方案,包括以夸娥计算集群为核心的基础设施、夸娥集群管理平台(KUAE Platform)以及夸娥大模型服务平台(KUAE ModelStudio),旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题,而夸娥工场则是摩尔线程倾力打造的模型展示中心,旨在为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。基于大语言模型高速推理框架vLLM以及MT Transformer推理引擎部署的QwQ-32B,基于在实际运行中展现出的卓越的推理性能与稳定性,从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini及Deepseek的各个蒸馏版本。在LiveBench与BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

凭借强大的性能和灵活性,开源大模型正在突破传统技术局限,成为不可阻挡的发展趋势。通过支持DeepSeek开源周“全家桶”,对千问QwQ-32B实现Day0级支持,摩尔线程充分验证了MUSA架构和全功能GPU的技术成熟度,以及MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势,更让国产全功能GPU有了更多AI创新应用场景。