下载app

扫码下载

扫码关注

新华报业网  > 财经 > 正文
通义灵码携 Qwen2.5-Max 震撼登场,编程能力问鼎榜首

近期,通义灵码上新了模型选择功能,除支持 DeepSeek 满血版 V3 和 R1 外, Qwen2.5-Max 也正式上线。据了解,在三方基准测试平台Chatbot Arena公布的最新大模型盲测榜单中,Qwen2.5-Max 超越 DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型;同时,Qwen2.5-Max在数学和编程等单项能力上排名第一。用户可以在通义灵码智能问答、AI 程序员窗口的输入框中,单击模型选择的下拉菜单即可体验 Qwen2.5-Max

通义灵码是基于通义大模型的 AI 研发辅助工具,提供代码智能生成、研发智能问答、多文件代码修改、任务自主执行等能力,这次内置最新的 Qwen2.5-Max 模型,编程能力、速度、准确率全面提升。据了解,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

此外,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现领先。同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中,将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B,以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比,如下图所示,通义千问的基座模型在大多数基准测试中都展现出了显著的优势。

通义灵码作为国内首个真正落地的 AI 程序员,在上线后展现出诸多优势。它支持 VS Code、JetBrains IDEs 等主流开发工具,实现前后端开发全覆盖,能够通过全程对话协作帮助开发者从 0 到 1 完成复杂编码任务,比如需求实现、问题修复以及批量生成单元测试等多文件级编码任务,这得益于 Qwen2.5 - Max 和 DeepSeek 满血版等开放强大的底层模型加持,从而为开发者提供了更高效、便捷的编程辅助体验,有力地推动了编程领域的发展与创新。

 

目前,通义灵码已经内置 DeepSeek 满血版以及 Qwen2.5-Max,欢迎大家下载通义灵码插件,体验全面、强大的编程能力!

责编:章强
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间