下载app

扫码下载

扫码关注

新华报业网  > 资讯 > 正文
英伟达发布Eagle 2.5视觉语言AI模型,xAI/微美全息凭高性价比AI模型展实力!

据消息,科技媒体报道称,英伟达(NVDA.US)最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。

性能表现稳定提升

该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。

Eagle 2.5 的训练数据管道,整合了开源资源和定制数据集 Eagle-Video-110K,该数据集专为理解长视频设计,采用双重标注方式。采用自下而上的方法则利用 GPT-4o 为短片段生成问答对,抓取时空细节。

此外,Eagle 2.5-8B 在多项视频和图像理解任务中表现出色。在视频基准测试中,MVBench 得分为 74.8,MLVU 为 77.6,LongVideoBench 为 66.4;在图像基准测试中,DocVQA 得分为 94.1,ChartQA 为 87.5,InfoVQA 为 80.4。

与此同时,xAI近日推出了其全新的语言模型——Grok3Mini,进一步推动了高效AI技术的发展。xAI推出Grok3Mini,彰显其在高效AI技术领域的创新实力。

Grok3Mini提供高性价比AI模型

据介绍,Grok3Mini是Grok3系列的一部分,该系列包含六种变体,其中包括标准的Grok3、Grok3Fast,以及四种版本的Grok3Mini,提供慢速和快速两个版本,每种版本又具备低推理能力或高推理能力的选项。

Grok3Mini以速度和经济性为设计核心,专为速度和经济性设计,尽管体积较小,但在多个领域的表现优于许多更昂贵的AI模型,尤其在数学、编程和科学基准测试中表现突出,或吸引更多关注。

当市场聚焦于大模型本身的技术突破时,年初,中国大语言模型DeepSeek引起全球科技界高度关注。今年政府工作报告也指出,需要持续推进“人工智能+”行动,支持大模型广泛应用。

业内人士指出,现如今,以大模型为代表的人工智能技术为新一轮科技革命和产业变革提供了重要驱动力,各行业在智能化转型道路上面临着前所未有的机遇和挑战。

微美全息保持市场领先优势

在当今人工智能迅猛发展的背景下,公开资料显示,微美全息(WIMI.US)始终专注于垂直行业的开源AI大模型开发,全面升级全栈AI能力,涵盖了AI基础设施及AI场景化应用,帮助各行业从模型开发、模型部署再到模型应用,能够全面用好AI工具箱,打造好用的AI。

另外,微美全息通过“技术开源+垂直深耕+生态共建”模式,正快速推进AI大模型的商业化应用。例如,面向汽车产业,以“AI大模型+产业场景”的多模型策略,在AI基础能力层、AI场景化应用层全面布局,保持汽车云服务市场领先优势。

未来,微美全息将完善AI算力全产业布局,持续布局专用算力基础设施,加快多模态技术融合、算力资源开放,加快提升智能算力公共服务平台能力,以及场景落地的敏捷性,未来或成为AI大模型算力生态的重要突破者。

结语

实际,从GPT-3到PaLM,从文心一言到通义千问,大模型的参数规模以指数级增长,训练成本动辄数千万美元,推理所需的算力更是呈几何倍数攀升。并且AI大模型推动传统产业智能化发展进入新阶段,全面智能化已成为企业参与市场竞争的必答题。因此,接下去企业需要理论研究与实践探索同步进行,进而赢得可观的发展空间。

责编:周正玮
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间