阿里史上最大规模开源发布,阿里Qwen2.5性能跨量级超Llama3.1
2024-09-20 11:00uSMART

阿里推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math,三大类模型共有10多个版本,Qwen2.5在多个基准测试中击败了Llama-3.1指令微调模型,该系列预训练数据大幅度增长达18万亿tokens。

今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。

这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。

如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,帮助你快速开发或集成生成式AI功能。

9月19日杭州,阿里云推出全球最强开源大模型Qwen2.5-72B,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。

同时,一大串Qwen2.5系列模型随之开源,包括:语言模型Qwen2.5、视觉语言模型Qwen2-VL-72B、编程模型Qwen2.5-Coder、数学模型Qwen2.5-Math等,累计上架超100个,部分性能赶超GPT-4o,刷新世界纪录。

Qwen2.5在海内外社交媒体上掀起讨论热潮

以结合视觉识别的Qwen2.5-Math为例,当输入一张数学题截图,Qwen2.5-Math快速识别题意,并给出了正确的解题过程和答案,准确与速度都不错。

一、再登全球榜首,Qwen2.5跨量级赶超Llama3.1-405B

具体来看看Qwen2.5的性能。

Qwen2.5模型支持高达128K的上下文长度,可生成最多8K内容,支持超29种语言,这意味着能帮用户胜任万字文章撰写。

不仅如此,基于18T token数据预训练,相比Qwen2,Qwen2.5整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。

据悉,旗舰模型Qwen2.5-72B模型在MMLU-rudex基准(考察通用知识)、MBPP 基准(考察代码能力)和MATH基准(考察数学能力)的得分高达86.8、88.2、83.1。

720亿参数的Qwen2.5,甚至“跨数量级”超越4050亿巨量参数的Llama3.1-405B。

Llama3.1-405B由Meta于2024年7月发布,在150多个基准测试集中追平甚至超越了当时SOTA(业界最佳)模型GPT-4o,引发“最强开源模型即最强模型”论断。

Qwen2.5指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等权威测评中,超越Llama3.1-405B。

二、史上最大模型族群诞生,开源模型上架超百个

Qwen2.5开源模型数量史无前例。

阿里云CTO周靖人在云栖大会上宣布,Qwen2.5系列总计上架开源模型超过100个,充分适配各种场景的开发者和中小企业需求。

1、语言模型:从0.5B到72B七个尺寸,从端侧到工业级场景全覆盖

Qwen2.5开源了7个尺寸语言模型,包括0.5B、1.5B、3B、7B、14B、32B、72B,均在对应赛道实现了SOTA成绩。

三、通义千问Qwen下载破4000万,“产仔”超5万个

狂飙一年半,通义千问已成为仅次于Llama的世界级模型群。

周靖人公布的两组最新数据对此进行了印证:

一是模型下载量,截至2024年9月初,通义千问开源模型累计下载量已经突破4000万,这是开发者和中小企业用脚投票的结果;

二是衍生模型数量,截至9月初,通义原生模型和衍生模型总数超过5万个,仅次于Llama。

 

追踪我们

Twitter, Instagram, YouTube TikTok 追踪我们,查阅更多实时财经市场资讯。

想和全球志同道合的人交流和发现投资的乐趣?加入uSMART投资社群并分享您的独特观点!立刻体验uSMART?点击下方图片下载uSMART app。

 

 

 

重要提示及免责声明

我们在撰写这篇文章时,基于我们的内部研究和可靠的公开信息来源。尽管我们在准备这篇文章时已经采取了所有合理的注意事项,但我们不保证本文中的信息准确或完整,并对事实错误或本文中的任何观点不承担责任。观点、预测和估计反映了我们在文章发布日期的评估,并可能发生变化。我们无义务通知您或任何人有关任何此类变化。您必须对本文中涉及的任何事项做出独立判断。我们及我们各自的董事、高管或员工将不对任何人因依赖本文中的任何陈述或遗漏而遭受的任何损失或损害承担责任。

这些证券的价值和收益可能会上升或下降。您的投资面临投资风险,包括收入和资本损失。过去的业绩数据以及本文中使用的任何预测或预测并不代表其未来表现。

此广告未经新加坡金融管理局审查。