南方财经5月9日电,今日,阿里云正式发布通义千问2.5,在权威基准OpenCompass上,该模型得分追平GPT-4 Turbo,同时,通义千问最新开源的1100亿参数模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。21世纪经济报道)
>ω<
在MMLU、C-Eval、HumanEval等多个基准测试中,Qwen1.5-110B都重返SOTA开源模型宝座,超越Llama 3 70B,成最强开源大模型。中文能力方面,对比仅喂了5%非英文数据的Llama 3 70B,Qwen1.5-110B更是优势明显。于是乎,模型一上线,开源社区已经热烈响应起来。这不,Qwen1.5-11是什么。
zai M M L U 、 C - E v a l 、 H u m a n E v a l deng duo ge ji zhun ce shi zhong , Q w e n 1 . 5 - 1 1 0 B dou zhong fan S O T A kai yuan mo xing bao zuo , chao yue L l a m a 3 7 0 B , cheng zui qiang kai yuan da mo xing 。 zhong wen neng li fang mian , dui bi jin wei le 5 % fei ying wen shu ju de L l a m a 3 7 0 B , Q w e n 1 . 5 - 1 1 0 B geng shi you shi ming xian 。 yu shi hu , mo xing yi shang xian , kai yuan she qu yi jing re lie xiang ying qi lai 。 zhe bu , Q w e n 1 . 5 - 1 1 shi shen me 。
通义千问首次推出千亿级参数模型Qwen1.5-110B,在MMLU、TheoremQA、GPQA等多个基准测评中展现出卓越性能。目前Qwen1.5系列已累计开源10款大模型,通义千问开源模型下载量超过700万。本文源自金融界
>﹏<
编译| 长颈鹿编辑| 李水青智东西4月19日消息,4月18日,Meta推出迄今为止能力最强的开源大模型Llama 3系列,发布8B和70B两个版本。Llama 3在一众榜单中取得开源SOTA(当前最优效果)。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mis等会说。
+0+
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来Meta宣布推出Llama3,这是一个开源SOTA语言模型,有80亿和700亿参数版本。该模型在多个基准测试中表现优异,包括MMLU、GPQA和HumanEval等。Llama3的发布在开源社区引起了广泛关注,其性能被认为超越了同好了吧!
≥△≤
克雷西鱼羊发自凹非寺量子位| 公众号QbitAILlama 3来了!就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。并且推出即为开源SOTA:Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过神经网络。
●0●
白交发自凹非寺量子位| 公众号QbitAI澜舟科技官宣:孟子3-13B大模型正式开源!这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。尤其在参数量20B以内的轻量化大好了吧!
梦晨发自凹非寺量子位| 公众号QbitAI成立仅9个月,法国Mistral AI拿出仅次于GPT-4的大模型。在所有已能通过API访问的大模型中排第二,全班唯二在MMLU考试中拿80分以上的。一举获得微软青睐,签署了多年合作协议。也就是说,微软不再独宠OpenAI了。同时推出在线聊天机器人平神经网络。
ˋωˊ
明敏丰色发自凹非寺量子位| 公众号QbitAI悄无声息,羊驼家族“最强版”来了!与GPT-4持平,上下文长度达3.2万token的LLaMA 2 Long,正式登场。在性能上全面超越LLaMA 2。和竞争对手相比,在指令微调MMLU (5-shot)等测试集上,表现超过ChatGPT。在人类评估(human evaluation)上神经网络。
ゃōゃ
MMLU、GPQA、GSM8K等8项测试得分均力压GPT-4,展现出接近人类的理解和流畅性;Sonnet作为中间选择,巧妙地平衡了处理速度和计算效率,同时兼顾经济性,在需要大规模部署的企业级应用场景中具有优势;而Haiku是三者中最快、体积最小的模型,对于arXiv网站上一篇信息和数据密神经网络。
发表评论