首页 > 快讯 阿里通义千问3登顶全球权威开源模型测评榜 快讯 零壹财经 零壹财经 2025-05-06 阅读:2608 关键词:通义千问阿里大模型 5月6日讯,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)斩获全球开源模型冠军,并在指令遵循(Instruction Following)这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一。据了解,LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)联合纽约大学等机构推出,从数学、推理、编程、语言理解等多个复杂维度全面评估大模型。因其采用动态更新的题库,被誉为“全球首个无法作弊的模型基准测试”。(上证报) 上一篇>新疆首笔服务贸易项下“货币桥”业务落地 下一篇>商汤与中国移动香港、香港中文大学法律学院就视觉AI、大模型等领域达成合作 相关文章 微信支付香港已覆盖超过15万家本地商户 蚂蚁国际回应将在香港申请稳定币牌照 蚂蚁数科启动申请香港稳定币牌照 中关村科金发布多项垂类大模型领先成果 用户评论 游客 自律公约 登录后发布 所有评论 主编精选 more 消金合作名单披露迷局:990条数据背后的行业现状与问题 上市银行新生成不良率排行榜:最低0.23%,最高超2%,半数指标“变坏” 阿里系消金布局再深化:流量APP全员下场,蚂蚁消金重回增长 消金的新红利时代 京东战略布局RWA,并衔接稳定币和数字人民币 专题推荐more 第四届中国零售金融发展峰会(共15篇) 02-06 郭田勇:零售金融发展,要发挥平台机构的作用 01-20 星图金融研究院副院长薛洪言:2023年消费信贷或迎来新起点 01-20 上海科技金融研究所执行副所长孟添:开放银行与嵌入式金融为数字普惠金融带来更大发展空间 资讯排行 48h 7天 中办、国办:探索央行数字货币在跨境领域的适用性 字节跳动推出视频模型Seedance 1.0 pro 豆包大模型1.6正式发布,价格较前一代下降63% OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待” 美团发布首款AI Coding Agent,编程“小白”聊天就能做游戏、网站 碳足迹“安卓”系统TIDAS发布 蚂蚁数科提供自主可控技术支持 消金合作名单披露迷局:990条数据背后的行业现状与问题 稳定币发行方Circle估值或达69亿美元 AI视频软件PixVerse发布国内版——拍我AI 智源发布“悟界”系列大模型,宣布围绕物理AGI进行布局 首页 评论 回顶部
游客
自律公约