首页 > 快讯 阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一 快讯 零壹财经 零壹财经 2025-04-29 阅读:2519 关键词:阿里通义人工智能 阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,极大节省了算力消耗。据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。(新浪科技) 上一篇>南京银行首席信息官余宣杰:正在加快部署大模型,今年要落地100个场景 下一篇>前微软高管剖析 ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像 相关文章 网商银行公布AI信贷、理财、营销新进展,提出“新310”模式 中国银行保险报联合OceanBase及19家编委银行发布“AI时代中小银行数据库报告” 支付宝发布政务AI助手“晓政”,全国16000种服务一键直达 稳定币成败启示录之二:香港的唯一出路是打造全球第一的稳定币市场 用户评论 游客 自律公约 登录后发布 所有评论 主编精选 more 稳定币成败启示录之二:香港的唯一出路是打造全球第一的稳定币市场 稳定币成败启示录之一:为什么美元赢了,欧洲输了? 头部助贷稳了,新规十月见 宁波银行:韧性与突破 柏亮:RWA和稳定币链接了一个新流动性体系 专题推荐more 第四届中国零售金融发展峰会(共15篇) 02-06 郭田勇:零售金融发展,要发挥平台机构的作用 01-20 星图金融研究院副院长薛洪言:2023年消费信贷或迎来新起点 01-20 上海科技金融研究所执行副所长孟添:开放银行与嵌入式金融为数字普惠金融带来更大发展空间 资讯排行 48h 7天 中科大孙玄外滩大会分享:通过AI设计核聚变堆,或将破解算力能源瓶颈 稳定币成败启示录之一:为什么美元赢了,欧洲输了? 宇树科技官宣IPO后王兴兴首次发声 “现在AI干活还是一片荒漠” 张宏江外滩大会分享:基础设施加速扩张,AI 正步入“产业规模化” 蚂蚁集团数字蚂力首批专家级“AI数字员工团队”亮相外滩大会 首页 评论 回顶部
游客
自律公约