首页 > 快讯 阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一 快讯 零壹财经 零壹财经 2025-04-29 阅读:409 关键词:阿里通义人工智能 阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,极大节省了算力消耗。据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。(新浪科技) 上一篇>南京银行首席信息官余宣杰:正在加快部署大模型,今年要落地100个场景 下一篇>前微软高管剖析 ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像 相关文章 苏州银行:总资产突破7000亿,个人消费贷增超15%,跨境金融势头迅猛 小米开源“Xiaomi MiMo”大模型:为推理而生 2025Q1手机银行数字竞争力排行榜TOP100 (总第14期) 国家数据局报告:数据生产量同比增长25%,约66%龙头企业购买过数据 用户评论 游客 自律公约 登录后发布 所有评论 主编精选 more 2024年中国大模型发展指数报告(总第3期) 年报管窥:朗新RWA的底层资产怎么样 合规催收新范式:破解消费贷“既要又要”两难困局 宁波银行有什么「确定性」? 新能源RWA,为Web3.0注入新的“锚” 专题推荐more 第四届中国零售金融发展峰会(共15篇) 02-06 郭田勇:零售金融发展,要发挥平台机构的作用 01-20 星图金融研究院副院长薛洪言:2023年消费信贷或迎来新起点 01-20 上海科技金融研究所执行副所长孟添:开放银行与嵌入式金融为数字普惠金融带来更大发展空间 资讯排行 48h 7天 2025Q1手机银行数字竞争力排行榜TOP100 (总第14期) 2024年中国大模型发展指数报告(总第3期) 商务部:3000亿以旧换新资金已落地1600亿,拉动消费超7200亿 年报管窥:朗新RWA的底层资产怎么样 商汤:香港为科创学术研究及应用落地沃土 将大模型技术应用到日常生活中 2025年中国知识产权创新调研报告:AI点燃知识产权生产力革命 2025Q1手机银行数字竞争力排行榜TOP100 (总第14期) 智慧芽调研报告:超85%受访企业知识产权团队积极引入AI 2024年中国大模型发展指数报告(总第3期) 商务部:3000亿以旧换新资金已落地1600亿,拉动消费超7200亿 首页 评论 回顶部
游客
自律公约