首页 > 快讯

阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一

快讯 零壹财经 零壹财经 2025-04-29 阅读:409

关键词:阿里通义人工智能


阿里巴巴开源了新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,宣布成本大幅下降,性能超越R1、OpenAI-o1等领先模型。千问3是一个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,极大节省了算力消耗。据了解,千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段经过多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。(新浪科技)

上一篇>南京银行首席信息官余宣杰:正在加快部署大模型,今年要落地100个场景

下一篇>前微软高管剖析 ChatGPT 变谄媚根源:人类不喜 AI 直言的人格画像



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 157ms