首页 > 快讯

阿里云通义开源首个推理步骤评估标准

快讯 零壹财经 零壹财经 2025-01-16 阅读:2161

关键词:阿里通义人工智能


1月16日讯,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队还开源首个步骤级的评估标准 ProcessBench,填补了大模型推理过程错误评估的空白。(新浪财经)

上一篇>用户被异地刷脸支付成功,腾讯:已先行全额补偿

下一篇>国产视频大模型Vidu 2.0发布,1秒低至“4分钱”



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 206ms