首页 > 快讯

红杉中国正式开源AI基准测试xbench评测集

快讯 零壹财经 零壹财经 2025-06-18 阅读:280

关键词:红杉中国人工智能


6月18日讯,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开发者,同时尽力避免静态评测集经常出现的过拟合问题,确保xbench的长期有效。(新浪财经)

上一篇>美国参议院通过稳定币法案

下一篇>谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 143ms