昆仑万维:天工大模型推理能力领先GPT-3.5
快讯 零壹财经 零壹财经 2023-10-20 阅读:1677
10月19日,昆仑万维表示,天工AI助手的手机App已开启内测。日前,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一;在权威推理榜单Benchmark GSM8 K测试中,天工大模型以80%的正确率,领先GPT-3.5(57.1%)和LLaMA2-70 B(56.8%),推理能力达到全球领先水平。
此外,在基于SuperCLUE综合性测评基准,包括多轮开放式问题测评SuperCLUE-OPEN和三大能力客观题测评SuperCLUE-OPT的测试中,天工大模型文理兼顾,跻身中文闭源模型第一梯队。
此外,在基于SuperCLUE综合性测评基准,包括多轮开放式问题测评SuperCLUE-OPEN和三大能力客观题测评SuperCLUE-OPT的测试中,天工大模型文理兼顾,跻身中文闭源模型第一梯队。
相关文章
用户评论
所有评论
主编精选
more专题推荐
more
第四届中国零售金融发展峰会(共15篇)
资讯排行
- 48h
- 7天
-
首页
-
评论
-
回顶部
游客
自律公约