Meta AI研究人员提出长语境LLM:超越GPT-3.5-Turbo-16k的
快讯 零壹财经 零壹财经 2023-10-08 阅读:1284
10月7日,Meta AI研究人员提出了一种构建长语境LLM的方法,这种方法优于所有现有的开源模型。该方法围绕LLAMA2检查点进行持续的预训练,并利用额外的4000亿个token形成广泛的训练序列。这些序列旨在捕捉长语境理解的本质。此外,这项工作提供了一系列模型变体,包括使用32,768个token序列训练的较小的7B/13B模型和使用16,384个token序列训练的较大的34B/70B模型。(MarktechPost)
相关文章
用户评论
所有评论
主编精选
more专题推荐
more
第四届中国零售金融发展峰会(共15篇)
资讯排行
- 48h
- 7天
-
首页
-
评论
-
回顶部
游客
自律公约