首页 > 快讯

英伟达发布 Llama Nemotron Nano VL AI

快讯 零壹财经 零壹财经 2025-06-05 阅读:1049

关键词:英伟达人工智能


6 月 5 日讯,科技媒体 marktechpost 昨日(6 月 4 日)发布博文,报道称英伟达(Nvidia)针对高效、精准地处理文档级理解任务,推出 Llama Nemotron Nano VL 视觉-语言模型(VLM)。
Llama Nemotron Nano VL 基于 Llama 3.1 架构,融合了 CRadioV2-H 视觉编码器和 Llama 3.1 8B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支持最长 16K 的上下文长度,覆盖图像和文本序列。
模型通过投影层和旋转位置编码实现视觉-文本对齐,优化了 token 效率,特别适合长篇多模态任务,无论是多图像输入还是复杂文本解析,它都能游刃有余。(IT之家)

上一篇>摩根大通拟接受加密货币ETF作为贷款抵押品

下一篇>蚂蚁国际推出AI平台Alipay+ GenAI Cockpit



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 135ms