首页 > 快讯

字节跳动与中科大联合提出多模态文档大模型DocPedia

快讯 零壹财经 零壹财经 2023-12-05 阅读:682

关键词:字节跳动大模型


12月4日,字节跳动与中国科学技术大学合作研发的多模态文档大模型DocPedia已成功突破了分辨率的极限,达到了2560×2560的高分辨率,而目前业内先进多模态大模型如LLaVA、MiniGPT-4等处理图像分辨率上限为336×336,无法解析高分辨率的文档图像。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。
 
据称,DocPedia不仅能准确识别图像信息,还能结合用户需求调用知识库回答问题,展现高分辨率多模态文档理解的能力。(站长之家)
 

上一篇>百度智能云发布基于文心一言的AI原生应用“超级助理”

下一篇>哈尔滨工业大学(深圳)发布多模态大模型“九天”



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 243ms