智源大模型-的相关资讯
[智源研究院发布370亿参数多模态大模型Emu2]
[12月21日,北京智源研究院宣布发布具有370亿参数的多模态大模型Emu2。据介绍,Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型,]
[智源研究院正式开源700亿参数大模型Aquila2-70B-Expr]
[11月30日讯,北京智源人工智能研究院副院长兼总工程师林咏华在2023人工智能计算大会上宣布,正式开源700亿参数大模型Aquila2-70B-Expr(异构先驱版),这是首个基于英伟达混合资源及]
[智源研究院:悟道・天鹰Aquila大语言模型系列已全面升级]
[10月12日讯,智源研究院宣布悟道・天鹰Aquila大语言模型系列已经全面升级到Aquila2,并且新添340亿参数的Aquila2-34B。据悉,该新模型在推理、泛化等方面表现出色,在智能体、]
[北京智源发布悟道3.0大模型,进入全面开源的新阶段]
[6月12日讯,北京智源人工智能研究院院长黄铁军在2023北京智源大会上作报告,发布悟道3.0大模型系列,并宣布进入全面开源的新阶段。此次悟道3.0包含悟道·天鹰(Aquila)语言大模型系列、“天秤]
[阿里巴巴、智源研究院、清华大学联合发布国内最大预训练AI模型 “文汇”]
[1月12日讯,今日,阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互]
[岩芯数智发布自研大模型“Yan模型”]
[1月24日,岩芯数智正式发布自研大模型“Yan模型”。Yan模型采用非Transformer架构,为非Attention机制的通用自然语言大模型。据了解,该大模型有相较于同等参数]
[京西智谷发起“大算力+大模型”生态建设]
[10月29日,京西智谷“大算力+大模型”生态共建点亮仪式近日在京进行。北京市门头沟区政府现场与共建企业进行落地签约,并为北京市人工智能算法交易服务中心首批13家认证企业授牌。京西智谷人工智能计算中心]
[李彦宏:大模型开源意义不大,闭源才能走通商业模式]
[4月11日讯,据悉,李彦宏近期发表了内部讲话,谈及对大模型开源与闭源的路线选择。他表示,文心刚刚发布的时候,内部是有过非常激烈的讨论,最终的决定是不开源。因为闭源模型在能力上会持续地领先,而不是一时]
[通义千问7款大语言模型全开源]
[4月7日讯,据报道,阿里云通义千问开源320亿参数模型Qwen1.5-32B。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。]
[浪潮信息发布千亿级开源大模型“源2.0”]
[11月27日,浪潮信息正式发布千亿级开源大模型“源2.0”。源2.0采用LFA(Localized Filtering-based Attention)局部依赖的自注意力机制,可有效捕捉局部信息和短]