中国大模型发展指数 (第 1 期)

  48页 阅读:31554 零壹财经
中国大模型指数从100点基数增长至257.40。

【编者按】

为了及时跟踪中国大模型动态,深入研究大模型产业发展的广度、深度、锐度,零壹智库联合多家学界和业界的机构和专家,编制“中国大模型发展指数”。大模型的发展日新月异,指数以月为单位更新数据。第1期指数数据更新到2024年4月,因第一期指数在数据挖掘、处理、建模、调研等用时较长,今日才得以发布。第2期指数将更新到2024年9月,将于近期发布。我们期待各界人士为指数提供建议、观点和优秀案例,我们将不断改进指数,为中国大模型的发展制作精准的风向标和参照系。——《中国大模型发展指数》编写组
 

【摘要】

本报告构建了中国大模型发展指数,旨在量化评估中国大模型发展现状和趋势。指数涵盖大模型研发、大模型实践和大模型支撑三个维度,共20个四级指标,以2023年5月至2024年4月的数据为基础进行分析。

中国大模型发展指数显示,国内大模型在技术和应用方面均取得了显著进展。大模型技术作为推动科技创新和产业变革的核心技术,正逐步成为经济发展的新引擎。

大模型研发方面:研发指数反映出学术研究和专利授权的稳步增长,表明中国在大模型领域的技术创新和学术探索持续活跃。尽管增速有所放缓,但大模型研发的总体趋势依旧向上,显示出国内在该领域的深厚积累和创新潜力。

大模型实践方面:实践指数揭示了大模型在实际应用中的增长态势,尽管短期内增速有所放缓,但大模型在各行业的应用水平仍在提升。特别是大模型创业指数的快速增长,表明市场对大模型应用的高度认可和积极响应。

大模型支撑方面:支撑指数的显著增长凸显了中国在算力、人才、政策和创新环境等方面的坚实基础。算力中心数量的增加、高校专业人才的培养、国家及地方政府的政策支持,以及开源社区的活跃度提升,均为大模型的快速发展提供了有力支撑。

典型案例:KAN网络提出了一种创新的神经网络架构,在理论基础、结构设计、参数效率和可解释性方面具有优势。智谱清言是一款新一代基座大模型,具备多模态能力。在高级自然语言处理能力、多语言交流、深度文本分析、智能写作、信息搜索、个性化服务、文档理解等众多方面得到应用。

东方财富妙想金融大模型凭借其自研技术、金融数据挖掘、专业词表、高效训练算法、算力集群、金融场景应用、数据积淀和专业生态,已成为金融科技领域的领先者,服务于百万专业投资者和金融机构。

融云创结合行业专知,引入检索增强生成技术(RAG),融合多模态,为金融行业提供了精准、高效和个性化的服务,成为AI产业应用的典范。

结论与展望:中国大模型发展迅速,已成为全球重要力量。未来需要加强技术研发,拓展应用场景,完善政策环境,营造良好创新生态。中国大模型有望在多个领域发挥重要作用,推动经济和社会发展。


人工智能技术正引领新一轮科技革命,其中AI大模型作为核心技术,在推动科技创新和产业变革方面发挥着重要作用。

中国密集出台政策支持大模型发展,并在技术研发和应用方面取得了显著成效。然而,目前缺乏对中国大模型发展现状的量化评估工具。

为此,本报告构建了中国大模型发展指数,旨在从大模型支撑、大模型研发和大模型实践三个维度,对中国大模型发展情况进行全面评估,为相关决策提供参考依据。

一、指数背景

(一)国家政策背景

伴随人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。特别是自2022年以来,以ChatGPT为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。

作为新质生产力的重要组成部分,大模型有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。当前,全球主要国家已经着手制定大模型相关的发展战略和政策文件。

1. 美、欧等人工智能战略动向

2021年,白宫科学技术政策办公室(OSTP)宣布启动国家人工智能倡议办公室,负责协调和监督美国政府的国家人工智能政策计划。

2023年 5月,美国政府发布了新版《国家人工智能研发战略计划》,同年6月宣布投资1.4亿美元成立7 家新的国家人工智能研究所,7月在白宫召集亚马逊、谷歌、Anthropic、Meta、微软等七家AI头部公司签署人工智能的自愿承诺协议,9月再次与英伟达、IBM、Adobe、Salesforce、Scale、Cohere等八家企业签署该协议。

2023年6月,欧洲议会通过了《人工智能法案》的一系列修正案,预计于2024年正式通过《人工智能法案》。

欧盟主要针对人工智能的定义、禁止的人工智能应用清单、高风险人工智能的义务及基础模型、执法机制几个争议性的领域加以讨论和修正。还将成立 “人工智能委员会”,在欧洲议会的建议下建立一个新的人工智能办公室,该机构将拥有行政、咨询、解释和执法相关的一系列权力,并负责协调跨境调查。

当下,围绕《人工智能法案》的争议集中在它是否会过度约束大模型的发展,由此可以看出,欧盟内部对以大模型为代表的新一代人工智能整体还是持审慎态度。

日本对人工智能技术采取的战略性举措包括整体规划“社会5.0”《新机器人战略》《下一代人工智能促进战略》《人工智能技术战略》《人工智能技术战略实施计划》《以人为中心的人工智能社会原则》以及《人工智能战略》等加强对人工智能技术和专利发展的战略性引导。

近年来,新加坡瞄准人工智能在当今国际局势中的战略性地位,大力发展人工智能以赋能智慧国家建设并发挥国际战略优势,在战略、军事、治理等方面展现数字革命时代下新加坡的文化 特色。

新加坡致力于用数字信息科技改变新加坡,在2006年、2014年分别启动“智慧国家2015计划”与“智慧国家2025计划”,并发布《国家人工智能战略》,计划于2030年成为人工智能广泛应用的智慧国家,实现经济与产业转型并成为全球人工智能创新的领跑者。

2. 我国大模型政策布局动向

我国对大模型产业持包容审慎态度,自2022年下半年以来,密集出台了一系列大模型相关政策。

表1-1:中国AI大模型行业最新政策汇总一览表


资料来源:公开渠道,零壹智库

在技术创新方面显著提升,加快形成大模型产业。在国家政策的指导下,国内各地密集出台人工智能政策,围绕算力、算法、数据等大模型应用基本点发力,加快形成大模型产业。

各地人工智能政策发布呈密集态势,且主要聚焦通用人工智能大模型,多省市在2023年上半年密集出台人工智能相关利好政策,都在努力抢抓发展风口。

据不完全统计,2023年上半年,重点省市共出台人工智能发展相关政策19项,而2022 年同期仅有5项,增长率近400%。北京、上海、深圳、成都、杭州、武汉等大城市均高度重视大模型产业发展。

国内多地大模型政策主要以“三算”(算力、算法、算据)、应用和企业布局为同质化着力点。

从算力上看,杭州、上海等地加快建设算力基础设施、统筹调度平台及算力协调体系,集聚算力资源、夯实发展“底座”,如妙想金融大模型致力于以底座能力赋能金融场景。

从算法上看,南京、深圳等地聚焦基础软硬件体系、大模型算法核心技术,做好底层支撑以突破算法瓶颈。

其中,成都、杭州、廊坊实施首试首用、支持首版次等措施来支持算法研发;北京则强调通用人工智能算法发展,如百融云创金融大模型结合了算力、行业专知对模型进行算法精调;苏州和无锡提出探索元宇宙相关算法。

从数据上看,北京、成都等6地提出归集高质量数据开放共享资源集、支持数据交易、探索公共数据开放使用途径,打通数据资源壁垒,其中,北京谋划建设数据训练基地、建设数据基础制度先行示范区,成都和杭州都考虑构建行业级数据集或数据平台。

表1-2:主要城市大模型政策
资料来源:公开渠道,零壹智库

(二)技术发展背景

数字技术创新成效显著。我国大模型爆发式增长,紧跟国际前沿步伐,特别是在技术创新领域,成效显著。

人工智能、区块链、云计算、大数据和物联网等数字技术(统称ABCDI)是发展大模型的关键技术。

为了更好地获得ABCDI数据,我们选择从企业预警通、智慧芽等渠道获取数据并分析得出,ABCDI专利申请数量自2008年的10018件至2021年达到峰值415982件,但在2023年回落至214478件。

专利申请的增长率也从2021年的27.04%显著下降至2023年的-40.16%。

这一趋势反映出近三年专利申请数量的明显减少,主要是区块链的专利申请数量下降明显;专利申请数量逐渐减少导致后期专利授权数量逐年减少,授权数量从2008年的1872件,到2022年最高峰为161988件,2023年略有下降为131125件,专利授权增长率从2009年的46.31%上升到2020年78.59的峰会,之后下降到2023年的-19.05%。

图1-1:数字技术创新增长率
数据来源:智慧芽,零壹智库

大模型专利累计数量逐年增长,以2023年05月-2024年04月共达到384506件,月平均增长32042件,具体如图1-2所示,从图中可以看出大模型专利增长强劲。

这也说明自2022年以来,以ChatGPT为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。大模型作为新质生产力的重要组成部分,有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。

图1-2:2023年5月-2024年4月每月大模型专利数量
数据来源:智慧芽,零壹智库

(三)产业发展背景

近年来,人工智能得到快速发展,激发了新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。当前我国人工智能技术被广泛运用在无人驾驶、移动网络、智能家居等产业中,逐步形成了依赖基础技术支持并融合人工智能技术和人工智能应用链接的产业框架。

通过人工智能技术应用于实体经济,促进技术进步,带动产业升级和经济转型,进一步推动经济的持续增长,2022年中国核心产业规模达到5080亿元,同比增长18%。

在技术创新领域,中国在人工智能芯片、深度学习软件架构和中文自然语言处理等领域取得了显著进展,同时AI技术正在医疗健康金融科技和新消费等领域广泛应用,赋能到各行各业。

截至2023年,人工智能显示出强劲的发展势头并通过创新推动实体经济的发展,涵盖人工智能产业链相关行业的创新、工业机器人和服务机器人产业的创新,以及物联网和智能商业模式的创新。

人工智能产业作为一个充满巨大机遇和潜力的新兴产业,对于国家经济发展和社会进步具有重要意义。人工智能产业的发展也面临着一系列挑战和问题,需要政府、企业和社会各界共同努力解决。

总体来看,在市场机遇和技术挑战的双重驱动下,人工智能产业迎来了前所未有的发展机遇。但是,政策环境和国际竞争的不确定性仍然给人工智能产业带来一定的挑战。因此,只有进一步加强政策引导,加强国际合作,才能够促进人工智能产业健康、可持续发展。

二、评价体系

自2022年11月底发布ChatGPT以来,以其为代表的通用人工智能大模型在全球掀起了新一轮的人工智能发展浪潮。作为新质生产力的重要组成部分,大模型有望揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。

目前,尚未有指标对我国大模型发展情况进行衡量。因此,鉴于大模型的快速发展,本报告以月度数据作为基础数据,拟选取2023年5月至2024年4月十二个月,从大模型支撑、大模型研发和大模型实践3个维度,构建中国大模型发展指数指标体系,对我国大模型发展情况进行量化研究。

(一)构建原则

本报告基于我国大模型研究和发展实际,坚持科学性、系统性、可操作性、可比性原则,构建中国大模型发展水平的评价指标体系。

1. 科学性原则

指标体系的设置考虑指标的内在因果逻辑,严谨、准确地反映大模型发展水平和发展潜力。其中,指标权重的确定采用CRITIC客观赋权法,指标的构建以定量指标为主,最大限度排除主观干扰。基于此计算得到的中国大模型各级指数能够反映中国大模型发展的现实发展水平、变化程度、未来趋势等。

2. 系统性原则

选取指标尽可能地全面反映大模型发展的各方面,又能突出重点,确保指标体系完整、客观、合理。系统性原则使得单个指标能反映大模型发展的某个侧面,综合指标又能反映大模型的整体情况。

本报告从大模型支撑、大模型研发和大模型实践3个维度对我国大模型发展情况进行测量。其中,大模型支撑是大模型发展的基础条件,本报告从算力、人才、政策以及创新环境等维度测量我国对大模型发展的支持情况。

对大模型的学术研究和技术研发是大模型创新发展的重要源泉,而良好的开源生态有利于大模型技术持续创新。大模型实践是大模型在企业和产业的实践和落地情况。三个维度较好地囊括了我国大模型发展基础、学术和技术研发及实践应用情况。

3. 可操作性原则

本报告立足现行统计制度和方法,聚焦大模型相关实物量和价值量指标需求,充分考虑大模型学术和行业数据的可获得性、可操作性,力求全面、准确反映大模型发展状况。数据以定量数据为主,主要通过查阅国家统计局、教育部、中国知网和网络搜索等途径获得数据。

其中,大模型技术研发活跃度数据来源于全球最大的开源社区之一—github,基于该平台检索我国开源大模型数量、参与者数量及项目参与者活跃度。这一做法,很大程度上减少了数据遗漏,使得数据可以持续获得。

4. 可比性原则

通过对各月基础数据进行归一化和去量纲等方法进行处理,消除不同特征之间的量纲差异,使不同特征数据之间具有可比性,从而使计算结果具有综合可比性。同时,针对计算结果进行基期指数化,更直观地反映我国大模型发展指数变动情况和趋势。

(二)指标体系

向上联结学术、向下扎根行业,实现技术创新与社会价值的接轨是大模型发展的第一性原理(1)。而这一切也都需要人力、算力和创新环境等的支撑。由此可以看出,对大模型发展而言,大模型支撑是基础,大模型研究是创新的源泉,大模型实践是落脚点。

基于此,本报告从大模型支撑、大模型研究和大模型实践3个一级指标(见表2-1)、8个二级指标、13个三级指标和18个四级指标构建大模型发展指数指标体系,衡量我国大模型发展水平。

表2-1:中国大模型发展指数一级指标

1.大模型支撑

算力、人才、政策的支持,以及良好的创新环境,是大模型发展的重要支撑。算力和人才指大模型发展最重要的资源投入之一。大模型发展离不开训练和推理,大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节,每个环节都需要大量人才、算力等资源的投入。

本报告分别用算力中心数量和高等院校相关专业数量来衡量我国算力和人才支持情况(表2-2所示)。

同时,政府政策是保障大模型健康发展的重要规范。大模型的使用可能会出现各种各样的错误,也会带来一些伦理、安全和隐私等方面的问题。这就需要政府从大模型治理、隐私保护等各方面出台各项政策支持,保障大模型安全、健康、持续发展。

如,2023年7月,国家网信办联合国家发展改革委、教育部等7部门联合公布《生成式人工智能服务管理暂行办法》。从数据和基础模型的合法性、知识产权保护、个人信息保护等方面提出了相关要求,对促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益意义重大。

本报告以大模型、内容平台、生成式人工智能等关键词(见附录二)在知领政策库检索大模型相关政策数量作为基础数据。

此外,技术创新是大模型发展的首要驱动力。大模型发展面临诸多挑战,如鲁棒性、安全性及效率问题,这些挑战的解决依赖于技术进步和原始创新。

大模型的实践,除了技术层面的突破,也需要商业模式的创新。因此,良好的创新环境是大模型研发和应用的动力源泉。基于此,本报告以大模型、内容平台、生成式人工智能等关键词(见附录二)在中国日报网等进行检索,以表征创新热情。

表2-2:大模型支撑指标

2.大模型研发

大模型研发主要集中于两类,分别是学术研究和技术研发(表2-3所示)。其中,学术研究层面,近年来,高校与科研院所积极布局大模型,大模型学术研究雨后春笋般涌现。

本报告以中国知网作为检索平台,以大模型、预训练、生成式预训练、GPT、涌现能力、语言大模型、NLP、大语言模型、LLM、ChatGPT等作为关键词(见附录一),检索我国关于大模型研究的学术论文数量。

在技术研发方面,专利是衡量创新产出的重要指标。本指标从智慧芽等平台检索我国专利授权数量,以此衡量我国技术创新成效。

此外,良好的开源生态不仅有利于大模型技术持续创新、拓展大模型应用路径,还能在多方携手共建的基础上更好地解决大模型的可解释性、安全性、稳定性等问题。

因此,本指标基于github社区,检索我国开源大模型规模,及各开源模型贡献者(contributors)表征开源大模型参与者数量,各位贡献者存在多次提交(commits),以各参与者提交次数累计值表征开源大模型参与者活跃度。

表 2-3:大模型研发指标

3.大模型实践

大模型作为新物种,一直在快速进化,目前已经初步形成包括各参数规模、各种技术架构、各种模态和各种应用场景的大模型家族。本报告从大模型创业和大模型应用两个维度分别测量我国大模型创业情况和大型企业在大模型应用上的实践(表2-4)。

目前,投创界积极入局大模型竞赛,本报告借助企业预警通平台,通过关键词检索(见附录1),据此统计大模型创业企业规模,初始资本等,衡量我国大模型创业情况。同时,通过爬取AIGC企业投融资数据,作为创业企业资本补给基础数据。

大模型的实践应用上,行业大模型是大模型在产业中的应用拓展与典型,是大模型专业化、场景化和垂直化的体现。另一方面,大模型输入模态从文本向语音和图像等多模态的扩充的趋势。

多模态应用进一步提升了产业应用的适应性,让大模型解锁了更多的可能性。因此,本报告从大模型垂直应用、单模态应用和多模态应用三个维度测量大模型应用水平。该部分数据来源主要是网络搜索。

表2-4:大模型实践指标

(三)指标权重

指标权重的确定有客观赋权和主观赋权两类方法。客观赋权法可排除主观干扰,应用相对广泛。

熵权法、标准离差法和CRITIC法是主要的客观赋权法,三种方法均用变量的变异确定权重。其中,CRITIC法考虑了变量之间的冲突,确定的权重更为精准(Chen et al.,2021;Chen et al.,2022;许涤龙和陈双莲,2015)。本报告首先对各指标数据进行离差标准化处理,以避免量纲的差异对测算结果的影响。

本报告选择CRITIC法确定各指标的权重。第i个指标的权重:

根据上述计算公式,计算各一级指标权重如下。

表2-5:中国大模型发展指数一级指标权重

(四)数据来源

本指数测量时间为2023年05月至2024年04月,所涉数据来源于国家统计局、教育部、中国知网、中国日报网、智慧芽、企业预警通、知领政策库、零壹财经、github平台等。

三、中国大模型总体情况

大模型作为人工智能领域的重要突破,对于推动科技进步和产业升级具有至关重要的意义,它们在揭示科学规律、促进技术创新方面发挥着核心作用,为各行各业的转型与发展提供了强大的动力。

通过上述的指标体系,计算得出了中国大模型指数。为了更深入地理解这些指标背后的含义,并从中提炼出有价值的信息,接下来将进行中国大模型指数分析,揭示中国大模型发展的特点。

(一)中国大模型总体指数快速上升

从2023年5月至2024年4月,中国大模型指数从100点基数增长至257.40。

图3-1:中国大模型总体指数
数据来源:零壹智库

我国大模型总体指数快速上升的原因是:

其一,国家政策驱动大模型发展。我国高度重视人工智能的发展,将其上升为国家战略,并出台了一系列的扶持政策和规划,为AI大模型产业发展创造了良好的环境。

如2024年,多重利好因素推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对 AI 领域投入资金、人力、技术研发,各环节协同支撑大模型发展。

积极发展 AI、促进 AI 与实体经济深度融合,成为中国实现经济可持续高质量发展的必然选择。

其二,基础设施支持大模型发展。我国具备发展人工智能较好的基础,算力中心、5G网络等基础设施发展迅速,企业创新能力和动力强劲,快速跟上全球大模型发展前沿,涌现出一批具有行业影响力的大模型。

其三,资本赋能大模型发展。大模型能够有效的解决人工智能方面的很多问题,不断降低资源需求、提高性能、创造良好的效益,不断激发了业界和资本的动力,推动了大模型的发展。

(二)我国大模型研发指数增长4倍

大模型研发指数是由学术研究和技术研发两个二级指标构成,从计算得出大模型研发指数从2023年05月63.57增长到2024年04月258.54,增长4倍;大模型研发指数增长率从26.20%下降到9.33%。

图3-2:大模型研发指数及增长率
数据来源:零壹智库

我国大模型研发指数增长强劲,其原因如下:

其一,学术成果丰硕,从计算结果得出,大模型学术研究指数从2023年5月44.35增长到2024年04月的253.37,增长5倍,原因是围绕大模型的学术论文从2024年05月216篇增长到了1018篇,大模型专利数量从2023年05月13001项增长到了2024年04月39412项。

大家都明白,自2022年以来,以ChatGPT为代表的大模型在全球掀起了新一轮的人工智能发展浪潮,能揭示重大科学规律、催生重要科技成果,激发新一轮的技术和产业变革,赋能千行百业,推动经济和社会跨越式发展。

其二,技术研发水平不断提升,从计算的结果得出,大模型技术研发指数从2023年05月82.24增长到2024年04月258.54,增长3倍。原因是技术创新成效、开源大模型研发水平、开源项目开发进展三个指标增长较快,分别从64.13增长到258.54、从96.86增长到、258.54;从95.14增长到258.54。这会加大大模型技术快速发展,使我国大模型产业发展将迈入快车道

1. 大模型学术研究指数增长率有所放缓

大模型研发二级指数学术研究指数从2023年05月45.25增长到2024年04月的285.54,学术研究指数增长率从2023年6月28.70%下降2023年12月12.14%,一直到2024年12 月稳定在12%左右;技术研发指数从2023年05月79.07增长到2024年04月的253.37,技术研发指数增长率从25.86%下降到6.37% 。

图3-3:大模型学术研究指数和大模型技术研究指数及增长率
数据来源:零壹智库

其增速放缓的原因如下:

其一,创新边际递减效应。创新的边际递减效应是一个经济学原理,它描述了随着技术发展,每增加等量的投入,所带来的产出增长会逐渐减少的现象。

这一效应在学术发展过程中同样存在,尤其是在学术研究成熟期,创新的难度和成本增加,而获得的额外效益却逐渐减少。

从大模型学术研究数据来看,2023年5月到2023年6月大模型论文由216篇增长到278篇,只增长了62篇;而增长率却为28.70%。2024年3月到2024年4月大模型论文由1098篇增至1234篇,增长了136篇,而增长率仅为12.39%。大模型论文的增长率呈现出边际递减效应。

其二,论文选题方向边际递减效应。现有的大模型研究主要方向是深度神经网络、Transformer架构、自监督学习、预训练与微调策略,以及高效的优化算法,之后研究转向了大模型处理复杂任务时的适应能力和泛化能力。

然而,随着时间的推移,大模型处理复杂任务研究逐渐遇到了性能瓶颈,即在现有理论框架和技术手段下,进一步的性能提升变得越来越困难,导致研究产出的增长速度开始减缓,呈现出论文选题方向边际递减效应。

2. 大模型技术研发指数增长率逐渐降低

大模型技术研发指数增长率从2023年5月24.7%下降到2024年4月6.13%(图3-3),增速逐渐放缓。其具体原因主要是:

其一,市场竞争日益激烈。大模型领域的竞争愈演愈烈,各类企业纷纷投入研发和推广,为了争夺市场份额,各大企业不断推陈出新,使得技术更新速度越来越快,在这种情况下,大模型研发的高增长率难以持续;

其二,当前大模型的应用场景有限。尽管大模型在很多领域都表现出了出色的能力,但实际上,它们的应用场景仍然相对有限。许多企业在尝试将大模型应用到自己的业务中时,发现实际效果并不如预期;

其三,大模型的高成本和技术难题也是制约其增速的重要因素。开发和维护大模型需要大量的资金和技术投入,这使得一般的中小企业难以承受,同时大模型的技术难题也使得很多企业在实际应用中面临诸多挑战。这些问题的存在,导致大模型的热度逐渐降低。

(三)我国大模型实践应用复合增长率16%

大模型实践指数从2023年5月44.68增长至2024年4月234.37,复合增长率16%。大模型实践指数在短期内经历了一段“降温”期,但从中期视角来看,指数仍然呈现出“稳步加温”的态势。

特别是在2023年的6月、11月,以及2024年的2月,可以观察到了显著的增长率高峰(参见图3-4)。总体而言,大模型实践指数保持着上升的发展轨迹,尽管增长率在不同时间段表现出一定的波动性。

这些数据点揭示了一个模式:尽管大模型实践可能会遇到暂时的冷却期,但经过一段时间的沉淀和调整,研究和应用的热情往往会被重新点燃。

这种周期性的波动可能与技术突破、市场需求变化或政策导向等因素有关。因此,尽管面临暂时的挑战,大模型的发展前景依然乐观。

其“降温”原因如下:

其一,大模型认知鸿沟被逐步填平。大模型神秘面纱正在不断被揭开,同时开源社区也获得了蓬勃起步,学术界也积极参与和支持开源化,这进一步降低了大模型在应用侧的门槛。

随着认知差逐步平衡,上手试验成本降低,在初期结构性红利诱导下的冲动臆想正在快速消退,产业界逐步回归理性。

其二,国家出台政策进一步约束大模型安全合规问题。国内对大模型安全高度重视,国家网信办等七部门于2023年7月10日联合公布了《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。

该办法就生成式人工智能可能面临的安全问题提出了一系列明确的约束规范,比如要求提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德;要求采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。

规定提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识(2)。

大模型的安全和伦理约束是确保技术负责任发展的关键。

虽然这些约束在一定程度上抑制了技术的迅猛发展,但它们对于防止技术滥用和潜在风险至关重要,不仅避免了技术的过热,也为行业的可持续发展提供了宝贵的思考和调整空间。

通过这种适度的制约,我们可以确保大模型技术的发展方向与社会的整体利益相一致,促进行业的健康和有序发展。

图3-4:大模型实践指数及增长率
数据来源:零壹智库

1.大模型创业指数总体增速较快,月均复合增长率26%

大模型创业指数初期发展水平较低,总体增速较快。从2023年5月19.21增长至2024年4月253.36,月均复合增长率为26%(图3-5),增速较快。

其中,2023年6月增长率激增,高达124.40%,随后增长率下降至2024年1月11.62%。随后2月,增长率增长至42.43%。整体增长情况与大模型实践指数保持一致。

图3-5:大模型创业指数及增长率
数据来源:零壹智库

溯其根源,大模型相关企业数量、初创企业资本金和大模型企业融资金额基础指标总体呈现递增,2023年5月初创企业数量从28449家增长至2024年4月303779家,初创企业资本金2223.5亿元增长至106427.80亿元,大模型企业融资金额从15.16亿元增长至176.37亿元。

三个下属指标均在2023年6月呈现快速增长,这也导致大模型创业指数在6月份激增。

图3-6:大模型相关企业数量、初创企业资本金和大模型企业融资金额
数据来源:企业预警通,零壹智库

其一,2023年开始,创投界青睐对大模型投资青睐有加。据统计,2020年至2022年,各年投融资事件数量未超过5起,而2023年共有20起(3)。

从已知金额来看,2023年,国内LLM领域投融资金额已高达64.27亿元(图3-6)。其中,腾讯和阿里是国内最“慷慨”的投资方,国内5家大模型独角兽公司中(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里参投率高达100%,腾讯参与了其中3家的投资,参投率为60%(图3-7)。

2024年4月,中国人工智能(CAAI)和蚂蚁集团联合发起设立“CAAI-蚂蚁科研基金(大模型专项)”,用于支持大模型领域的产学研合作和共同发展,该基金课题涵盖行业应用大模型、 通用大模型、大模型数据、大模型安全、大模型 infra 等五个方向。

表3-1:2022年至今国内大模型独角兽融资情况
数据来源:公开渠道,零壹智库

其二,大型语言模型投融资地区、覆盖的行业不均衡。从大型语言模型投融资事件发生的地点来看,主要集中在北京、上海、广东等经济发达地区,这些地区经济发展水平居前,科研技术水平较高、科研氛围良好,三地投融资事件数量共计占全国的半数。

其中,北京占比27.4%,广东占比13.7%,上海占比8.2%。从被投公司的行业分布来看,截至2023年,我国LLM领域投融资项目以企业服务细分为主,具体来看,主要是各类AI内容平台商。企业服务领域占比高达58.3%,其次是元宇宙,占比为25.0%。工具软件、文娱传媒占比均小于10%(4)。

其三,从外部环境来看,政策出台助力为科技型企业提供全生命周期的多元化接力式金融服务。

2023年6月,国务院总理李强主持召开国务院常务会议,审议通过《加大力度支持科技型企业融资行动方案》(以下简称《行动方案》)。

会议强调,要引导金融机构根据不同发展阶段的科技型企业的不同需求,进一步优化产品、市场和服务体系,为科技型企业提供全生命周期的多元化接力式金融服务。《行动方案》的出台为大模型初创企业解决融资难、融资贵问题具有重要意义,也有效提升了大模型创业指数。

此外,仅2023年4月28日,OpenAI单次完成3亿美元融资;截止当日,OpenAI已获得约103亿美元融资(据美国科技媒体TechCrunch数据)。由此催生的创业浪潮点燃了风投公司投资热情,带来了一定时期内的投资热潮。

2.大模型应用指数复合增长率8%

大模型应用指数发展水平整体较高,增长速度逐步放缓,增长趋势与大模型创业指数基本一致。由2023年5月89.05增长至2024年4月201.28,复合增长率8%,且增速明显放缓。

图3-7:大模型应用指数及增长率
数据来源:零壹智库

从下级指标来看,大模型应用水平上,应用大模型数量从34个增长至100个,其行业覆盖率从25%增长至85%,现大模型已覆盖大部分行业。大模型未涉及的行业范围越来越少,导致覆盖率增速放缓。就离散度而言,大模型所覆盖行业的增速慢于大模型数量增长率,因此离散度有减缓的趋势。

图3-8:应用大模型数量、大模型覆盖率和离散度
数据来源:零壹智库

在大模型单模态应用上,单模态大模型数量呈现先递增后减少的趋势。而在大模型多模态应用上,多模态大模型数量呈现递增的趋势。

究其原因,不难发现,相比传统的单模态大模型,多模态大模型更加符合人类的多渠道认知方式,从而导致单模态大模型与多模态大模型的此消彼长。多模态大模型能将不同模态信息相互补充,提高信息的完整性和准确性,从而更好地应对复杂环境、场景和任务。

落实到应用层面,多模态能使机器更好地理解人类的意图和需求,提供精准、个性化服务。

图3-9:单模态和多模态大模型应用
数据来源:公开渠道,零壹智库

其次,垂直大模型致力于解决特定场景问题,因此其发展节奏与大模型创业企业发展节奏基本一致。此外,中国大模型产业发展源于多领域的广泛需求,例如办公、金融、医疗、政务等场景和诉求。随着大模型应用场景和领域增长,大模型未涉及的行业领域越来越少,导致覆盖率增速放缓。

综上所述,我们可以从以下方面分析大模型应用指数呈现整体较高,增长速度逐步放缓特征的原因。

其一,随着基础模型的不断强大,开发应用的难度逐渐降低,导致其发展水平整体较高。如李彦宏预测,在未来,各个行业领域都可能依据自身独特的场景和丰富的经验,催生出大量的智能体,从而构建起一个庞大的智能体生态(5)。

其二,随着大模型行业应用将更加广泛,涵盖越来越多的行业和场景,大模型未涉及的行业范围越来越少,导致覆盖率增速放缓。

其三,垂直大模型致力于解决特定场景问题,因此其发展节奏与大模型创业企业发展节奏基本一致。

大模型本身的特性与金融、医疗等行业有着天然的契合,导致大模型应用在某些行业应用较多(表3-2)。以金融领域为例,该领域数据种类具有广泛性和深度,要满足不同用户的需求,妙想大模型结合相关技术提高性能,满足不同顾客需求;金融数据多且杂,导致大模型可能产生的“幻觉”问题,百融云创金融大模型运用创新增强生成技术解决此问题。

以医疗领域为例,该领域存在大量模态种类丰富且跨学科的数据,大模型与医疗行业有着天然的契合性,医疗AI大模型不仅能深刻理解临床数据,还能生成富有洞见的医疗知识(图3-10)。

从影像诊断到药物研发,这些模型正逐步改写医疗服务的未来(6)。

表3-2:国内应用大模型所属行业top10
数据来源:GitHub - wgwang/awesome-LLMs-In-China: 中国大模型

图3-10医疗健康AI大模型应用场景
图片来源:介入医学工程国创平台

(四)我国大模型支撑指数累计增长68%

大模型支撑指数总体持续平稳增长。从2023年5月至2024年4月,大模型支撑指数从150.89增至253.37,累计增长了67.92%(图3-14)。大模型支撑指数总体增速有两个月较快,分别是2023年7月和2024年4月。

2023年7月增速最大,达28.86%;2024年4月增速为6.02%。除此外,其他月份大模型增长速度保持相对平稳,每月平均增速为2.32%。这两个月指数增长较快的原因:

其一,我国算力数据有很大提升。2023年6月增幅达80%,中国算力大会公布数据显示,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197百亿亿次/秒(EFLOPS),存力总规模超过1080艾字节(EB)。

算力枢纽节点建设了130条干线光缆,数据传输性能大幅改善。这些数据体现在2023年7月的大模型支撑指数和增幅上,导致指数增长较快。

其二,人才支撑有了大幅度提升。因2020年开设与大模型相关专业(如:大数据技术、数据科学、计算机科学与技术、信息技术等专业)数量增长明显,导致2024年1月的毕业生人数有较大幅度增加。2019年大模型相关专业数量为304个,到2020年增加至335个,增幅达10.2%。

图3-11:大模型支撑指数及增长率
数据来源:零壹智库

1.大模型政策指数增长4.23倍

大模型政策指数从2023年5月59.94,增长至2024年4月253.37,增长了4.23倍,增速较快(图3-15)。

其中,2023年6月和9月增长率激增,分别是55.45%和23.67%,随后增长率下降至2024年2月的2.14%。

随后至4月,增长率略有增长至10%左右。大模型政策指数总体增长增速在放缓。

主要原因是,我国大模型政策集中在2023年出台发布,如2023年7月发布《人工智能气象应用工作方案(2023-2030)》《生成式人工智能服务管理暂行办法》,8月发布《电子信息制造业2023—2024年稳增长行动方案》,10发布《人形机器人创新发展指导意见》,12月发布《关于加快推进视听电子产业高质量发展的指导意见》《“数据要素+”三年行动计划(2024-2026)(征求意见稿)》;2024 年《政府工作报告》中提出开展“人工智能+”行动。

我国各地方政府也在2023年出台相关支持政策,加快大模型产业的持续发展。如北京、深圳、杭州、成都、福建、安徽、上海、广东等地在2023年均发布了关于 AI 大模型的相关政策。

图3-12:大模型政策支撑指数及增长率
数据来源:零壹智库

2.大模型创新环境指数增长14.16倍

大模型创新环境指数从2023年5月17.89,增长至2024年4月253.37,增长了14.16倍,并且一直保持高速增长(图3-16)。其中,2023年6月增长最快,最高达111.07%;其次是2023年9月,增速为35.01%。主要原因如下:

其一,受大模型实践成功的刺激。受到ChatGPT4以及SORA等大模型的成功案例影响,激起中国大模型业内人士兴趣,开始国产化大模型的研究与应用,国内的研究院所、高校、企业等单位成为大模型创新的主要推动者。根据不完全统计,仅在开源大模型项目commits参与者人数达32万余人。

其二,受到中国大模型政策的鼓舞。中国大模型政策鼓舞了大模型企业,促进大模型行业应用。致使中国大模型从业者不断地将大模型技术运用垂直领域,从而在应用领域等相关方面快速地创新。

其三,受益于中国创新环境的改善。“中国科技创新能力迅速提升”已成为国际广泛共识。中国科学技术发展战略研究院2023年11月21日发布的《国家创新指数报告2022—2023》显示,中国创新能力综合排名上升至第10位,较上期报告提升3位,是唯一进入榜单前15位的发展中国家,向创新型国家前列进一步迈进。

在世界知识产权组织的《全球创新指数》评价结果中,中国创新能力综合排名由2012年的第34位提升至2023年的第12位。在欧盟委员会的《欧洲创新记分牌》评价体系中,中国创新能力2014年总体水平仅相当于欧盟的44%,2023年总体水平已达欧盟的95%。创新环境的不断提升,致使我国大模型领域受益,并且取得巨大进步。

图3-13:大模型创新环境支撑指数及增长率
数据来源:零壹智库
…………提示:完整报告,请查看PDF内容

剩余 50% 未读,点击登录,阅读全文

零壹智库研究报告

2013年至今,零壹智库累计发布超过40部新金融专业书籍、200份专题报告500份数据报告,并为数十家机构和政府部门提供了专业的新金融咨询服务;举办了超过30场行业峰会、20000多业内人士到现场交流,超过40场高端闭门会、1500余位业内高管 和专家参与探讨。零壹智库会员体系将在原有机构会员服务的基础上,推出个人VIP会员服务,旨在为新金融行业决策者、从业者和投资者提供专业化的知识、业务交流水平和资源开拓的能力。

报告需求或合作请联系: 132-6199-0570 marketing@01caijing.com 报告购买与咨询请微信扫码:


热门报告

TOP1
免 费
2024Q3手机银行数字竞争力排行榜TOP 100(总第11期)

2024Q3手机银行数字竞争力排行榜TOP 100(总第11期)


相关推荐

中国金融消费者投诉指数报告(第2期)
免 费

中国金融消费者投诉指数报告(第2期)

2024Q2手机银行数字竞争力排行榜TOP 100(总第11期)
免 费

2024Q2手机银行数字竞争力排行榜TOP 100(总第11期)

2024Q1手机银行数字竞争力排行榜TOP 100 (总第10期)
免 费

2024Q1手机银行数字竞争力排行榜TOP 100 (总第10期)

互联网的疆场上,到处跳动着字节的战火
免 费

互联网的疆场上,到处跳动着字节的战火


耗时 134ms