AI大模型可按照应用领域和输入数据类型进行分类。
AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系;AI大模型基于注意力机制,通过在大规模、多元化的无标注数据集进行训练,具有较强泛化能力,应用在广泛的场景和任务。按输入数据类型,AI大模型分为语言大模型,视觉大模型、多模态大模型等;从应用领域角度分类,AI大模型分为通用大模型、行业大模型、垂直大模型。
1956-2006年,深度学习和神经网络技术的提出和发展,为AI大模型的出现奠定了技术基础,大模型技术萌芽开始出现;2006年后自然语言处理技术、Transformer架构的发展,为大模型预训练算法技术和架构奠定了基础;2018年OpenAI和Google分别发布GPT-1与BERT,预训练大模型成为自然语言处理领域的主流;2022年底,OpenAI推出ChatGPT引发全球大模型发展热潮,2023年中国国内大模型训练开始井喷,出现“百模大战”现象;2024年中国政策加大行业落地推动力度,商业发展加速。

我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案,截止到2024年11月,已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看,通用大模型占比28%,垂类大模型占比72%;从应用领域看,互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。
当前AI大模型产品进化路线有两条,一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率,获得更具性价比的产品,如70B参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升,国产大模型厂商开始大幅降价,截止到2024年底,我国典型AI大模型的价格下降至0.5元/百万Tokens以内,为大模型应用的广泛落地打下了基础。
AI大模型市场应用的商业化模式逐渐清晰: 定制化模式面向大型政企:大型企业AI大模型应用时,更倾向于定制化,并采用本地化部署模式;例如浦发银行最新招标的2024年大模型应用体系建设项目,采购定制化算力设备和大模型软件,且要求算力设备和大模型软件满足信创要求。当前,大模型技术和产品迭代迅速,定制化模式下,客户会要求大模型服务商定期迭代更新服务。
API及订阅模式适用于中小企业及机构:采用API及订阅模式采购大模型服务,具有节省资源、快速集成、实时更新和可扩展性强等优势,适用于中小型企业;如豆包大模型等采用API对外提供问答等服务。此外,企业用户调用API需要注意数据安全和隐私保护。 嵌入智能终端和APP中收取广告费的模式逐渐落地:随着大模型应用的普及,将大模型嵌入智能终端和APP中,向广告主收取广告费的模式,将成为大模型产品变现的重要方式,未来大模型应用将成为互联网广告提升和优化流量的重要抓手。2024年11月,苹果与百度达成合作,国行版iPhone接入百度最新的AI大模型Ernie 4.0,iPhone将能够提供更精准、更智能的语音助手、图像识别和数据处理等功能,将拉开大模型规模化嵌入智能终端、收取广告费的序幕。
大模型应用需求落地一般分为四个阶段:(1)场景需求评估:评估企业当前的大模型技术、应用场景和能力,做好大模型应用落地的准备,包括技术能力评估、应用场景梳理、能力分析等。(2)部署能力建设:设计和构建符合战略规划和业务需求的大模型能力体系,包括大模型建设方案设计、系统研发和功能测试、数据与算法准备等。(3)大模型应用部署:将大模型部署到具体的业务场景中,提供定制化的智能解决方案,实现大模型的商业化应用,包括定制化优化与应用开发、效能评估与闭环管理、全生命周期管理等。(4)大模型运营管理:建立大模型运营管理体系,保障大模型的长效运行,并通过实时监测和反馈机制提升运营效率,包括实时监测与动态追踪、持续优化与管理体系完善等。
根据第一新声智库研究,2022-2027年中国AI大模型应用市场规模复合增长率将达到148%,至2027年,AI大模型市场规模将达到1130亿,AI大模型行业达到盈利临界点。 Ø 洞察一:2024年,中国AI大模型商用加速,根据第一新声研究院不完全统计,2024年公开的大模型中标项目超过1000个,整体应用市场规模将达到157亿,市场用户主要以定制化和API调用模式为主;大模型应用市场规模包括企业用户购买大模型产品、大模型服务、大模型应用服务和软硬一体化大模型应用平台形成的市场总量。

洞察二: 中国AI大模型商用主要通过三种通路,一是大模型厂商直接向终端用户提供模型产品和部署服务;二是大模型服务商通过系统集成商,将大模型产品以行业解决方案的形式提供给用户;三是大模型服务商通过API接口,通过企业级软件服务商或直接向用户提供服务。系统集成商和企业级软件服务商将成为AI大模型提升产业渗透的关键驱动方。 Ø 洞察三: 2024年,中国大模型产业新增GPU需求量超过190万张,算力投资达千亿规模,其中80%的新增算力用于头部互联网大模型训练和自有业务支撑,20%用于行业用户大模型能力建设和对外提供MaaS服务,2024年,服务商大模型业务收入,主要用于覆盖算力成本,尚未实现盈利,整体市场规模约157亿元,预计至2025年后将有部分大模型企业开始盈利。
当前AI大模型技术发展呈现四大趋势:(1) Scaling Law面临挑战,大模型研究重点从预训练转向后训练;(2)算力平台和模型创新紧密耦合,提升大模型创新效率;(3) MoE架构开始广泛应用于推动模型性能和效率提升;(4)大模型工具链不断完善加速大模型应用研发与落地。
AI大模型应用面临公开可用的高质量中文数据资源相对较少的挑战。当前,高质量数据集缺乏的主要原因包括:(1)国内专业数据服务产业处于起步阶段,整体资源投入较少:当前数据存在规范性不足、质量不高、安全性存在隐患等问题;高质量数据集的产生要求投入大量资源对数据进行收集、清洗、标注、验证等工作;(2)数据交易体系还未形成规范和标准:数据交易体系流通存在数据权属配置不清晰、交易体系薄弱、缺乏通用的数据定价规则、未形成统一的流通规则、数据安全治理和监管体系薄弱等问题;(3)私域数据流通难:训练垂类大模型所需行业和场景数据需要更为专业的行业知识,涉及企业私域数据,出于隐私保护等原因,此部分数据获取较为困难。