大模型产业进展如何?

大模型产业进展如何?

最佳答案 匿名用户编辑于2025/03/14 10:47

海外大模型引领创新,国产模型快速崛起。

1.海外闭源模型三巨头模型迭代加速,从纯文本模型到多模态和复杂推理

继 ChatGPT 后,OpenAI 于2023 年 3 月发布了 GPT-4 ,首次将输入模态从单一文本扩展到图文双模态。OpenAI对GPT-4系列模型进行 了重要技术升级,发布了GPT 4V(2023年9月)和GPT-4 Turbo(2023年11月),显著增强了模型的视觉能力和安全性。2024年5月, OpenAI春季发布会发布了新型旗舰模型“GPT-4o”。与 GPT-4 Turbo 相比,GPT-4o 速度提高了 2 倍,价格减半,限制速率提高了 5倍。 同时实现了文本、图像、语音等多模态输入输出的融合。 • OpenAl、Google、Antropic三大厂商轮番争夺大模型第一宝座:自23年初GPT-4发布以来,在1年左右时间内基本保持了领先优势。而 2024年谷歌、 Antropic 加速模型迭代,撼动了OpenAI的领先地位。

Google:2024年5月,Google发布Gemini1.5 Pro进阶版,实现200万tokens上下文,可以一次性处理大量信息,包括一 小时视频、11小时音频、超过30000行代码等,同时增强了模型的代码生成、逻辑推理和规划、多轮对话以及音频和 图像理解能力。 • Antropic :2024年6月,Antropic发布Claude 3.5 Sonnet,具备更强的代码和视觉能力,综合性能超越GPT-4o且价格更 便宜。同时推出了实时交互功能Artifacts,使用户能够实时查看、编辑和构建Claude生成的内容,支持文档、代码、 网页内容、可缩放矢量图形、图表和流程图、交互式React组建。

OpenAI o1引入强化学习和思维链技术提升模型复杂推理能力。2024年9月,OpenAI发布o1模型。与GPT-4系列相比,o1可执行更复杂 的推理任务。o1模型通过在生成结果前进行思考链(Chain of Thought,CoT)的生成,利用更多的计算资源和时间来增强推理能力。 这种方法使得模型在逻辑推理和复杂任务处理上达到了新的高度,甚至在某些评测中,o1-mini模型的表现超过了o1-preview模型。12 月6日,OpenAI直播发布o1完全体。与 o1 和 o1-preview 相比,o1 pro 模式在数学、科学和编码等 ML 基准测试中表现更佳。 • o3系列模型首次突破ARC-AGI基准测试。2024年12月21日,OpenAI正式发布o3系列模型,包括o3和o3-mini。o3系列在ARC-AGI(人 工通用智能评估基准)测试中取得了显著的成绩,成为首个突破 ARC-AGI 基准的 AI 模型。在高算力配置下,o3达到了87.5%的得分, 而在低算力配置下也取得了75.7%的得分,远超o1的25%。

o1的发布将大模型的Scaling law由训练端扩展至推理端。o1系列引入了test-time compute技术,随着推理时间计算的增加,o1 的性能 会持续提高,意味着可以通过增加推理时的计算量来进一步提高性能。 OpenAI的核心科学家Noam Brown强调了test-time compute的重 要性,认为它是通往通用人工智能(AGI)时代的关键技术。与预训练(pre-train)相比, test-time compute的成本相对较低,且算法 改进空间巨大,具有巨大的提升潜力。 • o1带领人工智能进入推理新纪元。OpenAI 将 AGI(通用人工智能)定义为在最具经济价值的任务中超越人类的高度自治系统。根据 24年7月公布的OpenAI AGI路线图,将AGI 划分了五个发展阶段。依据该标准,o1系列的发布标志着AGI发展已经进入第二阶段。而 根据其前研究员预测,五级AGI最快将在27年实现。

2.国内大模型能力持续追赶突破

国内大模型能力加速追赶海外头部模型,差距持续缩小。24年国内大模型也在各功能上加快迭代速度,主要方向包括多模态信息处理能 力、长文本能力、逻辑推理能力等方面。总体趋势上,国内外第一梯队大模型在中文领域的通用能力差距在持续缩小,从2023年5月的 30.12%的差距,缩小至2024年8月的1.29%。目前国内大模型正在持续接近Claude 3.5 Sonnet和ChatGPT-4o-latest的能力,但o1-preview的推 出进一步拉大了与其他模型的差距,国内大模型与o1-preview在中文难任务上相差约为14%,在中文通用能力上相差约8%。

 

字节跳动:布局大模型全产业链,AI应用全面铺开

 豆包大模型于2024年5月正式发布,随后豆包快速补齐了音乐生成、图生图、图生视频、视觉识别等能力,推出了包括豆包大模型家 族在内的17款大模型、2个智能体开发平台,和十余款AI应用,覆盖了聊天、社交、办公、教育、图像、视频、音乐等各大类型。 • 截至12月中旬,豆包大模型的日均tokens数已经突破了4万亿,发布7个月以来增长超过33倍。tokens调用规模化增长的同时,豆包大 模型在不同场景中的调用量均快速增长,全面开花。

2024年12月18日,火山引擎举办FORCE大会,豆包大模型家族全新升级。会上重磅发布豆包视觉理解模型,拥有更强的内容识别、 理解和推理和更细腻的视觉描述能力,极大地拓展了大模型的场景边界。豆包视觉理解的输入价格为每千tokens 0.003元,比行业平 均价格降低85%,相当于一块钱可以处理284张720P的图片,视觉理解模型正式走进厘时代。 • 豆包通用模型Pro已全面对齐GPT-4o的能力,综合任务处理能力相较于5月份提升了32%,推理能力提升了13%,指令遵循能力提升了 9%,代码处理能力提升了58%,数学问题解决能力提升了43%,专业知识领域能力提升了54%。豆包通用模型pro-32k输入价格为 0.0008元/千tokens,比行业价格低99.3%,花一元钱就能让豆包处理 200 万个汉字,相当于三本《三国演义》。

国内厂商在视频生成赛道脱颖而出

 Sora发布开启视频文生视频大模型热潮,目前视频模型效果趋近“影像级”。2024年2月,OpenAI 推出Sora并提出DiT架构,为视频 生成大模型提供了可行的技术路线。在Sora发布到正式上线之间,国内外大模型企业快速推出了众多AI视频生成产品并实现了商业 化,目前主流视频模型的生成时长已由发布之初的2-4秒提升至5秒以上,分辨率多数可达到720P及以上,帧率向24/30fps 趋近。从多 模态模型的能力来看,国内大模型与海外大模型的差距较小,且视频语料数量充足。 • 国内的海螺AI、快手可灵、字节即梦在视频大模型赛道竞争力较强,轮番登上榜单。Minimax旗下的海螺AI视频在海外爆火出圈, 根据AI产品榜,海螺AI视频在2024年10月的海外访问量达到了1173万,同比增长率高达2772.92%。快手可灵月活超150万,单月流水 也超过了千万人民币。

大模型API降价潮开启,加速AI普惠时代到来

 OpenAI GPT系列模型调用成本显著下降,GPT-4o相比一年 前的GPT-4,输入价格降为1/12,输出价格降为1/6。 • 国内大模型厂商开启“价格战”。2024年5月,DeepSeek推 出DeepSeek-V2,价格将至每百万输入Tokens 1元,每百万 输出Tokens 2元,随后字节、阿里、百度等厂商纷纷跟进降 价。字节宣布豆包通用模型pro-32k版模型推理输入价格仅 为0.0008元/千Tokens,比行业低99.3%。阿里云宣布其9款 商业化及开源系列模型降价,最高降价幅度达到了90%。 百度智能云宣布文心大模型的两款主力产品ENIRE Speed与 ENIRE Lite全面免费。我们认为API算法调用的价格下降能 够大幅地降低中小企业的开发成本,有望促进AI大模型技 术的普及,加速AI应用的全面爆发。

参考报告

计算机行业2025年投资策略:AI应用和自主可控有望持续演绎.pdf

计算机行业2025年投资策略:AI应用和自主可控有望持续演绎。行业回顾:1)市场表现:截至2024年12月31日收盘,申万计算机指数较年初累计上涨4.42%,同期沪深300指数上涨14.68%,计算机行业略微跑输沪深300指数,涨幅在31个申万一级行业中排名第14。从涨幅前十的个股来看,互联网金融、华为链和低空经济相关个股表现突出。2)业绩表现:2024年前三季度,计算机行业上市公司总营收达8581.38亿元,同比增长5.72%,归母净利润同比下降29.8%,反映出行业盈利能力有所承压。3)基金持仓:2024Q3计算机行业基金重仓持股比例连续下降,处于历史低位。AI:1)从技术发展趋势上看,2...

查看详情
相关报告
我来回答