大模型 - 未来智库

海内外大模型落地进展如何？

提问时间：2025/11/07
浏览量：44
提问者：匿名用户

[1个回答]海内外大模型持续迭代升级，多模态场景加速落地。一、海外方面：巨头领衔大模型市场方向1、ChatGPT：高性能AI大模型龙头OpenAI以GPT系列为基石，持续推进多模态更新落地。OpenAI成立于2015年，由SamAltman、ElonMusk等人联合创立，是一家专注于人工智能研究与开发的前沿科技公司。其核心产品包括GPT系列大语言模型及ChatGPT。GPT是模型，而ChatGPT是基于该模型开发的智能聊天机器人程序，ChatGPT功能性能依托于GPT模型的性能与容量。2018年，OpenAI发布了初代预训练语言模型GPT-1。2021年3月，OpenAI正式推出基于GPT-3架构的Cha...

标签：大模型

未来大模型的发展方向是什么？

提问时间：2025/09/22
浏览量：58
提问者：匿名用户

[1个回答]未来机器人通用大模型的架构演进方向之一，是将“世界模型”引入决策推理流程，作为具身智能的核心支撑模块。1.模态：融入更多模态，构筑世界模型当前主流模型仅涵盖三个模态，未来扩展空间大。当前主流的机器人大模型多是VLA，即只包括视觉、语言和动作三个模态，未来若想加强人形与世界的交互，构筑更真实的世界模型，或将需要融入如触觉、温度等更多模态。触觉或为下一个模态，VTLA已有相关研究储备。触觉的引入可助力VLA模型进一步泛化。通过引入触觉这一关键信息，VLA模型可进一步延申为VTLA模型。目前包括戴盟、帕西尼在内的公司已有相关VTLA技术储备，预计未来触觉将成为下一个融入模型的...

标签：大模型

大模型产业发展与企业应用情况如何？

提问时间：2025/09/17
浏览量：58
提问者：匿名用户

[1个回答]海外大模型差异化发展，企业调用考虑性价比。1。大模型份额变化：谷歌与Anthropic优势明显，国内模型稳健进步根据Openrouter数据谷歌与Anthropic模型份额较高，目前占据模型调用市场半壁以上江山。两者陆续迭代发布重磅模型版本，如谷歌的Gemini1.5与Gemini2.0系列，在多模态、长文本领域优势明显。Anthropic发布Claude3.5\3.7\4.0系列，复杂推理编程能力突出。国内随着Deepseek推理开源V3/R1模型的发布，以开源为特点在模型市场份额稳步提升。代表如Deepseek系列、QWEN系列、Kimi系列。海外大模型差异化发展OpenAI:技术路径上依...

标签：大模型

海内外基础大模型发展趋势及技术展望分析

提问时间：2025/08/21
浏览量：37
提问者：匿名用户

[1个回答]自ChatGPT发布后，大模型行业发展不断加速，目前呈现推理模型深化、智能体模型爆发的发展格局。1.海外基础大模型发展趋势及技术展望OpenAIOpenAI成立于2015年，由萨姆·奥尔特曼（SamAltman）、埃隆·马斯克（ElonMusk）等硅谷科技领袖联合创立，初期为非营利组织，2019年转型为“封顶”营利性实体，现由非营利母公司OpenAIInc.与营利性子公司OpenAILP组成，微软为最大投资者（持股49%）。创始团队早期聚焦开源工具开发，随后转向大型语言模型研究。OpenAI于2018年发布GPT-1，2019年升级至GPT-...

标签：大模型

字节大模型核心亮点在哪？

提问时间：2025/08/11
浏览量：114
提问者：匿名用户

[1个回答]重视基模能力迭代，组织架构和制度导向确保长期处于领先。1.基础模型：慢思考、快执行，全面布局且能力领先我们认为，字节大模型经过2023~2024年的快速迭代，初步实现了模型系列完备、模型能力处于国内一梯队的阶段性目标，其中1）LLM方向字节4月发布的Seed-Thinking-v1.5模型一度将国内与海外前沿模型的能力差距缩短至3个月以内；2）多模态方向文生图、视频生成模型能力均处于全球领先水平。起步相对较晚、迭代速度快，相继补全语言和图像、音乐、视频等多模态的AI大模型。2023年初，字节内部开始训练基础模型，部署Seed项目专注于模型层的研发。2023年8月，字节发布云雀大模型V1.0版本...

标签：字节大模型

国内大模型瓶颈及商业化难点在哪？

提问时间：2025/07/24
浏览量：86
提问者：匿名用户

[1个回答]国内大模型的瓶颈，以及国内商业化的难点。1.国内大模型瓶颈：核心依然是算力受限，从而导致技术路线创新缓慢我们认为，制约国内大模型发展的瓶颈有四个，其中高性能算力是最核心的根源。1）瓶颈#1：高性能算力受限，单集群大小受限。不可否认，国产算力已经有了突飞猛进的进展，25年5月发布的718B参数稀疏MoE（推理激活39B）模型PanguUltra完全在910B平台上完成了训练，并实现6KAscendNPUs上30.0%的模型浮点运算利用率（MFU）和1.46M的每秒token（TPS）。然而，目前仍然有相当一部分的国内模型是在Nvidia的GPU以及CUDA生态上训练的。由于宏观等因素，国内相比海...

标签：大模型

大模型产业链投资机遇在哪？

提问时间：2025/07/24
浏览量：50
提问者：匿名用户

[1个回答]在硬件端以外，与大模型行业密不可分的供配电系统、散热技术、高速互联与存储开发者软件平台及生态终端亦具备优良的投资前景。1、上游机遇1：光模块及光器件算力需求提升带动网络带宽成倍增加，驱动数通光器件需求高增。AI大模型的训练和推理需要处理海量数据，并依赖于大规模GPU集群内及集群间的高吞吐量、低延迟互连。因此，大模型的快速发展对网络硬件的性能提出了更高的要求，数据通信的互联速率正从400G向800G快速过渡，并进一步向1.6T甚至3.2T演进。光模块等光器件作为实现高速数据传输的核心组件，在全球互联网云厂持续加大资本开支建设或升级数据中心的背景下，需求快速增长。2024年，400G以上的高速光模...

标签：大模型

大模型金融能力评价基准梳理

提问时间：2025/07/17
浏览量：119
提问者：匿名用户

[1个回答]当前其实已经推出了多种用于评估大模型在金融领域能力的基准测试，涵盖不同任务类型和语言环境。以下我们整理了几个主流的金融领域基准，包括FinanceBench、FinBen、SuperCLUE-Fin等，试图探究如何构建一个可以有效评价大模型金融能力的评价基准。FinanceBench专注于开放金融问答（Open-bookQA）。它包含关于上市公司的事实性问题，需要模型在提供的财务文档证据中查找答案。问题场景多样且贴近真实金融业务，但题目设计为明确且单一答案，作为金融问答的最低能力要求。例如，模型可能被问及某公司年报中的特定财务指标值或事项，需从10-K等报告中提取答案。FinanceBench...

标签：大模型金融能力

海内外大模型厂商产品迭代方向和下游应用趋势分析

提问时间：2025/07/14
浏览量：160
提问者：匿名用户

[1个回答]以下分析海内外大模型厂商产品迭代方向和下游应用趋势。一、OpenAI与谷歌在AI大模型商业化策略上的对比分析1.OpenAI在技术和产品优势的基础上，推动模型商业化落地。根据Pymnts网站，OpenAI公司2024年营收37亿美元。OpenAI的CFOSarahFriar在2025年2月提到，OpenAI公司2025年的营收有可能达到110亿美元。2025年6月，OpenAI宣布其年化收入（annualrecurringrevenue）已达到100亿美元。OpenAI收入增长的趋势一方面与其用户规模相关，另一方面与其AI大模型产品的商业化策略相关。OpenAI的用户规模呈现稳定增长的趋势。O...

标签：大模型

大模型技术路线、创新与改进分析

提问时间：2025/06/17
浏览量：222
提问者：匿名用户

[1个回答]大模型技术路线呈现出从预训练到后训练的发展过程。回顾大模型的迭代历程，呈现出从预训练到后训练的发展过程。大语言模型的预训练主要包括参数集的扩大、训练数据的扩大以及模型架构的优化。自2017年Google提出Transformer架构，通过自注意力机制首次实现了序列数据的全局关联建模与高效并行处理。自此预训练的ScalingLaw开启。回顾过去大模型的迭代，2018-2024年9月主要是模型的预训练阶段。参数量来看，2024年主流大模型迭代至千亿级别，而后参数扩大的趋势有所放缓。进入2025年，以Llama4Behemoth为代表的模型进一步将参数扩大至2万亿级别。自2024年9月OpenAIo...

标签：大模型

大模型如何基于图片思考？

提问时间：2025/06/09
浏览量：83
提问者：匿名用户

[1个回答]从LLM到MLLM。多模态协同是大模型通往通用人工智能（AGI）的必经之路。ChatGPT、DeepSeek等里程碑式的大模型一次次的向人类证明，在自然语言处理的任务中，大模型的能力远超人们想象。然而，想接近AGI的圣杯，仅仅作为一个自然语言处理任务的“专家”依然远远不够。因此，多模态大模型（MLLMs）自然成为AI研究的重要方向，致力于将大模型的智能从文本的单模态泛化至图片、音频等领域，成为多模态智能的“通才”。典型的多模态大模型架构通常包含三个模块：编码器、连接器以及LLM，而让多模态大模型“看得到，听得见”的关键则在...

标签：大模型

人工智能大模型发展趋势有哪些？

提问时间：2025/04/22
浏览量：38
提问者：匿名用户

[1个回答]大模型发展态势，从技术、生态、应用、商业模式等多维度研判，梳理出七大核心趋势：1.模型能力不断提升，国内外差距逐步缩小（一）中国大模型加速追赶，开启竞争新格局。国内大模型通过架构、算法创新降低训练成本，探索模型极限。中国AI研发能力已居世界前列，AI领域论文数量居世界第一，专利申请数量世界第二，国内外大模型能力差距被不断缩小。通过协同创新、生态创新，国内大模型产业正在形成跨APP、跨设备、跨行业协同创新新格局。（二）目前国内外大模型市场环境差距明显。中国工业互联网研究院的报告表明，在投资总量上，24年，美国在人工智能领域的投资额约为641亿美元，中国仅为55亿美元。雄厚的资金投入使国际科技巨头...

标签：大模型人工智能

互联网大厂大模型进展梳理

提问时间：2025/04/18
浏览量：139
提问者：匿名用户

[1个回答]持续迭代参与竞争，阿里通义性能比肩DeepSeek。1.阿里巴巴：基座模型、深度推理模型进展稳居第一梯队阿里旗下最新旗舰模型Qwen2.5-Max在指令模型、基座模型的指标对比中，均已能赶超业界领先的模型。阿里通义于25年1月发布最新Qwen2.5-Max模型，其为通义千问系列效果最好的模型。根据通义千问披露：1）指令模型（即我们平常使用的可以直接对话的模型）对比，在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等基准测试中，Qwen2.5-Max的表现超越DeepSeek-V3。同时在MMLU-Pro等其他评估中也展现出具备竞争力的成绩。2）基...

标签：互联网大模型

政务行业大模型概念、发展驱动、核心价值及发展趋势分析

提问时间：2025/04/11
浏览量：128
提问者：匿名用户

[1个回答]通用大模型基座结合政务行业数据，服务政务业务场景的专业模型。1.政务行业大模型概念界定政务行业大模型是在通用大模型基础上结合政务行业专属数据和政务行业业务场景特征、为政务领域专业定制的专属行业大模型。•在部署模式上，政务行业大模型一般需要支持私有化部署，以满足政务数据安全性与合规性要求；•在开发能力上，政务行业大模型需要具备定制化开发能力，以更好地适应不同政务场景的特殊要求；•在服务能力上，政务行业大模型需要配备本地化服务团队，以支持政务行业大模型的调优和长期维护。2.政务行业大模型发展驱动自从Google提出Transformer大语言模型、使“千亿...

标签：政务大模型

金融机构选择或部署大模型需要哪些能力要素？

提问时间：2025/03/17
浏览量：254
提问者：匿名用户

[1个回答]金融机构在落地大模型的过程中，需要综合考虑数据价值链管理、模型的选择与部署、AI平台搭建、以及AI治理等要素。1.数据价值链管理：提升数据可用性和数据质量金融机构的数据价值链管理是生成式AI在金融场景中有效发挥价值的基石，其核心目的是提升数据质量、数据可用性以及确保数据的合规获取，有利于金融机构面向不同的应用场景快速构建高质量的数据集，并为后续金融大模型的规模应用奠定坚实的基础。目前市场中已存在通过构建多模数据管理平台DMS或是通过数据管理全流程解决方案，以更好地满足大模型时代的用数需求。生成式AI数据价值链负责监督基础模型、微调模型/金融行业模型使用的训练数据的获取、生成、处理和管理，以确保...

标签：金融大模型

"大模型" 相关的问题

海内外大模型落地进展如何？

未来大模型的发展方向是什么？

大模型产业发展与企业应用情况如何？

海内外基础大模型发展趋势及技术展望分析

字节大模型核心亮点在哪？

国内大模型瓶颈及商业化难点在哪？

大模型产业链投资机遇在哪？

大模型金融能力评价基准梳理

海内外大模型厂商产品迭代方向和下游应用趋势分析

大模型技术路线、创新与改进分析

大模型如何基于图片思考？

人工智能大模型发展趋势有哪些？

互联网大厂大模型进展梳理

政务行业大模型概念、发展驱动、核心价值及发展趋势分析

金融机构选择或部署大模型需要哪些能力要素？

海内外大模型落地进展如何？

未来大模型的发展方向是什么？

大模型产业发展与企业应用情况如何？

海内外基础大模型发展趋势及技术展望分析

字节大模型核心亮点在哪？

国内大模型瓶颈及商业化难点在哪？

大模型产业链投资机遇在哪？

大模型金融能力评价基准梳理

海内外大模型厂商产品迭代方向和下游应用趋势分析

大模型技术路线、创新与改进分析

沃巴查芒

每日新报

StartYourFinance

999感冒灵

王中王