传媒行业动态跟踪:Gemini3发布——地表最先进推理能力,开启Google时刻.pdf

  • 上传者:J***
  • 时间:2025/11/20
  • 热度:198
  • 0人点赞
  • 举报

传媒行业动态跟踪:Gemini3发布——地表最先进推理能力,开启Google时刻。Gemini3 正式发布,采用 Transformer 的 MoE,原生支持文本、视觉和音频等多 模态输入,构建最强全模态推理能力。具体测试看 Gemini3 先进性体现在:(1) 推理能力。Gemini3 Pro 在各项 AI 基准测试中,LMArena 排行榜 1501 的 Elo 评分 高居榜首,GPQA Diamonds 达到 91.9%的准确率,在 Humanity’s Last Exam 不 使用任何外部工具取得 37.5%的成绩。(2)多模态理解能力。从 Gemini 1.0 即确 立原生多模态和长上下文的原则,致力于原生且无缝理解文本、图像或音频等信息 模态之间的内在联系和差别。Gemini3 Pro 在多模态理解上达到新高度,MMMUPro 取得 81%成绩、Video-MMMU 达 87.6%。(3)编码能力。基于推理和多模态 能力,Gemini3 Pro 仅需非常简单的自然语言描述,即可交付出视觉丰富、可交互 的前端界面或应用实体。

重构用户体验,全栈优势体现:Gemini3 发布即全面集成到搜索 AI Mode 下, Gemini APP 用增年内有望进一步提速。(1)Google 为应对 Chatbot 对传统搜索 冲击,24 年起推出 AIO 和 AI Mode 模式,目前搜索 AIO 已覆盖 20 亿 MAU、AI Mode DAU 达 7500 万。此次 Gemini3 发布即上线 AI Mode,重塑传统搜索从单点 查询--->散点主动规划生成。(2)我们观点为底模能力为应用(用增)第一生产 力。Gemini 25Q1 DAU 3500 万-->25Q2 MAU 4.5 亿-->25Q3 MAU 6.5 亿,Gemini 3 Pro 上线及后续 NanoBanana2 集成(更强语义理解能力、更简易自然语言交互、 更强中文能力),看好 Gemini APP、及 Google AI 系列用增进一步上行。(3)比 直接落地更重要的是 Gemini 3 优化了用户交互【看见并交互】,比如让搜索实现 了“生成式用户界面”(Generative UI)。AI 不再只是生成内容,开始实时动态生 成一个为用户搜索量身定制的可视化界面。对于用户而言,这意味着信息获取从 “阅读”升级为“体验”,不仅是文字、图文简单交互,这是应用场景的巨大进 步。

重构生产力范式:全新 AI IDE Google AntiGravity,从 AI 辅助写代码到 AI 合作 开发。基于 Google AntiGravity,开发者可以在更高的抽象层级下达任务,Gemini 3 会自主将其分解为子任务,规划执行路径开始编码,并通过浏览器验证运行效 果。

我们观点是:科技大厂更强调全栈能力,硬件(自研芯片、数据中心等)-研究层 (AGI 探索)-模型-应用(产品、平台),全栈路径的最大优势在于速度和协同。 (1)速度:能大幅缩短模型开发完成与在产品中展示给大量用户之间的时间。 (2)协同:谷歌搜索产生的大量用户数据将为 Gemini 模型后训练带来极强数据优 势,即应用数据-模型训练具有明显飞轮效应。模型能力强化将带来 Gemini 算力消 耗大幅增加,有望反哺上游 google cloud 需求增长,且谷歌 TPU 在 Gemini 的训 练具有明显效率优势,即云/硬件-模型能力具有飞轮效应。因此我们看好谷歌全栈 AI 能力的飞轮效应,对标国内同样具备全栈优势的阿里巴巴。

1页 / 共3
传媒行业动态跟踪:Gemini3发布——地表最先进推理能力,开启Google时刻.pdf第1页 传媒行业动态跟踪:Gemini3发布——地表最先进推理能力,开启Google时刻.pdf第2页 传媒行业动态跟踪:Gemini3发布——地表最先进推理能力,开启Google时刻.pdf第3页
  • 格式:pdf
  • 大小:0.3M
  • 页数:3
  • 价格: 4积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至