2026年第2周计算机行业周报:小红书Video_Thinker打破工具依赖,DeepSeek推出mHC
- 来源:华鑫证券
- 发布时间:2026/01/16
- 浏览次数:146
- 举报
计算机行业周报:小红书Video_Thinker打破工具依赖,DeepSeek推出mHC.pdf
计算机行业周报:小红书Video_Thinker打破工具依赖,DeepSeek推出mHC。算力:算力租赁价格平稳,小红书Video-Thinker打破工具依赖小红书推出Video-Thinker视频推理模型,打破行业外部工具依赖。其通过创新数据集构建与“SPO+GRPO”两阶段训练,实现核心能力内化。7B版本在双重评测中确立SOTA,关键基准准确率领先显著,核心指标大幅提升,性能优于外部工具方案,为视频推理开辟内生智能新范式。AI应用:Character.AI周访问量环比+8.32%,DeepSeek推出流形约束超连接2026年1月1日,由DEEPSEEK公司发布、其创...
算力动态:算力租赁价格平稳,小红书 Video-Thinker 打破工具依赖
1.1、 Tokens 跟踪
根据 OpenRouter 公开数据,2025 年 12 月 22 日至 12 月 28 日,周度 token 消耗量有所 上升,调用量为 5.57T,环比上周-2.28%。在 tokens 规模 leaderboard 前五名中,xAI 旗下 GrokCodeFast1 以 409Btokens 位居榜首;Google 的 Gemini2.5Flash 以 353B 位列第二; DeepSeekV3.2以352B排第三;Anthropic的ClaudeSonnet4.5以352Btokens排第四;xiaomi 的 MiMo-V-Flash 以 351B 位列第五。 从市场份额维度来看,Google 以 247Btokens 占据 23.2%的份额,稳居首位;Anthropic 以 149Btokens 占比 14.1%,位列第二;xAI、Deepseek、OpenAI、则分别以 142B、116B、 95.1Btokens,对应占据 13.4%、11.0%、9.0%的市场份额。

1.2、数据跟踪:算力租赁价格平稳
上周算力租赁价格平稳。具体来看,显卡配置为 A100-40G 中,腾讯云 16 核+96G 价格 为 28.64 元/时,阿里云 12 核+94GiB 价格为 31.58 元/时;显卡配置为 A800-80G 中,恒源云 16 核+256G 价格为 7.50 元/时。
1.3、产业动态:小红书 Video-Thinker 打破工具依赖, 刷新视频推理 SOTA
12 月 底 , 小 红 书 研 究 团 队 推 出 全 新 视 频 推 理 模 型 Video-Thinker , 以 “ThinkingwithVideos”打破行业“工具依赖”困局,其 7B 参数量版本在 Video-Holmes 等 多个高难度基准测试中刷新 SOTA 性能,为视频大模型的动态推理开辟了新路径。 针对现有视频推理方法往往受限于对外部工具的依赖或预设的提示词策略的痛点, Video-Thinker 提出将“时序定位(Grounding)”与“视觉描述(Captioning)”两大关 键能力融入模型思维链(CoT),让模型在推理中自主定位关键帧、提取视觉线索。 Video-Thinker 的技术革新首先体现在高质量数据集的突破性构建上。针对现有开源视 频数据集的二元割裂缺陷,团队整合 ActivityNet、STAR、LVBench 等六大主流数据集,创 新推出 Hindsight-Curation 自动化流水线,构建了高质量样本的 Video-Thinker-10K 数据 集。通过“双向信息补全”、“结构化思维链合成”、“后见之明验证”三步闭环,实现 了时序定位、视觉描述与逻辑推理的深度融合,为模型内生能力培养奠定了坚实数据基础。
其另一核心技术革新在于“监督微调(SFT)+组相对策略优化(GRPO)”的两阶段 训练范式。SFT 阶段先通过标签主动定位关键片段,再利用标签提取视 觉细节,最后通过标签进行逻辑整合,完成模型“冷启动”,强制模型习得“定 位-感知-推理”的结构化思考范式,有效抑制无证据生成答案的幻觉倾向;GRPO 阶段则 突破传统 PPO 算法的局限,通过对同一输入并行采样多组不同的推理轨迹,利用组内输 出的相对优势来指导梯度更新。同时设计结果导向和过程约束的复合奖励函数,引入 KL 散度约束防止策略突变。这种训练模式不仅让模型将时序定位与视觉描述能力内化于思 维链,涌现出顿悟时刻,使模型能主动修正推理偏差,真正摆脱外部工具依赖,实现视 频内容的自主导航与深度推理。 为了全方位验证 Video-Thinker 的视频推理能力,研究团队构建了包含域内(InDomain)与域外(Out-of-Domain)的双重评估体系。Video-Thinker-7B 在域内与域外 双重评测体系中表现亮眼,成功确立 7B 参数量级模型的新 SOTA。评测涵盖 5 个域内测试 集与 6 个高难度域外推理基准,对比了 5+12 个主流基础模型及视频推理模型,结果显示 其域外泛化能力实现质变,Video-Holmes 榜单准确率达 43.22%,VRBench 综合基准准确 率 80.69%,证明模型真正习得通用视频推理能力。帧数鲁棒性测试中,该模型在 16 帧、 32 帧、64 帧不同输入设置下均持续压制基线模型,即便 16 帧低帧率条件下仍保持高推 理精度,体现出高效的时序信息整合机制。深度归因分析表明,其时序定位平均交并比 (mIoU)达 48.22%,较基础模型提升 75.5%,Recall@0.3 指标近乎基础模型两倍;视觉 描述在三大核心指标上全面领先,较基础模型提升 31.2%,较 Video-R1 提升 61.0%,为 推理提供了坚实信息基础。

消融实验进一步验证了模型的核心优势,简单外挂工具会导致性能“负优化”,即便 调用 72B 参数量专家工具,准确率仍低于 7B 基础模型;成熟工具调用方法 VideoMind-7B 虽 超越基础模型,但仍落后 Video-Thinker 约 4.2 个百分点。而 Video-Thinker 的内生思维链 实现“感知-定位-描述-推理”无缝融合,展现压倒性优势。同时实验揭示,SFT 阶段仅负 责规范模型思考格式,GRPO 强化学习才是性能飞跃的关键,使其在 Video-Holmes 和 VRBench 上分别提升 11.70%和 18.29%,两阶段训练成为提升复杂推理能力的有效路径。这 一系列实测结果证明,视频推理能力无需依赖“大参数+大数据”堆砌,通过精准培养内生 能力,7B 量级模型即可实现超越现有方案的性能,为视频推理领域开辟了新范式。
Video-Thinker 的核心价值,在于打破了“视频推理必须依赖外部工具”的固有认知, 通过“高质量数据合成+精准强化训练”的全链路设计,让 MLLM 真正实现内生“时序定位” 与“片段描述”能力,实现了端到端的自主视频思考。
AI 应用动态:Character.AI 周访问量环 比+8.32%,DeepSeek 推出流形约束超连接
2.1、 周流量跟踪:Character.AI 周访问量环比+8.32%
本期(2025.12.25-2025.12.31)AI 相关网站流量数据:访问量前三位分别为 ChatGPT (1090.0M)、Bing(749.0M)和 Gemini(384.0M),访问量环比增速第一为 Character.AI (8.32%);平均停留时长前三位分别为 Character.AI(00:18:04)、Discord(00:10:42) 和 Kimi(00:08:43);平均停留时长环比增速第一为 Gemini(1.16%)。
2.2、 产业动态:DeepSeek 推出流形约束超连接,引领 AI 架构效率新突破
2026 年 1 月 1 日,由 DEEPSEEK 公司发布、其创始人梁文锋署名的一篇学术论文,正式 公开了一种名为 mHC(流形约束超连接)的全新架构设计。这一方法能够在参数量为 27B 的 模型上,仅引入约 6.7%的额外训练时间开销,即可实现显著的性能提升,标志着在提升模 型能力与效率的探索道路上迈出了关键一步。 DEEPSEEK提出的mHC架构,正是针对传统残差流通道宽度瓶颈痛点的一次突破性尝试。 其核心创新在于,将 Hyper-Connections 的参数空间约束到特定的流形(manifold)上,以恢复恒等映射结构。具体而言,该方法要求矩阵元素非负,且每一行与每一列的元素之和 均为 1。这种双随机性带来了多重理论优势:首先,该类矩阵的谱范数不大于 1,这意味着 映射过程是非扩张的,有助于抑制梯度爆炸;其次,双随机矩阵在乘法运算下具有封闭性, 确保了跨越多层的复合残差映射仍然是双随机的,从而在整个模型深度范围内保持稳定性; 最后,该矩阵可视为一系列置换操作的凸组合,这提供了一种鲁棒的特征融合机制。
在技术实现层面,mHC 架构对每一层参数的处理进行了精心设计。给定某一层的输入, 模型会首先将其展平以保留完整的上下文信息,随后分别计算一个动态映射和一个静态映 射,接着通过 Sigmoid 函数得到最终满足约束的映射。Sinkhorn–Knopp 算子首先通过指数 运算保证所有元素为正,然后执行交替的迭代归一化过程,使矩阵的行和列分别归一到 1。 尽管严格的归一化迭代过程需要无限迭代,但实验中进行约 20 次迭代即可获得一个实用的 近似解,在效率与精度之间取得了良好平衡。
在基础设施设计层面,研究团队也实施了多层次的优化策略:首先,通过“内核融合” 技术和混合精度策略,对高维隐藏状态进行除以范数的操作重新排序,在不牺牲计算速度 的前提下最大化数值精度,并将多个具有共享内存访问模式的算子融合为统一的计算内核, 显著减少了内存带宽瓶颈。其次,为了应对 n 路残差结构带来的内存开销,他们采用了巧妙的重计算策略——在前向传播后丢弃 mHC 产生的中间激活,在反向传播需要时再即时重新计 算。通过最小化与 L_r 对应的总内存占用确定了最优的重计算块大小。最后,在大规模训练 中,团队扩展了现有的 DualPipe 调度策略。通过将部分计算内核置于独立的高优先级计算 流,并避免使用长时间运行的持久化内核,以防止产生长时间的停顿。该设计允许对已重 叠的注意力计算进行抢占,从而在保持计算设备处理单元高利用率的同时,实现更加灵活 的调度。
实验部分全面验证了 mHC 架构的训练稳定性和收敛性。在 27B 参数模型的训练稳定性测 试中,mHC 成功解决了原始 HC 方法中观察到的训练不稳定性问题,其最终训练损失较基线 模型降低了 0.021,并且在整个训练过程中展现出显著优于 HC 的稳定性,与基线相当。在 下游任务性能评估中,mHC 模型在包括 BBH、DROP 等在内的多个基准测试上,其零样本和少 样本性能均持续超越基线模型,并且在绝大多数任务上也优于 HC 模型。特别是在 BBH 和 DROP 任务上,相较于 HC 取得了超过 2 个百分点的额外性能提升,证明了其在大规模预训练 中的有效性。
研究团队还深入分析了 mHC 的扩展特性。通过在不同模型规模——从 3B 到 27B 参数, 和不同计算预算下的对比实验,结果表明 mHC 带来的性能增益在不同规模下均能稳健保持, 在更高的计算预算下仅有轻微衰减,验证了 mHC 架构在大规模训练场景下的普遍有效性。综 上所述,DEEPSEEK 提出的 mHC 架构,成功地将“扩展残差流宽度”这一理论设想推向了实 用化,同时实现了增强模型处理能力和保证训练稳定性的双重目标。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 华为鲲鹏产业体系研究深度报告:鲲鹏展翅,挥下千亿市场.pdf
- 2 计算机行业研究及2020年投资策略(103页).pdf
- 3 国产计算机基础软硬件行业深度报告:重构中国IT产业生态.pdf
- 4 计算机行业深度分析:国产软件大阅兵.pdf
- 5 国产操作系统产业分析报告:国魂所系,任重道远.pdf
- 6 网络安全服务行业研究报告:网络安全行业的制高点
- 7 计算机操作系统的历史演进和未来趋势.pdf
- 8 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf
- 9 计算机行业2020年度投资策略报告(87页).pdf
- 10 2020年计算机行业中期策略:疫情和中美脱钩对行业意味着什么.pdf
- 1 计算机行业2025年三季报业绩综述:业绩趋势向好,关注AI+与信创主题.pdf
- 2 计算机行业从Circle和Coinbase看稳定币产业链:稳定币+RWA,迈向Finternet的关键.pdf
- 3 计算机行业“智能驾驶”系列专题报告:域控制器研究框架.pdf
- 4 计算机行业专题报告:物理AI,AI技术演进新方向,赋能产业智能化升级.pdf
- 5 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 6 计算机行业深度研究报告:字节跳动,深度布局AIGC,竞逐新一轮技术浪潮.pdf
- 7 计算机行业分析:国产算力迎来GB200时刻,AI交换网络是核心增量.pdf
- 8 计算机行业深度报告:脑机接口,从概念到落地,开启交互新时代.pdf
- 9 计算机行业深度研究:软件大革命深度,AI Agent投资宝典.pdf
- 10 计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”.pdf
- 1 计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库【星环科技】.pdf
- 2 计算机行业AI应用系列:3D打印百花齐放,国产厂商持续突破.pdf
- 3 计算机行业:从智谱华章MiniMax IPO看产业机遇,国内AI产业机遇期来临.pdf
- 4 计算机行业专题研究:千问APP正式接入阿里生态,流量模型AI应用产业格局有望重构.pdf
- 5 计算机行业:SpaceX如何值万亿美元?.pdf
- 6 计算机行业AI编程:重塑软件开发新范式,应用生态加速繁荣.pdf
- 7 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf
- 8 计算机行业:AI编程商业化加速,关注本土产业参与方.pdf
- 9 计算机行业:SpaceX,从“变革”中崛起的“星际先行者”.pdf
- 10 计算机行业共享出行:迈向高质量发展,Robotaxi开启新篇章.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
