字节大模型核心亮点在哪？

提问时间：2025/08/11
浏览次数：114
提问者：匿名用户
举报
分享微信 QQ 微博

字节大模型核心亮点在哪？

标签

字节
大模型

共有1个回答
关注问题
我来回答

最佳答案由匿名用户编辑于2025/08/11 15:42

重视基模能力迭代，组织架构和制度导向确保长期处于领先。

1.基础模型：慢思考、快执行，全面布局且能力领先

我们认为，字节大模型经过 2023~2024 年的快速迭代，初步实现了模型系列完备、模型能力处于国内一梯队的阶段性目标，其中 1）LLM 方向字节 4 月发布的 Seed-Thinking-v1.5 模型一度将国内与海外前沿模型的能力差距缩短至 3 个月以内；2）多模态方向文生图、视频生成模型能力均处于全球领先水平。起步相对较晚、迭代速度快，相继补全语言和图像、音乐、视频等多模态的 AI 大模型。2023 年初，字节内部开始训练基础模型，部署 Seed 项目专注于模型层的研发。2023 年 8 月，字节发布云雀大模型 V1.0 版本，此后基础大模型能力保持快速迭代，每 1-2 月就有新版本推出。2024 年 5 月字节发布豆包大模型，包括通用模型 pro 和 lite2 款基座模型，以及 7 款功能性模型，涵盖角色扮演、语音识别、语音合成、声音复刻、文生图等方面。2024 年 9 月字节发布豆包视频生成模型， 12 月发布豆包视觉理解模型、全面升级通用模型，在多模态大模型领域持续取得技术突破。2025 年 1 月发布豆包大模型 1.5 系列，4 月发布 1.5 深度思考模型，6 月 11 日发布豆包大模型 1.6 系列。在 LLM 及多模态上，字节对应模型均取得了相应的排位，处于领先状态。

1）字节 LLM 能力处于国内一梯队，国内大语言模型能力与海外差距缩短至 3 个月以内。自 2022 年 ChatGPT 发布以来，中美前沿模型之间的性能差距一直存在，但国内大模型持续迭代不断追赶，使得这一差距从此前的一年多时间缩小至三个月以内。海外主要是 OpenAI 的 o3 模型处于领先地位，国内则主要由 DeepSeek 和阿里巴巴通义模型引领。在国内模型技术追赶的过程中，字节于 2025 年 4 月发布的 Seed-Thinking-v1.5 模型能力超越彼时的 DeepSeek R1，将国内大语言模型的先进性继续往更高水平推进。

2）字节文生图/视频能力较强，多模态上现阶段国内与海外势均力敌。从多模态的角度，参考 Artificail Analysis 榜单，字节在文生图和视频生成上表现亮眼，其文生图模型 Seedream 3.0 发布时一度取得全球文生图模型的榜首位置，目前全球排名仅次于 OpenAI 的 GPT-4o，位于第二；4 月底上线的视频生成模型 Seedance1.0 目前位于全球第一。语音模型也处于国内领先水平（SuperClue-TTS 语音合成测评国内第一）。我们认为，国内多模态模型的能力，目前与海外是势均力敌、互相追赶的状态。相较于语言大模型文字类的通用场景，国内在多模态的应用和市场更大，预计多模态类的 AI 应用能打造技术-场景测试-数据迭代-产品优化的良性循环。字节方面受益于短视频（兼具视频和声音）数据和用户生态，看好其多模态发展潜力。

2. 研发架构：阶段性领先目标达成，研发分层和整合放眼长期 AGI 研究

我们认为，字节 Seed 团队高人才密度和赛马机制，是过去 2 年大模型研究快速突破、跃升到国内领先水平的核心，竞争和成果导向帮助字节在前期落后的情况下实现追赶甚至反超。在新周期下的大模型军备竞赛，集团层面字节 AI 业务优先级和重要性高，且从 25 年字节近期 AI 研发架构变动判断，其基模战略放眼更为长期的 AGI 研究，核心聚焦基础模型能力向前沿范式推进和持续领先。在配套制度保障上，虚拟小组精简组织关系和汇报层级、为长期 AGI 研究团队设置更长的考核周期等动作，目的均在于创造更良性的研究氛围、激发团队人才的创新创业热情。

字节 AI 团队高人才密度。以 Seed 研发团队来看，团队组建于 2023 年，聚集了一批高水平研究人员，包括：1）早年即加入字节的 AI 研究者，如 2021 年加入的冯佳时，目前是豆包大模型视觉基础研究团队负责人；2018 年加入的王雨轩，目前是豆包大模型语音团队的负责人；2）字节也吸引了外部技术骨干，如原谷歌 DeepMind 副总裁的吴永辉，目前担任 Seed 团队基础模型负责人；2024 年加入的周畅，此前为阿里通义大模型技术负责人，目前为字节世界模型负责人；3）此外字节也争取到相当一部分的年轻研究者， 24 年 5 月，Seed 团队发起了面向顶尖应届博士毕业生的 Top Seed 人才计划，招募了约 30 人，为 AI 人才团队注入年轻血液。内部赛马机制激发技术突破。以视频生成模型为例，Seed 部门里有两个团队参与相关工作，即 PixalDance 和 Seaweed，通过竞争促进技术突破和产品创新。

集团架构层面，AI 业务负责人直接汇报梁汝波，业务优先级和重要性高。字节 AI 团队主要包括 Seed（2023 年初成立，专注大模型底层技术研发）、Flow（2023 年底成立，负责基于大模型的 AI 原生应用研发）、AI Lab（2016 年建立，随着核心团队成员离开有所弱化和分拆，目前并入 Seed）、Data-AML（机器学习中台）、Stone（AI产品研发支持）。到2023年底，Seed、Flow 已成为和抖音、火山、飞书等平级的重要业务，其中 Seed 团队负责人吴永辉、朱文佳直接向字节跳动全球 CEO梁汝波汇报，区别于其他互联网大厂是独立组织架构和直接汇报一号位的层级。从人员流向来看，24 年初抖音集团 CEO 张楠、飞书副总裁齐俊元均转岗至相关 AI 部门，Seed 负责人朱文佳此前为今日头条 CEO 和 TikTok 产品技术负责人，Flow 负责人朱骏为字节跳动产品与战略副总裁，从集团层面抽调了原各业务线的核心成员到 AI 团队。因此综合业务层级、汇报级别、内部活水动向判断，字节 AI 业务在集团内部处于高优先级。

3 月 Seed 全员会明确探索智能上限目标，聚焦模型能力以保持长期领先优势。字节通过前期快速追赶，模型能力已达到国内一梯队水平。在国内各家大模型竞争愈发激烈的态势下，大厂凭借高维的算力和资源投入，对起步更早的初创公司形成一定挤压，如 AI 六小龙在资源相对不足的情况下重心各有分化，百川转向垂直模型、零一万物转向训练更轻量化和有商业落地前景的模型等。对于字节而言，负责人的调整、Seed 架构和汇报条线的变化等，均向外界传达出其 AI 战略在于坚定聚焦探索下一代模型范式，探索智能边界，追求全球领先。

（1）前 Google Deepmind 副总裁吴永辉加盟，Seed 内部研发分层和整合。 Seed 目前为双负责人模式。25 年字节 AI 团队最大的人员变动在于引入前 Google Deepmind 研究副总裁、Google Fellow 吴永辉博士担任大模型团队 Seed 基础研究负责人，原本由朱文佳独立负责的 Seed 部门，转变为吴永辉掌舵 AI 基础研究、朱文佳主抓模型应用方向的双负责人模式。相比此前担任 TikTok 产品技术负责人的朱文佳，在搜素和推荐算法技术领域有深厚积累，吴永辉的研发经历更聚焦 AI，研究领域涉及机器翻译、语音技术和大语言模型等多个领域，是 Palm 2大模型训练团队的核心贡献者，也是 Gemini 应用总技术负责人之一。吴永辉是继2022年加入的CFO高准之后，最新一位直接空降到CEO-1级别的高管。吴永辉2008 年博士毕业于加州大学河滨分校，起初作为一名排序工程师加入谷歌，致力于改进谷歌核心网页搜索排名的算法。2015 年吴永辉转入 Google Brain 团队，专注于深度学习及其应用研究，主导了神经机器翻译（GNMT）、RankBrainn 等项目，推动了语音识别的技术发展。双负责人制下，研发方向有所分层：根据晚点 LatePost，吴永辉带队大模型研发环节，多名原来向朱文佳汇报的算法和技术负责人转向吴永辉汇报，如 AML 和豆包大模型 Foundation 团队负责人项亮、字节人工智能实验室（AI Lab）总监李航、字节豆包大模型视觉多模态生成负责人杨建朝等；朱文佳则更侧重于研发与体验更相关的模型应用能力，如问答、创作、解题、代码和 AI 使用工具的能力等。另一方面，内部研发力量整合更加明显，包括 AI Lab 正式并入 Seed、原属于 AML 部门的肖文之团队（曾发表过模型训练数据以及监督预训练方向的成果）也并入 AI Lab。我们认为，双负责人模式下的模型研发，说明字节 AI 思路上尤其重视底层基础模型能力提升、追求保持领先水平，并且同样重视模型在应用侧的能力嫁接和用户体验，模型应用能力作为偏通用和标准的模块，或为新模型能力快速接入应用、提供丝滑和差异化的用户体验等奠定强大支持。

（2）重视 Seed Edge 长期研究，并通过制度保障鼓励创意创新。字节于 25 年 1 月正式设立代号为“Seed Edge”的研究项目， 4 月 AI Lab 的 Seed Robotics、AI for Science、Reponsible AI 三个方向也一并加入该研究团队。Seed Edge 的目标是做更长期、更底层的 AGI 前沿研究，并拟定 5 大相对长期的研究方向，不要求像迭代模型一样快速出成果。在制度和资源保障上，字节为 Seed Edge 项目人员提供更长的考核周期，不设置 OKR 和半年考核，关注研究成果的长期影响和价值，并且提供充足的算力资源保障。此外，吴永辉在 Seed 内部设立了若干虚拟小组（不在正式组织结构中，是专注于特定项目的临时团队），并且调整了内部汇报流程体系，职级为吴永辉-2 的人也可以直接向吴永辉汇报，从而使得组织关系更精简高效。我们认为，Seed Edge 更聚焦研究长期、底层的技术变革，在保障基础模型能力短期处于领先水平之外，放眼长期、培养下一技术周期的竞争力。

参考报告

字节跳动AI底层架构专题报告：基模领先，组织财务双保障，占领AI时代高地.pdf

字节跳动AI底层架构专题报告：基模领先，组织财务双保障，占领AI时代高地。字节大模型（LLM和多模态）实力领先，剑指长期AGI研究。根据ArtificialAnalysis，字节自研语言大模型能力处于国内一梯队，多模态方面文生图Seedream3.0、视频生成Seedance1.0均处于全球TOP排位，语音模型也较为亮眼。我们认为，研发团队高人才密度和内部赛马机制，是字节在后发情况下快速突破的重要原因。25年变化在于，字节AI战略明确布局更为长期、前沿的AGI研究，核心聚焦基础模型能力向前沿范式推进和持续领先。业务优先研发加码、集团财务雄厚，使字节AI战略长期定力足和确定性高。区别于市场，报告...

查看详情

字节大模型核心亮点在哪？

1.基础模型：慢思考、快执行，全面布局且能力领先

2. 研发架构：阶段性领先目标达成，研发分层和整合放眼长期 AGI 研究

字节跳动AI底层架构专题报告：基模领先，组织财务双保障，占领AI时代高地.pdf

字节AI布局记着呢如何？

字节在AI领域的布局情况如何？

海内外大模型落地进展如何？

未来大模型的发展方向是什么？

大模型产业发展与企业应用情况如何？

海内外基础大模型发展趋势及技术展望分析

国内大模型瓶颈及商业化难点在哪？

大模型产业链投资机遇在哪？

商业火箭目前发展到什么阶段了？

康耐特光学有哪些业务布局？

AI眼镜行业规模、需求、成长性、格局及竞争要素在哪？

康耐特光学发展历程、股权结构及收入分析

中宠股份经营看点在哪？

中宠股份发展历程、股权结构及营收分析

赛微电子发展历程、股权结构、主营业务、研发及财务分析

梦百合内外销业务进展如何？

沃巴查芒

每日新报

StartYourFinance

999感冒灵

王中王

字节大模型核心亮点在哪？

1.基础模型：慢思考、快执行，全面布局且能力领先

2. 研发架构：阶段性领先目标达成，研发分层和整合放眼长 期 AGI 研究

2. 研发架构：阶段性领先目标达成，研发分层和整合放眼长期 AGI 研究