字节大模型核心亮点在哪?

字节大模型核心亮点在哪?

最佳答案 匿名用户编辑于2025/08/11 15:42

重视基模能力迭代,组织架构和制度 导向确保长期处于领先。

1.基础模型:慢思考、快执行,全面布局且能力领先

我们认为,字节大模型经过 2023~2024 年的快速迭代,初步实现了模型系列完备、模型能力处于 国内一梯队的阶段性目标,其中 1)LLM 方向字节 4 月发布的 Seed-Thinking-v1.5 模型一度将 国内与海外前沿模型的能力差距缩短至 3 个月以内;2)多模态方向文生图、视频生成模型能力 均处于全球领先水平。 起步相对较晚、迭代速度快,相继补全语言和图像、音乐、视频等多模态的 AI 大模型。2023 年 初,字节内部开始训练基础模型,部署 Seed 项目专注于模型层的研发。2023 年 8 月,字节发布 云雀大模型 V1.0 版本,此后基础大模型能力保持快速迭代,每 1-2 月就有新版本推出。2024 年 5 月字节发布豆包大模型,包括通用模型 pro 和 lite2 款基座模型,以及 7 款功能性模型,涵盖角色 扮演、语音识别、语音合成、声音复刻、文生图等方面。2024 年 9 月字节发布豆包视频生成模型, 12 月发布豆包视觉理解模型、全面升级通用模型,在多模态大模型领域持续取得技术突破。2025 年 1 月发布豆包大模型 1.5 系列,4 月发布 1.5 深度思考模型,6 月 11 日发布豆包大模型 1.6 系 列。在 LLM 及多模态上,字节对应模型均取得了相应的排位,处于领先状态。

1)字节 LLM 能力处于国内一梯队,国内大语言模型能力与海外差距缩短至 3 个月以内。自 2022 年 ChatGPT 发布以来,中美前沿模型之间的性能差距一直存在,但国内大模型持续迭代不断追 赶,使得这一差距从此前的一年多时间缩小至三个月以内。海外主要是 OpenAI 的 o3 模型处于领 先地位,国内则主要由 DeepSeek 和阿里巴巴通义模型引领。 在国内模型技术追赶的过程中,字 节于 2025 年 4 月发布的 Seed-Thinking-v1.5 模型能力超越彼时的 DeepSeek R1,将国内大语言 模型的先进性继续往更高水平推进。

2)字节文生图/视频能力较强,多模态上现阶段国内与海外势均力敌。从多模态的角度,参考 Artificail Analysis 榜单,字节在文生图和视频生成上表现亮眼,其文生图模型 Seedream 3.0 发布时一度取得全球文生图模型的榜首位置,目前全球排名仅次于 OpenAI 的 GPT-4o,位于第二;4 月底上线的视频生成模型 Seedance1.0 目前位于全球第一。语音模型也处于国内领先水平 (SuperClue-TTS 语音合成测评国内第一)。 我们认为,国内多模态模型的能力,目前与海外是势均力敌、互相追赶的状态。相较于语言大模 型文字类的通用场景,国内在多模态的应用和市场更大,预计多模态类的 AI 应用能打造技术-场 景测试-数据迭代-产品优化的良性循环。字节方面受益于短视频(兼具视频和声音)数据和用户 生态,看好其多模态发展潜力。

2. 研发架构:阶段性领先目标达成,研发分层和整合放眼长 期 AGI 研究

我们认为,字节 Seed 团队高人才密度和赛马机制,是过去 2 年大模型研究快速突破、跃升到国 内领先水平的核心,竞争和成果导向帮助字节在前期落后的情况下实现追赶甚至反超。 在新周期下的大模型军备竞赛,集团层面字节 AI 业务优先级和重要性高,且从 25 年字节近期 AI 研发架构变动判断,其基模战略放眼更为长期的 AGI 研究,核心聚焦基础模型能力向前沿范式推 进和持续领先。在配套制度保障上,虚拟小组精简组织关系和汇报层级、为长期 AGI 研究团队设 置更长的考核周期等动作,目的均在于创造更良性的研究氛围、激发团队人才的创新创业热情。

字节 AI 团队高人才密度。以 Seed 研发团队来看,团队组建于 2023 年,聚集了一批高水平研究 人员,包括:1)早年即加入字节的 AI 研究者,如 2021 年加入的冯佳时,目前是豆包大模型视觉 基础研究团队负责人;2018 年加入的王雨轩,目前是豆包大模型语音团队的负责人;2)字节也 吸引了外部技术骨干,如原谷歌 DeepMind 副总裁的吴永辉,目前担任 Seed 团队基础模型负责 人;2024 年加入的周畅,此前为阿里通义大模型技术负责人,目前为字节世界模型负责人;3)此外字节也争取到相当一部分的年轻研究者, 24 年 5 月,Seed 团队发起了面向顶尖应届博士毕 业生的 Top Seed 人才计划,招募了约 30 人,为 AI 人才团队注入年轻血液。 内部赛马机制激发技术突破。以视频生成模型为例,Seed 部门里有两个团队参与相关工作,即 PixalDance 和 Seaweed,通过竞争促进技术突破和产品创新。

集团架构层面,AI 业务负责人直接汇报梁汝波,业务优先级和重要性高。字节 AI 团队主要包括 Seed(2023 年初成立,专注大模型底层技术研发)、Flow(2023 年底成立,负责基于大模型的 AI 原生应用研发)、AI Lab(2016 年建立,随着核心团队成员离开有所弱化和分拆,目前并入 Seed)、Data-AML(机器学习中台)、Stone(AI产品研发支持)。到2023年底,Seed、Flow 已成为和抖音、火山、飞书等平级的重要业务,其中 Seed 团队负责人吴永辉、朱文佳直接向字 节跳动全球 CEO梁汝波汇报,区别于其他互联网大厂是独立组织架构和直接汇报一号位的层级。 从人员流向来看,24 年初抖音集团 CEO 张楠、飞书副总裁齐俊元均转岗至相关 AI 部门,Seed 负责人朱文佳此前为今日头条 CEO 和 TikTok 产品技术负责人,Flow 负责人朱骏为字节跳动产品 与战略副总裁,从集团层面抽调了原各业务线的核心成员到 AI 团队。因此综合业务层级、汇报级 别、内部活水动向判断,字节 AI 业务在集团内部处于高优先级。

3 月 Seed 全员会明确探索智能上限目标,聚焦模型能力以保持长期领先优势。字节通过前期快 速追赶,模型能力已达到国内一梯队水平。在国内各家大模型竞争愈发激烈的态势下,大厂凭借 高维的算力和资源投入,对起步更早的初创公司形成一定挤压,如 AI 六小龙在资源相对不足的情 况下重心各有分化,百川转向垂直模型、零一万物转向训练更轻量化和有商业落地前景的模型等。 对于字节而言,负责人的调整、Seed 架构和汇报条线的变化等,均向外界传达出其 AI 战略在于 坚定聚焦探索下一代模型范式,探索智能边界,追求全球领先。

(1) 前 Google Deepmind 副总裁吴永辉加盟,Seed 内部研发分层和整合。 Seed 目前为双负责人模式。25 年字节 AI 团队最大的人员变动在于引入前 Google Deepmind 研 究副总裁、Google Fellow 吴永辉博士担任大模型团队 Seed 基础研究负责人,原本由朱文佳独立 负责的 Seed 部门,转变为吴永辉掌舵 AI 基础研究、朱文佳主抓模型应用方向的双负责人模式。 相比此前担任 TikTok 产品技术负责人的朱文佳,在搜素和推荐算法技术领域有深厚积累,吴永辉 的研发经历更聚焦 AI,研究领域涉及机器翻译、语音技术和大语言模型等多个领域,是 Palm 2大 模型训练团队的核心贡献者,也是 Gemini 应用总技术负责人之一。 吴永辉是继2022年加入的CFO高准之后,最新一位直接空降到CEO-1级别的高管。吴永辉2008 年博士毕业于加州大学河滨分校,起初作为一名排序工程师加入谷歌,致力于改进谷歌核心网页 搜索排名的算法。2015 年吴永辉转入 Google Brain 团队,专注于深度学习及其应用研究,主导了 神经机器翻译(GNMT)、RankBrainn 等项目,推动了语音识别的技术发展。 双负责人制下,研发方向有所分层:根据晚点 LatePost,吴永辉带队大模型研发环节,多名原来 向朱文佳汇报的算法和技术负责人转向吴永辉汇报,如 AML 和豆包大模型 Foundation 团队负责 人项亮、字节人工智能实验室(AI Lab)总监李航、字节豆包大模型视觉多模态生成负责人杨建 朝等;朱文佳则更侧重于研发与体验更相关的模型应用能力,如问答、创作、解题、代码和 AI 使 用工具的能力等。另一方面,内部研发力量整合更加明显,包括 AI Lab 正式并入 Seed、原属于 AML 部门的肖文之团队(曾发表过模型训练数据以及监督预训练方向的成果)也并入 AI Lab。 我们认为,双负责人模式下的模型研发,说明字节 AI 思路上尤其重视底层基础模型能力提升、追 求保持领先水平,并且同样重视模型在应用侧的能力嫁接和用户体验,模型应用能力作为偏通用 和标准的模块,或为新模型能力快速接入应用、提供丝滑和差异化的用户体验等奠定强大支持。

(2) 重视 Seed Edge 长期研究,并通过制度保障鼓励创意创新。 字节于 25 年 1 月正式设立代号为“Seed Edge”的研究项目, 4 月 AI Lab 的 Seed Robotics、AI for Science、Reponsible AI 三个方向也一并加入该研究团队。Seed Edge 的目标是做更长期、更 底层的 AGI 前沿研究,并拟定 5 大相对长期的研究方向,不要求像迭代模型一样快速出成果。在 制度和资源保障上,字节为 Seed Edge 项目人员提供更长的考核周期,不设置 OKR 和半年考核,关注研究成果的长期影响和价值,并且提供充足的算力资源保障。此外,吴永辉在 Seed 内部设 立了若干虚拟小组(不在正式组织结构中,是专注于特定项目的临时团队),并且调整了内部汇 报流程体系,职级为吴永辉-2 的人也可以直接向吴永辉汇报,从而使得组织关系更精简高效。 我们认为,Seed Edge 更聚焦研究长期、底层的技术变革,在保障基础模型能力短期处于领先水 平之外,放眼长期、培养下一技术周期的竞争力。

参考报告

字节跳动AI底层架构专题报告:基模领先,组织财务双保障,占领AI时代高地.pdf

字节跳动AI底层架构专题报告:基模领先,组织财务双保障,占领AI时代高地。字节大模型(LLM和多模态)实力领先,剑指长期AGI研究。根据ArtificialAnalysis,字节自研语言大模型能力处于国内一梯队,多模态方面文生图Seedream3.0、视频生成Seedance1.0均处于全球TOP排位,语音模型也较为亮眼。我们认为,研发团队高人才密度和内部赛马机制,是字节在后发情况下快速突破的重要原因。25年变化在于,字节AI战略明确布局更为长期、前沿的AGI研究,核心聚焦基础模型能力向前沿范式推进和持续领先。业务优先研发加码、集团财务雄厚,使字节AI战略长期定力足和确定性高。区别于市场,报告...

查看详情
相关报告
我来回答