2023年半导体行业专题研究:AI PC风起,英特尔发布Meteor Lake

  • 来源:华泰证券
  • 发布时间:2023/12/18
  • 浏览次数:400
  • 举报

英特尔召开 AI Everywhere 大会,展示全面 AI 版图

英特尔于 2023 年 12 月 14 日召开 AI Everywhere 大会,更新了一系列 AI 产品的最新进 展,展示了其数据中心、云和 PC 等多个领域的全面 AI 解决方案。会议的亮点包括: 1) 发布首个内置 AI 加速引擎 NPU 的酷睿 Ultra 移动处理器 Meteor Lake,它采用颠覆 性分离式模块设计并首次集成了神经网络处理器(NPU)作 AI 计算,在 PC 上实现高 能效的 AI 加速和本地推理,为 AI PC 和新应用提供动力。早在今年 10 月份,英特尔 就已启动 AI PC 加速计划,此次公司重磅发布首款 Meteor Lake 系列处理器,开创了 其 AI PC 新纪元,也标志着英特尔四年五节点的第 2 个节点 Intel 4 进展顺利。英特尔 正与 100 多家软件厂商紧密合作,为 PC 市场带来数百款 AI 增强型应用。华硕、微 星、宏碁、联想等合作伙伴均已推出搭载 Meteor Lake 处理器的 AI PC 产品,英特尔 预计酷睿 Ultra 处理器明年将为全球笔记本电脑和 PC 制造商的 230 多款机型带来 AI 特性,并计划在未来 2 年内交付 1 亿个客户端处理器。 2) 推出了第五代英特尔至强可扩展处理器 Emerald Rapids,每个核心内置 AI 加速器, 提高了 AI 和整体性能,同时降低了总体拥有成本(TCO),加速数据中心、云、网络 和边缘 AI。英特尔表示,最新的至强处理器尤其适用于推理,即部署人工智能模型的 过程,其功耗低于训练过程。

第五代英特尔至强可扩展处理器性能和能效双升级。Emerald Rapids 与今年 1 月推出的 Sapphire Rapids 同样基于 Intel 7 节点,核心架构升级至 Raptor Cove,并将最大核心数提 升至 64 核,最大三级缓存提升至 320MB,HPC 性能提升至 1.3 倍。此外,Emerald Rapids 还重点提升了 AI 性能,沿用 Sapphire Rapids 中使用的 AMX 技术加强 AI 任务中的矩阵运 算能力,并内置 AI 加速器,使得 AI 推荐系统和自然语言处理性能提升至 1.4 倍,大数据吞 吐量提升至 1.7 倍。与上一代产品相比,在相同的热设计功率范围内,第五代英特尔至强可 扩展处理器平均性能提升 21%,并在一系列工作负载中将每瓦性能提升高达 36%。对于遵 循典型的五年更新周期并从更前一代处理器进行升级的客户,总体拥有成本最多可降低 77%。

第五代至强处理器为数据中心、云、网络和边缘 AI 加速。第五代英特尔至强可扩展处理器 能微调参数量多达 200 亿的大语言模型,并将其推理性能提高 42%。现阶段,英特尔至强 可扩展处理器也是唯一一款拥有 MLPerf 训练和推理基准测试结果并持续提升性能的 CPU。 IBM 表示,与上一代英特尔至强可扩展处理器的测试数据相比,第五代英特尔至强可扩展 处理器在其 watsonx.data 平台上的网络查询吞吐量提高了 2.7 倍。将于明年部署第五代英 特尔至强可扩展处理器的谷歌云指出,得益于谷歌云中第四代英特尔至强可扩展处理器内 置的加速器,Palo Alto Networks 在其基于深度学习模型的威胁检测的性能得到两倍提升。

3) 首次展示了即将于明年推出的英特尔 Gaudi3 加速器。Habana Gaudi 是由英特尔在 2019 年 12 月宣布以 20 亿美元收购的 Habana Labs 设计的 ASIC 芯片,第一款 Gaudi (16nm)于 2019 年 6 月推出,目前已迭代至 Habana Gaudi2(7nm),2022 年末已 推出。Gaudi 2 采用台积电 7nm 制程,可用于 AI 训练和推理任务加速,其中在 AI 推 理任务上表现尤其出色,在最新的 MLPerf v3.1 基准测试中,英特尔 FP8 精确量化使 Gaudi 2 性能提升了 1 倍以上,Gaudi 2 运行速度高达英伟达 A100 的 2.4 倍,几乎 与 H100 Hopper GPU 齐平。在 AI 训练端,Gaudi 2 同样介于英伟达 A100 与 H100 之间,英特尔期望应用 FP8 后 Gaudi 2 可以超越 H100。英特尔预计下一代 Gaudi 3 将于 2024 年推出,采用台积电 5nm 制程,性能提升显著。其 BF16 工作负载性能是 Gaudi 2 的 4 倍,网络性能是 Gaudi 2 的 2 倍,HBM 容量是 Gaudi 2 的 1.5 倍。

英特尔 Meteor Lake 正式发布,开创公司 AI PC 新纪元

英特尔首款 AI PC 处理器 Meteor Lake 已于 23 年 10 月上市,并在此次“AI Everywhere” 发布会上正式发布,该处理器标志着英特尔 40 年来最大的 PC 芯片架构转变,集成 GPU、 NPU 和 CPU,兼具低功耗和 AI 加速功能等优势。Meteor Lake 首次采用分离式模块化 (Tile-based)设计,封装技术采用 3D Foveros,将处理器划分为计算模块(Intel 4)、I/O 模块(N6)、SoC 模块(N6)、图形模块(N5),不同的单元可以利用三种不同的制程技术。 借助台积电的成熟工艺和低成本,使得英特尔得以实现成本效益的突破。 1)制程:CPU 采用 Intel 4 制程,Intel 4 是英特尔首个采用 EUV 光刻技术的节点,能效相 比 Intel 7 提升了 20%,GPU 单元首次采用了台积电 5nm 制程,SoC 和 IOE 采用了台积电 6nm 制程; 2)CPU 模块:集成新一代 Redwood Cove P 核和 Crestmont E 核,Redwood Cove P 核 相比上一代将进一步提升性能功耗比,而 Crestmont E 核能将时钟速度提高 4%~6%; 3)GPU 模块:引入 Xe-LPG 架构,即目前 Arc A 系列独立显卡架构中 Xe-HPG 的低功耗 版本,支持 DX12 Ultimate、AV1 编解码等先进特性,每瓦性能高达 Alder Lake 的 2 倍;4) SoC 模块:首次集成了带有 AI 推理引擎的 NPU,该 NPU 可与 tGPU 协同运行 AI 负载, 使得生成式 AI 大模型得以在端侧高效运行。此外,SoC 模块也集成了 2 颗低能耗 E 核, 将优先负责大部分负载,这意味着执行轻度工作负载时(轻度工作负载往往占据大部分时 间)Meteor Lake 可让 CPU 模块休眠,从而大幅降低能耗; 5)L4 四级缓存:Meteor Lake 的另一个特点在于其支持 L4 四级缓存(Adamantine,架构 图中简称为 ADM),可提供比 L3 缓存更快的访问速度,缩短加载时间。

Meteor Lake 采用四个性能核(P-Core),八个能效核(E-Core)和两个位于 SoC 模块的 低功耗能效核(LP E-Core)构建的 3D 混合架构,通过仅用低功耗能效核执行低负载任务 降低了整体功耗,同时保证了 CPU 较高的峰值性能。图形模块将升级为全新 Xe LPG 微架 构集成显卡,基于 Arc 独立显卡的 Xe HPG 微架构改进而来。图形模块的空间增大,Meteor Lake 将拥有 8 个 Xe 核心,即 128EU,较 Alder Lake 的 96EU 有了较大提升,能耗比有了 两倍的提升。

Al 算力高达 34TOPS。英特尔称 Meteor Lake 的关键特性之一是其 AI 加速能力,最高可 提供 34 TOPS。但 Al 加速支持只有在 Windows 12 发布后才会开始显现其价值,公司预 计 Windows 12 将于明年推出。

这些芯片采用该公司的 7 纳米工艺制造,比早期芯片更省电。此外,Core Ultra 芯片还包 括更强大的游戏功能,新增的图形处理能力可帮助 Adobe Premier 等程序的运行速度提高 40% 以上。该产品于本周四在笔记本电脑商店上市。 会上,英特尔还展示了在 Meteor Lake 笔记本电脑本地运行 Llama 2 LLM(大型语言模型)。 Zoom 在其芯片上运行背景模糊功能,图中可以看到一个视频窗口显示的是由 GPU 生成 的背景模糊,而另一个视频窗口显示的是由 NPU 生成的模糊。英特尔所承诺的这项进步 表现在:新的 Meteor Lake 芯片将能够比当前笔记本电脑中的英特尔芯片更高效地执行“AI” 任务。这意味着除了通过本地运行 AI 应用节省金钱和保护隐私外,用户还可以在视频通话 期间获得更多的系统资源。这是因为 NPU(神经处理单元)能够处理相机效果,从而释放 GPU 以处理其他任务。

英特尔与台积电在 Meteor Lake 的合作或是重要看点,符合英特尔 IDM2.0 扩大第三方代 工产能的战略,或将能使公司更有效抗衡早早借助台积电东风的 AMD。除此之外,Meteor Lake 标志着英特尔“AI PC”战略已经打响第一枪,其 NPU 可使 PC 在本地高效运行 AI 推 理任务,同时其 tGPU 具备高性能,可与 NPU 协同运行 AI 工作负载,第三方 mooreslawisdead 官网认为 Meteor Lake 中的 tGPU 单元(核显)使用的 Iris Xe 或将足以 替代笔记本显卡。 Meteor Lake 和苹果 M 系列芯片均采用分离式模块化设计、E 核和 P 核分离的设计和台积 电制程,同时重点关注了能耗优化。英特尔从 Meteor Lake 到 Panther Lake 的产品线迭代 重点着眼于 CPU、GPU 和 NPU 三方面“每瓦性能”上的提升。鉴于 Meteor Lake 的设计技 术革新使其在能耗方面展现出提升,而能耗正是基于 ARM 架构的苹果 M 系列芯片的优势 所在。

下一代 Arrow Lake 将于 2024 下半年推出,基于 Intel 20A 节点,GPU 单元升级显著。与 Meteor Lake 主要适用笔记本端不同,Arrow Lake 将同时覆盖笔记本端和桌面端。Arrow Lake 的一大重要升级在于 GPU 架构将升级至 Xe-LPG+,即 Meteor Lake 中 GPU 的增强 版本,主要改进在于引入 XMX 计算单元,即 eXtended Matrix eXtensions(扩展矩阵),该 技术专为 FP64、FP32、FP16 和 bfloat16 格式的矩阵乘法运算设计,可执行 DPAS(点 积累加收缩)这一特殊运算指令,从而更高效地支持 XeSS 超分技术。XeSS 超分技术是英 特尔的升频技术,可利用 AI 技术提高帧率,将游戏从 1080P 提升至 4K,与目前较为成熟 的英伟达的 DLSS 和 AMD 的 FSR 类似。目前已经上市的 Meteor Lake 也可支持 XeSS 超 分技术,但由于硬件支持不足,只能使用 DP4a 指令,对运行效率有一定削弱。根据 wccftech 官网报道,Arrow Lake-H 已有样片流出,“H”表示该芯片适用于笔记本端高性能游戏本, Arrow Lake-H 的 CPU 单元由 6 个 P 核和 8 个 E 核组成,CPU 核微架构有较大优化,引入 了新一代 Lion Cove 和 Skymont;GPU 单元将继续采用台积电代工,将基于台积电 3nm 制程。

Lunar Lake 将于 2024 年在 Arrow Lake 之后推出,重点布局低功耗,旨在实现每瓦性能 的突破性提升。英特尔在 2023 年 Innovation 大会上展示了在 Lunar Lake 上运行 Riffusion 和 Stable Diffusion 生成式 AI 大模型的突出效果。外媒 Tom’s Hardware 的报道则披露了关 于 Lunar Lake MX 的更多细节,Lunar Lake MX 将采用全新 Lion Cove和 Skymont 微架构, NPU 单元包含多达 6 层 NPU 4.0 AI 加速器,封装技术将沿用 3D Foveros 技术,能实现每 瓦性能的突破性提升。在制程方面,该芯片在英特尔 PC CPU 路线图上显示将基于 Intel 18A 节点,不过根据外媒 Tom's Hardware 在 11 月的报道,英特尔 Lunar Lake MX 的计 算单元可能将采用台积电 N3B 节点。考虑到英特尔计划将 Lunar Lake 的 CPU 和 GPU 单 元放在同一块硅片上,若此报道信息属实,此举或可省去基于 Intel 18A 重新设计 Xe2 GPU 的步骤,为英特尔节省成本。

在 AI PC 应用端方面,英特尔于 23 年 10 月 19 日的 Intel Innovation Day 上推出“AI PC 加速计划”,不仅将持续为其 PC CPU 搭载内置 AI 加速器,目标在 2025 年实现 1 亿台个 人电脑的 AI 赋能,英特尔和超过 100 家企业合作,全面改善未来 PC 在游戏、视频、安全 性能等环节的 AI 性能,推动 AI 端侧应用落地。会上公司也展现了丰富的端侧 AI 应用场景 的落地,其中 Lunar Lake 运用其内置 AI 加速器在几秒内就可生成一首 Taylor Swift 风格的 歌曲和一张戴着牛仔帽的长颈鹿图片。这些生成式 AI 负载完全在端侧进行,无需与云端互 联,从而缩短了运行时间。为了加强 AI 算力,英特尔将和 CyberLink 在 NPU 应用方面进 行紧密合作,以达到更理想的推理加速效果,并和 Blackmagic Design DaVinci 合作,优 化 Core Ultra 的媒体引擎。 Panther Lake 将于 2025 年推出,最快于 2024Q1 投产,旨在基于 Lunar Lake 将所有芯 片单元用 Intel 18A 节点制造。Panther Lake 将采用全新 Cougar Cove P 核和 Darkmont E 核,iGPU 由 Lunar Lake 的 Xe2 升级至 Xe3 "Celestial"微架构。

AI PC 发展浪潮已至,全球 PC 产业将稳步迈入 AI 时代

AI 芯片、PC 企业合作共同打造 AI PC 生态

PC 厂商正在积极探索从 Smart PC 向 AI PC 的转变,需要从软硬件协同发展开始。此前对 PC 进行 AI 智能化仅限于 Smart PC 阶段,即从应用场景出发(Always on Always),例如: 人机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。然而,受限于成本和算 力,推进速度相对缓慢。目前,随着生成式 AI(AIGC)的迅速发展,将通过云端+本地端 协作。利用云端算力丰富本地端的 PC 使用场景,从而助力 Smart PC 向着 AI PC 的方向 持续转化。

联想提出“All For AI”战略,全栈智能布局全面升级。2023 年 10 月 24 日,联想在 Lenovo Tech World 2023 上首次展示了 AI PC、大模型压缩技术、人工智能双胞胎(AI Twin)等丰 富创新产品。联想 AI PC 计划于 2024 年 9 月后正式上市。AI Twin 是可在多平台、多环境 上运行的对话个人 AI 助手。联想全栈智能全新升级之后,AI Twin 可通过压缩模型在大模 型终端设备上离线运行,譬如参考用户的旅行日记和笔记,为用户提供更个性化的旅行计 划。混合 AI 大模型框架包括私域大模型的微调、个人大模型的压缩以及数据管理+隐私保 护技术等 3 项技术。混合 AI 框架采用了模型微调与企业知识向量数据库相结合的方式,让 企业可通过特定数据进行额外的训练和微调,在端侧再加入企业知识矢量数据库中的特定 知识,从而有效处理特定任务,并得到精确的结果。同时,可根据模型参数的重要程度, 对大模型进行适当压缩,这既显著缩小了大模型,同时还保持了性能,可让大模型直接在 个人终端设备上运行。AI Twin 和大模型压缩技术可跨终端、跨平台、跨架构,让个人在终 端体验到 AI,而升级的基础设施和应用服务,则能让企业使用 AI。

各大 AI 高管亮相,推进 AI 应用规模化落地。在 Lenovo Tech World 2023 上,微软、英特 尔、AMD、NVIDIA、高通等企业高管纷纷亮相,并宣布与联想持续深化多层次战略合作, 共同推进 AI 应用规模化落地。英伟达 CEO 黄仁勋表示联想与 NVIDIA 合作推出新的混合 人工智能计划,加速将下一代云人工智能技术落地。联想将提供基于 NVIDIA MGX 架构的 新的企业级 AI 解决方案、联想混合人工智能服务。高通总裁兼 CEO Cristiano Amon 表示 下一代骁龙计算平台采用了 Oryon CPU、先进的 GPU 和 NPU,意图推动 Windows 笔记 本电脑的性能实现质的飞跃。英特尔 CEO Pat Gelsinger 表示将与联想携手推动 AI 在客户 端、边缘、网络和云端的所有工作负载上的规模化应用。英特尔则推出代号 "Meteor Lake" 的英特尔酷睿 Ultra 处理器,为 PC 带来 AI 加速和本地推理体验。AMD CEO 苏姿丰表示 AMD 与联想的合作包括从数据中心的 ThinkSystem 到 ThinkStation 工作站和 ThinkPad 笔 记本电脑。

各大芯片、PC 厂商进军 AI 领域, AI PC 商业化落地节奏加速。微软预计 Copilot 等 AI 应用将在 Windows 使用中日益重要,并鼓励相关芯片制造商将 AI 功能构建到 CPU 中。联 想目前 AI 已扩展到各类中高端产品系列,如消费 Yoga、游戏本 Legion、中小企业用户 ThinkBook 和商用 ThinkPad 等产品系列。ThinkPadX1 系列和 YOGA 系列中的第一代产品 都符合联想提出的智能 PC 理念。苹果(Apple)则考虑每年花费 10 亿美元开发其生成式 人工智能产品,满足未来混合式发展的需求,此外积极推进 5G 芯片在 MacBook Pro 产品 线上的落地,以促进 AI PC 时刻在线的需求,发布时间公司预计在 2025 年。惠普、宏碁等 品牌也进一步加大与关键软件服务商和芯片供应商合作,将重新设计 PC 架构。公司计划将 AIGC 或其他 AI 应用导入到终端设备上,相关 AI 笔记本方案会在 2024、2025 年陆续推出。

全球 PC 出货量触底反弹,AI PC 渗透空间有望加大

2023 年二季度开始,全球 PC 出货量的同比跌幅不断收窄,并开始出现环比增长,行业开 启上行周期。疫情期间居家办公使得 PC 需求大幅增加,22 年达到高基数,然而 23 年以来 全球 PC 市场持续疲软。根据 IDC 发布的数据,2023Q1 全球 PC 出货量 5690 万台,同比 下滑 29.3%,环比下滑 15.3%,出货量达到了行业底部,同比连续 5 个季度呈持续下滑趋 势;然而,2023Q2 全球 PC 出货量出现回暖,升至 6160 万台,尽管同比仍下滑 13.4%, 但下滑幅度已经大幅收窄,且实现了环比 8.26%的增长;2023Q3 全球 PC 出货量同比下滑 幅度继续收窄至 7.6%,环比增长 10.7%,并实现出货 6820 万台。至此全球 PC 出货量虽 然同比仍负,但连续两个季度环比增长,PC 市场已触底并出现反弹迹象。目前 PC 市场出 货量和激活量的走势越来越趋于一致,Gartner 预计随着行业去库存接近尾声,PC 市场有 望在 2023Q4 结束持续 8 个季度的同比下滑,再次出现增长。2024 年随着各品牌的 AI PC 产品陆续上市,2024 年有望成为 AI PC 的元年,并使 PC 出货量迎来全面增长。

2024 年有望成为 AI PC 的元年,未来五年内全球 PC 产业将稳步迈入 AI 时代。在经历多 个季度低迷后,全球 PC 行业有回暖态势。AI PC 的出现也有望为 PC 行业注入新的成长动 力,未来五年内全球 PC 产业将稳步迈入 AI 时代,AI PC 整机出货量将保持两位数以上的 年增长率,并在 2027 年成为主流化的 PC 产品类型。Canalys 预计从 2024H1 开始,支持 AI 的 PC 型号将大幅增加。随着最新版本 Windows 计划于 2024 年底发布人工智能增强功 能,以及人工智能工具在商业和生产力软件中的广泛集成,Canalys 预计到 2024Q4 出货量 将增至 2000 万台左右,占全球 PC 出货量份额的 25%以上。到 2027 年,预计 AI PC 出货 量将超过 1.75 亿台,占 PC 总出货量的 60%。2024-2027 行业复合年增长率(CAGR)达 64%。 Sigmaintell 认为 2024-2027 年全球 AI PC 整机出货量将达到约 0.13 亿、0.53 亿、1.1 亿、 1.5 亿台,相较于 Canalys 稍显保守。

多方入局百花齐放,ARM 和 x86 谁能在 AI PC 更胜一筹?

CPU 主流架构分为 x86 与 ARM 两类,前者使用复杂指令集(CISC),后者使用精简指令 集(RISC)。X86 架构具有 1)丰富先进的指令集,性能卓越,能在短时间内完成大量复杂 的计算;2)广泛的软件支持与安全技术,兼容性与通用性高,产业化规模大等优势。然而 x86 存在寄存器较少,寻址范围小等缺点;此外多模态等 AI 应用趋势推进,节能需求凸显, 而 x86 芯片面积大、晶体管数量多,导致能耗较高。ARM 具有 1)体积小,能耗、成本低; 2) 通用寄存器多,指令执行速度快;3) 寻址方式灵活简单,执行效率高等优势,因此在数 据中心与 AI 应用中,逐渐受到青睐。目前 AMD 与英特尔的桌面级与服务器级 CPU 主要采 用 x86 架构;高通、苹果、三星等移动端和嵌入式系统中通常采用 ARM 架构。

由于独立 GPU 运行 AI 运载功耗较高,因此未来 CPU+xPU 的异构方案或成为 AI PC 场景 标配。分类来看 AI 芯片将使用 1)CPU+NPU;2)CPU+独立 GPU;3)CPU+NPU+独立 GPU 组合作为处理 AI 负载主力的算力架构方案。目前 AMD 7040 系列处理器、英特尔 Meteor Lake 处理器、苹果 M3 系列处理器与高通最新 X Elite 处理器都搭载了 CPU+NPU, NPU 能针对 AI 部署需求加速神经网络的运算,未来将随着产品更新换代逐年升级。

AMD:推出首个 x86 架构 AI PC 芯片,占据一定先发优势

AMD 于 2023 年初率先推出 AI PC 处理器 Ryzen 7040,又于 2023 年 12 月推出新一代 Ryzen 8040 “Hawk Point”处理器,AI 性能较强且产品代际更迭迅速。AMD 已于 2023 年 初推出集成 NPU 的 Ryzen 7040 系列 PC 处理器,基于 TSMC 4nm 制程,内置 AMD Ryzen AI 引擎,NPU 最高算力可达 10TOPS,可在本地以较低功耗执行 AI 工作负载;Ryzen 7040 系列合作商目前已覆盖宏碁、华硕、戴尔、联想、惠普、小米等各大品牌厂商。2023 年 12 月 7 日 AMD Advancing AI 大会上公司又推出了 Ryzen 8040 “Hawk Point”处理器,该处理 器相比 Ryzen 7040 “Phoenix”主要改进了 NPU 运行速度,整体算力达 39TOPS,NPU 算 力提升至 16TOPS,AI 大模型运行性能最高可提升 40%,游戏性能最高提升 80%。截至发 布日,AMD 已向合作商发出 Ryzen 8040 “Hawk Point”处理器,而其正式上市时间公司预 计为 2024Q1。紧随 Hawk Point 之后,集成下一代 XDNA2 NPU 的 Ryzen 8050 “Strix Point” 也将于 2024 年下半年发布,生成式 AI 性能将高达 Hawk Point 的 3 倍;高配版 Strix Point Halo 集成 40 个 RDNA 3+ GPU 计算单元,AI 算力高达 40 TOPS。

AMD Ryzen AI 已与众多应用厂商合作,应用场景多样,或可为 AMD AI PC 处理器的推广 提供较大助力,结合 AMD 在 iGPU 领域的领先地位,AMD 或将成为英特尔 AI PC 产品推 进过程中的一大劲敌。Ryzen AI 应用不断拓展,已与 Adobe、微软、Zoom 以及国内的字 节跳动、爱奇艺等应用厂商合作,并已在超过 100 个应用中实现了 AI 加速,在 Adobe Photoshop、Premiere Pro、After Effect、Lightroom 等创意设计软件中实现了显著的运行 效率提升;Ryzen AI 也与 Windows Studio Effects 适配,能实现自动取景对焦、眼神矫正、 高级背景特效等多种 AI 功能。此外,AMD 还面向大模型开发者推出 Ryzen AI 软件平台, 支持 TensorFlow、PyTorch、ONNX 等 AI 模型编程包。

ARM PC CPU 则相对 x86 具有灵活性、低能耗、AI 运行高效性的优势。1)x86 CPU 被 设计为通用处理器,而基于 ARM 的 SoC 则不同,可根据特定用例进行高度定制,具有 较强的灵活性。这意味着 ARM SoC 在设计上可采用更多的高性能 CPU 内核和高度集成 的内存,从而实现更高效的内存访问,使其能与 x86 CPU 在性能层面竞争;2)由于 ARM 架构基于 RISC,因此天然具有能耗和热效率的优势,电池续航能力得以提升;此外,将 GPU 集成至 ARM SoC 可进一步提升每瓦性能,使得端侧 AI 更高效地运行;3)随着基于 Arm 的 SoC 的推出,个人电脑的尺寸和重量有望减少,便携性有望提升,笔电和平板融 合的趋势可加强。

英伟达:或可发挥 AI 技术优势弄潮 AI PC 时代

英伟达入局 ARM 架构 PC CPU,PC 端 ARM 架构竞争渐趋激烈。根据路透社在 2023 年 10 月 24 日的报道,随着微软与高通的排他性协议即将在明年到期,AMD 和英伟达或将在 2024年加入高通行列,为微软设计基于 ARM 的处理器,预计均将于2025年推出自研ARM PC CPU。该计划瞄准了苹果公司的自研 ARM 芯片,目前 PC 端 ARM CPU 几乎被苹果垄 断。 回顾历史,英伟达进军 ARM CPU 市场的战略早已可见。2020 年 9 月,英伟达曾提出以 400 亿美元收购 ARM。ARM 在 2020 年的营收约为 20 亿美元,该收购价格对应 PS 为 20x, 显著高于 9x 的行业平均,再对比 2016 年软银私有化 ARM 的 320 亿美元,虽然英伟达的 收购计划在 2022 年 2 月 8 日正式宣告告终,但我们认为英伟达愿意付出约两倍于行业平均 PS 溢价收购 ARM,体现了其看准 ARM 在移动端的低能耗优势,希望将其有效融合到公司 擅长的 GPU 和 DPU 领域的战略规划。此外,英伟达数据中心产品 GH200 中的 Grace CPU 就已采用 ARM 架构,拥有一定 ARM CPU 设计经验。

早在 2008 年,英伟达就曾入局 ARM 架构 PC 和移动端 CPU,但尝试未果,此次重新入局 能否获得成功亦有不确定性。2008 年,英伟达预判 PC 轻薄化将成为大趋势,在同年 6 月 推出基于 ARM 且内置 GeForce GPU 的 Tegra 移动处理器,应用于手机和平板等移动设备, 其后又与微软 Windows 8 合作将 Tegra 扩展至 PC 端。2011 年 11 月,英伟达发布了 Tegra 3 处理器,该处理器具备明显性能和功耗优势,但却最终由于基带的落后及设计、发热、续 航能力等方面的劣势不敌高通,逐渐被市场淘汰。

英伟达在 Tegra 处理器上的失败或将为此次英伟达重新入局能否成功带来启示,其在 AI 芯片领域的技术优势或助其弄潮 AI PC 时代。与 12 年前类似,英伟达再度与微软合作,而 如今高通和微软已在 WOA(Windows On ARM)生态深耕多年,ARM 架构几经迭代已达 成与 Windows 操作系统更强的协同性,且随着 AI PC 浪潮席卷整个 PC CPU 领域,英伟 达或有望凭借 AI 芯片技术优势推动 PC CPU 市场重新洗牌,英伟达在此时入场或相比 12 年前更具优势,不过英伟达最早也要到 2025 年才能推出其自研 ARM PC 处理器,或增加 其入局后的不确定性。

高通:深耕移动端功耗优势突出,推出骁龙 X Elite 进军 AI PC 芯片

从 2016 年就开始研发 ARM PC CPU 的高通在 10 月的 2023 骁龙峰会上也发布了最新一 代 AI PC 芯片骁龙 X Elite,该芯片基于高通自研 ARM 架构内核“Oryon”,集成 AI 功能, 采用台积电 4nm 制程工艺,兼具高性能和低功耗优势。X Elite 集成 CPU、GPU 和 NPU, 重点优化了 AI 性能,最高算力可达 75TOPS,其独立的 Hexagon NPU 最高算力达 45TOPS, 为行业领先,支持在端侧运行超过 130 亿参数的生成式 AI 模型;其 Adreno GPU 较 Ryzen9-7940HS GPU 性能达到 90%的提升,而功耗降低 80%。搭载骁龙 X Elite 的 PC 公司预计将于 2024 年中面市,首发厂商包括微软、联想、戴尔和惠普等。

高通官方发布了 X Elite 与竞争对手上一代产品的基准测试,虽在测试高通中 X Elite 优势显 著,但需注意其对比对象均为竞争对手上一代的产品(英特尔 Raptor Lake、AMD Ryzen 9 和苹果 M2 芯片),因此其竞争力仍有待进一步验证。此外,高通也致力于提高 AI 落地能力, 其与微软和 Meta 合作开发 Llama 2 生成式大模型,并于 2024 年将 Llama 2 应用于搭载其 芯片的手机和 PC。高通凭借其在低能耗移动端芯片制造领域的长期积淀,未来或可缩小 Windows 系统 PC 与苹果 Mac 系列 PC 的能耗差距,同时其在 AI 大模型开发和端侧应用 上的推动或将进一步提升其在 AI PC 时代的竞争力,从而在 PC 市场占据重要席位。

苹果:垄断地位不断巩固,NPU 算力为 18TOPS

除了基于 Windows 操作系统的 PC 端 ARM 处理器,苹果 M 系列芯片兼具能耗及 NPU 优 势,最新 M3 系列芯片进一步提升了 AI 性能并降低功耗。根据 IDC 2023Q3 的数据,自苹 果为 Mac 电脑发布自研 ARM 芯片以来,该公司的市场份额在三年内几乎翻倍,苹果 M 系 列芯片占 ARM PC 处理器市场份额的 90%以上,占据垄断地位。低功耗是苹果 M 系列芯 片的一大核心优势,而苹果公司于今年 10 月推出的 M3 芯片更是重点关注了每瓦性能的提 升,该芯片为业界首款采用台积电 3nm 制程的个人电脑芯片,同时改进了内置 GPU、NPU 的设计以提供更优的图形处理和 AI 任务性能,GPU 增加了硬件加速网格着色、光线追踪等 渲染功能和动态缓存等功能,NPU 算力达 18TOPS。苹果官方表示 M3 在 AI 任务上相比 M1 有 60%的性能提升,总体运行速度较 M1 有 35%的提升。

根据 Counterpoint 数据,截至 2023 年 4 月,ARM 架构 PC 市场份额为 14%,其中苹果份 额为 93%,占绝大多数,高通占 3%左右。Counterpoint 预测 ARM 架构占 PC 市场份额将 迅速提升,且该份额于 2027 年近乎翻倍至 25%。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至