GPU的评价指标包含哪些?

GPU的评价指标包含哪些?

最佳答案 匿名用户编辑于2023/07/17 11:19

硬件看算力,软件看生态。

GPU 作为进行并行计算或绘图(本质也是并行计算)的硬件,其核心指标在于算力。 而根据 GPU 的架构我们可以得知,核心数量与算力成正比,其他诸如显存大小、显存位 宽、显存带宽、显存频率等都会影响 GPU 的性能,这些值越大,GPU 在图形处理和图像 渲染上的速度越快,最终使 GPU 的像素填充率、纹理填充率、浮点算力更高,代表 GPU 性能更强。

相比硬件性能,软件生态对 GPU 或许更为关键,因为生态真正决定了用户是否有足 够的软件可用。回顾 CPU 发展史,桌面端的 x86-Windows 生态以及移动端的 ARM-Android/iOS 生态长期难以撼动,即便是 intel 和微软进军移动端的行动也未能取得 成功,其核心原因就在于生态。

为何芯片与生态往往是强绑定且难以撼动?因为计算芯片的设计决定了其指令集(每 一条指令都与特定的硬件结构一一对应),指令集相当于芯片的“语言”,而软件开发者需 要用芯片的指令来编写程序,相当于用“指令语言”来写一本书。诸多开发者各自编写程 序,构成了庞大的软件生态和开发者生态,诸多软件积累的用户群体则是生态最具规模的 部分。指令集、程序、开发者、用户共同构成了庞大的生态圈,要颠覆这一生态显然难度 巨大。

GPU 芯片作为 CPU 的变种,同样存在指令集与软件生态。以英伟达为例,通常应用 开发者会基于 CUDA 框架进行开发,而 CUDA 程序与普通 C 语言程序一样需要进行编译。 不同点在于,常规的 C 程序编译后会生成 x86 汇编程序,而 CUDA 程序编译后会生成 PTX 代码(Parallel Thread Execution),这是程序员能够操作的最底层汇编语言了。由于 CUDA 最初默认提供的是 C 语言编程接口,所以 PTX 汇编指令与常规的 x86 汇编指令具有一定 的相似性。在 PTX 下层还有一层 SASS(Streaming Assembly/Shader Assembly)指令集,该 指令集与硬件一一对应,由于 GPU 硬件架构设计经常变化,所以 SASS 指令集也会经常 变化,通常应用程序开发者不会直接接触这一层级的指令。

GPU 领域,软件对商业成功的影响方面不乏先例。例如 20 世纪 90 年代如日中天的 3DFX 及其 voodoo 显卡,因为使用非开源的 glide API,受到部分主流应用开发者的抵制, 逐步被更开放、生态更大的 NVIDIA/OpenGL 取代,而 2007 年推出 CUDA 以来,NVIDIA 则逐渐积累起庞大的生态,吸引各行各业的用户,构筑了极深的护城河。

在 PTX 下层还有一层 SASS(Streaming Assembly/Shader Assembly)指令集,该 指令集与硬件一一对应,由于 GPU 硬件架构设计经常变化,所以 SASS 指令集也会经常 变化,通常应用程序开发者不会直接接触这一层级的指令。

基于底层的 PTX 和 SASS 指令集,NVIDIA 发展出了庞大的生态,从 2001 年提出 CUDA 开发计划至今,二十余年的积累,并非短期可以复制。

除英伟达之外,另一家 GPU 大厂 AMD 也试图在生态端进行追赶,因而推出了开源的 ROCm 平台(Radeon Open Computing platforM)。ROCm 试图对 CUDA 进行替代,几 乎原样复制了 CUDA 的架构与 API,开发者可以相对容易地进行迁移。

综合来看,GPU 生态中最核心的三个部分可以归纳为 GPU 指令集、标准 API、图形 引擎/算法库/计算框架三大层级。

对图形 GPU 来说,首先应当适配的生态组分是图形 API。常用的图形渲染引擎 Unity、 Cocos2d、OpenSceneGraph、Skia 等都通过图形 API 实现其功能,如在游戏中图形 API 可以连接系统层、显卡驱动和游戏引擎。其中广为使用的是 khronos 组织运营的 OpenGL、 Vulkan开放标准,应用于众多领域和专业软件。此外还有微软推出的DirectX下的Direct 3D, 苹果推出的 metal、AMD 推出的 mantle,都作为厂商们自己使用的图形 API 标准。

对于 GPGPU 来说,为了进行 HPC/AI 运算,首先应当做到适配主流计算框架。Khronos 组织推出OpenCL、OpenGL compute开放标准,微软在Direct家族里推出DirectCompute, Google 借助其在移动端 Android 系统的优势,推出 RenderScript 标准进行使用。

GPU 领域,软件对商业成功的影响方面不乏先例。例如 20 世纪 90 年代如日中天的 3DFX 及其 voodoo 显卡,因为使用非开源的 glide API,受到部分主流应用开发者的抵制, 逐步被更开放、生态更大的 NVIDIA/OpenGL 取代,而 2007 年推出 CUDA 以来,NVIDIA 则逐渐积累起庞大的生态,吸引各行各业的用户,构筑了极深的护城河。

参考报告

景嘉微分析报告:信创基石,从图形计算到通用计算.pdf

景嘉微分析报告:信创基石,从图形计算到通用计算。公司是我国机载显示模块与国产GPU龙头,近年来业绩实现高增。景嘉微主要业务为图形显控模块、小型专用化雷达以及GPU芯片三大领域。公司是我国最早系统性研发GPU的企业,也是国内目前唯一自研GPU芯片量产出货的A股上市公司。GPU:并行计算加速硬件,算力与软件支持是关键。1)GPU在CPU的基础上牺牲一定的通用性来换取并行计算形象,核心要求在于足够强的性能以及足够的兼容性与可用性。软件生态方面对国产GPU企业来说要求更高,直接决定产品的可用性,其中对于图形GPU来说,最重要的是兼容图形API,对GPGPU来说,需要重点兼容通用计算标准。2)GPU未来...

查看详情
相关报告
我来回答