EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 Heaven_1 于 2023-3-29 10:45 编辑 " [) x$ ]5 i0 }$ k' X
# u* h' R) G/ F8 ]- |' E显卡(Video card,Graphics card)全称显示接口卡,又称显示适配器,是计算机最基本配置、最重要的配件之一。就像电脑联网需要网卡,主机里的数据要显示在屏幕上就需要显卡。因此,显卡是电脑进行数模信号转换的设备,承担输出显示图形的任务。具体来说,显卡接在电脑主板上,它将电脑的数字信号转换成模拟信号让显示器显示出来。 原始的显卡一般都是集成在主板上,只完成最基本的信号输出工作,并不用来处理数据。随着显卡的迅速发展,就出现了GPU的概念,显卡也分为独立显卡和集成显卡。 6 v( \5 B4 M+ J1 y' d
GPU这个概念是由Nvidia公司于1999年提出的。GPU是显卡上的一块芯片,就像CPU是主板上的一块芯片。自Nvidia提出GPU这个概念后,GPU就进入了快速发展时期。简单来说,其经过了以下几个阶段的发展: - 仅用于图形渲染,此功能是GPU的初衷,Graphic Processing Unit,图形处理单元;
- 浮点运算,是把浮点运算做一些处理,包装成图形渲染任务,然后交给GPU来做;0 `, y; F7 ~6 S( ^/ Q
如前提到,浮点运算需要包装,为了让不懂图形学知识的人也能使用GPU运算能力,提出CUDA。 CUDA(Compute Unified DeviceArchitecture),通用并行计算架构,是一种运算平台。它包含CUDA指令集架构以及GPU内部的并行计算引擎。使用一种类似于C语言的CUDA C语言,就可以开发CUDA程序,从而可以更加方便的利用GPU强大的计算能力,而不是像以前那样先将计算任务包装成图形渲染任务,再交由GPU处理,并不是所有GPU都支持CUDA。 CPU负责逻辑性强的事物处理和串行计算,GPU则专注于执行高度线程化的并行处理任务(大规模计算任务)。 + l: g9 Q5 C {; B' E( r
GPU衡量的参数: - 计算能力(吞吐量):计算吞吐量,单位为GFLOP/s,表示每秒的浮点操作数量;. v" ?6 y) S# A8 J; Y
28Core@2.5GHZ 双精度浮点性能是:28Core2.5GHZ32FLOPs/Cycle=2240GFLPs=2.24TFLOPs显存大小:全称显示内存,暂时储存显示芯片要处理的数据和处理完毕的数据。显存类型从原来的容量不大的SDR,发展到DDR、SDRAM、DDR3、DDR4等。 - 显存位宽:位数越大则瞬间所能传输的数据量越大,64位、128位、256位和512。512位宽的显存更多应用于高端显卡,而主流显卡基本都采用128和256位显存。
- 显存带宽:指每秒能传输的数据量,显存频率8008MHz,显示位宽192bit,则:显存带宽=8008X192/8/1000(GB/s) =192.2 GB/s
- 显存频率:显存频率指显存在显卡上工作时的频率,以MHz(兆赫兹)为单位。Ø像素填充速率:指GPU一秒钟内能处理多少个像素,单位是GPixel/S(每秒十亿像素),或MPixel/S(每秒百万像素)。像素填充速率是较好衡量GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。显卡的硬件指标对其速度具有直接影响。
- 纹理填充率,指对多边形图像进行纹理贴图、实现3D效果的速度,和像素填充率类似,单位是GTexels/S或MTexels/S。
- 功率:集显依靠CPU的主板连接提供电源,但独显性能较强,需要单独接电源。如RTX 3080 Ti功率为750w。
- 总线接口:显示卡要插在主板上才能与主板互相交换数据,现在主流接口为PCLe(PCI-Express)。接口提供数据流量带宽,目前主流采用PCLe4.0版本,16个通道。
- Directx支持:是一种应用程序接口(API)。DX由微软编写,由很多的API组成,包括显示、声音、输入和网络。DirectX 11还支持高质量实时渲染和预渲染场景,目前DX已发展到Directx 12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。
- CUDACore和Tensor Core:为GPU提供计算能力的硬件单元。CUDA core也叫Streaming Processor(SP),是单精度,组成SM的重要部分。Tensor Core已发展到第三代,Tensor Core大幅减少了深度学习需要的时间。Core的数量越多,并行运算的线程越大,计算的峰值越高。
1 @8 N4 E% O; ]" G Y' ^
GPU性能最直接的体现就是画图的速度,对应的指标就是像素填充率和纹理填充率。 + }% D; `2 A0 f
- E) D4 }1 Z0 K( k9 p0 k: r
|