tf是什么意思(TFLOPS是什么意思)

/ 0评 / 0

RTX30视频卡线上发布会有一个细节特别抢眼,那就是当一个名为TFLOPS的数据发布时,如果你看的视频有弹幕,弹幕会立刻爆炸。这个参数到底是什么?为什么大家这么关注?2021-09-28 就来说说吧。TFLOPS是说Tera和浮点运算的短语

RTX 30视频卡线上发布会有一个细节特别抢眼,那就是当一个名为TFLOPS的数据发布后,如果你看的视频有弹幕,弹幕会立刻爆炸。这个参数到底是什么?为什么大家这么关注?2021-09-28 就来说说吧。

TFLOPS是Tera和每秒浮点运算的组合,后者表示每秒浮点运算,Tera表示万亿,合起来就是每秒有多少万亿的浮点运算。因为当前图像是分像素的,每个像素的颜色需要浮点运算,然后组合成一幅图片,这个参数显示了显卡或GPU每秒可以处理多少像素。

它的基础来自于目前的GPU设计。目前,图形处理器由许多小的处理核心或流处理器组成。这个内核比处理器内核简单得多,每个时钟周期只处理一个浮点数据,所以浮点运算的总数就是内核时钟周期数。而且由于当前内核一次可以处理一个双精度浮点数据,相当于两个基本的单精度浮点数据,所以GPU的浮点运算次数可以在另外两个中得到。

回去看看这个参数对游戏意味着什么。分辨率确定后,每张图片的像素数就确定了,所以每秒处理的像素越多,每秒可以处理的图片就(原创www.isoyu.com版权)越多。这是什么意思?当然,游戏的帧率(每秒帧数)越高。没错,对于同代的显卡,尤其是同核的显卡,通过计算其浮点运算能力,基本可以了解游戏速度。

但是这种比较并不适合不同代甚至不同架构的GPU。比如RTX 3080的浮点运算次数是RTX 2080 Ti的两倍,那么百特网络的帧率能达到RTX 2080 Ti的两倍吗?从之前的测试中,我们都知道情况肯定不是这样。

这就引出了另一个问题,那就是核心的效率问题,因为没有人能保证所有的核心或者Baxter网络流处理器都能一直满负荷高效运行,而它的实际发挥也要考虑前端分配、后端合成、内存数据等单元的协调。因此,在不同的架构下,根据最理想情况计算的浮点运算次数是不同的。

RTX 30也不同,因为它实际上允许每个内核中的整数算术单元参与浮点运算,从而使“理论”算术能力翻倍。但是由于是非专业工作,整数单元的浮点运算效率赶不上专业的浮点运算单元。此外,使用百特,前端的数据分配容量和视频内存带宽都没有翻倍。因此,效率大大下降。最后,我们可以看到双倍浮点运算能力带来的只有不到40%