如果说HD7970的性能是意料之中的话,HD7870则有些意外了。GCN架构虽然优秀,但包括笔者在内,相信很多网友都没想到这一代的中端HD7870可以轻松击败上一代的旗舰HD6970。
就实用性而言,旗舰产品性能固然无可比拟,功耗发热却也不小,再加上价格昂贵,并不适合大多数消费者,而兼顾性价比的高端产品更适合游戏玩家,所以也是大家关注的焦点。
因此,在HD7870发布之后,各大AIB对这款产品均给予厚望,而今天抵达泡泡的就是来自XFX的FX-787A-CDB双酷魂黑卡,一款穿着金属铠甲的非公版HD7870!
GCN架构的精髓:更强大的多线程性能
因为HD7870发布时间还不长,所以可能很多朋友对这款显卡还不是非常了解。这里我们简单介绍一下这款显卡的GPU核心。
众所周知,相比HD5000/6000系列,南方群岛除了工艺从40nm更新到28nm以外,最重大的改变就是采用了全新的GCN架构了。关于GCN架构想必大家在HD7970首发评测中已经有所了解,所以本文只做简单介绍。
AMD历代GPU的瓶颈除了曲面细分以外,其实最重要的是5D/4D VLIW架构的效率问题。这一痼疾在南方群岛身上终于得以根除,它的流处理器结构已经面目全非了。
通过Pitcairn的整体架构图我们看到,传统的SIMD流处理器阵列消失了,取而代之的是GCN阵列,Pitcairn总计拥有1280个流处理器,现在来看看GCN阵列的微观结构。
GCN阵列里有4组SIMD单元,每组SIMD单元里面包括16个流处理器、或者说是标量运算器。GCN架构已经完全抛弃了此前5D/4D流处理器 VLIW超长指令架构的限制,不存在5D/4D指令打包-派发-解包的问题,所有流处理器以16个为一组SIMD阵列完成指令调度。简单来说,以往是指令 集并行,而现在是线程级并行。
可以这么理解,一个GCN阵列与GF100当中的一组SM相当,GF100的一组SM当中有4组共计32个流处理器,而Tahiti的一组GCN当中有4组共计64个流处理器。
更多的线程调度
从线程级别来看,GCN与SM是不可分割的最小单元,GCN一次可以执行64个线程,而SM是48个(其实就是流处理器的数量)。
从多线程执行上来看,GCN可以同时执行4个硬件线程,而SM是双线程调度器的设计(参见架构图)。如此来看,GCN架构的多线程性能会更好一些。