扛起CUDA大旗 GeForce GTX 200深入评测

GeForce GTX 200图形处理架构

来源：超能网　更新日期：2008-06-20 作者：佚名

CES消费电子展专题报道年度评选盛典获奖揭晓

内容导航：　　分页浏览 | 全文浏览

◆ GeForce GTX 200图形处理架构

　　GTX 200是首款使用NVIDIA第二代统一架构渲染及运算引擎的显卡。对比GeForce 8或者9系显卡，新架构能够带来约1.5倍的性能增长。

GeForce GTX 280的图形处理架构

　　想必大家都记得GeForce 8系列以及GeFeforce 9系列的核心是基于一个可扩展处理器阵列(Scalable Processor Array，SPA)结构，GTX 200系列所用的是一个重新设计加强以及延展的SPA结构。

　　SPA结构里面包含了一些TPC单元，TPC的全称根据用途的不同而有所不同。在图形处理模式时它被称为贴图处理群（Texture Processing Cluster），而在并行计算模式时它被称为线程处理群（Thread Processing Cluster）。每一个TPC包含了一定数量的流处理单元（Streaming multiprocessors,SMs），而每一个流处理单元内部又包含了8个流处理器核心（Stream Processors,SPs,或者thread Processors）。另外，每一个SM内部也包含了一定数量的纹理过滤处理器（Texture Filtering Processor），除了在3D图形模式上有着很大的作用之外，在运算模式下也非常有用处，如大型图像的放大缩小等等。

　　第二代统一渲染架构和G80以及G92所使用的第一代统一渲染架构相比，在两方面有着巨大的进步。首先，每一个TPC内的SM数目从第一代的两个增加至三个；第二是每一个GPU内的TPC从8个增加至10个（GTX 260为8个），TPC和SM数量上的增加直接导致了SP的数目增加至240个（GTX 260只有192个）。

GTX 200与前代产品的SP比较

　　GPU的处理核心SP基于传统的处理器核心设计，能够进行整数，浮点计算，逻辑运算等操作，从硬体设计上看就是一种完全为多线程设计的处理核心，拥有复数的管线平台设计，完全胜任每线程处理单指令的工作。

　　GPU内的线程分成多种，包括像素、几何以及运算三种不同的类型，在三维图像处理模式下，大量的线程同时处理一个shader program以达到最大化的效率，所以GTX 200 GPU的核心内很大一部分面积都作为计算之用，和CPU上大部分面积都被缓存所占据有所不同，大约估计在CPU上有20%的晶体管是用作运算之用的，而（GTX 200）GPU上有80%的晶体管用作运算。GPU处理的首要目标是运算以及数据吞吐量，而CPU内部晶体管的首要目的是降低处理的延时以及保持管线繁忙，这也决定了GPU在密集型计算比起CPU来更有优势。

　　从上面的GeForce GTX 280的图形处理架构图可以看到10个TPCs，每个TPCs包含了三个SMs，每个SMs又包含了8个流处理器核心，这样流处理器核心总量达到了240个。

返回高清播放机频道首页