搜索新闻

GPU炼金试验室 揭秘HD7800强劲性能之谜

shader灵活度测试:矩阵转置
来源:中关村在线 更新日期:2012-04-15 作者:顾杰
内容导航:  分页浏览 | 全文浏览

shader灵活度测试:矩阵转置

    ● shader灵活度测试:矩阵转置

    矩阵转置同矩阵乘法一样,也广泛分布在包括坐标变换等过程在内的大量图形处理过程中。矩阵转置可以被理解成矩阵沿特定方向“翻转”之后产生的镜像,这导致了矩阵转置操作会涉及到大量数据,比如稀疏矩阵的对角线数据等的临时存储,因此矩阵转置操作对于体系的缓冲密度是相当敏感的。

    同矩阵乘法一样,伴随着频率的不断提升,HD7950的矩阵转置性能提升速度较之HD7970要高出许多,两者之间的性能差异在迅速的收窄甚至趋同。由于矩阵转置的操作过程较之矩阵乘法更加“规整”,能够产生瞬间高延迟的因素较少,因此矩阵转置测试所得的趋势也更加明显和直观。

    由于矩阵转置对缓冲体系的敏感,缓冲密度相同但总量更少的Pitcairn在这项测试中遇到了不小的问题,不足以应对测试需求的缓冲体系导致了大量的访存过程,这直接拖累HD7800的矩阵转置性能。这个过程在Tahiti中同样存在,但拥有巨大显存带宽的HD7900系列成功的以更好的显存性能应对了缓冲溢出的问题。sweet spot级的HD7800并不具备旗舰级的384bit显存位宽,因此只能接受150G显存带宽带来的测试结果。

   

 标签:
上一页 1 2 3 4 5 6 7 8 9 10 11 下一页
广告联系:010-82755684 | 010-82755685 手机版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影时代网 版权所有 关于投影时代 | 联系我们 | 欢迎来稿 | 网站地图
返回首页 网友评论 返回顶部 建议反馈
快速评论
验证码: 看不清?点一下
发表评论