Chinese, Simplified subtitles

← cs344_unit5_25_l_GPU的Litte法则

Get Embed Code
2 Languages

Showing Revision 1 created 05/15/2013 by Lian7.

  1. 我们来看看GPU的Litter法则。
  2. 回顾一下,Litte法则阐述了传达的有用字节数
  3. 等于平均内存事务延迟乘以带宽。
  4. 这有什么含义?
  5. 首先,存在最小延迟,把一个信号或一块数据从一个SM一直
  6. 移到DRAM的某处,或从DRAM获取信息并带入SM。
  7. 好的,你可以在网上找到你的特定GPU的具体细节,
  8. 但一般来说,任何DRAM事务将花数以百计的时间周期。
  9. 顺便说一下,这不是GPU专有的,这适用于所有现代处理器。
  10. 现代芯片上的一个时钟周期花费半纳秒,例如,2千兆赫芯片。
  11. 即使是光速—你知道的,光在一纳秒内走不了很远。
  12. 电更慢,特别是在你在计算机芯片上找到的小导线上。
  13. 所以从GPU内部某处离开芯片,
  14. 通过电板上的某处导线到DRAM,获得结果,
  15. 一直往回运动,数以百计的时钟周期,很多很多纳秒。
  16. 所以这意味着试图读写全局内存的线程
  17. 得等待100秒时钟,时间可以用在
  18. 可以进行真正计算。
  19. 这反过来就是为什么我们有这么多线程在飞行状态的原因。
  20. 我们通过有很多很多线程能够同时运行,
  21. 来处理这内存访问间数以百计的高延迟,
  22. 所以在一个线程向全局内存请求一块数据,
  23. 或启动一个全局内存存储,另一个线程可以步入进行一些计算。