YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Chinese, Simplified subtitles

← cs344_unit5_15_s_理论峰值带宽

Get Embed Code
2 Languages

Showing Revision 2 created 05/20/2013 by Lian7.

  1. 因此2,508兆赫就是每秒2508乘以10的六次方个时钟周期 。
  2. 128位内存总线等于每个时钟周期16个字节。
  3. 所以如果你把这乘起来,
  4. 内存系统的最大理论峰值带宽
  5. 将刚好超过每秒40 GB。
  6. 作为一条粗略的经验法则,
  7. 任何时候我们实现内存带宽的40%到60%,
  8. 我们会说,"哦,那做的不错。它不是很棒。可能有改进的余地。"
  9. 如果你可以达到60%到75%,那就做得相当不错。
  10. 你可能无法对此改进。
  11. 在任何时候你达到超过75%,我们会认为那是极好的,好吗?
  12. 在任何真正实质的代码上,你将永远无法达到此理论峰值带宽,明白吗?
  13. 这就是从字面上讲你把时钟速率和内存总线相乘得出的结果,
  14. 另外,一个真正的代码会有额外的开销。
  15. 所以如果你可以得到理论值的75%以上,你就做得非常好了,
  16. 你很可能不需要进一步优化内存。
  17. 那么这个代码中我们做得怎么样呢?