Return to Video

图块尺寸的考虑

  • 0:00 - 0:04
    在这个问题中,您需要把你的工作分成区块 ;在这个例子中,即图块。
  • 0:04 - 0:08
    在微小的图块之间我们有一个连续区—
    许多这样的连续区和较少的图块,
  • 0:08 - 0:14
    每个图块的大小等于
    单个线程块可以容纳的最大值。
  • 0:14 - 0:15
    在这个特定的问题中,大图块意味着较少的内存带宽,这很好。
  • 0:18 - 0:22
    一般地,你接下来想要把你的图块大小变成
    一个单线程块可以容纳的最大尺寸,
  • 0:22 - 0:25
    因为,那样可以最小化总体的内存带宽。
  • 0:25 - 0:27
    但请留意以下 2 个注意事项。一、你需要至少拥有和你的GPU的
  • 0:29 - 0:31
    SM一样多的线程块。因为,不然的话,
  • 0:33 - 0:36
    你的SM就会无所事事。很显然,你要确保给机器补充
  • 0:36 - 0:38
    足够的工作来保持所有的 SM 处于忙碌状态,
  • 0:38 - 0:41
    即使你得往连续区这边稍微移动一点,
  • 0:41 - 0:44
    并且把你的图块尺寸稍微改小一点。二、如果你位于连续区的右端,
  • 0:47 - 0:49
    这对整体的内存带宽是最好的。但结果往往是
  • 0:49 - 0:51
    你实际更喜欢靠左1个小单位。这允许一个小数字,
  • 0:55 - 0:58
    比如,一次2个块同时驻留。那潜在地提供
  • 1:01 - 1:03
    更好的延迟隐藏特性。因为在同一时间你
  • 1:03 - 1:06
    从该程序略有不同的片断中拥有更多的warp线程组。这一定是你想
  • 1:09 - 1:12
    仔细调试的东西,如果你需要最快可能的实现。
Title:
图块尺寸的考虑
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
CS344 - Intro to Parallel Programming
Duration:
01:12

Chinese, Simplified subtitles

Incomplete

Revisions Compare revisions