Return to Video

x

  • 0:00 - 0:04
    好了,所以,为更有效地进行分区,事实上不是这样的。
  • 0:04 - 0:07
    我们还没有谈及分区函数、 分区函数和
  • 0:07 - 0:11
    我能做递归并行的动态启动没有多大关系。
  • 0:11 - 0:13
    不中断启动,但是,是这样的。
  • 0:13 - 0:20
    这的确非常有帮助因为我不用再
    不断的回到 CPU 来执行启动。
  • 0:20 - 0:23
    这意味着我将传递较少的数据,而这意味着
  • 0:23 - 0:26
    当我需要的时候,我的启动会立即执行,
  • 0:26 - 0:30
    而不用等到一波特定的执行完成后。
  • 0:30 - 0:34
    简单的代码,同时很方便,而且我大致可以断定它将更快,
  • 0:34 - 0:37
    不是它实际运行更快的原因。
  • 0:37 - 0:42
    最后,更大的 GPU 利用率大概是最大化提速的原因。
  • 0:42 - 0:49
    通过不中断启动,我确保我的 GPU 总是很忙,
    所以当部分排序完成后,
  • 0:49 - 0:54
    它将立即创建另外2个,保持我的 GPU全负荷状态并且忙于工作。
  • 0:54 - 0:59
    它一次为我的GPU流入更多的工作,而为我的排序
    则以更快的端到端而结束。
  • 0:59 - 1:05
    事实上,当我以动态并行形式编写了这个程序,
    然后驻留启动的形式,
  • 1:05 - 1:09
    我看到,在二者之间有非常清楚的2因子提速。
Tytuł:
x
Opis:

more » « less
Video Language:
English
Team:
Udacity
Projekt:
CS344 - Intro to Parallel Programming
Duration:
01:09

Chinese, Simplified subtitles

Revisions Compare revisions