Return to Video

cs_344_u1_15_l_一个_CUDA_GPU_程序

  • 0:00 - 0:02
    典型的程序像这样。
  • 0:02 - 0:06
    首先,CPU在GPU上分配存储。
  • 0:06 - 0:10
    然后,CPU把某个输入数据从CPU复制到GPU。
  • 0:10 - 0:16
    接着,CPU调用某些内核来监视这些在GPU上处理这个数据的内核。
  • 0:16 - 0:21
    最后,CPU把结果从GPU复制回CPU。
  • 0:21 - 0:26
    其中两步需要在CPU和GPU中来回移动数据。
  • 0:26 - 0:27
    这代价大吗?
  • 0:27 - 0:33
    通常来说,你想尽可能地最小化CPU和GPU间的数据传输。
  • 0:33 - 0:37
    如果你要移动很多数据,而只对那些数据做一点点的计算,
  • 0:37 - 0:40
    CUDA或GPU计算可能不是很适合你的问题。
  • 0:40 - 0:46
    一般地,我们发现最成功的GPU计算应用进行大量计算,
  • 0:46 - 0:49
    与通信相比有很高的计算比率。
  • 0:49 - 0:51
    它们把数据发送给GPU,
  • 0:51 - 0:54
    它们进行很多工作,只是那时,它们才把数据取回。
タイトル:
cs_344_u1_15_l_一个_CUDA_GPU_程序
概説:

more » « less
Video Language:
English
Team:
Udacity
プロジェクト:
CS344 - Intro to Parallel Programming
Duration:
0:55
Michael Xiao approved Chinese, Simplified subtitles for 01-22 A CUDA Program
Michael Xiao edited Chinese, Simplified subtitles for 01-22 A CUDA Program
Lian7 added a translation

Chinese, Simplified subtitles

改訂 Compare revisions