Return to Video

cs_344_u1_36_s_立方数的CUDA代码

  • 0:00 - 0:02
    好吧,让我们看看我们将如何解决这个问题。
  • 0:02 - 0:06
    我们要做的第一件事是将平方例程改为立方例程,
  • 0:06 - 0:08
    并相应地更改数学运算。
  • 0:08 - 0:10
    所以现在我们要从平方改为立方。
  • 0:10 - 0:15
    现在我们不是计算 f x f,而是只计算 f x f x f。
  • 0:15 - 0:19
    现在,既然我们的新名字在这里是立方,
    我们不得不一直向下滚动回到这里。
  • 0:19 - 0:24
    我们现在不是启动平方,而是启动了q。
  • 0:24 - 0:27
    接下来我们必须要改变的一件事是分配。
  • 0:27 - 0:32
    现在,我们不是想在64个元素上运行这个,
    而是要在96 元素上运行。
  • 0:32 - 0:39
    我们很方便地写了此代码,这样从数组的大小来说
    所有都完成了,包括分配。
  • 0:39 - 0:41
    这应该是所有我们需要做的。
  • 0:41 - 0:44
    现在,让我们回到我的shell 窗口并演示这个是否可行,好吗?
  • 0:44 - 0:47
    现在我们打算在我们自己的终端窗口来执行它。
  • 0:47 - 0:51
    首先,我要明确给你演示
    我实际上已经在这个文件中进行了修改。
  • 0:51 - 0:56
    注意我们现在有一个立方的例程,f x f x f 且现在是96。
  • 0:56 - 1:00
    现在,我们要将它编译成可执行的立方。
  • 1:00 - 1:02
    然后我们要运行它。
  • 1:02 - 1:08
    请注意,不是打印出平方,现在它打印
    0、 1、 8、 27,等等。
  • 1:08 - 1:09
    一共 96 个立方。
  • 1:09 - 1:12
    好的,不错。让我们继续。
Title:
cs_344_u1_36_s_立方数的CUDA代码
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
CS344 - Intro to Parallel Programming
Duration:
01:13

Chinese, Simplified subtitles

Revisions Compare revisions