Chinese, Simplified subtitles

← cs344_unit5_41_l_各种数学优化

Get Embed Code
2 Languages

Showing Revision 2 created 05/15/2013 by Lian7.

  1. 不同的数学指令花费不同的时间也值得注意。
  2. 而这个话题也许值半个忍者。
  3. 你可以真正地深入了解不同数学优化所涉及的延迟,
  4. 但有几个每个人都应该牢记的一般原则。
  5. 所以首先要记住的是只有当你确实需要双精度时才使用它。
  6. 64位数学运算比32 位慢,
  7. 但很容易忘记的是,
    浮点字符,像这里的2.5被解释为fp64
  8. 除非你添加 f 后缀。
  9. 因此,左边的语句比右边的语句需要更长的执行时间。
  10. 这是微妙的区别,很显然有时候你需要使用双精度,
  11. 但如果你担心性能,
  12. 并且你想从你的内核挤出最后的几个百分点,
  13. 那么只有你绝对打算使用它时才使用它。
  14. 第二种面向数学的优化是对常用运算尽可能地使用内部函数。
  15. CUDA 支持许多常见数学运算的特别版本,
  16. 像正弦、余弦和指数,这被称为内部函数。
  17. 这些内置函数实现的精度比它们对应的math.h的低2至3位,
  18. 但它们要快得多。
  19. 也有快速平方根、 快速除、 0D规范等的编译器标志。
  20. 你可以阅读编程指南获得更多详情。