Chinese, Traditional subtitles

← 07-13 Slac And Big Data

Get Embed Code
4 Languages

Showing Revision 5 created 02/05/2013 by shalley3.

  1. 我們目前在 SLAC 國家加速器實驗室
  2. 我們將去看看他們如何使用計算,了解宇宙的奧秘
  3. [Spencer Gessner] 我們就站在速調管 (klystron) 走廊,
    曾經是世界上最長的建築
  4. [Richard Mount] 你現在在 SLAC 國家加速器實驗室
  5. 這是一個 50 多年歷史的實驗室,
    實驗室周圍燈桿上的所有標誌都說明了這一點
  6. 它的建立是為了建一個 2 英里長的直線加速器
  7. SLAC 仍然是一個加速器實驗室
  8. 其主要的科學是基於加速粒子,創造新的物態
  9. 或用加速粒子來探索物質的性質
  10. 它一直在產生大量的資料,大量的資訊
  11. 這是資料密集的實驗科學
  12. 從 SLAC 早期的計算
  13. 到分析資料,已成為了這裡的主要活動
  14. 你真的只能在電腦中研究宇宙
  15. 你有一次機會去看看宇宙
  16. 去了解宇宙如何進化成現在的狀態
  17. 你必須在電腦中進行
  18. 這裡有進行模擬的大規模計算
  19. 催化和材料科學的大規模計算
  20. 這裡也有大量的資料分析
  21. 我現在也參與了
  22. 特別的粒子物理實驗,有一些 300 petabytes 的磁碟空間
  23. 也就是 300,000 terabytes
    或 300 萬 gigabytes 的磁碟空間
  24. 在世界各地做這種分析
  25. 當然,我們距離了解宇宙的一切還很遙遠
  26. 但這可能是今天科學領域中,資料最密集的活動之一
  27. 我所參與的 ATLAS 探測器的原始資料速率
  28. 是每秒鐘 1 petabyte
  29. 也就是每秒 100 萬 gigabytes
  30. 任何人的預算,都不能儲存這麼多的資料
  31. 大多數資料都是飛速地檢查,減少到小很多,
    但仍是很大的可儲存的資料
  32. 現在,我們在篩選很多、很多 petabytes 的資料
  33. 尋找希格斯玻色子 (Higgs boson) 的信號,
    無疑地大家在新聞中有聽說過
  34. 這些誘人的提示,讓我無法屏住呼吸
  35. 但這是我們做的方法
  36. 你必須有那些大量的資料
  37. 只是為了挑選將物理真正革命化的東西
  38. 你需要了解所有的細節,因為你在尋找的
  39. 和其他一切比較起來,有點不尋常
  40. 如果你不完全了解其他一切,那麼你什麼都不懂
  41. [Max Swiatlowski] 我們正在看其中一個機架,包含
  42. 在 SLAC 的 ATLAS proof buster
  43. ATLAS 是瑞士日內瓦的實驗大型強子對撞機
  44. 它碰撞質子,大自然的基本構成物
  45. 質子移動的速度非常接近光速
  46. 其能量是在室溫中的數兆倍
  47. 你立刻可以看到很多、很多這類的碰撞
  48. 這台龐大的機器讀出數萬億的資料通道 (data channel)
  49. 在一天結束時,你有龐大的資料,petabytes 資料
  50. 你必須分析,
    在裡面尋找非常罕見,非常特別的特徵 (signatures)
  51. 如果我想要立即尋找罕見的特徵 (signatures),
    有很多能量的東西
  52. 以及很多奇異粒子
  53. 在這機器中,儲存了上兆 (trillions) 的事件
  54. 為了在合理的時間內尋找它們
  55. 我必須馬上進行很多的搜尋
  56. 我需要使用電腦上所有的核心
  57. 機器上,數百個核心同時全速運行
  58. 希望在合理的時間內完成
  59. [Richard Mount] 這不是搜尋引擎這類程式
    目前做的事情
  60. 他們尋找文字的字串,和索引他們找到的所有文字字串
  61. 像這樣的方式
  62. 我們所做的非常、非常有結構
  63. 我們知道這些資料的結構
  64. 我們確實知道如何在這些資料中,找到想要的資料
  65. 因為我們已經非常了解,每件事連結在一起的方式
  66. 事情總是會出錯
  67. 你不能假設,你在磁碟中不會丟失資料
  68. 你藉由網路,從一個電腦中心向另一個電腦中心,
    發送資料
  69. 你不能假設資料會完好無損地到達目的地
  70. 你不能假設電腦在計算的過程中不會死當
  71. 一切都可能出錯,所以我們為 LHC 做的計算
  72. 有許多層的錯誤糾正 (error correction) 和重試 (retry)
  73. 一些基本的失敗率是相當高的
  74. 但當一切都完全地自動重試
  75. 錯誤被修正之後,我們會得到高產出量 (throughput)
    以及高成功率