Japanese subtitles

← 26-13 Slac And Big Data

26-13 Slac And Big Data

Get Embed Code
4 Languages

Showing Revision 1 created 07/21/2014 by osawakjvta.

  1. 今SLAC国立加速器研究所にいます
  2. 宇宙の謎を解明するためにコンピューティングが
    どのように活用されているか見ていきます
  3. クライストロンギャラリーにいます
    ここは以前世界で一番長いビルでした
  4. あなたは今SLAC国立加速器研究所にいます
  5. 築50年の研究所です 研究所の周りの街灯柱に
    それを示す旗がつけられています
  6. ここは約3.2キロメートルの直線加速装置を
    開発するために設立されました
  7. SLACはまだ加速器の研究所です
  8. 主なサイエンスは加速粒子、新しい物質の状態の生成
  9. または加速粒子を使った物質の性質を
    調査することに基づいています
  10. ここからたくさんのデータや
    たくさんの情報が必ず生まれてきました
  11. これはデータ集約型実験サイエンスです
  12. 初期のSLACのコンピューティングから
  13. データの分析までがここの主要業務になっています
  14. 宇宙について研究するには
    コンピュータが不可欠です
  15. 調べる機会を得てもそれがどのように進化して
    現在の状態になったか理解するために
  16. すべての作業をコンピュータで行わなければなりません
  17. そのシミュレーションを行うために
    大量のコンピューティングを行います
  18. 触媒作用や物質科学に関する大量のコンピューティング
  19. そして膨大な量のデータ分析も行われます
  20. 現在私が携わっている粒子物理学実験は
  21. 約300ぺタバイトのディスク領域があります
  22. この分析を行うために
    世界には約30万テラバイトや約3億ギガバイトの
  23. ディスク領域があります
  24. もちろん宇宙について
    すべてを把握するにはまだ程遠いですが
  25. おそらくこれが今日の科学において
    最も一般的なデータ集約型作業になります
  26. 私が携わっている
    ATLAS検出器から出される生データ率は
  27. 1秒当たり約1ぺタバイトです
  28. これは1秒当たり100万ギガバイトに相当します
  29. 世の中に知られている
    一般的な保存量ではそれを保存できません
  30. そのため生データの大部分は急いで調査され
    十分な量が保存可能なデータ量に縮減されます
  31. ヒッグス粒子はニュースで知っていると思いますが
    現在ヒッグス粒子の信号を探すために
  32. 非常に多くのぺタバイトのデータを
    ふるいにかけています
  33. すぐに結果が出るとは思っていませんが
    期待が持てそうな兆しも出てきています
  34. 今のところこれが私たちが行っているやり方です
  35. 物理学に革命を及ぼすようなものを選択するためには
  36. このように膨大な量のデータを持つ必要があります
  37. そしてデータをすべて詳細に把握する必要があります
  38. なぜなら探しているものが他のすべてのものと比較して
    少しだけ珍しいものだからです
  39. すべてのものを完璧に理解できなければ
    何も分かったことになりません
  40. SLACのATLAS選別システムが組み込まれている
    ラックの1つを見ています
  41. ATLASはスイスジュネーブにある
    大型ハドロン衝突型加速器(LHC)です
  42. これは室温で持っているエネルギーの何兆倍で
  43. とても光速に近い速さで移動させることで
  44. 自然の基本的な構成要素である陽子を衝突させます
  45. 一度に非常に多くの衝突が起こせます
  46. そして数兆ものデータチャネルを読み出す
    巨大な機械です
  47. 最終的にはこの膨大な量のデータ
    つまりぺタバイトのデータを持つことになります
  48. その内部にある特定のレアなサインを探す
    分析をしなければなりません
  49. 多くのエネルギーを持ち
    たくさんの珍しい粒子を同時に有する何かである
  50. レアなサインを探したい場合
  51. この機械に保存するものは何兆にもなります
  52. 十分な時間の中でそれを見つけ出すためには
    同時にたくさんの調査をしなければいけません
  53. コンピュータ上のすべてのコアを
    使用する必要があります
  54. 十分な時間で行えるように機械の何百ものコアが
  55. 同時にフルスピードですべてを実行します
  56. これは現在検索エンジンが行っていることとは
    少し違います
  57. 検索エンジンはテキスト文字列を探し
    このように何らかの方法で見つけた
  58. あらゆるテキスト文字列をインデックス化しています
  59. これは実に構造的です
  60. これらのデータの構造が分かります
  61. このようなデータに取り入れたいと思うものは
    何でも入手できる方法が分かっています
  62. なぜならすべてが一緒にリンクされていて
    とても分かりやすいからです
  63. 物事は常に間違った方向に向かいます
  64. ディスクからデータが失われないとは仮定できません
  65. 1つのコンピュータセンターから別のところへ
    ネットワークを通じてデータを送ります
  66. ダメージなく送られるとは仮定できませんし
  67. 計算中にコンピュータが壊れないとも仮定できません
  68. すべてのことが悪い方向へ進む可能性があり
    LHCのために行うコンピューティングでは
  69. エラー修正や再試行がよく起きます
  70. 基本的な不具合率はとても高いものがあります
  71. しかしすべてが自動的に再試行され
    エラーが修正されている時には
  72. 高い処理能力と高い成功率が得られています