< Return to Video

Examples analyzing clusters, gaps, peaks and outliers for distributions

  • 0:00 - 0:02
    この動画では分布やそれらの
  • 0:02 - 0:05
    頂点、空白や集まりなどの
  • 0:05 - 0:08
    特徴の例を挙げようと思います。
  • 0:08 - 0:11
    こちらで、試してみましょう。
  • 0:11 - 0:13
    これらの記述のうちどれがこの下の分布を
  • 0:13 - 0:15
    一番正確に表せているでしょうか。
  • 0:15 - 0:17
    当てはまるもの全てを選びなさい。
  • 0:17 - 0:20
    まず一つ目の記述は、「この分布には外れ値が存在する」
  • 0:20 - 0:23
    外れ値とは、他のデータの点と
  • 0:23 - 0:25
    かけ離れている
  • 0:25 - 0:27
    つまり多数データの点が
  • 0:27 - 0:29
    集まっている箇所に比べ極端に大きい、
  • 0:29 - 0:31
    もしくは小さいという事です。ここをみてみれば、
  • 0:31 - 0:34
    0と6の間にたくさん点があるのがわかります。
  • 0:34 - 0:36
    まずこのグラフでは何を図っているのかを考えましょう。
  • 0:36 - 0:38
    これらは、ゴーグさんの店で売られる
  • 0:38 - 0:42
    りんごの保存期間を表しています。
  • 0:42 - 0:45
    例えば、ここでは一、二、三、四、
  • 0:45 - 0:50
    五、六、七個が保存期間〇日、
  • 0:50 - 0:53
    つまりすぐ悪くなってしまうという事ですね。
  • 0:53 - 0:57
    ここには一、二、三、四、五、六、七
  • 0:57 - 0:59
    八個の林檎があと一日もつということです。
  • 0:59 - 1:01
    二個のリンゴは
  • 1:01 - 1:04
    あと六日持ち、一つのリンゴは
  • 1:04 - 1:06
    あと十日も持ちます。これは異常ですね。
  • 1:10 - 1:12
    他のりんごに比べ長すぎる
  • 1:12 - 1:14
    保存期間なので、これは外れ値と言えます。
  • 1:14 - 1:15
    よって、この分布は外れ値があると言えます。
  • 1:15 - 1:18
    この点一つだけが
  • 1:18 - 1:21
    遠い右側に、大きな値で、
  • 1:21 - 1:24
    他のりんごと比べ長すぎる保存期間なので、
  • 1:24 - 1:27
    この分布の外れ値はこれでしょう。
  • 1:27 - 1:30
    「この分布には四日から六日に点の集まりがある」
  • 1:30 - 1:33
    確かに四日から六日にかけて点が密集しています。
  • 1:33 - 1:36
    密集点とは、名前から想像できるように、
  • 1:36 - 1:38
    点の集まり、ここでは四日から六日の
  • 1:38 - 1:40
    保存期限のりんごの集まりがあることが
  • 1:40 - 1:42
    ここでは確認できますね。
  • 1:42 - 1:45
    そしてもうすでに二つ選択肢を選んでいるのだから、
  • 1:45 - 1:46
    「どれでもない」の選択肢ではないでしょう。
  • 1:46 - 1:50
    答えを確認しましょう。
  • 1:50 - 1:53
    あと数問解いてみましょう。
  • 1:53 - 1:54
    これらの記述のうちどれが
  • 1:54 - 1:57
    以下の分布を正確に表していますか。
  • 1:57 - 2:00
    また、該当する全て選べ。
  • 2:00 - 2:02
    「この分布には外れ値が存在する。」
  • 2:02 - 2:04
    分布を見てみましょう。
  • 2:04 - 2:07
    高い値と低い値に
  • 2:07 - 2:09
    居座る点はありますが、
  • 2:09 - 2:12
    飛び抜けて高い、または低い
  • 2:12 - 2:14
    点は見当たりません。
  • 2:14 - 2:16
    もし点がこんなところにあったら
  • 2:16 - 2:19
    まあ外れ値だろうと言えますが、
  • 2:19 - 2:22
    また、はるか遠く左に点があれば
  • 2:22 - 2:23
    それは外れ値になりますが、
  • 2:23 - 2:27
    ここでは外れ値は確認できません。
  • 2:27 - 2:31
    全ての点が、まとまっていますね。
  • 2:31 - 2:35
    つまり、この分布には外れ値は存在しません。
  • 2:35 - 2:37
    この分布の頂点は22度である。
  • 2:37 - 2:38
    確かに、そのように見えます。
  • 2:38 - 2:43
    ここでは何を図っているかを見てみましょう。
  • 2:43 - 2:45
    「エッジトン、アイオワ州の七月の最高気温
  • 2:45 - 2:49
  • 2:49 - 2:52
  • 2:52 - 2:56
  • 2:56 - 2:58
  • 2:58 - 2:59
  • 2:59 - 3:04
  • 3:04 - 3:07
  • 3:07 - 3:09
  • 3:09 - 3:11
  • 3:11 - 3:12
  • 3:12 - 3:14
  • 3:14 - 3:16
  • 3:16 - 3:18
  • 3:18 - 3:21
  • 3:21 - 3:21
  • 3:22 - 3:26
  • 3:26 - 3:29
  • 3:30 - 3:32
  • 3:32 - 3:36
  • 3:36 - 3:39
  • 3:39 - 3:40
  • 3:40 - 3:42
  • 3:42 - 3:46
  • 3:46 - 3:48
  • 3:48 - 3:51
  • 3:51 - 3:54
  • 3:54 - 3:58
  • 3:58 - 4:00
  • 4:00 - 4:02
  • 4:02 - 4:06
  • 4:06 - 4:09
  • 4:09 - 4:14
  • 4:14 - 4:17
  • 4:17 - 4:20
  • 4:20 - 4:21
  • 4:21 - 4:24
  • 4:24 - 4:28
  • 4:28 - 4:30
  • 4:30 - 4:32
  • 4:32 - 4:36
  • 4:36 - 4:38
  • 4:38 - 4:40
  • 4:40 - 4:41
  • 4:41 - 4:42
  • 4:42 - 4:46
  • 4:46 - 4:51
  • 4:51 - 4:55
  • 4:55 - 4:58
  • 4:58 - 5:01
  • 5:01 - 5:05
  • 5:05 - 5:07
  • 5:07 - 5:10
  • 5:10 - 5:12
  • 5:12 - 5:15
  • 5:15 - 5:16
  • 5:16 - 5:21
  • 5:21 - 5:22
  • 5:22 - 5:25
  • 5:25 - 5:29
  • 5:29 - 5:32
  • 5:32 - 5:36
  • 5:36 - 5:38
  • 5:38 - 5:41
  • 5:41 - 5:42
  • 5:42 - 5:44
  • 5:44 - 5:46
  • 5:46 - 5:48
  • 5:48 - 5:49
  • 5:49 - 5:51
  • 5:51 - 5:54
  • 5:54 - 5:57
  • 5:57 - 6:00
  • 6:00 - 6:01
  • 6:01 - 6:05
  • 6:05 - 6:07
  • 6:07 - 6:09
  • 6:09 - 6:11
  • 6:11 - 6:14
  • 6:14 - 6:15
  • 6:15 - 6:17
  • 6:17 - 6:22
  • 6:22 - 6:24
  • 6:24 - 6:26
  • 6:26 - 6:28
  • 6:29 - 6:31
Title:
Examples analyzing clusters, gaps, peaks and outliers for distributions
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
06:32

Japanese subtitles

Revisions Compare revisions