< Return to Video

Constructing a box-and-whisker plot

  • 0:01 - 0:03
    レストランの経営者は
  • 0:03 - 0:06
    顧客がどこから来るかを知りたいです。
  • 0:06 - 0:08
    ある日、彼は来客の
  • 0:08 - 0:11
    レストランまでの移動距離を
  • 0:11 - 0:13
    マイルで調べました。
  • 0:13 - 0:16
    以下がその距離です。
  • 0:16 - 0:18
    すべてのデータがここにあります。
  • 0:18 - 0:20
    これをグラフにして
  • 0:20 - 0:23
    距離のバラツキを理解したいです。
  • 0:23 - 0:26
    距離のバラツキと
  • 0:26 - 0:29
    来客の移動距離の
  • 0:29 - 0:34
    中央値を把握したいと思っています。
  • 0:34 - 0:37
    どのようなグラフを作成するとよいでしょう。
  • 0:37 - 0:40
    どのようなグラフを作成するかという問いは
  • 0:40 - 0:43
    実際にグラフを作成するより
  • 0:43 - 0:45
    簡単な問いですね。
  • 0:45 - 0:50
    これらの情報を基にバラツキを求めようとしています。
  • 0:50 - 0:52
    そして同時に中央値も知りたいです。
  • 0:52 - 0:56
    これらの2つの情報を捉えるグラフは
    なんでしょうか。
  • 0:56 - 0:58
    それは箱ひげ図です。
  • 0:58 - 1:02
    では、実際に箱ひげ図を作成してみましょう。
  • 1:02 - 1:04
    そのためには中央値が必要です。
  • 1:04 - 1:06
    そして、データの上下の半分の
  • 1:06 - 1:08
    中央値も必要です。
  • 1:08 - 1:10
    中央値を取得する際には
  • 1:10 - 1:12
    データを順に並べ替えると便利です。
  • 1:12 - 1:16
    では、データを順に並び替えましょう。
  • 1:16 - 1:19
    最も小さい数はなんですか。
  • 1:19 - 1:20
    見てみましょう。
  • 1:20 - 1:21
    2がひとつあります。
  • 1:21 - 1:23
    印をつけましょう。
  • 1:23 - 1:26
    ここにも2があります。
  • 1:26 - 1:27
    これらがすべての2です。
  • 1:27 - 1:30
    そしてここに3があります。
  • 1:30 - 1:32
    ここにも3があります。
  • 1:32 - 1:34
    これが全部の3でしょう。
  • 1:34 - 1:37
    次に4があります。
  • 1:37 - 1:40
    ここも4があります。
  • 1:40 - 1:42
    5もあるでしょうか。
  • 1:42 - 1:43
    ないですね。
  • 1:43 - 1:44
    6がありますか。
  • 1:44 - 1:45
    6があります。
  • 1:45 - 1:48
    6はひとつのようです。
  • 1:48 - 1:49
    7はどうでしょう。
  • 1:50 - 1:52
    はい7がここにあります。
  • 1:52 - 1:54
    ここに1があるのを見落としました。
  • 1:54 - 1:57
    1をはじめに置きます。
  • 1:57 - 1:58
    ここに1があります。
  • 1:58 - 2:00
    もうひとつ1があります。
  • 2:00 - 2:01
    両方見落としていました。
  • 2:01 - 2:04
    この両方の1をここに置きます。
  • 2:04 - 2:07
    だから、1と2と3と4があり、
    5はありません。
  • 2:07 - 2:09
    そして6がひとつ。
  • 2:09 - 2:10
    7がひとつあります。
  • 2:10 - 2:13
    ここに8がひとつあります。
  • 2:13 - 2:15
    そして9はどうでしょう。
  • 2:15 - 2:16
    9はないです。
  • 2:16 - 2:17
    10 はありますか。
  • 2:17 - 2:19
    10 はひとつあります。
  • 2:19 - 2:20
    11 はどうでしょう。
  • 2:20 - 2:22
    11 はここにあります。
  • 2:22 - 2:23
    12はどうでしょう。
  • 2:23 - 2:24
    ないですね。
  • 2:24 - 2:27
    13 は? 14 はひとつあります。
  • 2:27 - 2:31
    15 があります。
  • 2:31 - 2:35
    そして 20がひとつと
    22 がひとつあります。
  • 2:35 - 2:36
    データを順に並び替えました。
  • 2:36 - 2:38
    これで簡単に
  • 2:38 - 2:41
    中央値を見つけることができます。
  • 2:41 - 2:43
    データはいくつありますか。
  • 2:43 - 2:50
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
    11, 12, 13, 14, 15, 16, 17.
  • 2:50 - 2:52
    だから、中央値は
  • 2:52 - 2:54
    それより小さい数が8つあり、
  • 2:54 - 2:56
    そして大きい数が8つある数となります。
  • 2:56 - 2:57
    見てみましょう。
  • 2:57 - 3:00
    1, 2, 3, 4, 5, 6, 7, 8,
  • 3:00 - 3:04
    だから、この6には
    それより小さい数が8つあります。
  • 3:04 - 3:06
    私が正しく数えていたら、
  • 3:06 - 3:08
    これより大きい数は8つあります。
  • 3:08 - 3:12
    1, 2, 3, 4, 5, 6, 7, 8。
  • 3:12 - 3:17
    これが実際に中央値になります。
  • 3:17 - 3:21
    箱ひげ図を作成する際には、
  • 3:21 - 3:25
    まず中央値があり
  • 3:25 - 3:27
    それによってデータセットが2つに分割されます。
  • 3:27 - 3:31
    次にそれぞれのセットの中央値を求めます。
  • 3:31 - 3:32
    従来の方法では
  • 3:32 - 3:34
    中央値はここでは考慮しません。
  • 3:34 - 3:36
    中央値も含める人もいます。
  • 3:36 - 3:38
    でも一般的には中央値は考慮しません。
  • 3:38 - 3:39
    これらの上下のセットを
  • 3:39 - 3:42
    個別に考えます。
  • 3:42 - 3:45
    下半分のデータセットでは、
  • 3:45 - 3:49
    中央値はなんですか。
  • 3:49 - 3:55
    1, 2, 3, 4, 5, 6, 7, 8
    8つのデータがあります。
  • 3:55 - 3:57
    つまり、中央に来る数は2つあります。
  • 3:57 - 4:01
    中央になる数は2と3です。
  • 4:01 - 4:02
    これらから見て
    3つの数はそれより下にあり、
  • 4:02 - 4:04
    3つの数はそれより上にあります。
  • 4:04 - 4:05
    だから中央値として
  • 4:05 - 4:07
    この2つの数があります。
  • 4:07 - 4:08
    この2つの数の平均を取ります。
  • 4:08 - 4:13
    2と3の平均は2.5です。
  • 4:13 - 4:17
    2足す3は5で、それを2で割ると2.5です。
  • 4:17 - 4:22
    この下半分の中央値は2.5です。
  • 4:22 - 4:25
    では、上半分の中央値はなんですか。
  • 4:25 - 4:27
    ここにも8つの数があります。
  • 4:27 - 4:30
    真ん中の2つの数を取ります。
  • 4:30 - 4:34
    これは11と14です。
  • 4:34 - 4:36
    この2つの数の平均を取ります。
  • 4:36 - 4:39
    11足す14は 25で
  • 4:39 - 4:43
    平均は 12.5 になります。
  • 4:43 - 4:47
    12.5は、11と14の真ん中です。
  • 4:47 - 4:49
    これですべての情報が得られ、
  • 4:49 - 4:52
    実際に箱ひげ図を
  • 4:52 - 4:55
    作成することができます。
  • 4:55 - 5:03
    では、数直線を引きます。
  • 5:03 - 5:05
    できるだけ正確に…
  • 5:05 - 5:07
    これが数直線です。
  • 5:07 - 5:10
    ここを0とします。
  • 5:10 - 5:14
    22 かそれを超える必要があります。
  • 5:14 - 5:15
    ここが0で
  • 5:15 - 5:17
    ここが5で
  • 5:17 - 5:19
    ここを 10 とします。
  • 5:19 - 5:21
    これが 15で
  • 5:21 - 5:23
    これが 20
  • 5:23 - 5:25
    そして、ここが 25です。
  • 5:25 - 5:30
    30か35まで引きましょう。
  • 5:30 - 5:33
    では、まず箱ひげ図を作成するに
  • 5:33 - 5:34
    見ていくことは…
  • 5:34 - 5:37
    箱ひげ図の箱の部分は
  • 5:37 - 5:39
    実際にこれらのデータの
  • 5:39 - 5:42
    中央となる半分のデータを示します。
  • 5:42 - 5:45
    このデータセットの
  • 5:45 - 5:52
    上半分と下半分の中央値の間にある値です。
  • 5:52 - 5:54
    この部分が箱ひげ図の
  • 5:54 - 5:55
    箱になります。
  • 5:55 - 6:00
    だから 2.5 から始まります。
  • 6:00 - 6:02
    基本的に第一四分位と
  • 6:02 - 6:05
    第二四分位を分けます。
  • 6:05 - 6:07
    最初の4分の1 にある数と
    2つ目の4分の1にある数を分けます。
  • 6:07 - 6:08
    ここになります。
  • 6:08 - 6:10
    これが2.5です。
  • 6:10 - 6:13
    2.5は0と5の中央で、
  • 6:13 - 6:15
    ここが 2.5になります。
  • 6:15 - 6:17
    そして、こちらには 12.5があります。
  • 6:17 - 6:22
    12.5 はここになります。
  • 6:22 - 6:25
    これは10です。
  • 6:25 - 6:29
    だから、ここが 10 と 15 の中央で
  • 6:29 - 6:32
    12.5 になります。
  • 6:32 - 6:33
    やっていきます。
  • 6:33 - 6:38
    ここが 12.5 です。
  • 6:38 - 6:40
    これにより第三四分位と
  • 6:40 - 6:41
    第四四分位が分かれます。
  • 6:41 - 6:44
    そして、この間を箱で囲み、
  • 6:44 - 6:47
    中央の半分の数がここに入ります。
  • 6:48 - 6:50
    次に実際の中央値を示します。
  • 6:50 - 6:52
    これはレストランの経営者が
  • 6:52 - 6:54
    実際に求めようとしていた
  • 6:54 - 6:55
    情報のひとつです。
  • 6:55 - 6:58
    来客の移動距離の中央値です。
  • 6:58 - 7:00
    中央値は6です。
  • 7:00 - 7:02
    ここに示します。
  • 7:02 - 7:06
    ここが6になります。
  • 7:06 - 7:08
    同じピンクを使用しましょう。
  • 7:08 - 7:12
    ここに6があります。
  • 7:12 - 7:15
    箱ひげ図のひげは
  • 7:15 - 7:17
    データの範囲を示します。
  • 7:17 - 7:21
    これは異なる色を使いましょう。
  • 7:21 - 7:22
    オレンジにします。
  • 7:22 - 7:24
    基本的にデータが
  • 7:24 - 7:26
    22まであることを示します。
  • 7:26 - 7:27
    ここまで広がっています。
  • 7:27 - 7:30
    22がここになります。
  • 7:30 - 7:33
    データは22までいきます。
  • 7:37 - 7:39
    下は1まで下がります。
  • 7:39 - 7:43
    1はここになります。
  • 7:43 - 7:44
    ラベルを付けます。
  • 7:44 - 7:45
    これが1です。
  • 7:45 - 7:48
    1まで下がります。
  • 7:48 - 7:48
    これで出来上がりです。
  • 7:48 - 7:50
    箱ひげ図ができました。
  • 7:50 - 7:52
    このようなグラフを見ると、
  • 7:52 - 7:54
    一見しただけで
  • 7:54 - 7:55
    中央値がなにかわかります。
  • 7:55 - 7:58
    箱の中央になります。
  • 7:58 - 7:59
    これでデータの中央がわかります。
  • 7:59 - 8:00
    そして、バラツキも
  • 8:00 - 8:02
    どこに寄っているか見れます。
  • 8:02 - 8:05
    そして、さらに
  • 8:05 - 8:08
    データの範囲も
  • 8:08 - 8:11
    一目で見れます。
  • 8:11 - 8:14
    だから、このグラフは
  • 8:14 - 8:17
    中央値とバラツキを理解するに便利です。
Title:
Constructing a box-and-whisker plot
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
08:18

Japanese subtitles

Revisions Compare revisions