Return to Video

箱ひげ図の読み方

  • 0:01 - 0:04
    ある生態学者が、地域の森にある木の樹齢を
  • 0:04 - 0:05
    100本調べた。
  • 0:05 - 0:08
    データを図示するために、
  • 0:08 - 0:10
    彼は以下の「箱ひげ図」を描いた。
  • 0:10 - 0:14
    調べた樹齢の範囲(range)はいくつだろう?
  • 0:14 - 0:17
    森の樹齢の中央値(median)は何だろう?
  • 0:17 - 0:18
    まず第一に、
  • 0:18 - 0:19
    「箱ひげ図」とは、
  • 0:19 - 0:21
    一体何なのかを理解しよう。
  • 0:21 - 0:24
    箱ひげ図は、樹齢のように
  • 0:24 - 0:26
    様々なデータの分布を見るために
  • 0:26 - 0:27
    用いられ、
  • 0:27 - 0:29
    中央値や、多くの木が
  • 0:29 - 0:30
    どのあたりの樹齢に位置するのか
  • 0:30 - 0:32
    といった情報を読み取ることが
  • 0:32 - 0:33
    できる。
  • 0:33 - 0:35
    まず「ひげ」の部分について。
  • 0:35 - 0:37
    この黒い部分がひげで、
  • 0:37 - 0:38
    こっちは箱、
  • 0:38 - 0:40
    こっちにもう一つ「ひげ」がある。
  • 0:40 - 0:42
    ひげは基本的に、全データが広がる範囲を
  • 0:42 - 0:44
    示す。
  • 0:44 - 0:46
    つまり、このサンプルで最も小さいデータは
  • 0:46 - 0:48
    樹齢8年だと分かる。
  • 0:48 - 0:51
    下の軸は年を表すとする。
  • 0:51 - 0:55
    そして最も高齢の木はここ、
  • 0:55 - 0:56
    50年と分かる。
  • 0:56 - 0:58
    だから範囲を求める時、
  • 0:58 - 1:00
    統計学的に「範囲」を考えると、
  • 1:00 - 1:02
    「最も大きいデータ 引く
  • 1:02 - 1:04
    最も小さいデータ」 となる。
  • 1:04 - 1:07
    よって 50 - 8 で
  • 1:07 - 1:10
    範囲は 42 だと分かる。
  • 1:10 - 1:11
    これが「ひげ」の意味だ。
  • 1:11 - 1:13
    全てのデータが、8〜50年の間に収まっていることが
  • 1:13 - 1:16
    読み取れる。ただし8,50を含む。
  • 1:16 - 1:19
    次に箱について。線の場所の意味は、
  • 1:19 - 1:22
    こう説明しよう。
  • 1:22 - 1:24
    真ん中にあるこの線は中央値だ。
  • 1:24 - 1:27
    ここが中央値(median)。
  • 1:27 - 1:31
    つまり半数はこの中央値より若い。
  • 1:31 - 1:33
    図より中央値は 21 だから、
  • 1:33 - 1:36
    半数の木が21歳より若く、
  • 1:36 - 1:39
    半数の木が21歳より高齢であることが、
  • 1:39 - 1:42
    箱ひげ図から読み取れる。
  • 1:42 - 1:45
    そして端っこの点は、
  • 1:45 - 1:47
    2つの区間それぞれの中央値だ。
  • 1:47 - 1:49
    つまりこの点は、
  • 1:49 - 1:51
    実際の中央値より低い木のみをー
  • 1:51 - 1:53
    全て取り出したうちの中央値だ。
  • 1:53 - 1:55
    この点は、21より若い木から取った
  • 1:55 - 1:57
    中央値なんだ。
  • 1:57 - 2:00
    こっちは、21より高齢のー
  • 2:00 - 2:02
    木からとった中央値だ。
  • 2:02 - 2:05
    これにより僕らは、
  • 2:05 - 2:08
    全てのデータを次の4グループに分けたことになる:
  • 2:08 - 2:11
    ここが第1四分位(first quartile)で、
  • 2:11 - 2:13
    これを Q1 としよう。
  • 2:13 - 2:15
    やっぱり 1Q にしよう。
  • 2:15 - 2:18
    これが第1四分位で、
  • 2:18 - 2:20
    木々の約1/4がここに属する。
  • 2:20 - 2:21
    そうなるように、木のデータをー
  • 2:21 - 2:23
    境界線に用いたのだから。
  • 2:23 - 2:25
    木々の約1/4がここに来て、
  • 2:25 - 2:28
    次の1/4は14〜21歳で、
  • 2:28 - 2:31
    もう1/4は21〜33歳で、
  • 2:31 - 2:33
    残りの1/4はこの四分位に来る。
  • 2:33 - 2:37
    これを第1四分位、第2四分位、
  • 2:37 - 2:40
    第3四分位、第4四分位と呼ぶ。
  • 2:40 - 2:42
    さて問に答えよう。
  • 2:42 - 2:44
    範囲はすでに求めたね。
  • 2:44 - 2:47
    最高齢と最年少の間には42年の開きがあり、
  • 2:47 - 2:50
    森の木々の年齢の中央値は
  • 2:50 - 2:51
    21だ。
  • 2:51 - 2:54
    中には50歳もある木が見つかったー
  • 2:54 - 2:55
    にもかかわらず、
  • 2:55 - 2:57
    森全体の中央値で見ると、
  • 2:57 - 2:59
    実は低い方にー
  • 2:59 - 3:03
    多く分布していたんだ。
  • 3:03 - 3:06
    だから中央値を代表値とみなせば、
  • 3:06 - 3:09
    たったの21歳になる。
  • 3:09 - 3:11
    次のことに注目しよう。
  • 3:11 - 3:12
    今回の中央値は箱の左側に近く、
  • 3:12 - 3:15
    ひげの右端よりも、
  • 3:15 -
    左端の方に近いんだ。
Title:
箱ひげ図の読み方
Description:

u08_l2_t1_we4 箱ひげ図の読み方

more » « less
Video Language:
English
Duration:
03:18

Japanese subtitles

Revisions