箱ひげ図の読み方
-
0:01 - 0:04ある生態学者が、地域の森にある木の樹齢を
-
0:04 - 0:05100本調べた。
-
0:05 - 0:08データを図示するために、
-
0:08 - 0:10彼は以下の「箱ひげ図」を描いた。
-
0:10 - 0:14調べた樹齢の範囲(range)はいくつだろう?
-
0:14 - 0:17森の樹齢の中央値(median)は何だろう?
-
0:17 - 0:18まず第一に、
-
0:18 - 0:19「箱ひげ図」とは、
-
0:19 - 0:21一体何なのかを理解しよう。
-
0:21 - 0:24箱ひげ図は、樹齢のように
-
0:24 - 0:26様々なデータの分布を見るために
-
0:26 - 0:27用いられ、
-
0:27 - 0:29中央値や、多くの木が
-
0:29 - 0:30どのあたりの樹齢に位置するのか
-
0:30 - 0:32といった情報を読み取ることが
-
0:32 - 0:33できる。
-
0:33 - 0:35まず「ひげ」の部分について。
-
0:35 - 0:37この黒い部分がひげで、
-
0:37 - 0:38こっちは箱、
-
0:38 - 0:40こっちにもう一つ「ひげ」がある。
-
0:40 - 0:42ひげは基本的に、全データが広がる範囲を
-
0:42 - 0:44示す。
-
0:44 - 0:46つまり、このサンプルで最も小さいデータは
-
0:46 - 0:48樹齢8年だと分かる。
-
0:48 - 0:51下の軸は年を表すとする。
-
0:51 - 0:55そして最も高齢の木はここ、
-
0:55 - 0:5650年と分かる。
-
0:56 - 0:58だから範囲を求める時、
-
0:58 - 1:00統計学的に「範囲」を考えると、
-
1:00 - 1:02「最も大きいデータ 引く
-
1:02 - 1:04最も小さいデータ」 となる。
-
1:04 - 1:07よって 50 - 8 で
-
1:07 - 1:10範囲は 42 だと分かる。
-
1:10 - 1:11これが「ひげ」の意味だ。
-
1:11 - 1:13全てのデータが、8〜50年の間に収まっていることが
-
1:13 - 1:16読み取れる。ただし8,50を含む。
-
1:16 - 1:19次に箱について。線の場所の意味は、
-
1:19 - 1:22こう説明しよう。
-
1:22 - 1:24真ん中にあるこの線は中央値だ。
-
1:24 - 1:27ここが中央値(median)。
-
1:27 - 1:31つまり半数はこの中央値より若い。
-
1:31 - 1:33図より中央値は 21 だから、
-
1:33 - 1:36半数の木が21歳より若く、
-
1:36 - 1:39半数の木が21歳より高齢であることが、
-
1:39 - 1:42箱ひげ図から読み取れる。
-
1:42 - 1:45そして端っこの点は、
-
1:45 - 1:472つの区間それぞれの中央値だ。
-
1:47 - 1:49つまりこの点は、
-
1:49 - 1:51実際の中央値より低い木のみをー
-
1:51 - 1:53全て取り出したうちの中央値だ。
-
1:53 - 1:55この点は、21より若い木から取った
-
1:55 - 1:57中央値なんだ。
-
1:57 - 2:00こっちは、21より高齢のー
-
2:00 - 2:02木からとった中央値だ。
-
2:02 - 2:05これにより僕らは、
-
2:05 - 2:08全てのデータを次の4グループに分けたことになる:
-
2:08 - 2:11ここが第1四分位(first quartile)で、
-
2:11 - 2:13これを Q1 としよう。
-
2:13 - 2:15やっぱり 1Q にしよう。
-
2:15 - 2:18これが第1四分位で、
-
2:18 - 2:20木々の約1/4がここに属する。
-
2:20 - 2:21そうなるように、木のデータをー
-
2:21 - 2:23境界線に用いたのだから。
-
2:23 - 2:25木々の約1/4がここに来て、
-
2:25 - 2:28次の1/4は14〜21歳で、
-
2:28 - 2:31もう1/4は21〜33歳で、
-
2:31 - 2:33残りの1/4はこの四分位に来る。
-
2:33 - 2:37これを第1四分位、第2四分位、
-
2:37 - 2:40第3四分位、第4四分位と呼ぶ。
-
2:40 - 2:42さて問に答えよう。
-
2:42 - 2:44範囲はすでに求めたね。
-
2:44 - 2:47最高齢と最年少の間には42年の開きがあり、
-
2:47 - 2:50森の木々の年齢の中央値は
-
2:50 - 2:5121だ。
-
2:51 - 2:54中には50歳もある木が見つかったー
-
2:54 - 2:55にもかかわらず、
-
2:55 - 2:57森全体の中央値で見ると、
-
2:57 - 2:59実は低い方にー
-
2:59 - 3:03多く分布していたんだ。
-
3:03 - 3:06だから中央値を代表値とみなせば、
-
3:06 - 3:09たったの21歳になる。
-
3:09 - 3:11次のことに注目しよう。
-
3:11 - 3:12今回の中央値は箱の左側に近く、
-
3:12 - 3:15ひげの右端よりも、
-
3:15 -左端の方に近いんだ。
linoal.13 edited Japanese subtitles for Reading Box-and-Whisker Plots | ||
linoal.13 edited Japanese subtitles for Reading Box-and-Whisker Plots | ||
linoal.13 edited Japanese subtitles for Reading Box-and-Whisker Plots | ||
linoal.13 edited Japanese subtitles for Reading Box-and-Whisker Plots |