< Return to Video

Statistics intro: mean, median and mode

  • 0:00 - 0:07
    私たちはこれから「統計」の
    世界へと旅を始めます。
  • 0:07 - 0:11
    それは本当にデータについて
    理解する方法です。
  • 0:11 - 0:14
    つまり統計とは結局データに
    ついてです。
  • 0:14 - 0:19
    そして統計の世界への旅を
    始める時には,
  • 0:19 - 0:23
    まず,記述統計学と呼ばれるものに
    ついてたくさんやっていきます。
  • 0:23 - 0:25
    さて,私たちがたくさんの
    データを持っているとして,
  • 0:25 - 0:30
    データ全部を見せることなしに,
    そのデータについて何かを語りたい時,
  • 0:30 - 0:34
    そのデータをある少ない数のセットでどうにか記述できな
    いでしょうか?
  • 0:34 - 0:35
    それが私たちが焦点を
    あてたいことです。
  • 0:35 - 0:39
    そして,私たちが記述統計学の
    上にツールキットを作ったら,
  • 0:39 - 0:41
    データについて推計したり,
    何か結論を出したり,
  • 0:41 - 0:44
    何か判断したりしはじめる
    ことができるでしょう。
  • 0:44 - 0:51
    私たちは推計統計学について
    たくさんのことをしはじめ,推計をします。
  • 0:51 - 0:53
    これらは今は置いておき,
  • 0:53 - 0:56
    まずは,データをどうやって
    記述するかについて考えましょう。
  • 0:56 - 1:00
    まずは数のセットがあるとします。
  • 1:00 - 1:02
    これをデータと考えることができます。
  • 1:02 - 1:05
    たとえば,私たちの庭にある
    植物の高さを測ったとしましょう。
  • 1:05 - 1:07
    ここには 6 本の植物が
    あったとします。
  • 1:07 - 1:14
    そして高さは 4 インチ,3 インチ,
    1 インチ, 6 インチ,
  • 1:14 - 1:18
    そして,1 インチ, 7インチ
    だったとします。
  • 1:18 - 1:21
    そして,他の部屋にいる誰かが,
    あなたの植物は見ずに,
  • 1:21 - 1:24
    「あなたの植物の高さはどれくらい?」
    と尋ねたとします。
  • 1:24 - 1:26
    そしてその人は 1 つの数しか
    聞きたくないとします。
  • 1:26 - 1:30
    つまり,どうにかして,これらの
    植物全部を代表するような
  • 1:30 - 1:33
    1 つの数を知りたいのです。
  • 1:33 - 1:36
    どうしたらいいでしょうか?
  • 1:36 - 1:38
    そうですね。どうしたら
    いいでしょうか?
  • 1:38 - 1:41
    何かこの数のうち,
    よくあるものとか。
  • 1:41 - 1:44
    または,なんとかこの数の
    真ん中を表すような数。
  • 1:44 - 1:46
    たとえば,一番よく出てくる
    数かもしれません。
  • 1:46 - 1:48
    あるいは,これらの数
    全部の真ん中を
  • 1:48 - 1:51
    表すような数とかかもしれません。
  • 1:51 - 1:53
    もしあなたが,こういった
    ことを言ったとしたら,
  • 1:53 - 1:55
    実はあなたは記述統計学を
    最初に考えた人たちと
  • 1:55 - 1:58
    同じことをしています。
  • 1:58 - 2:00
    その人たちは,「どうしたら
    いいかな?」と言ったことでしょう。
  • 2:00 - 2:04
    そして「平均」という考えに
    ついて考えはじます。
  • 2:04 - 2:05
    「平均」。
  • 2:05 - 2:07
    ここで見ていきますが,
    毎日の言葉で
  • 2:07 - 2:09
    「平均」は特定の意味を持ちます。
  • 2:09 - 2:11
    多くの人が平均と言うと,
  • 2:11 - 2:15
    すぐ後で見ますが,算術平均に
    ついて言っています。
  • 2:15 - 2:18
    しかし統計学では,平均というのは,
    もっと一般の何かを言います。
  • 2:18 - 2:23
    それは,よく出てくるもの,中央のもの,
  • 2:23 - 2:29
    または,これらは「または」でつなぎます。
  • 2:30 - 2:34
    それは実際には中心傾向の
    測定をみつけることです。
  • 2:34 - 2:38
    「中心傾向」。
  • 2:38 - 2:40
    ではもう一度,あなたが
    たくさんの数を持っていて,
  • 2:40 - 2:44
    どうにかしてこれらを 1 個の数で
    表わそうとした時,それを平均と呼び,
  • 2:44 - 2:50
    それは,よくあるものか,真ん中か,
    これらの数の中央にある何かです。
  • 2:50 - 2:54
    これから,いろんなタイプの
    平均(Average)を見ていきます。
  • 2:54 - 2:56
    最初のものは多分あなたに
    一番身近なものでしょう。
  • 2:56 - 2:59
    それは,人々は「この試験の平均」,とか
  • 2:59 - 3:01
    「この植物の高さの平均」とか言います。
  • 3:01 - 3:03
    それは普通算術平均です。
  • 3:03 - 3:05
    書いてみましょう。
  • 3:05 - 3:13
    黄色で算術平均と書きます。
  • 3:13 - 3:19
    算術は名詞ですが,ここでは
    形容詞のように使います。
  • 3:19 - 3:21
    算術平均。
  • 3:21 - 3:25
    これは全部のデータの和を
    データの数で割ったものです。
  • 3:25 - 3:28
    これは人間が作った定義で,
    使い出があるものです。
  • 3:28 - 3:31
    これら数の全部の和ろ,
  • 3:31 - 3:34
    これらの数の数で割ります。
  • 3:34 - 3:39
    これが与えられたとして,この
    データセットの算術平均は何ですか?
  • 3:39 - 3:40
    計算してみましょう。
  • 3:40 - 3:47
    4 たす 3 たす 1 たす
    6 たす 1 たす 7 を
  • 3:47 - 3:51
    ここにあるデータポイントの
    数で割ります。
  • 3:51 - 3:53
    6 個のデータポイントがあります。
  • 3:53 - 3:55
    ですから 6 で割ります。
  • 3:55 - 4:02
    4 たす 3 は 7 で,たすことの
    1 は 8,たすことの 6 は 14,
  • 4:02 - 4:05
    たすことの 1 は 15,たすことの 7。
  • 4:05 - 4:08
    15 たす 7 は 22 に等しい。
  • 4:08 - 4:09
    もう一見確かめます。
  • 4:09 - 4:15
    7, 8, 14, 15, 22,
    これ全部を 6 で割る。
  • 4:15 - 4:17
    これは帯分数で書けます。
  • 4:17 - 4:21
    6 は 22 に 3 回あるので,
    あまりは 4 です。
  • 4:21 - 4:25
    すると,3 と 6 分の 4 です。
    それは,3 と 3 分の 2 と同じです。
  • 4:25 - 4:28
    これを小数で, 3.6 の
    循環と書くこともできます。
  • 4:28 - 4:32
    これは実は 3.6 の循環小数です。
  • 4:32 - 4:34
    わかっているのならどう
    書いてもいいです。
  • 4:34 - 4:36
    しかし,これはある意味
    データを代表する数です。
  • 4:36 - 4:40
    これは中心傾向を
    とらえようとしています。
  • 4:40 - 4:41
    繰り返しますが,これは
    人の作ったものです。
  • 4:41 - 4:46
    誰かが,これは宗教の書物とかで,
  • 4:46 - 4:48
    算術平均はこうして計算する
    ように定義されなくてはならない,
  • 4:48 - 4:49
    というものではありません。
  • 4:49 - 4:53
    また,宇宙を研究する時に
    考える,円の周長を求める,
  • 4:53 - 4:58
    みたいな純粋な
    計算でもありません。
  • 4:58 - 5:00
    円周とかは宇宙を
    研究すると出てきます。
  • 5:00 - 5:02
    算術平均は人間の作った定義で,
  • 5:02 - 5:04
    いろいろ使い道があります。
  • 5:04 - 5:07
    さて,平均,よくあるもの,
    真ん中の値とかを求めるには
  • 5:07 - 5:10
    他の方法もあります。
  • 5:10 - 5:14
    よくある他の方法には
    中央値,メジアンがあります。
  • 5:14 - 5:15
    中央値と書いとおきます。
  • 5:15 - 5:16
    もう色がないですね。
  • 5:16 - 5:18
    これはピンクで書きます。
  • 5:18 - 5:21
    さて,中央値です。
  • 5:21 - 5:25
    中央値とは,文字通り,
    真ん中の数を探します。
  • 5:25 - 5:27
    もしこれらの数を
    全部順番に並べて,
  • 5:27 - 5:31
    真ん中の数をみつけたら,
    それが中央値です。
  • 5:31 - 5:35
    では,この数のセットの
    中央値は何でしょうか?
  • 5:36 - 5:37
    求めてみましょう。
  • 5:37 - 5:38
    まずは順番に並べましょう。
  • 5:38 - 5:39
    1 があって,
  • 5:40 - 5:41
    もう 1 個 1 があります。
  • 5:41 - 5:43
    それから 3 があり,
  • 5:43 - 5:46
    4,6, そして 7 です。
  • 5:46 - 5:48
    これらの数を並びかえました。
  • 5:48 - 5:51
    では何が真ん中の数ですか?
  • 5:51 - 5:52
    ここを見ます。
  • 5:52 - 5:55
    ここには偶数の数の数があります。
    6 個の数があります。
  • 5:55 - 5:57
    すると中央の数はありません。
  • 5:57 - 5:59
    実は 2 個の中央の数があります。
  • 5:59 - 6:02
    ここに,2 個の中央の数があります。
  • 6:02 - 6:03
    3 と 4 です。
  • 6:03 - 6:06
    この場合のように 2 個の
    中央の数がある時には,
  • 6:06 - 6:09
    これら 2 個の数の間をとります。
  • 6:09 - 6:14
    中央値を求めるには,これら
    2 個の数の算術平均をとります。
  • 6:14 - 6:19
    すると中央値は 3 と 4 の間,
    つまり 3.5 になります。
  • 6:19 - 6:24
    するとこの場合には
    中央値は 3.5 です。
  • 6:24 - 6:26
    もし偶数の数の数が
    あった場合には,
  • 6:26 - 6:28
    中央値は,真ん中の 2 個の
    数の算術平均をとります
  • 6:28 - 6:31
    あるいは,真ん中の 2 個の
    数の真ん中の値をとります。
  • 6:31 - 6:34
    もし数の数が奇数なら,
    もっと簡単です。
  • 6:34 - 6:37
    その場合には,そうですね,
    他のデータセットを考えましょう。
  • 6:37 - 6:38
    データセットは,
  • 6:38 - 6:43
    最初から順番に並べますが,
  • 6:43 - 6:55
    0,7,50, どうしますかね,
    1 万,100 万とします。
  • 6:55 - 6:57
    これがデータセットだとしましょう。
  • 6:57 - 6:58
    ちょっとおかしなデータ
    セットかもしれません。
  • 6:58 - 7:02
    しかしこの場合,中央値は
    何になりますか?
  • 7:02 - 7:04
    ここには 5 個の数があります。
  • 7:04 - 7:05
    数の数は奇数です。
  • 7:05 - 7:07
    すると,真ん中を
    取るのは簡単です。
  • 7:07 - 7:12
    真ん中は,こちらの 2 個の
    数よりも大きくて,
  • 7:12 - 7:13
    こちらの 2 個の数よりも
    小さいものです。
  • 7:13 - 7:14
    これは丁度真ん中にあります。
  • 7:14 - 7:19
    するとこの場合,
    中央値は 50 です。
  • 7:19 - 7:20
    さて,3 番目の中心傾向は,
  • 7:20 - 7:22
    多分日常生活では,
    一番使わないでしょうが,
  • 7:22 - 7:26
    モード,最頻値です。
  • 7:26 - 7:28
    これは結構忘れられて
    いるのではないでしょうか。
  • 7:28 - 7:30
    何か複雑な響きがあります。
  • 7:30 - 7:33
    しかし,これはとても
    素直な考えです。
  • 7:33 - 7:36
    ある意味,一番基本の
    考えとも言えます。
  • 7:36 - 7:40
    最頻値は,データセットの
    中の一番よくある数のことです。
  • 7:40 - 7:42
    もし一番よく出てくる数が
    あるのならば,です。
  • 7:42 - 7:43
    全部の数が等しく表われたり,
  • 7:44 - 7:45
    一番よく出てくる数が
    1 つに決まらない場合,
  • 7:45 - 7:47
    最頻値はありません。
  • 7:47 - 7:50
    しかし,最頻値の定義が
    そう与えられたとして,
  • 7:50 - 7:54
    この元のデータセットに一番良く
    出てくる 1 個の数は何でしょうか?
  • 7:54 - 7:58
    このデータセットです。
  • 7:58 - 8:00
    4 は 1 個しかありません。
  • 8:00 - 8:01
    3 は 1 個しかありません。
  • 8:01 - 8:03
    しかし 1 は 2 個あります。
  • 8:03 - 8:05
    6 も 7 も 1 個だけです。
  • 8:05 - 8:11
    ここで一番良く出てくる数は 1 です。
  • 8:11 - 8:14
    最頻値は,一番普通にある数,
    一番良く出てくる数で,
  • 8:14 - 8:17
    ここでは 1 です。
  • 8:17 - 8:19
    さて,これらがよくあるもの,
    中央のもの,中心傾向を
  • 8:19 - 8:23
    求める方法です。
  • 8:23 - 8:25
    しかしそれぞれはまったく
    違う方法です。
  • 8:25 - 8:27
    もっと学び,もっと統計をやっていくと,
  • 8:27 - 8:29
    これらはそれぞれ違う利用法が
    あるとわかるでしょう。
  • 8:29 - 8:31
    これが最も使われるものです。
  • 8:31 - 8:34
    中央値はこんなふうに算術平均が
    ゆがんでしまうような,
  • 8:34 - 8:38
    変なデータセットの時に
    とても良いです。
  • 8:38 - 8:41
    最頻値(モード)は,
  • 8:41 - 8:46
    特に 1 つの数がよく出てくる
    場合にとても使い出があります。
  • 8:46 - 8:47
    とにかく今回はここまでにしましょう。
  • 8:47 - 8:50
    そして,次のいくつかの
    ビデオでは統計について
  • 8:50 - 8:53
    もっと深く見ていきましょう。
Title:
Statistics intro: mean, median and mode
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
08:54

Japanese subtitles

Revisions Compare revisions