1 00:00:00,494 --> 00:00:07,699 では、統計学に入りましょう。 2 00:00:07,699 --> 00:00:11,411 データの扱い方です。 3 00:00:11,411 --> 00:00:14,531 統計とは、データです。 4 00:00:14,531 --> 00:00:19,044 統計学を始めるにあたり、 5 00:00:19,044 --> 00:00:23,615 記述的統計学と呼ばれるものを習いましょう。 6 00:00:23,615 --> 00:00:29,728 多くのデータについて、それをすべて見ずに 何か示すことができるでしょうか? 7 00:00:29,728 --> 00:00:34,196 大規模なデータを小数の数字で記述することが できますか? 8 00:00:34,196 --> 00:00:35,692 これが、この学習の焦点です。 9 00:00:35,692 --> 00:00:39,096 記述的統計学を学んだ後で、 10 00:00:39,096 --> 00:00:52,059 推測統計学に進むことができます。 11 00:00:52,059 --> 00:00:55,130 では、まず、同様にデータを記述するか習いましょう。 12 00:00:56,760 --> 00:01:03,808 数字のセットがあるとします。 これがデータです。 13 00:01:03,808 --> 00:01:06,379 たとえば、庭の植物の高さを測ったとします。 14 00:01:06,379 --> 00:01:08,897 6つの植物があり、その高さが 15 00:01:08,897 --> 00:01:18,159 4、3、1、6、1、7インチとします。 16 00:01:18,159 --> 00:01:23,097 この結果を知らない人が、植物の高さを聞いたとします。 17 00:01:23,097 --> 00:01:33,829 何かすべての植物の高さを記述する数字を聞かれました。 18 00:01:33,829 --> 00:01:36,907 どうすればいいでしょう? 19 00:01:36,907 --> 00:01:44,427 中心を示す数字ではどうでしょう? 20 00:01:44,427 --> 00:01:52,712 あるいは、頻繁な高さではどうでしょう? あるいは、真ん中の高さではどうでしょう? 21 00:01:52,712 --> 00:01:57,194 これらは、同じことをしています。 22 00:01:57,194 --> 00:01:59,113 つまり、記述的統計学を行っています。 23 00:01:59,113 --> 00:02:01,048 では、実際どうすればいいでしょう? 24 00:02:01,048 --> 00:02:15,040 平均を考えましょう。 日常、平均はよく使用され、算術して得られる数です。 25 00:02:15,040 --> 00:02:18,481 統計学では、平均はより一般的な意味があります。 26 00:02:18,481 --> 00:02:38,897 それは、典型的な、あるいは、真ん中の数、 つまり、中心となる傾向を求めようとしています。 27 00:02:38,897 --> 00:02:50,664 多くのデータが存在する場合、 平均、または中心となる数で、それを記述しようとします。 28 00:02:50,664 --> 00:02:55,095 平均には、いろいろなものがあります。 29 00:02:55,095 --> 00:03:03,865 まず、最も馴染みのあるものは、 算術的な試験の平均や、高さの平均です。 30 00:03:03,865 --> 00:03:13,843 算術的に得られる平均です。 31 00:03:13,843 --> 00:03:22,193 黄色で書きます。 32 00:03:22,193 --> 00:03:26,761 これは、すべての数字を合計し 33 00:03:26,761 --> 00:03:29,756 データ数で割った値です。 34 00:03:29,756 --> 00:03:35,581 データ数で割った値です。 35 00:03:35,581 --> 00:03:39,809 算術的な平均値とは何でしょう? 36 00:03:39,809 --> 00:03:56,157 では、計算してみましょう。 4+3+1+6+1+7をデータ数の6で割ります。 37 00:03:56,157 --> 00:04:14,776 4+3=7、7+1=8、8+6=14、14+1=15、15+7=22、これを6で割ります。 38 00:04:14,776 --> 00:04:29,606 6は22に3回はいります。残りは4です。 34/6です。つまり、32/3です。あるいは3.6です。 39 00:04:29,606 --> 00:04:40,768 どのように書いてもいいですが、 中心をとらえようとしている記述的な数値です。 40 00:04:40,768 --> 00:04:44,043 これは、絶対的なものではなく、 41 00:04:44,043 --> 00:04:50,345 このように、定義されたものです。 42 00:04:50,345 --> 00:05:00,446 円周の計算のように絶対的なものではなく 43 00:05:00,446 --> 00:05:04,440 便宜的に定義された数値です。 44 00:05:04,440 --> 00:05:10,765 典型的な平均を求める他の方法もあります。 45 00:05:10,765 --> 00:05:23,812 他の典型的な平均は、中央値で、ピンクで書きます。 46 00:05:23,812 --> 00:05:28,024 中央に位置する値です。 47 00:05:28,024 --> 00:05:32,764 すべての数を並べ替え、真ん中に置かれるのが 中央値です。 48 00:05:32,764 --> 00:05:36,543 このデータセットでの中央値は何でしょう? 49 00:05:36,543 --> 00:05:48,641 どれが中央値ですか? 50 00:05:48,641 --> 00:05:52,691 1、1、3、4、6、7で 中央の値は何ですか? 51 00:05:52,691 --> 00:06:02,765 偶数の数があるので、中央には 2つの値があります。 52 00:06:02,765 --> 00:06:04,762 3と4です。 53 00:06:04,762 --> 00:06:10,856 この場合は、この2つの値の真ん中を取ります。 54 00:06:10,856 --> 00:06:14,842 この2つの値の平均値を見つけます。 55 00:06:14,842 --> 00:06:25,096 この場合、3と4の真ん中は、3.5で、 つまり、中央値は3.5です。 56 00:06:25,096 --> 00:06:31,946 偶数のデータ数の場合は、中央の2つの値の 平均値です。 57 00:06:31,946 --> 00:06:35,761 基数のデータ数の場合は、単に中央に値です。 58 00:06:35,761 --> 00:06:38,730 別のデータでやってみましょう。 59 00:06:38,730 --> 00:06:41,829 これは、既に置き換えられたデータで、 60 00:06:41,829 --> 00:06:57,723 0、0、7、50、10000、1000000です。 61 00:06:57,723 --> 00:07:02,945 奇妙なデータですが、中央値は何ですか? 62 00:07:02,945 --> 00:07:08,249 5つのデータがあるので、 中央の値を取ります。 63 00:07:08,249 --> 00:07:14,476 中央値は、2つの値より大きく、2つの値より小さいです。 64 00:07:14,476 --> 00:07:19,481 真ん中の値は、50です。 65 00:07:19,481 --> 00:07:28,629 3つ目の中心の傾向の見つけ方は、最頻値です。 これは、先の2つに比べ、使用される機会が少ないです。 66 00:07:28,629 --> 00:07:43,712 難しく聞こえますが これは、最も多く見られる値を意味します。 67 00:07:43,712 --> 00:07:47,879 ここでの、最頻値は何ですか? すべての値が1度しか見られない場合、最頻値はありません。 68 00:07:47,879 --> 00:08:05,280 このデータセットの最頻値は何ですか? 4、3、6、7は1つで、1は2つあります。 69 00:08:05,280 --> 00:08:17,690 最もよく見受けられる値は最頻値なので、 ここでは、1です。 70 00:08:17,690 --> 00:08:28,307 平均を求める異なった方法が分かりましたか? これらはとても異なった方法です。 71 00:08:28,307 --> 00:08:31,012 それぞれの平均は 統計学を習っていくと異なった場合に役にたちます。 72 00:08:31,012 --> 00:08:33,508 これは、最も広く使用されます。 73 00:08:33,508 --> 00:08:38,146 中央値は、奇妙な値が存在する場合に便利です。 74 00:08:38,146 --> 00:08:45,647 最頻値は、値が複数存在する場合に便利です。 75 00:08:45,647 --> 00:08:52,700 では、次のビデオをより深く習いましょう。