0:00:00.494,0:00:07.699 では、統計学に入りましょう。 0:00:07.699,0:00:11.411 データの扱い方です。 0:00:11.411,0:00:14.531 統計とは、データです。 0:00:14.531,0:00:19.044 統計学を始めるにあたり、 0:00:19.044,0:00:23.615 記述的統計学と呼ばれるものを習いましょう。 0:00:23.615,0:00:29.728 多くのデータについて、それをすべて見ずに[br]何か示すことができるでしょうか? 0:00:29.728,0:00:34.196 大規模なデータを小数の数字で記述することが[br]できますか? 0:00:34.196,0:00:35.692 これが、この学習の焦点です。 0:00:35.692,0:00:39.096 記述的統計学を学んだ後で、 0:00:39.096,0:00:52.059 推測統計学に進むことができます。 0:00:52.059,0:00:55.130 では、まず、同様にデータを記述するか習いましょう。 0:00:56.760,0:01:03.808 数字のセットがあるとします。[br]これがデータです。 0:01:03.808,0:01:06.379 たとえば、庭の植物の高さを測ったとします。 0:01:06.379,0:01:08.897 6つの植物があり、その高さが 0:01:08.897,0:01:18.159 4、3、1、6、1、7インチとします。 0:01:18.159,0:01:23.097 この結果を知らない人が、植物の高さを聞いたとします。 0:01:23.097,0:01:33.829 何かすべての植物の高さを記述する数字を聞かれました。 0:01:33.829,0:01:36.907 どうすればいいでしょう? 0:01:36.907,0:01:44.427 中心を示す数字ではどうでしょう? 0:01:44.427,0:01:52.712 あるいは、頻繁な高さではどうでしょう?[br]あるいは、真ん中の高さではどうでしょう? 0:01:52.712,0:01:57.194 これらは、同じことをしています。 0:01:57.194,0:01:59.113 つまり、記述的統計学を行っています。 0:01:59.113,0:02:01.048 では、実際どうすればいいでしょう? 0:02:01.048,0:02:15.040 平均を考えましょう。[br]日常、平均はよく使用され、算術して得られる数です。 0:02:15.040,0:02:18.481 統計学では、平均はより一般的な意味があります。 0:02:18.481,0:02:38.897 それは、典型的な、あるいは、真ん中の数、[br]つまり、中心となる傾向を求めようとしています。 0:02:38.897,0:02:50.664 多くのデータが存在する場合、[br]平均、または中心となる数で、それを記述しようとします。 0:02:50.664,0:02:55.095 平均には、いろいろなものがあります。 0:02:55.095,0:03:03.865 まず、最も馴染みのあるものは、[br]算術的な試験の平均や、高さの平均です。 0:03:03.865,0:03:13.843 算術的に得られる平均です。 0:03:13.843,0:03:22.193 黄色で書きます。 0:03:22.193,0:03:26.761 これは、すべての数字を合計し 0:03:26.761,0:03:29.756 データ数で割った値です。 0:03:29.756,0:03:35.581 データ数で割った値です。 0:03:35.581,0:03:39.809 算術的な平均値とは何でしょう? 0:03:39.809,0:03:56.157 では、計算してみましょう。[br]4+3+1+6+1+7をデータ数の6で割ります。 0:03:56.157,0:04:14.776 4+3=7、7+1=8、8+6=14、14+1=15、15+7=22、これを6で割ります。 0:04:14.776,0:04:29.606 6は22に3回はいります。残りは4です。[br]34/6です。つまり、32/3です。あるいは3.6です。 0:04:29.606,0:04:40.768 どのように書いてもいいですが、[br]中心をとらえようとしている記述的な数値です。 0:04:40.768,0:04:44.043 これは、絶対的なものではなく、 0:04:44.043,0:04:50.345 このように、定義されたものです。 0:04:50.345,0:05:00.446 円周の計算のように絶対的なものではなく 0:05:00.446,0:05:04.440 便宜的に定義された数値です。 0:05:04.440,0:05:10.765 典型的な平均を求める他の方法もあります。 0:05:10.765,0:05:23.812 他の典型的な平均は、中央値で、ピンクで書きます。 0:05:23.812,0:05:28.024 中央に位置する値です。 0:05:28.024,0:05:32.764 すべての数を並べ替え、真ん中に置かれるのが[br]中央値です。 0:05:32.764,0:05:36.543 このデータセットでの中央値は何でしょう? 0:05:36.543,0:05:48.641 どれが中央値ですか? 0:05:48.641,0:05:52.691 1、1、3、4、6、7で[br]中央の値は何ですか? 0:05:52.691,0:06:02.765 偶数の数があるので、中央には[br]2つの値があります。 0:06:02.765,0:06:04.762 3と4です。 0:06:04.762,0:06:10.856 この場合は、この2つの値の真ん中を取ります。 0:06:10.856,0:06:14.842 この2つの値の平均値を見つけます。 0:06:14.842,0:06:25.096 この場合、3と4の真ん中は、3.5で、[br]つまり、中央値は3.5です。 0:06:25.096,0:06:31.946 偶数のデータ数の場合は、中央の2つの値の[br]平均値です。 0:06:31.946,0:06:35.761 基数のデータ数の場合は、単に中央に値です。 0:06:35.761,0:06:38.730 別のデータでやってみましょう。 0:06:38.730,0:06:41.829 これは、既に置き換えられたデータで、 0:06:41.829,0:06:57.723 0、0、7、50、10000、1000000です。 0:06:57.723,0:07:02.945 奇妙なデータですが、中央値は何ですか? 0:07:02.945,0:07:08.249 5つのデータがあるので、[br]中央の値を取ります。 0:07:08.249,0:07:14.476 中央値は、2つの値より大きく、2つの値より小さいです。 0:07:14.476,0:07:19.481 真ん中の値は、50です。 0:07:19.481,0:07:28.629 3つ目の中心の傾向の見つけ方は、最頻値です。[br]これは、先の2つに比べ、使用される機会が少ないです。 0:07:28.629,0:07:43.712 難しく聞こえますが[br]これは、最も多く見られる値を意味します。 0:07:43.712,0:07:47.879 ここでの、最頻値は何ですか?[br]すべての値が1度しか見られない場合、最頻値はありません。 0:07:47.879,0:08:05.280 このデータセットの最頻値は何ですか?[br]4、3、6、7は1つで、1は2つあります。 0:08:05.280,0:08:17.690 最もよく見受けられる値は最頻値なので、[br]ここでは、1です。 0:08:17.690,0:08:28.307 平均を求める異なった方法が分かりましたか?[br]これらはとても異なった方法です。 0:08:28.307,0:08:31.012 それぞれの平均は[br]統計学を習っていくと異なった場合に役にたちます。 0:08:31.012,0:08:33.508 これは、最も広く使用されます。 0:08:33.508,0:08:38.146 中央値は、奇妙な値が存在する場合に便利です。 0:08:38.146,0:08:45.647 最頻値は、値が複数存在する場合に便利です。 0:08:45.647,0:08:52.700 では、次のビデオをより深く習いましょう。