では、統計学に入りましょう。 データの扱い方です。 統計とは、データです。 統計学を始めるにあたり、 記述的統計学と呼ばれるものを習いましょう。 多くのデータについて、それをすべて見ずに 何か示すことができるでしょうか? 大規模なデータを小数の数字で記述することが できますか? これが、この学習の焦点です。 記述的統計学を学んだ後で、 推測統計学に進むことができます。 では、まず、同様にデータを記述するか習いましょう。 数字のセットがあるとします。 これがデータです。 たとえば、庭の植物の高さを測ったとします。 6つの植物があり、その高さが 4、3、1、6、1、7インチとします。 この結果を知らない人が、植物の高さを聞いたとします。 何かすべての植物の高さを記述する数字を聞かれました。 どうすればいいでしょう? 中心を示す数字ではどうでしょう? あるいは、頻繁な高さではどうでしょう? あるいは、真ん中の高さではどうでしょう? これらは、同じことをしています。 つまり、記述的統計学を行っています。 では、実際どうすればいいでしょう? 平均を考えましょう。 日常、平均はよく使用され、算術して得られる数です。 統計学では、平均はより一般的な意味があります。 それは、典型的な、あるいは、真ん中の数、 つまり、中心となる傾向を求めようとしています。 多くのデータが存在する場合、 平均、または中心となる数で、それを記述しようとします。 平均には、いろいろなものがあります。 まず、最も馴染みのあるものは、 算術的な試験の平均や、高さの平均です。 算術的に得られる平均です。 黄色で書きます。 これは、すべての数字を合計し データ数で割った値です。 データ数で割った値です。 算術的な平均値とは何でしょう? では、計算してみましょう。 4+3+1+6+1+7をデータ数の6で割ります。 4+3=7、7+1=8、8+6=14、14+1=15、15+7=22、これを6で割ります。 6は22に3回はいります。残りは4です。 34/6です。つまり、32/3です。あるいは3.6です。 どのように書いてもいいですが、 中心をとらえようとしている記述的な数値です。 これは、絶対的なものではなく、 このように、定義されたものです。 円周の計算のように絶対的なものではなく 便宜的に定義された数値です。 典型的な平均を求める他の方法もあります。 他の典型的な平均は、中央値で、ピンクで書きます。 中央に位置する値です。 すべての数を並べ替え、真ん中に置かれるのが 中央値です。 このデータセットでの中央値は何でしょう? どれが中央値ですか? 1、1、3、4、6、7で 中央の値は何ですか? 偶数の数があるので、中央には 2つの値があります。 3と4です。 この場合は、この2つの値の真ん中を取ります。 この2つの値の平均値を見つけます。 この場合、3と4の真ん中は、3.5で、 つまり、中央値は3.5です。 偶数のデータ数の場合は、中央の2つの値の 平均値です。 基数のデータ数の場合は、単に中央に値です。 別のデータでやってみましょう。 これは、既に置き換えられたデータで、 0、0、7、50、10000、1000000です。 奇妙なデータですが、中央値は何ですか? 5つのデータがあるので、 中央の値を取ります。 中央値は、2つの値より大きく、2つの値より小さいです。 真ん中の値は、50です。 3つ目の中心の傾向の見つけ方は、最頻値です。 これは、先の2つに比べ、使用される機会が少ないです。 難しく聞こえますが これは、最も多く見られる値を意味します。 ここでの、最頻値は何ですか? すべての値が1度しか見られない場合、最頻値はありません。 このデータセットの最頻値は何ですか? 4、3、6、7は1つで、1は2つあります。 最もよく見受けられる値は最頻値なので、 ここでは、1です。 平均を求める異なった方法が分かりましたか? これらはとても異なった方法です。 それぞれの平均は 統計学を習っていくと異なった場合に役にたちます。 これは、最も広く使用されます。 中央値は、奇妙な値が存在する場合に便利です。 最頻値は、値が複数存在する場合に便利です。 では、次のビデオをより深く習いましょう。