-
では、統計学に入りましょう。
-
データの扱い方です。
-
統計とは、データです。
-
統計学を始めるにあたり、
-
記述的統計学と呼ばれるものを習いましょう。
-
多くのデータについて、それをすべて見ずに
何か示すことができるでしょうか?
-
大規模なデータを小数の数字で記述することが
できますか?
-
これが、この学習の焦点です。
-
記述的統計学を学んだ後で、
-
推測統計学に進むことができます。
-
では、まず、同様にデータを記述するか習いましょう。
-
数字のセットがあるとします。
これがデータです。
-
たとえば、庭の植物の高さを測ったとします。
-
6つの植物があり、その高さが
-
4、3、1、6、1、7インチとします。
-
この結果を知らない人が、植物の高さを聞いたとします。
-
何かすべての植物の高さを記述する数字を聞かれました。
-
どうすればいいでしょう?
-
中心を示す数字ではどうでしょう?
-
あるいは、頻繁な高さではどうでしょう?
あるいは、真ん中の高さではどうでしょう?
-
これらは、同じことをしています。
-
つまり、記述的統計学を行っています。
-
では、実際どうすればいいでしょう?
-
平均を考えましょう。
日常、平均はよく使用され、算術して得られる数です。
-
統計学では、平均はより一般的な意味があります。
-
それは、典型的な、あるいは、真ん中の数、
つまり、中心となる傾向を求めようとしています。
-
多くのデータが存在する場合、
平均、または中心となる数で、それを記述しようとします。
-
平均には、いろいろなものがあります。
-
まず、最も馴染みのあるものは、
算術的な試験の平均や、高さの平均です。
-
算術的に得られる平均です。
-
黄色で書きます。
-
これは、すべての数字を合計し
-
データ数で割った値です。
-
データ数で割った値です。
-
算術的な平均値とは何でしょう?
-
では、計算してみましょう。
4+3+1+6+1+7をデータ数の6で割ります。
-
4+3=7、7+1=8、8+6=14、14+1=15、15+7=22、これを6で割ります。
-
6は22に3回はいります。残りは4です。
34/6です。つまり、32/3です。あるいは3.6です。
-
どのように書いてもいいですが、
中心をとらえようとしている記述的な数値です。
-
これは、絶対的なものではなく、
-
このように、定義されたものです。
-
円周の計算のように絶対的なものではなく
-
便宜的に定義された数値です。
-
典型的な平均を求める他の方法もあります。
-
他の典型的な平均は、中央値で、ピンクで書きます。
-
中央に位置する値です。
-
すべての数を並べ替え、真ん中に置かれるのが
中央値です。
-
このデータセットでの中央値は何でしょう?
-
どれが中央値ですか?
-
1、1、3、4、6、7で
中央の値は何ですか?
-
偶数の数があるので、中央には
2つの値があります。
-
3と4です。
-
この場合は、この2つの値の真ん中を取ります。
-
この2つの値の平均値を見つけます。
-
この場合、3と4の真ん中は、3.5で、
つまり、中央値は3.5です。
-
偶数のデータ数の場合は、中央の2つの値の
平均値です。
-
基数のデータ数の場合は、単に中央に値です。
-
別のデータでやってみましょう。
-
これは、既に置き換えられたデータで、
-
0、0、7、50、10000、1000000です。
-
奇妙なデータですが、中央値は何ですか?
-
5つのデータがあるので、
中央の値を取ります。
-
中央値は、2つの値より大きく、2つの値より小さいです。
-
真ん中の値は、50です。
-
3つ目の中心の傾向の見つけ方は、最頻値です。
これは、先の2つに比べ、使用される機会が少ないです。
-
難しく聞こえますが
これは、最も多く見られる値を意味します。
-
ここでの、最頻値は何ですか?
すべての値が1度しか見られない場合、最頻値はありません。
-
このデータセットの最頻値は何ですか?
4、3、6、7は1つで、1は2つあります。
-
最もよく見受けられる値は最頻値なので、
ここでは、1です。
-
平均を求める異なった方法が分かりましたか?
これらはとても異なった方法です。
-
それぞれの平均は
統計学を習っていくと異なった場合に役にたちます。
-
これは、最も広く使用されます。
-
中央値は、奇妙な値が存在する場合に便利です。
-
最頻値は、値が複数存在する場合に便利です。
-
では、次のビデオをより深く習いましょう。