Japanese subtitles

← Non Normal Data

Get Embed Code
4 Languages

Showing Revision 1 created 05/21/2014 by K2480.

  1. t検定ではデータには正規性があると仮定していました
  2. 学習を進めていくと
    確率分布を見る機会が頻繁にあるでしょう
  3. ここに示したものや
    これとはまったく別のものもあります
  4. 検定には正規性のないデータにも
    利用できるものがあります
  5. その方法について見ていきましょう
  6. まずは扱うデータがガウス分布かどうかで
    正規性を確かめます
  7. 精度は低いですが釣鐘型曲線かどうかで
  8. 正規性を判断することもできます
  9. しかしこの2つよりも確実な方法があります
  10. 標本データが正規分布に従うかどうかを確かめる
  11. いくつかの検定方法があるのです
  12. その1つがシャピロ・ウィルク検定です
  13. 論理については詳しく説明しませんが
  14. SciPyでの実行方法を見ていきましょう
  15. 非常に簡単です
  16. W,p=scipy.stats.shapiro(data)と入力します
  17. ここのdataはあらゆるデータポイントを有する
    配列やリストです
  18. この関数が2つの値を返します
  19. Wはシャピロ・ウィルク検定の統計量を示します
  20. もう一つはpの値で
  21. t検定におけるpの値と同じ働きをします
  22. つまりデータが正規分布に従うという
    帰無仮説の検証において
  23. Wが最も極端な値であるかどうかの尤度を表します