YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Japanese subtitles

← Impute Using Linear Regression

Get Embed Code
4 Languages

Showing Revision 1 created 05/21/2014 by K2480.

  1. 欠損値を補完する別の方法として
  2. 線形回帰分析によって欠損値を推定する方法があります
  3. 線形回帰については次のレッスンで詳しく扱いますが
  4. 考え方としては 既存の情報を使って
    欠損値を予測する方程式を作り
  5. その方程式を使って欠損値を補完するというものです
  6. 線形回帰のような手法を使う場合の欠点は
    何でしょうか?
  7. そのような手法で欠損値を補完する時の欠点の1つは
  8. データの中にすでに見られる傾向が
    強調されすぎることです
  9. 例えばメジャーリーグの選手の
    生年月日と身長の間に関係があるとしたら
  10. 補完された値によって
    その関係がより強調されることになります
  11. さらにこの手法では
    欠損値に対して明確な値を代入するため
  12. 実際よりも確実性の高い結果が出てしまいます
  13. ともあれ この野球選手のデータを使って
  14. 体重の欠損値を補完するためには
  15. 既存のデータを線形モデルで表します
  16. そのモデルを使って欠損値を補完することになります
  17. この野球のデータを使って
    体重の欠損値を補完するためには
  18. 既存のデータを線形モデルで表します
  19. つまりポジション、左打ちか右打ちか、
  20. 打率、生年月日、死亡年月日、身長、体重です
  21. そしてできたモデルを使って欠損値を補完するのです