0:00:00.000,0:00:05.004 ハイ。Statics Oneへお帰りなさい。[br]今日のトピックはメディエーション(媒介)分析。 0:00:05.004,0:00:10.022 この前の幾つかで重回帰分析について詳細に扱った。 0:00:10.022,0:00:15.053 最初は概念的に重回帰を学び、 0:00:15.053,0:00:20.000 そこで回帰方程式に複数の回帰係数がある時に 0:00:20.000,0:00:25.017 それをどう解釈するかを学んだ。[br]そして行列の代数について見ていき、 0:00:25.017,0:00:30.061 一つの方程式で複数の予測変数の回帰係数を一度に 0:00:30.061,0:00:35.085 計算出来るようになった。[br]今日のレクチャーとこの後の2つのレクチャーでやっていく事は、 0:00:35.085,0:00:41.014 社会科学の分野で特に人気な特定の種類の重回帰分析について 0:00:41.014,0:00:46.023 より詳しく見ていく。[br]今日のレクチャー10ではメディエーション分析をやっていく。 0:00:46.023,0:00:50.097 次のレクチャー11ではモデレーション分析をやっていく。 0:00:50.097,0:00:56.074 そしてレクチャー12では媒介分析とモデレーション分析を両方 0:00:56.074,0:01:02.084 Rでやっていく。そういう訳で今日のフォーカスはメディエーション分析。[br]そして今日のレクチャーは2つのセグメントに分けた。 0:01:02.084,0:01:08.011 最初のセグメントではメディエーション分析をするのに、 0:01:08.011,0:01:13.018 いわゆる回帰アプローチを取る。[br]2つ目のセグメントではパスモデル、または 0:01:13.018,0:01:18.071 パス分析と呼ばれるアプローチを取る。[br]最初のセグメントでは 0:01:18.071,0:01:28.082 メディエーション分析をする為に回帰アプローチだけでいく。[br]最初にメディエーションとモデレーションの違いを 0:01:28.082,0:01:33.074 はっきりさせたい。[br]というのは、このトピックをこれまで 0:01:33.074,0:01:39.007 大学院のコースで何度も教えてきたけれど、、、[br]そうそう、 0:01:39.007,0:01:44.067 普段入門コースではこの話はしないけど、 0:01:44.067,0:01:50.020 Satics Oneでは入れる事にした、とても良く使われる手法だからね。 0:01:50.020,0:01:55.068 あー、そうだ。で、大学院レベルのコースで何度も教えてきたのだが、 0:01:55.068,0:02:00.047 多くの院生がメディエーション(媒介)とモデレーションの区別をつけるのに苦労してる。 0:02:00.047,0:02:05.045 どっちの分析がある種類のデザインや 0:02:05.045,0:02:10.024 検証したい仮説に適切なのか?[br]だから最初にこの区別をクリアにしておきたい。 0:02:10.024,0:02:15.050 メディエーションとモデレーション。[br]既に述べたように、今日は 0:02:15.050,0:02:20.057 メディエーションについて話す。次のレクチャーでモデレーション。[br]その次に両方を一緒にRでやる。 0:02:20.057,0:02:26.073 その区別をする為に、これら2つの丁度よい絵がある。 0:02:26.073,0:02:32.025 メディエーション(媒介)やメディエータという言葉の意味について考えてみてくれ。 0:02:32.025,0:02:38.016 この絵が描いているのは、この真ん中の所、メディエータ(調停人)の人がいる。 0:02:38.016,0:02:44.038 これら2つの異なる意見を持つ人がコミュニケートして、 0:02:44.038,0:02:50.052 この真ん中の人がこの二人の人の仲を取り持つ。 0:02:50.052,0:02:56.087 統計的には、我々がやるのは、2つの相関があるかもしれない変数を 0:02:56.087,0:03:02.099 調べる、という事。例えばXとYとする。[br]そんな例をここまでたくさん見てきた。 0:03:02.099,0:03:09.012 そこではXとYの相関を見てきた。 0:03:09.012,0:03:14.088 そこからさらに、もう一つの変数が見つけられるかを見てみる、という所が新しい。[br]それをMと呼ぼう。それがXとYの関係を 0:03:14.088,0:03:21.078 メディエート(仲介)している。[br]もしそれが見つけられるなら、XとYをつなぐメカニズムについて、 0:03:21.078,0:03:28.008 何かが言える。[br]そんな訳でこれは社会科学で人気の手法だ。 0:03:28.008,0:03:33.057 何故ならたくさんの社会科学の領域で、 0:03:33.057,0:03:38.084 彼らは観察研究に依拠せざるを得ない。[br]彼らはランダム化実験が出来ない。 0:03:38.084,0:03:44.004 だからこの相関から因果を推測する問題がある。 0:03:44.004,0:03:49.045 もし、メディエーションを示す事が出来たら、ちょっとだけ 0:03:49.045,0:03:55.037 強い因果の議論に近づける。[br]それがただの相関だけなら、まだそこまでは行けない。 0:03:55.037,0:04:03.048 でもそれは、モデレーションと区別するのには役に立つ。 0:04:03.048,0:04:10.064 ここに、画像の下の所でモデレートしている絵がある。 0:04:10.064,0:04:16.044 モデレータ(議長)は議論の全体をコントロールする。[br]モデレータはこの人間達の 0:04:16.044,0:04:22.066 一人の人に直接影響を与える。 0:04:22.066,0:04:29.023 統計的に変数同士の関係と同様に。[br]だからもしXとYに相関がある、と我々が言っても、 0:04:29.023,0:04:36.048 モデレータは、 0:04:36.048,0:04:42.027 いや、私の屋根の下ではそんなの無い、と言ったり出来る。[br]または、その相関を増加させよう、 0:04:42.027,0:04:47.098 その関係はとても重要と私が思うから、と言ったりも出来る。[br]つまりモデレータは他の関係に影響を与えたり、 0:04:47.098,0:04:56.070 制御したりする。[br]たくさんの院生はこのメディエーション分析や 0:04:56.070,0:05:01.050 モデレーション分析で頭を悩ませるが、私の考えではそれは、 0:05:01.050,0:05:06.092 それはたくさんの要素を詰めすぎるからだ。[br]だから私はこのナイスで短い省略形、 0:05:06.092,0:05:11.091 高校のサッカーコーチが良く私に言った、KISS (Keep It Simple, Stupid, シンプルにしておく方が良いという諺) 0:05:11.091,0:05:16.077 に立ち戻る。[br]試合を大げさにやり過ぎたり、何かについて喧嘩しすぎたときには 0:05:16.077,0:05:21.039 彼はいつも、「KISSの法則を使え」と言った。[br]シンプルにしておきなさい。 0:05:21.039,0:05:25.095 KISSの法則を使え。[br]ここでは我々は四つの変数しか扱わない。 0:05:25.095,0:05:30.014 これはそんなに複雑じゃない。[br]コースの後半では四つの変数よりももっと多くの 0:05:30.014,0:05:33.081 デザインをする事になる。[br]Statics Oneより先のコースまで行くと、 0:05:33.081,0:05:39.046 もっと複雑なデータセットを扱う事になる。 0:05:39.046,0:05:46.017 でもここでは多くとも4つの変数だけ。[br]このメディエーション分析では三変数のみ。 0:05:46.017,0:05:52.013 シンプルに保て。[br]4つの変数だけある。XとYをこれまで同様 0:05:52.013,0:05:57.018 予測変数と結果変数を表すのに使う。[br]この例で、このセグメントでは、 0:05:57.018,0:06:02.035 予測変数と結果変数を使っていくが、 0:06:02.035,0:06:07.026 Xを本当の意味での独立変数、 0:06:07.026,0:06:12.050 ランダム化実験の物として使い、その上でメディエーション分析を行う、という事も考えられるのは 0:06:12.050,0:06:17.061 心にとめておきなさい。[br]そして実際Rでメディエーション分析を実演するレクチャーでは、そうする。 0:06:17.061,0:06:22.074 しかしここでは、それらを予測変数と結果変数に留めておく。[br]Mをメディエーターとして使う。 0:06:22.074,0:06:29.079 Zはモデレータ変数。[br]この最初のセグメントで扱う例は、 0:06:29.079,0:06:35.050 Xを何らかの心理学的特性、たとえば外向性として、 0:06:35.050,0:06:40.060 それが幸福と相関しているか、という物。[br]実際多くの研究で真と出てる。 0:06:40.060,0:06:45.082 正の相関が見て取れる。[br]つまりより外向的な方が、 0:06:45.082,0:06:50.081 より幸せ、と異なる種類の尺度で出てる。[br]ではどんなメディエーターや 0:06:50.081,0:06:56.034 メカニズムが考えられるか?[br]今このデータを作り上げた。 0:06:56.034,0:07:02.025 私はRでデータをシミュレートした。[br]一つ考えられるメカニズムは、 0:07:02.025,0:07:08.030 単に人生経験が多様なだけ、という物。[br]もしあなたが外向的なら、より幅広い経験を得るかもいれない。 0:07:08.030,0:07:13.091 より多様な人生経験。 0:07:13.091,0:07:19.067 それらは相関があるかもしれず、それが結果としてより幸福なのかも。 0:07:19.067,0:07:24.037 次のレクチャーでやる事としては、今日はこの変数には関与しませんが、 0:07:24.037,0:07:29.002 それは、その関係にモデレータ変数を考えてみる事だ。 0:07:29.002,0:07:35.078 つまり、社会経済的なステータスがその関係をモデレートしてるかもしれない。 0:07:35.078,0:07:40.058 つまり、この絵に描いたように、外向性が 0:07:40.058,0:07:46.025 幸福と正に相関するのは、SCS(社会経済的ステータス)が高い人だけにあてはまるのかもしれない。 0:07:46.025,0:07:50.091 SCSが低い、もの凄く低いと、 0:07:50.091,0:07:56.031 外向的で様々な人生の経験を積んでいると、 0:07:56.031,0:08:01.072 負の人生経験を積む事になり、より低い幸福度になるかも。[br]だから社会経済的なステータスは、 0:08:01.072,0:08:07.056 その関係をモデレートするかもしれない、メディエートではなく。(モデレートは仕切る感じでメディエートは調整する感じ) 0:08:07.056,0:08:12.092 さて、メディエーション分析をする時は、 0:08:12.092,0:08:18.084 XとYが相関する事を知っていて、しかしより踏み込んで何故その相関が存在するかを 0:08:18.084,0:08:24.048 知りたい時だ。[br]それらの変数が何故相関しているか? 0:08:24.048,0:08:30.061 何故それらの変数が相関しているかのメカニズムを説明出来るか?[br]我々は既に単回帰から、少し前の講義でやったように、 0:08:30.061,0:08:35.084 XとYが相関していると、XからYが予測出来る。 0:08:35.084,0:08:43.092 そしてここに単回帰の方程式がある。[br]今メディエータ変数を追加すると、 0:08:43.092,0:08:50.014 結果として3つの回帰式を得る事になる。 0:08:50.014,0:08:56.036 その内2つを見ていく。[br]最初の式で、メディエータ変数「から」 0:08:56.036,0:09:02.052 予測出来る。[br]二番目はメディエータ変数「を」Xから予測出来る。 0:09:02.052,0:09:08.019 つまり最初の回帰式ではこの部分を取り除いた。 0:09:08.019,0:09:14.018 Yをメディエータから予測出来る、と言っている。[br]二番目の回帰式では、 0:09:14.018,0:09:19.043 この部分を取り除いた。[br]この式で言っているのは、 0:09:19.043,0:09:25.044 メディエータをXから予測出来る、という事。[br]しかしこの、パス図の全体を取り込む為には、 0:09:25.044,0:09:32.064 そしてそれは次のセグメントでやる事でもあるが、しなくてはいけない事は、 0:09:32.064,0:09:41.033 両方の予測変数を一つの回帰方程式に入れる事。[br]これがいわば、フルのモデルだ。 0:09:41.033,0:09:48.047 メディエーターと元の予測変数が両方入ってる。 0:09:48.047,0:09:55.020 そこで質問は、メディエータを追加した後には 0:09:55.020,0:10:02.099 Xの予測の妥当性または予測の価値に、何が起こるか?という事。[br]もしXとYがメディエータの為に相関していたのなら、 0:10:02.099,0:10:09.039 このスライドで言ったように、という事だが、もしそうなら、Xはもはや有意では無いはず。 0:10:09.039,0:10:15.097 何故ならYの変動の内Xが寄与している部分は全て 0:10:15.097,0:10:22.097 メディエータが説明しているはずだから。[br]だからXはもはやYの有意な予測変数では無くなっているはず。 0:10:22.097,0:10:29.055 質問に答える為にこの下を見る。[br]回帰係数B2はもはや、 0:10:29.055,0:10:39.021 有意では無い、もしフルのメディエーションのケースなら。[br]しかし、こういう可能性も考えられる。 0:10:39.021,0:10:45.031 B2、つまりXの回帰係数はいまだ有意だが、 0:10:45.031,0:10:51.028 より小さく、弱くなっている、というケース、 0:10:51.028,0:10:56.087 それのみで回帰式に入っていた時よりも。 0:10:56.087,0:11:02.030 その場合は、パーシャルなメディエーションだという証拠を得た事になる。[br]つまりメディエーション分析をした時には、 0:11:02.030,0:11:07.037 3通りの結果の可能性がある。[br]メディエーションの証拠が全く得られない場合、 0:11:07.037,0:11:12.038 またはフルの証拠が得られる場合、[br]そうでなければ、部分的な証拠だけが得られる場合がある。 0:11:12.038,0:11:18.020 その例をお見せしよう。[br]繰り返しになるが、ここに赤文字で注意を置いた。 0:11:18.020,0:11:24.018 次のセグメントでは、これらのパスモデルを描いていくが、 0:11:24.018,0:11:30.031 そこでは矢印は普通は因果関係を表す。[br]でも少なくともこの例に関しては、 0:11:30.031,0:11:35.067 単にデータの相関を扱っているに過ぎない。[br]だから 0:11:35.067,0:11:41.070 相関関係が因果関係を意味しない、という標語は引き続き当てはまる。[br]さらに、この大学院レベルのクラスで言っておきたいのは、 0:11:41.070,0:11:47.046 統計的なメディエーションと真の因果的なメディエーションには 0:11:47.046,0:11:52.087 大きな違いがあるということである。[br]したがって、統計的な意味で完全なメディエーションの[br]証拠を得られたかもしれない。 0:11:52.087,0:11:57.055 しかし、単なるクロスセクションの相関データを[br]扱っているにすぎないのであれば、 0:11:57.055,0:12:03.041 因果性に関する強い主張を何かできている、[br]というわけではない。 0:12:03.041,0:12:10.004 オーケー。[br]では実際にどうメディエーションをどう検証して 0:12:10.004,0:12:16.056 実装するか?それは3つの回帰モデルを実行していく事によって。[br]レクチャー12で 0:12:16.056,0:12:22.083 ステップバイステップでRでスクリプトを書きながらやる。[br]ここでは、ただ駆け足で軽く見ていくだけに留める。 0:12:22.083,0:12:28.014 これらが実行したい3つの回帰方程式だ。 0:12:28.014,0:12:33.037 lmはRの関数で、LinearModel(線形モデル)を表す。[br]一つは、ただ単純に 0:12:33.037,0:12:38.061 XとYの直接の関係を示す。[br]明らかにメディエートとは 0:12:38.061,0:12:43.098 関係が無くてはならない。[br]それを確認する為、Xとメディエータの関係を見る。 0:12:43.098,0:12:50.089 その後、このフルのモデルを実行する。[br]問題は予測変数の妥当性、つまり 0:12:50.089,0:13:02.000 Xの予測における価値が、Mを加えた後でどうなるか。 0:13:02.000,0:13:07.020 フルのメディエーションを得る為に、最初はこの2つを見る。[br]この最初の2つの単回帰の方程式。 0:13:07.020,0:13:12.058 明らかに、Xは有意な予測変数であって欲しい。 0:13:12.058,0:13:17.084 メディエーション分析をするには、まずXが有意な予測変数でなくてはならない。 0:13:17.084,0:13:23.036 XはYの有意な予測変数でなくてはならない。[br]XはMの有意な予測変数である必要もある。 0:13:23.036,0:13:28.062 それらが前提条件。[br]もし成り立たなければ、メディエーション分析は出来ない。 0:13:30.056,0:13:37.027 この最後の回帰方程式では、Mは有意であるべき。[br]Xがどうあるべきかは、いろいろ有り得る。 0:13:37.027,0:13:42.055 Xが有意で無くなるなら、 0:13:42.055,0:13:48.021 0になるなら、それはフルのメディエーションである、という証拠となる。 0:13:48.021,0:13:54.039 つまり、Xの直接効果は完全に消えてしまった。 0:13:54.039,0:13:59.098 だが有意なメディエーターに対してもXは有意のままたりえる。[br]その場合はパーシャル(部分的)なメディエーションである、という証拠となる。 0:13:59.098,0:14:07.014 この例に戻って、幾つかの数字を実際に見て、 0:14:07.014,0:14:14.038 もっと具体的にしていこう。[br]前にも言った通り、 0:14:14.038,0:14:19.030 Rでデータを作った。[br]これらはシミュレートしたデータ。188人の被験者が居て、 0:14:19.030,0:14:24.042 これはナイスな大きな例だ、で、彼らを調査している。[br]このレクチャーでは社会経済的なステータスは 0:14:24.042,0:14:29.090 空白のままにしてある。[br]それは次のレクチャーで。 0:14:29.090,0:14:35.053 この時点では3つの指標だけある。[br]幸福、外向性、人生経験の多様性。 0:14:35.053,0:14:40.079 それらのスコアは単純に1から5までの尺度とする。 0:14:40.079,0:14:46.064 より高いスコアはより幸せ、より外向的、より多様な人生経験。 0:14:46.064,0:14:52.092 これら3つが全て正の相関だと想定している。[br]最初の2つの単回帰のモデルの結果は、 0:14:52.092,0:14:59.023 こうなる。[br]幸福を外向性から予測すると、 0:14:59.023,0:15:04.067 標準化していない回帰係数は0.28となる。 0:15:04.067,0:15:10.067 それが意味する所は一単位の外向性の上昇に対して、 0:15:10.067,0:15:17.079 幸福度の尺度で0.28だけの上昇を予測している。[br]そして外向性が0だと、 0:15:17.079,0:15:24.045 幸福度は2.19となると予測している。[br]例えば外向性が4の誰かを考えてみよう。 0:15:24.045,0:15:29.075 その人は、4掛ける0.28が1をちょっと越える位で、そこに2.19を足すのだから、 0:15:29.075,0:15:35.019 3.3とか3.4くらい。[br]だから外向性が高ければ、 0:15:35.019,0:15:41.030 少しだけ幸福度が高い、または幸福度の予測されるスコアは高くなる。 0:15:41.030,0:15:47.041 それらは正の相関を持っている。[br]人生経験の多様さも同様。 0:15:47.041,0:15:52.066 だから最初の2つの条件は満たしている。[br]Xが結果変数に対して有意な予測変数で、 0:15:52.066,0:16:00.016 しかもメディエータ変数も有意に予測している。[br]ではフルのモデルを見てみよう。 0:16:00.016,0:16:07.054 それは下のここにある。[br]見て取れる事として、外向性と人生経験の多様性の 0:16:07.054,0:16:13.074 回帰係数はどちらも有意。[br]そしてそれらを 0:16:13.074,0:16:19.029 単回帰にそれぞれ入れた場合と比較すると、 0:16:19.029,0:16:25.049 そんなには低下していない。 0:16:25.049,0:16:32.062 外向性は0.28から0.22へ、多様性は、、、 0:16:32.062,0:16:39.035 他の方を持ってないや。それが0.19になった。[br]これら予測変数と結果変数の関係の傾きは、 0:16:39.035,0:16:45.067 それらを個々に予測変数として入れた場合と比較して、 0:16:45.067,0:16:52.024 そんなに落ちてない。[br]ここで見ているのは、パーシャルなメディエーションの証拠という事になる。 0:16:52.024,0:16:58.064 何故ならダイレクトなパスは0には落ちてない。 0:16:58.064,0:17:04.039 実の所ちょっとしか落ちてない。[br]当初のナイスな正の傾きから、 0:17:04.039,0:17:09.075 僅かしか落ちていない。 0:17:09.075,0:17:16.012 この結果を解釈する為に、まず回帰式に戻る。[br]外向性と幸福度は 0:17:16.012,0:17:22.036 正の相関。[br]人生経験の多様性はその関係を部分的にだけ 0:17:22.036,0:17:29.009 メディエートしている。[br]何故ならここの値、0.22は、 0:17:29.009,0:17:36.056 0.28からちょっとしか落ちていない。[br]もしこれが0まで落ちていたら、 0:17:36.056,0:17:44.003 それはフルなメディエーションの証拠となるのだが。[br]次のセグメントでは、同じ例を、 0:17:44.003,0:17:49.050 パスモデル形式で行う。[br]そしてそれを全部グラフィカルに示す。 0:17:49.050,0:17:54.049 その事は関係を見て理解するのに役に立つと思う。 0:17:54.049,0:17:59.040 それを私のお気に入りのモデル達の中に見る事になる。 0:17:59.040,0:18:04.080 その為に、もう一度この例をパス分析のアプローチでやる。 0:18:04.080,0:18:07.044 それが次のセグメントのトピック。