WEBVTT 00:00:00.000 --> 00:00:05.004 ハイ。Statics Oneへお帰りなさい。 今日のトピックはメディエーション(媒介)分析。 00:00:05.004 --> 00:00:10.022 この前の幾つかで重回帰分析について詳細に扱った。 00:00:10.022 --> 00:00:15.053 最初は概念的に重回帰を学び、 00:00:15.053 --> 00:00:20.000 そこで回帰方程式に複数の回帰係数がある時に 00:00:20.000 --> 00:00:25.017 それをどう解釈するかを学んだ。 そして行列の代数について見ていき、 00:00:25.017 --> 00:00:30.061 一つの方程式で複数の予測変数の回帰係数を一度に 00:00:30.061 --> 00:00:35.085 計算出来るようになった。 今日のレクチャーとこの後の2つのレクチャーでやっていく事は、 00:00:35.085 --> 00:00:41.014 社会科学の分野で特に人気な特定の種類の重回帰分析について 00:00:41.014 --> 00:00:46.023 より詳しく見ていく。 今日のレクチャー10ではメディエーション分析をやっていく。 00:00:46.023 --> 00:00:50.097 次のレクチャー11ではモデレーション分析をやっていく。 00:00:50.097 --> 00:00:56.074 そしてレクチャー12では媒介分析とモデレーション分析を両方 00:00:56.074 --> 00:01:02.084 Rでやっていく。そういう訳で今日のフォーカスはメディエーション分析。 そして今日のレクチャーは2つのセグメントに分けた。 00:01:02.084 --> 00:01:08.011 最初のセグメントではメディエーション分析をするのに、 00:01:08.011 --> 00:01:13.018 いわゆる回帰アプローチを取る。 2つ目のセグメントではパスモデル、または 00:01:13.018 --> 00:01:18.071 パス分析と呼ばれるアプローチを取る。 最初のセグメントでは 00:01:18.071 --> 00:01:28.082 メディエーション分析をする為に回帰アプローチだけでいく。 最初にメディエーションとモデレーションの違いを 00:01:28.082 --> 00:01:33.074 はっきりさせたい。 というのは、このトピックをこれまで 00:01:33.074 --> 00:01:39.007 大学院のコースで何度も教えてきたけれど、、、 そうそう、 00:01:39.007 --> 00:01:44.067 普段入門コースではこの話はしないけど、 00:01:44.067 --> 00:01:50.020 Satics Oneでは入れる事にした、とても良く使われる手法だからね。 00:01:50.020 --> 00:01:55.068 あー、そうだ。で、大学院レベルのコースで何度も教えてきたのだが、 00:01:55.068 --> 00:02:00.047 多くの院生がメディエーション(媒介)とモデレーションの区別をつけるのに苦労してる。 00:02:00.047 --> 00:02:05.045 どっちの分析がある種類のデザインや 00:02:05.045 --> 00:02:10.024 検証したい仮説に適切なのか? だから最初にこの区別をクリアにしておきたい。 00:02:10.024 --> 00:02:15.050 メディエーションとモデレーション。 既に述べたように、今日は 00:02:15.050 --> 00:02:20.057 メディエーションについて話す。次のレクチャーでモデレーション。 その次に両方を一緒にRでやる。 00:02:20.057 --> 00:02:26.073 その区別をする為に、これら2つの丁度よい絵がある。 00:02:26.073 --> 00:02:32.025 メディエーション(媒介)やメディエータという言葉の意味について考えてみてくれ。 00:02:32.025 --> 00:02:38.016 この絵が描いているのは、この真ん中の所、メディエータ(調停人)の人がいる。 00:02:38.016 --> 00:02:44.038 これら2つの異なる意見を持つ人がコミュニケートして、 00:02:44.038 --> 00:02:50.052 この真ん中の人がこの二人の人の仲を取り持つ。 00:02:50.052 --> 00:02:56.087 統計的には、我々がやるのは、2つの相関があるかもしれない変数を 00:02:56.087 --> 00:03:02.099 調べる、という事。例えばXとYとする。 そんな例をここまでたくさん見てきた。 00:03:02.099 --> 00:03:09.012 そこではXとYの相関を見てきた。 00:03:09.012 --> 00:03:14.088 そこからさらに、もう一つの変数が見つけられるかを見てみる、という所が新しい。 それをMと呼ぼう。それがXとYの関係を 00:03:14.088 --> 00:03:21.078 メディエート(仲介)している。 もしそれが見つけられるなら、XとYをつなぐメカニズムについて、 00:03:21.078 --> 00:03:28.008 何かが言える。 そんな訳でこれは社会科学で人気の手法だ。 00:03:28.008 --> 00:03:33.057 何故ならたくさんの社会科学の領域で、 00:03:33.057 --> 00:03:38.084 彼らは観察研究に依拠せざるを得ない。 彼らはランダム化実験が出来ない。 00:03:38.084 --> 00:03:44.004 だからこの相関から因果を推測する問題がある。 00:03:44.004 --> 00:03:49.045 もし、メディエーションを示す事が出来たら、ちょっとだけ 00:03:49.045 --> 00:03:55.037 強い因果の議論に近づける。 それがただの相関だけなら、まだそこまでは行けない。 00:03:55.037 --> 00:04:03.048 でもそれは、モデレーションと区別するのには役に立つ。 00:04:03.048 --> 00:04:10.064 ここに、画像の下の所でモデレートしている絵がある。 00:04:10.064 --> 00:04:16.044 モデレータ(議長)は議論の全体をコントロールする。 モデレータはこの人間達の 00:04:16.044 --> 00:04:22.066 一人の人に直接影響を与える。 00:04:22.066 --> 00:04:29.023 統計的に変数同士の関係と同様に。 だからもしXとYに相関がある、と我々が言っても、 00:04:29.023 --> 00:04:36.048 モデレータは、 00:04:36.048 --> 00:04:42.027 いや、私の屋根の下ではそんなの無い、と言ったり出来る。 または、その相関を増加させよう、 00:04:42.027 --> 00:04:47.098 その関係はとても重要と私が思うから、と言ったりも出来る。 つまりモデレータは他の関係に影響を与えたり、 00:04:47.098 --> 00:04:56.070 制御したりする。 たくさんの院生はこのメディエーション分析や 00:04:56.070 --> 00:05:01.050 モデレーション分析で頭を悩ませるが、私の考えではそれは、 00:05:01.050 --> 00:05:06.092 それはたくさんの要素を詰めすぎるからだ。 だから私はこのナイスで短い省略形、 00:05:06.092 --> 00:05:11.091 高校のサッカーコーチが良く私に言った、KISS (Keep It Simple, Stupid, シンプルにしておく方が良いという諺) 00:05:11.091 --> 00:05:16.077 に立ち戻る。 試合を大げさにやり過ぎたり、何かについて喧嘩しすぎたときには 00:05:16.077 --> 00:05:21.039 彼はいつも、「KISSの法則を使え」と言った。 シンプルにしておきなさい。 00:05:21.039 --> 00:05:25.095 KISSの法則を使え。 ここでは我々は四つの変数しか扱わない。 00:05:25.095 --> 00:05:30.014 これはそんなに複雑じゃない。 コースの後半では四つの変数よりももっと多くの 00:05:30.014 --> 00:05:33.081 デザインをする事になる。 Statics Oneより先のコースまで行くと、 00:05:33.081 --> 00:05:39.046 もっと複雑なデータセットを扱う事になる。 00:05:39.046 --> 00:05:46.017 でもここでは多くとも4つの変数だけ。 このメディエーション分析では三変数のみ。 00:05:46.017 --> 00:05:52.013 シンプルに保て。 4つの変数だけある。XとYをこれまで同様 00:05:52.013 --> 00:05:57.018 予測変数と結果変数を表すのに使う。 この例で、このセグメントでは、 00:05:57.018 --> 00:06:02.035 予測変数と結果変数を使っていくが、 00:06:02.035 --> 00:06:07.026 Xを本当の意味での独立変数、 00:06:07.026 --> 00:06:12.050 ランダム化実験の物として使い、その上でメディエーション分析を行う、という事も考えられるのは 00:06:12.050 --> 00:06:17.061 心にとめておきなさい。 そして実際Rでメディエーション分析を実演するレクチャーでは、そうする。 00:06:17.061 --> 00:06:22.074 しかしここでは、それらを予測変数と結果変数に留めておく。 Mをメディエーターとして使う。 00:06:22.074 --> 00:06:29.079 Zはモデレータ変数。 この最初のセグメントで扱う例は、 00:06:29.079 --> 00:06:35.050 Xを何らかの心理学的特性、たとえば外向性として、 00:06:35.050 --> 00:06:40.060 それが幸福と相関しているか、という物。 実際多くの研究で真と出てる。 00:06:40.060 --> 00:06:45.082 正の相関が見て取れる。 つまりより外向的な方が、 00:06:45.082 --> 00:06:50.081 より幸せ、と異なる種類の尺度で出てる。 ではどんなメディエーターや 00:06:50.081 --> 00:06:56.034 メカニズムが考えられるか? 今このデータを作り上げた。 00:06:56.034 --> 00:07:02.025 私はRでデータをシミュレートした。 一つ考えられるメカニズムは、 00:07:02.025 --> 00:07:08.030 単に人生経験が多様なだけ、という物。 もしあなたが外向的なら、より幅広い経験を得るかもいれない。 00:07:08.030 --> 00:07:13.091 より多様な人生経験。 00:07:13.091 --> 00:07:19.067 それらは相関があるかもしれず、それが結果としてより幸福なのかも。 00:07:19.067 --> 00:07:24.037 次のレクチャーでやる事としては、今日はこの変数には関与しませんが、 00:07:24.037 --> 00:07:29.002 それは、その関係にモデレータ変数を考えてみる事だ。 00:07:29.002 --> 00:07:35.078 つまり、社会経済的なステータスがその関係をモデレートしてるかもしれない。 00:07:35.078 --> 00:07:40.058 つまり、この絵に描いたように、外向性が 00:07:40.058 --> 00:07:46.025 幸福と正に相関するのは、SCS(社会経済的ステータス)が高い人だけにあてはまるのかもしれない。 00:07:46.025 --> 00:07:50.091 SCSが低い、もの凄く低いと、 00:07:50.091 --> 00:07:56.031 外向的で様々な人生の経験を積んでいると、 00:07:56.031 --> 00:08:01.072 負の人生経験を積む事になり、より低い幸福度になるかも。 だから社会経済的なステータスは、 00:08:01.072 --> 00:08:07.056 その関係をモデレートするかもしれない、メディエートではなく。(モデレートは仕切る感じでメディエートは調整する感じ) 00:08:07.056 --> 00:08:12.092 さて、メディエーション分析をする時は、 00:08:12.092 --> 00:08:18.084 XとYが相関する事を知っていて、しかしより踏み込んで何故その相関が存在するかを 00:08:18.084 --> 00:08:24.048 知りたい時だ。 それらの変数が何故相関しているか? 00:08:24.048 --> 00:08:30.061 何故それらの変数が相関しているかのメカニズムを説明出来るか? 我々は既に単回帰から、少し前の講義でやったように、 00:08:30.061 --> 00:08:35.084 XとYが相関していると、XからYが予測出来る。 00:08:35.084 --> 00:08:43.092 そしてここに単回帰の方程式がある。 今メディエータ変数を追加すると、 00:08:43.092 --> 00:08:50.014 結果として3つの回帰式を得る事になる。 00:08:50.014 --> 00:08:56.036 その内2つを見ていく。 最初の式で、メディエータ変数「から」 00:08:56.036 --> 00:09:02.052 予測出来る。 二番目はメディエータ変数「を」Xから予測出来る。 00:09:02.052 --> 00:09:08.019 つまり最初の回帰式ではこの部分を取り除いた。 00:09:08.019 --> 00:09:14.018 Yをメディエータから予測出来る、と言っている。 二番目の回帰式では、 00:09:14.018 --> 00:09:19.043 この部分を取り除いた。 この式で言っているのは、 00:09:19.043 --> 00:09:25.044 メディエータをXから予測出来る、という事。 しかしこの、パス図の全体を取り込む為には、 00:09:25.044 --> 00:09:32.064 そしてそれは次のセグメントでやる事でもあるが、しなくてはいけない事は、 00:09:32.064 --> 00:09:41.033 両方の予測変数を一つの回帰方程式に入れる事。 これがいわば、フルのモデルだ。 00:09:41.033 --> 00:09:48.047 メディエーターと元の予測変数が両方入ってる。 00:09:48.047 --> 00:09:55.020 そこで質問は、メディエータを追加した後には 00:09:55.020 --> 00:10:02.099 Xの予測の妥当性または予測の価値に、何が起こるか?という事。 もしXとYがメディエータの為に相関していたのなら、 00:10:02.099 --> 00:10:09.039 このスライドで言ったように、という事だが、もしそうなら、Xはもはや有意では無いはず。 00:10:09.039 --> 00:10:15.097 何故ならYの変動の内Xが寄与している部分は全て 00:10:15.097 --> 00:10:22.097 メディエータが説明しているはずだから。 だからXはもはやYの有意な予測変数では無くなっているはず。 00:10:22.097 --> 00:10:29.055 質問に答える為にこの下を見る。 回帰係数B2はもはや、 00:10:29.055 --> 00:10:39.021 有意では無い、もしフルのメディエーションのケースなら。 しかし、こういう可能性も考えられる。 00:10:39.021 --> 00:10:45.031 B2、つまりXの回帰係数はいまだ有意だが、 00:10:45.031 --> 00:10:51.028 より小さく、弱くなっている、というケース、 00:10:51.028 --> 00:10:56.087 それのみで回帰式に入っていた時よりも。 00:10:56.087 --> 00:11:02.030 その場合は、パーシャルなメディエーションだという証拠を得た事になる。 つまりメディエーション分析をした時には、 00:11:02.030 --> 00:11:07.037 3通りの結果の可能性がある。 メディエーションの証拠が全く得られない場合、 00:11:07.037 --> 00:11:12.038 またはフルの証拠が得られる場合、 そうでなければ、部分的な証拠だけが得られる場合がある。 00:11:12.038 --> 00:11:18.020 その例をお見せしよう。 繰り返しになるが、ここに赤文字で注意を置いた。 00:11:18.020 --> 00:11:24.018 次のセグメントでは、これらのパスモデルを描いていくが、 00:11:24.018 --> 00:11:30.031 そこでは矢印は普通は因果関係を表す。 でも少なくともこの例に関しては、 00:11:30.031 --> 00:11:35.067 単にデータの相関を扱っているに過ぎない。 だから 00:11:35.067 --> 00:11:41.070 相関関係が因果関係を意味しない、という標語は引き続き当てはまる。 さらに、この大学院レベルのクラスで言っておきたいのは、 00:11:41.070 --> 00:11:47.046 統計的なメディエーションと真の因果的なメディエーションには 00:11:47.046 --> 00:11:52.087 大きな違いがあるということである。 したがって、統計的な意味で完全なメディエーションの 証拠を得られたかもしれない。 00:11:52.087 --> 00:11:57.055 しかし、単なるクロスセクションの相関データを 扱っているにすぎないのであれば、 00:11:57.055 --> 00:12:03.041 因果性に関する強い主張を何かできている、 というわけではない。 00:12:03.041 --> 00:12:10.004 オーケー。 では実際にどうメディエーションをどう検証して 00:12:10.004 --> 00:12:16.056 実装するか?それは3つの回帰モデルを実行していく事によって。 レクチャー12で 00:12:16.056 --> 00:12:22.083 ステップバイステップでRでスクリプトを書きながらやる。 ここでは、ただ駆け足で軽く見ていくだけに留める。 00:12:22.083 --> 00:12:28.014 これらが実行したい3つの回帰方程式だ。 00:12:28.014 --> 00:12:33.037 lmはRの関数で、LinearModel(線形モデル)を表す。 一つは、ただ単純に 00:12:33.037 --> 00:12:38.061 XとYの直接の関係を示す。 明らかにメディエートとは 00:12:38.061 --> 00:12:43.098 関係が無くてはならない。 それを確認する為、Xとメディエータの関係を見る。 00:12:43.098 --> 00:12:50.089 その後、このフルのモデルを実行する。 問題は予測変数の妥当性、つまり 00:12:50.089 --> 00:13:02.000 Xの予測における価値が、Mを加えた後でどうなるか。 00:13:02.000 --> 00:13:07.020 フルのメディエーションを得る為に、最初はこの2つを見る。 この最初の2つの単回帰の方程式。 00:13:07.020 --> 00:13:12.058 明らかに、Xは有意な予測変数であって欲しい。 00:13:12.058 --> 00:13:17.084 メディエーション分析をするには、まずXが有意な予測変数でなくてはならない。 00:13:17.084 --> 00:13:23.036 XはYの有意な予測変数でなくてはならない。 XはMの有意な予測変数である必要もある。 00:13:23.036 --> 00:13:28.062 それらが前提条件。 もし成り立たなければ、メディエーション分析は出来ない。 00:13:30.056 --> 00:13:37.027 この最後の回帰方程式では、Mは有意であるべき。 Xがどうあるべきかは、いろいろ有り得る。 00:13:37.027 --> 00:13:42.055 Xが有意で無くなるなら、 00:13:42.055 --> 00:13:48.021 0になるなら、それはフルのメディエーションである、という証拠となる。 00:13:48.021 --> 00:13:54.039 つまり、Xの直接効果は完全に消えてしまった。 00:13:54.039 --> 00:13:59.098 だが有意なメディエーターに対してもXは有意のままたりえる。 その場合はパーシャル(部分的)なメディエーションである、という証拠となる。 00:13:59.098 --> 00:14:07.014 この例に戻って、幾つかの数字を実際に見て、 00:14:07.014 --> 00:14:14.038 もっと具体的にしていこう。 前にも言った通り、 00:14:14.038 --> 00:14:19.030 Rでデータを作った。 これらはシミュレートしたデータ。188人の被験者が居て、 00:14:19.030 --> 00:14:24.042 これはナイスな大きな例だ、で、彼らを調査している。 このレクチャーでは社会経済的なステータスは 00:14:24.042 --> 00:14:29.090 空白のままにしてある。 それは次のレクチャーで。 00:14:29.090 --> 00:14:35.053 この時点では3つの指標だけある。 幸福、外向性、人生経験の多様性。 00:14:35.053 --> 00:14:40.079 それらのスコアは単純に1から5までの尺度とする。 00:14:40.079 --> 00:14:46.064 より高いスコアはより幸せ、より外向的、より多様な人生経験。 00:14:46.064 --> 00:14:52.092 これら3つが全て正の相関だと想定している。 最初の2つの単回帰のモデルの結果は、 00:14:52.092 --> 00:14:59.023 こうなる。 幸福を外向性から予測すると、 00:14:59.023 --> 00:15:04.067 標準化していない回帰係数は0.28となる。 00:15:04.067 --> 00:15:10.067 それが意味する所は一単位の外向性の上昇に対して、 00:15:10.067 --> 00:15:17.079 幸福度の尺度で0.28だけの上昇を予測している。 そして外向性が0だと、 00:15:17.079 --> 00:15:24.045 幸福度は2.19となると予測している。 例えば外向性が4の誰かを考えてみよう。 00:15:24.045 --> 00:15:29.075 その人は、4掛ける0.28が1をちょっと越える位で、そこに2.19を足すのだから、 00:15:29.075 --> 00:15:35.019 3.3とか3.4くらい。 だから外向性が高ければ、 00:15:35.019 --> 00:15:41.030 少しだけ幸福度が高い、または幸福度の予測されるスコアは高くなる。 00:15:41.030 --> 00:15:47.041 それらは正の相関を持っている。 人生経験の多様さも同様。 00:15:47.041 --> 00:15:52.066 だから最初の2つの条件は満たしている。 Xが結果変数に対して有意な予測変数で、 00:15:52.066 --> 00:16:00.016 しかもメディエータ変数も有意に予測している。 ではフルのモデルを見てみよう。 00:16:00.016 --> 00:16:07.054 それは下のここにある。 見て取れる事として、外向性と人生経験の多様性の 00:16:07.054 --> 00:16:13.074 回帰係数はどちらも有意。 そしてそれらを 00:16:13.074 --> 00:16:19.029 単回帰にそれぞれ入れた場合と比較すると、 00:16:19.029 --> 00:16:25.049 そんなには低下していない。 00:16:25.049 --> 00:16:32.062 外向性は0.28から0.22へ、多様性は、、、 00:16:32.062 --> 00:16:39.035 他の方を持ってないや。それが0.19になった。 これら予測変数と結果変数の関係の傾きは、 00:16:39.035 --> 00:16:45.067 それらを個々に予測変数として入れた場合と比較して、 00:16:45.067 --> 00:16:52.024 そんなに落ちてない。 ここで見ているのは、パーシャルなメディエーションの証拠という事になる。 00:16:52.024 --> 00:16:58.064 何故ならダイレクトなパスは0には落ちてない。 00:16:58.064 --> 00:17:04.039 実の所ちょっとしか落ちてない。 当初のナイスな正の傾きから、 00:17:04.039 --> 00:17:09.075 僅かしか落ちていない。 00:17:09.075 --> 00:17:16.012 この結果を解釈する為に、まず回帰式に戻る。 外向性と幸福度は 00:17:16.012 --> 00:17:22.036 正の相関。 人生経験の多様性はその関係を部分的にだけ 00:17:22.036 --> 00:17:29.009 メディエートしている。 何故ならここの値、0.22は、 00:17:29.009 --> 00:17:36.056 0.28からちょっとしか落ちていない。 もしこれが0まで落ちていたら、 00:17:36.056 --> 00:17:44.003 それはフルなメディエーションの証拠となるのだが。 次のセグメントでは、同じ例を、 00:17:44.003 --> 00:17:49.050 パスモデル形式で行う。 そしてそれを全部グラフィカルに示す。 00:17:49.050 --> 00:17:54.049 その事は関係を見て理解するのに役に立つと思う。 00:17:54.049 --> 00:17:59.040 それを私のお気に入りのモデル達の中に見る事になる。 00:17:59.040 --> 00:18:04.080 その為に、もう一度この例をパス分析のアプローチでやる。 00:18:04.080 --> 00:18:07.044 それが次のセグメントのトピック。