1 00:00:00,000 --> 00:00:05,004 ハイ。Statics Oneへお帰りなさい。 今日のトピックはメディエーション(媒介)分析。 2 00:00:05,004 --> 00:00:10,022 この前の幾つかで重回帰分析について詳細に扱った。 3 00:00:10,022 --> 00:00:15,053 最初は概念的に重回帰を学び、 4 00:00:15,053 --> 00:00:20,000 そこで回帰方程式に複数の回帰係数がある時に 5 00:00:20,000 --> 00:00:25,017 それをどう解釈するかを学んだ。 そして行列の代数について見ていき、 6 00:00:25,017 --> 00:00:30,061 一つの方程式で複数の予測変数の回帰係数を一度に 7 00:00:30,061 --> 00:00:35,085 計算出来るようになった。 今日のレクチャーとこの後の2つのレクチャーでやっていく事は、 8 00:00:35,085 --> 00:00:41,014 社会科学の分野で特に人気な特定の種類の重回帰分析について 9 00:00:41,014 --> 00:00:46,023 より詳しく見ていく。 今日のレクチャー10ではメディエーション分析をやっていく。 10 00:00:46,023 --> 00:00:50,097 次のレクチャー11ではモデレーション分析をやっていく。 11 00:00:50,097 --> 00:00:56,074 そしてレクチャー12では媒介分析とモデレーション分析を両方 12 00:00:56,074 --> 00:01:02,084 Rでやっていく。そういう訳で今日のフォーカスはメディエーション分析。 そして今日のレクチャーは2つのセグメントに分けた。 13 00:01:02,084 --> 00:01:08,011 最初のセグメントではメディエーション分析をするのに、 14 00:01:08,011 --> 00:01:13,018 いわゆる回帰アプローチを取る。 2つ目のセグメントではパスモデル、または 15 00:01:13,018 --> 00:01:18,071 パス分析と呼ばれるアプローチを取る。 最初のセグメントでは 16 00:01:18,071 --> 00:01:28,082 メディエーション分析をする為に回帰アプローチだけでいく。 最初にメディエーションとモデレーションの違いを 17 00:01:28,082 --> 00:01:33,074 はっきりさせたい。 というのは、このトピックをこれまで 18 00:01:33,074 --> 00:01:39,007 大学院のコースで何度も教えてきたけれど、、、 そうそう、 19 00:01:39,007 --> 00:01:44,067 普段入門コースではこの話はしないけど、 20 00:01:44,067 --> 00:01:50,020 Satics Oneでは入れる事にした、とても良く使われる手法だからね。 21 00:01:50,020 --> 00:01:55,068 あー、そうだ。で、大学院レベルのコースで何度も教えてきたのだが、 22 00:01:55,068 --> 00:02:00,047 多くの院生がメディエーション(媒介)とモデレーションの区別をつけるのに苦労してる。 23 00:02:00,047 --> 00:02:05,045 どっちの分析がある種類のデザインや 24 00:02:05,045 --> 00:02:10,024 検証したい仮説に適切なのか? だから最初にこの区別をクリアにしておきたい。 25 00:02:10,024 --> 00:02:15,050 メディエーションとモデレーション。 既に述べたように、今日は 26 00:02:15,050 --> 00:02:20,057 メディエーションについて話す。次のレクチャーでモデレーション。 その次に両方を一緒にRでやる。 27 00:02:20,057 --> 00:02:26,073 その区別をする為に、これら2つの丁度よい絵がある。 28 00:02:26,073 --> 00:02:32,025 メディエーション(媒介)やメディエータという言葉の意味について考えてみてくれ。 29 00:02:32,025 --> 00:02:38,016 この絵が描いているのは、この真ん中の所、メディエータ(調停人)の人がいる。 30 00:02:38,016 --> 00:02:44,038 これら2つの異なる意見を持つ人がコミュニケートして、 31 00:02:44,038 --> 00:02:50,052 この真ん中の人がこの二人の人の仲を取り持つ。 32 00:02:50,052 --> 00:02:56,087 統計的には、我々がやるのは、2つの相関があるかもしれない変数を 33 00:02:56,087 --> 00:03:02,099 調べる、という事。例えばXとYとする。 そんな例をここまでたくさん見てきた。 34 00:03:02,099 --> 00:03:09,012 そこではXとYの相関を見てきた。 35 00:03:09,012 --> 00:03:14,088 そこからさらに、もう一つの変数が見つけられるかを見てみる、という所が新しい。 それをMと呼ぼう。それがXとYの関係を 36 00:03:14,088 --> 00:03:21,078 メディエート(仲介)している。 もしそれが見つけられるなら、XとYをつなぐメカニズムについて、 37 00:03:21,078 --> 00:03:28,008 何かが言える。 そんな訳でこれは社会科学で人気の手法だ。 38 00:03:28,008 --> 00:03:33,057 何故ならたくさんの社会科学の領域で、 39 00:03:33,057 --> 00:03:38,084 彼らは観察研究に依拠せざるを得ない。 彼らはランダム化実験が出来ない。 40 00:03:38,084 --> 00:03:44,004 だからこの相関から因果を推測する問題がある。 41 00:03:44,004 --> 00:03:49,045 もし、メディエーションを示す事が出来たら、ちょっとだけ 42 00:03:49,045 --> 00:03:55,037 強い因果の議論に近づける。 それがただの相関だけなら、まだそこまでは行けない。 43 00:03:55,037 --> 00:04:03,048 でもそれは、モデレーションと区別するのには役に立つ。 44 00:04:03,048 --> 00:04:10,064 ここに、画像の下の所でモデレートしている絵がある。 45 00:04:10,064 --> 00:04:16,044 モデレータ(議長)は議論の全体をコントロールする。 モデレータはこの人間達の 46 00:04:16,044 --> 00:04:22,066 一人の人に直接影響を与える。 47 00:04:22,066 --> 00:04:29,023 統計的に変数同士の関係と同様に。 だからもしXとYに相関がある、と我々が言っても、 48 00:04:29,023 --> 00:04:36,048 モデレータは、 49 00:04:36,048 --> 00:04:42,027 いや、私の屋根の下ではそんなの無い、と言ったり出来る。 または、その相関を増加させよう、 50 00:04:42,027 --> 00:04:47,098 その関係はとても重要と私が思うから、と言ったりも出来る。 つまりモデレータは他の関係に影響を与えたり、 51 00:04:47,098 --> 00:04:56,070 制御したりする。 たくさんの院生はこのメディエーション分析や 52 00:04:56,070 --> 00:05:01,050 モデレーション分析で頭を悩ませるが、私の考えではそれは、 53 00:05:01,050 --> 00:05:06,092 それはたくさんの要素を詰めすぎるからだ。 だから私はこのナイスで短い省略形、 54 00:05:06,092 --> 00:05:11,091 高校のサッカーコーチが良く私に言った、KISS (Keep It Simple, Stupid, シンプルにしておく方が良いという諺) 55 00:05:11,091 --> 00:05:16,077 に立ち戻る。 試合を大げさにやり過ぎたり、何かについて喧嘩しすぎたときには 56 00:05:16,077 --> 00:05:21,039 彼はいつも、「KISSの法則を使え」と言った。 シンプルにしておきなさい。 57 00:05:21,039 --> 00:05:25,095 KISSの法則を使え。 ここでは我々は四つの変数しか扱わない。 58 00:05:25,095 --> 00:05:30,014 これはそんなに複雑じゃない。 コースの後半では四つの変数よりももっと多くの 59 00:05:30,014 --> 00:05:33,081 デザインをする事になる。 Statics Oneより先のコースまで行くと、 60 00:05:33,081 --> 00:05:39,046 もっと複雑なデータセットを扱う事になる。 61 00:05:39,046 --> 00:05:46,017 でもここでは多くとも4つの変数だけ。 このメディエーション分析では三変数のみ。 62 00:05:46,017 --> 00:05:52,013 シンプルに保て。 4つの変数だけある。XとYをこれまで同様 63 00:05:52,013 --> 00:05:57,018 予測変数と結果変数を表すのに使う。 この例で、このセグメントでは、 64 00:05:57,018 --> 00:06:02,035 予測変数と結果変数を使っていくが、 65 00:06:02,035 --> 00:06:07,026 Xを本当の意味での独立変数、 66 00:06:07,026 --> 00:06:12,050 ランダム化実験の物として使い、その上でメディエーション分析を行う、という事も考えられるのは 67 00:06:12,050 --> 00:06:17,061 心にとめておきなさい。 そして実際Rでメディエーション分析を実演するレクチャーでは、そうする。 68 00:06:17,061 --> 00:06:22,074 しかしここでは、それらを予測変数と結果変数に留めておく。 Mをメディエーターとして使う。 69 00:06:22,074 --> 00:06:29,079 Zはモデレータ変数。 この最初のセグメントで扱う例は、 70 00:06:29,079 --> 00:06:35,050 Xを何らかの心理学的特性、たとえば外向性として、 71 00:06:35,050 --> 00:06:40,060 それが幸福と相関しているか、という物。 実際多くの研究で真と出てる。 72 00:06:40,060 --> 00:06:45,082 正の相関が見て取れる。 つまりより外向的な方が、 73 00:06:45,082 --> 00:06:50,081 より幸せ、と異なる種類の尺度で出てる。 ではどんなメディエーターや 74 00:06:50,081 --> 00:06:56,034 メカニズムが考えられるか? 今このデータを作り上げた。 75 00:06:56,034 --> 00:07:02,025 私はRでデータをシミュレートした。 一つ考えられるメカニズムは、 76 00:07:02,025 --> 00:07:08,030 単に人生経験が多様なだけ、という物。 もしあなたが外向的なら、より幅広い経験を得るかもいれない。 77 00:07:08,030 --> 00:07:13,091 より多様な人生経験。 78 00:07:13,091 --> 00:07:19,067 それらは相関があるかもしれず、それが結果としてより幸福なのかも。 79 00:07:19,067 --> 00:07:24,037 次のレクチャーでやる事としては、今日はこの変数には関与しませんが、 80 00:07:24,037 --> 00:07:29,002 それは、その関係にモデレータ変数を考えてみる事だ。 81 00:07:29,002 --> 00:07:35,078 つまり、社会経済的なステータスがその関係をモデレートしてるかもしれない。 82 00:07:35,078 --> 00:07:40,058 つまり、この絵に描いたように、外向性が 83 00:07:40,058 --> 00:07:46,025 幸福と正に相関するのは、SCS(社会経済的ステータス)が高い人だけにあてはまるのかもしれない。 84 00:07:46,025 --> 00:07:50,091 SCSが低い、もの凄く低いと、 85 00:07:50,091 --> 00:07:56,031 外向的で様々な人生の経験を積んでいると、 86 00:07:56,031 --> 00:08:01,072 負の人生経験を積む事になり、より低い幸福度になるかも。 だから社会経済的なステータスは、 87 00:08:01,072 --> 00:08:07,056 その関係をモデレートするかもしれない、メディエートではなく。(モデレートは仕切る感じでメディエートは調整する感じ) 88 00:08:07,056 --> 00:08:12,092 さて、メディエーション分析をする時は、 89 00:08:12,092 --> 00:08:18,084 XとYが相関する事を知っていて、しかしより踏み込んで何故その相関が存在するかを 90 00:08:18,084 --> 00:08:24,048 知りたい時だ。 それらの変数が何故相関しているか? 91 00:08:24,048 --> 00:08:30,061 何故それらの変数が相関しているかのメカニズムを説明出来るか? 我々は既に単回帰から、少し前の講義でやったように、 92 00:08:30,061 --> 00:08:35,084 XとYが相関していると、XからYが予測出来る。 93 00:08:35,084 --> 00:08:43,092 そしてここに単回帰の方程式がある。 今メディエータ変数を追加すると、 94 00:08:43,092 --> 00:08:50,014 結果として3つの回帰式を得る事になる。 95 00:08:50,014 --> 00:08:56,036 その内2つを見ていく。 最初の式で、メディエータ変数「から」 96 00:08:56,036 --> 00:09:02,052 予測出来る。 二番目はメディエータ変数「を」Xから予測出来る。 97 00:09:02,052 --> 00:09:08,019 つまり最初の回帰式ではこの部分を取り除いた。 98 00:09:08,019 --> 00:09:14,018 Yをメディエータから予測出来る、と言っている。 二番目の回帰式では、 99 00:09:14,018 --> 00:09:19,043 この部分を取り除いた。 この式で言っているのは、 100 00:09:19,043 --> 00:09:25,044 メディエータをXから予測出来る、という事。 しかしこの、パス図の全体を取り込む為には、 101 00:09:25,044 --> 00:09:32,064 そしてそれは次のセグメントでやる事でもあるが、しなくてはいけない事は、 102 00:09:32,064 --> 00:09:41,033 両方の予測変数を一つの回帰方程式に入れる事。 これがいわば、フルのモデルだ。 103 00:09:41,033 --> 00:09:48,047 メディエーターと元の予測変数が両方入ってる。 104 00:09:48,047 --> 00:09:55,020 そこで質問は、メディエータを追加した後には 105 00:09:55,020 --> 00:10:02,099 Xの予測の妥当性または予測の価値に、何が起こるか?という事。 もしXとYがメディエータの為に相関していたのなら、 106 00:10:02,099 --> 00:10:09,039 このスライドで言ったように、という事だが、もしそうなら、Xはもはや有意では無いはず。 107 00:10:09,039 --> 00:10:15,097 何故ならYの変動の内Xが寄与している部分は全て 108 00:10:15,097 --> 00:10:22,097 メディエータが説明しているはずだから。 だからXはもはやYの有意な予測変数では無くなっているはず。 109 00:10:22,097 --> 00:10:29,055 質問に答える為にこの下を見る。 回帰係数B2はもはや、 110 00:10:29,055 --> 00:10:39,021 有意では無い、もしフルのメディエーションのケースなら。 しかし、こういう可能性も考えられる。 111 00:10:39,021 --> 00:10:45,031 B2、つまりXの回帰係数はいまだ有意だが、 112 00:10:45,031 --> 00:10:51,028 より小さく、弱くなっている、というケース、 113 00:10:51,028 --> 00:10:56,087 それのみで回帰式に入っていた時よりも。 114 00:10:56,087 --> 00:11:02,030 その場合は、パーシャルなメディエーションだという証拠を得た事になる。 つまりメディエーション分析をした時には、 115 00:11:02,030 --> 00:11:07,037 3通りの結果の可能性がある。 メディエーションの証拠が全く得られない場合、 116 00:11:07,037 --> 00:11:12,038 またはフルの証拠が得られる場合、 そうでなければ、部分的な証拠だけが得られる場合がある。 117 00:11:12,038 --> 00:11:18,020 その例をお見せしよう。 繰り返しになるが、ここに赤文字で注意を置いた。 118 00:11:18,020 --> 00:11:24,018 次のセグメントでは、これらのパスモデルを描いていくが、 119 00:11:24,018 --> 00:11:30,031 そこでは矢印は普通は因果関係を表す。 でも少なくともこの例に関しては、 120 00:11:30,031 --> 00:11:35,067 単にデータの相関を扱っているに過ぎない。 だから 121 00:11:35,067 --> 00:11:41,070 相関関係が因果関係を意味しない、という標語は引き続き当てはまる。 さらに、この大学院レベルのクラスで言っておきたいのは、 122 00:11:41,070 --> 00:11:47,046 統計的なメディエーションと真の因果的なメディエーションには 123 00:11:47,046 --> 00:11:52,087 大きな違いがあるということである。 したがって、統計的な意味で完全なメディエーションの 証拠を得られたかもしれない。 124 00:11:52,087 --> 00:11:57,055 しかし、単なるクロスセクションの相関データを 扱っているにすぎないのであれば、 125 00:11:57,055 --> 00:12:03,041 因果性に関する強い主張を何かできている、 というわけではない。 126 00:12:03,041 --> 00:12:10,004 オーケー。 では実際にどうメディエーションをどう検証して 127 00:12:10,004 --> 00:12:16,056 実装するか?それは3つの回帰モデルを実行していく事によって。 レクチャー12で 128 00:12:16,056 --> 00:12:22,083 ステップバイステップでRでスクリプトを書きながらやる。 ここでは、ただ駆け足で軽く見ていくだけに留める。 129 00:12:22,083 --> 00:12:28,014 これらが実行したい3つの回帰方程式だ。 130 00:12:28,014 --> 00:12:33,037 lmはRの関数で、LinearModel(線形モデル)を表す。 一つは、ただ単純に 131 00:12:33,037 --> 00:12:38,061 XとYの直接の関係を示す。 明らかにメディエートとは 132 00:12:38,061 --> 00:12:43,098 関係が無くてはならない。 それを確認する為、Xとメディエータの関係を見る。 133 00:12:43,098 --> 00:12:50,089 その後、このフルのモデルを実行する。 問題は予測変数の妥当性、つまり 134 00:12:50,089 --> 00:13:02,000 Xの予測における価値が、Mを加えた後でどうなるか。 135 00:13:02,000 --> 00:13:07,020 フルのメディエーションを得る為に、最初はこの2つを見る。 この最初の2つの単回帰の方程式。 136 00:13:07,020 --> 00:13:12,058 明らかに、Xは有意な予測変数であって欲しい。 137 00:13:12,058 --> 00:13:17,084 メディエーション分析をするには、まずXが有意な予測変数でなくてはならない。 138 00:13:17,084 --> 00:13:23,036 XはYの有意な予測変数でなくてはならない。 XはMの有意な予測変数である必要もある。 139 00:13:23,036 --> 00:13:28,062 それらが前提条件。 もし成り立たなければ、メディエーション分析は出来ない。 140 00:13:30,056 --> 00:13:37,027 この最後の回帰方程式では、Mは有意であるべき。 Xがどうあるべきかは、いろいろ有り得る。 141 00:13:37,027 --> 00:13:42,055 Xが有意で無くなるなら、 142 00:13:42,055 --> 00:13:48,021 0になるなら、それはフルのメディエーションである、という証拠となる。 143 00:13:48,021 --> 00:13:54,039 つまり、Xの直接効果は完全に消えてしまった。 144 00:13:54,039 --> 00:13:59,098 だが有意なメディエーターに対してもXは有意のままたりえる。 その場合はパーシャル(部分的)なメディエーションである、という証拠となる。 145 00:13:59,098 --> 00:14:07,014 この例に戻って、幾つかの数字を実際に見て、 146 00:14:07,014 --> 00:14:14,038 もっと具体的にしていこう。 前にも言った通り、 147 00:14:14,038 --> 00:14:19,030 Rでデータを作った。 これらはシミュレートしたデータ。188人の被験者が居て、 148 00:14:19,030 --> 00:14:24,042 これはナイスな大きな例だ、で、彼らを調査している。 このレクチャーでは社会経済的なステータスは 149 00:14:24,042 --> 00:14:29,090 空白のままにしてある。 それは次のレクチャーで。 150 00:14:29,090 --> 00:14:35,053 この時点では3つの指標だけある。 幸福、外向性、人生経験の多様性。 151 00:14:35,053 --> 00:14:40,079 それらのスコアは単純に1から5までの尺度とする。 152 00:14:40,079 --> 00:14:46,064 より高いスコアはより幸せ、より外向的、より多様な人生経験。 153 00:14:46,064 --> 00:14:52,092 これら3つが全て正の相関だと想定している。 最初の2つの単回帰のモデルの結果は、 154 00:14:52,092 --> 00:14:59,023 こうなる。 幸福を外向性から予測すると、 155 00:14:59,023 --> 00:15:04,067 標準化していない回帰係数は0.28となる。 156 00:15:04,067 --> 00:15:10,067 それが意味する所は一単位の外向性の上昇に対して、 157 00:15:10,067 --> 00:15:17,079 幸福度の尺度で0.28だけの上昇を予測している。 そして外向性が0だと、 158 00:15:17,079 --> 00:15:24,045 幸福度は2.19となると予測している。 例えば外向性が4の誰かを考えてみよう。 159 00:15:24,045 --> 00:15:29,075 その人は、4掛ける0.28が1をちょっと越える位で、そこに2.19を足すのだから、 160 00:15:29,075 --> 00:15:35,019 3.3とか3.4くらい。 だから外向性が高ければ、 161 00:15:35,019 --> 00:15:41,030 少しだけ幸福度が高い、または幸福度の予測されるスコアは高くなる。 162 00:15:41,030 --> 00:15:47,041 それらは正の相関を持っている。 人生経験の多様さも同様。 163 00:15:47,041 --> 00:15:52,066 だから最初の2つの条件は満たしている。 Xが結果変数に対して有意な予測変数で、 164 00:15:52,066 --> 00:16:00,016 しかもメディエータ変数も有意に予測している。 ではフルのモデルを見てみよう。 165 00:16:00,016 --> 00:16:07,054 それは下のここにある。 見て取れる事として、外向性と人生経験の多様性の 166 00:16:07,054 --> 00:16:13,074 回帰係数はどちらも有意。 そしてそれらを 167 00:16:13,074 --> 00:16:19,029 単回帰にそれぞれ入れた場合と比較すると、 168 00:16:19,029 --> 00:16:25,049 そんなには低下していない。 169 00:16:25,049 --> 00:16:32,062 外向性は0.28から0.22へ、多様性は、、、 170 00:16:32,062 --> 00:16:39,035 他の方を持ってないや。それが0.19になった。 これら予測変数と結果変数の関係の傾きは、 171 00:16:39,035 --> 00:16:45,067 それらを個々に予測変数として入れた場合と比較して、 172 00:16:45,067 --> 00:16:52,024 そんなに落ちてない。 ここで見ているのは、パーシャルなメディエーションの証拠という事になる。 173 00:16:52,024 --> 00:16:58,064 何故ならダイレクトなパスは0には落ちてない。 174 00:16:58,064 --> 00:17:04,039 実の所ちょっとしか落ちてない。 当初のナイスな正の傾きから、 175 00:17:04,039 --> 00:17:09,075 僅かしか落ちていない。 176 00:17:09,075 --> 00:17:16,012 この結果を解釈する為に、まず回帰式に戻る。 外向性と幸福度は 177 00:17:16,012 --> 00:17:22,036 正の相関。 人生経験の多様性はその関係を部分的にだけ 178 00:17:22,036 --> 00:17:29,009 メディエートしている。 何故ならここの値、0.22は、 179 00:17:29,009 --> 00:17:36,056 0.28からちょっとしか落ちていない。 もしこれが0まで落ちていたら、 180 00:17:36,056 --> 00:17:44,003 それはフルなメディエーションの証拠となるのだが。 次のセグメントでは、同じ例を、 181 00:17:44,003 --> 00:17:49,050 パスモデル形式で行う。 そしてそれを全部グラフィカルに示す。 182 00:17:49,050 --> 00:17:54,049 その事は関係を見て理解するのに役に立つと思う。 183 00:17:54,049 --> 00:17:59,040 それを私のお気に入りのモデル達の中に見る事になる。 184 00:17:59,040 --> 00:18:04,080 その為に、もう一度この例をパス分析のアプローチでやる。 185 00:18:04,080 --> 00:18:07,044 それが次のセグメントのトピック。