WEBVTT 00:00:01.354 --> 00:00:04.489 科学技術は多くをもたらしてくれました 00:00:04.489 --> 00:00:06.508 月面着陸 インターネット 00:00:06.508 --> 00:00:09.133 ヒトゲノム配列の解析などです 00:00:09.133 --> 00:00:12.857 ですが 私たちの奥深くにある 恐怖の多くにも それは入り込んでいます 00:00:12.857 --> 00:00:14.713 およそ30年ほど前 00:00:14.713 --> 00:00:17.266 文化批評家のニール・ポストマンは 00:00:17.266 --> 00:00:19.381 "Amusing Ourselves to Death" という著作で 00:00:19.381 --> 00:00:22.140 このことを的確に述べました 00:00:22.140 --> 00:00:23.790 彼はこの著作において 00:00:23.790 --> 00:00:26.053 ジョージ・オーウェルとオルダス・ハクスリーの 00:00:26.053 --> 00:00:29.626 ディストピア (反ユートピア) 思想を比べて こう書きました 00:00:29.626 --> 00:00:32.752 「オーウェルは私たちが 00:00:32.752 --> 00:00:35.000 囚われの身になる文化を恐れた 00:00:35.000 --> 00:00:38.752 ハクスリーは私たちが 取るに足らないことに耽溺する文化を恐れた 00:00:38.752 --> 00:00:40.897 オーウェルは真実が 00:00:40.897 --> 00:00:42.820 私たちから隠蔽されることを恐れ 00:00:42.820 --> 00:00:45.010 ハクスリーは私たちが無関心の海で 00:00:45.010 --> 00:00:47.703 溺れ死ぬことを恐れた」 00:00:47.703 --> 00:00:49.873 要するに 00:00:49.873 --> 00:00:52.473 「ビッグ・ブラザー」 に監視されるか 00:00:52.473 --> 00:00:54.969 「ビッグ・ブラザー」を監視するかの どちらかということです 00:00:54.969 --> 00:00:56.900 (笑) 00:00:56.900 --> 00:00:58.634 でも そうでなくともよいのです 00:00:58.634 --> 00:01:01.970 私たちはデータや技術を 受け身で消費するだけではありません 00:01:01.970 --> 00:01:04.373 生活において データや技術が果たす役割や 00:01:04.373 --> 00:01:06.503 その意味を見出す方法を 私たちが形作るのです 00:01:06.503 --> 00:01:08.106 しかし そのためには 00:01:08.106 --> 00:01:11.619 コード化の方法と同じくらいに 00:01:11.619 --> 00:01:13.649 考え方にも注意を向けねばなりません 00:01:13.649 --> 00:01:16.747 物を数えるだけでなく さらにそれを理解するために 00:01:16.747 --> 00:01:18.616 難解な問いを 00:01:18.616 --> 00:01:21.218 投げかけねばなりません 00:01:21.218 --> 00:01:23.664 私たちは世界に どれ位のデータがあるか 00:01:23.664 --> 00:01:26.140 常に聞かされていますが 00:01:26.140 --> 00:01:27.720 ビッグデータや 00:01:27.720 --> 00:01:30.316 それを読み解く難解さとなると 00:01:30.316 --> 00:01:32.404 量だけがすべてではありません 00:01:32.404 --> 00:01:35.307 データが動く速さも問題になりますし 00:01:35.307 --> 00:01:37.003 データには様々な種類があります 00:01:37.003 --> 00:01:39.501 ごくわずかな例を挙げると 00:01:39.501 --> 00:01:41.699 画像 00:01:41.699 --> 00:01:45.706 文章 00:01:45.706 --> 00:01:47.801 映像 00:01:47.801 --> 00:01:49.631 音声などです 00:01:49.631 --> 00:01:52.673 これら別々の種類のデータに 共通しているのは 00:01:52.673 --> 00:01:54.894 これらは人の手で作られ 00:01:54.894 --> 00:01:57.669 文脈を必要としているということです 00:01:57.669 --> 00:02:00.114 さて イリノイ大学シカゴ校出身の 00:02:00.114 --> 00:02:02.419 データ科学者のグループがあります 00:02:02.419 --> 00:02:04.973 このグループは ヘルス・メディア・コラボラトリーと呼ばれ 00:02:04.973 --> 00:02:07.560 米国疾病管理センターと一緒に仕事をし 00:02:07.560 --> 00:02:09.065 人々が 00:02:09.065 --> 00:02:11.913 禁煙についての言い表し方や 00:02:11.913 --> 00:02:14.593 電子タバコについての言い表し方 00:02:14.593 --> 00:02:16.578 禁煙を促すために協力しあえることを 00:02:16.578 --> 00:02:18.562 より良く理解するよう努めました 00:02:18.562 --> 00:02:20.575 興味深いことに 人がどのように 00:02:20.575 --> 00:02:22.791 喫煙について話しているかを 理解するにはまず 00:02:22.791 --> 00:02:24.692 「smoking (吸う)」という語で 00:02:24.692 --> 00:02:27.257 どんな意味が表されているかを 理解せねばなりません 00:02:27.257 --> 00:02:31.183 ツイッター上には 4つの主なカテゴリーがあります 00:02:31.183 --> 00:02:34.180 1つ目 タバコを「吸う」 00:02:34.180 --> 00:02:36.987 2つ目 マリファナを「吸入する」 00:02:36.987 --> 00:02:39.630 3つ目 リブ肉を「いぶす」 00:02:39.630 --> 00:02:43.183 4つ目 「煙が出るほどホットな」イケてる女 00:02:43.183 --> 00:02:46.176 (笑) 00:02:46.176 --> 00:02:48.602 電子タバコについて どのように話されているかは 00:02:48.602 --> 00:02:50.742 その上で考えてみなければなりません 00:02:50.742 --> 00:02:52.767 これには 非常に様々な例が見られます 00:02:52.767 --> 00:02:55.366 スライドからもおわかりのように 00:02:55.366 --> 00:02:57.976 これは複雑な問いなのです 00:02:57.976 --> 00:03:01.200 このことで思い出すのは 00:03:01.200 --> 00:03:03.611 言語は人々によって作られたものであり 00:03:03.611 --> 00:03:05.951 人間は厄介かつ複雑なもので 00:03:05.951 --> 00:03:08.718 比喩やスラングや隠語を 使うものだということ 00:03:08.718 --> 00:03:11.997 そしてそれを人間は毎日24時間 多くの言語で行い続けており 00:03:11.997 --> 00:03:15.221 理解するやいなや その言葉自体を変えてしまうことです 00:03:15.221 --> 00:03:20.339 では 米国疾病管理センターが出した 00:03:20.339 --> 00:03:22.769 喉に穴が開いた女性を 映し出すこのテレビ広告は 00:03:22.769 --> 00:03:24.790 非常に描写が露骨で 00:03:24.790 --> 00:03:26.694 気持ちの良いものではありませんが 00:03:26.694 --> 00:03:28.579 この広告は実際に禁煙するように 00:03:28.579 --> 00:03:31.250 人々を促したのでしょうか? 00:03:31.250 --> 00:03:34.557 ヘルス・メディア・コラボラトリーは データの限界を認めてはいますが 00:03:34.557 --> 00:03:36.562 その結論によると 00:03:36.562 --> 00:03:39.874 あなた方も見たことがあるかもしれない これらの広告によって 00:03:39.874 --> 00:03:42.465 将来の行動が 00:03:42.465 --> 00:03:44.287 影響されるかもしれないような 00:03:44.287 --> 00:03:47.954 思考プロセスに 人々を導いたのだそうです 00:03:47.954 --> 00:03:51.845 私がこのプロジェクトについて 感心し 評価するのは 00:03:51.845 --> 00:03:53.334 人間の現実的な必要性に 基づいている などの事実面はさておき 00:03:53.334 --> 00:03:57.391 人間の現実的な必要性に 基づいている などの事実面はさておき 00:03:57.391 --> 00:04:00.237 これが無関心の海に真っ向から 立ち向かう勇気を示す 00:04:00.237 --> 00:04:04.680 素晴らしい例であるということです 00:04:04.680 --> 00:04:07.985 一方 理解が難しいのは ビッグデータだけではないのです 00:04:07.985 --> 00:04:10.586 なぜなら 考えてもみてください 00:04:10.586 --> 00:04:13.180 私たち人間は データの大小にかかわらず 00:04:13.180 --> 00:04:15.873 それを台無しにしてしまった 豊かな歴史を 00:04:15.873 --> 00:04:17.490 有しているではありませんか 00:04:17.490 --> 00:04:21.226 何年も前に ロナルド・レーガン元大統領が 00:04:21.226 --> 00:04:23.500 このように述べて厳しく批判されたことを 00:04:23.500 --> 00:04:25.491 皆さんも覚えているかもしれません 00:04:25.491 --> 00:04:28.501 「事実とは馬鹿げたものである」と 00:04:28.501 --> 00:04:31.295 これは言い間違いでした 公平を期すなら ですが 00:04:31.295 --> 00:04:33.725 彼はジョン・アダムズが 00:04:33.725 --> 00:04:36.476 ボストン虐殺事件裁判において イギリス人兵士の弁護で述べた 00:04:36.476 --> 00:04:39.626 「事実とは確固たるものである」を 引用したつもりだったのです 00:04:39.626 --> 00:04:42.250 しかし このレーガンの言い間違いは 00:04:42.250 --> 00:04:45.668 偶然ながらも 一理あると私は思います 00:04:45.668 --> 00:04:48.444 なぜなら 事実は確固たるものですが 00:04:48.444 --> 00:04:51.367 時に 馬鹿げてもいるからです 00:04:51.367 --> 00:04:53.255 これが 私にとってなぜ重要なのか 00:04:53.255 --> 00:04:56.803 個人的なお話をしたいと思います 00:04:56.803 --> 00:04:59.240 ひと息つかせてください 00:04:59.240 --> 00:05:01.994 息子のアイザックは 2歳の時に 00:05:01.994 --> 00:05:04.411 自閉症の診断を受けました 00:05:04.411 --> 00:05:06.572 彼はにこにこして 愉快で 00:05:06.572 --> 00:05:08.607 愛情深く 優しい男の子でしたが 00:05:08.607 --> 00:05:11.509 彼の発育評価についての測定基準が 00:05:11.509 --> 00:05:13.579 着目したのは 話せる言葉の数や― 00:05:13.579 --> 00:05:17.236 これは当時 ゼロでした― 00:05:17.236 --> 00:05:21.176 意思疎通を図る身振り アイコンタクトなどであったため 00:05:21.176 --> 00:05:23.179 彼の発育レベルは 00:05:23.179 --> 00:05:27.140 9か月の赤ちゃん程度でした 00:05:27.140 --> 00:05:30.100 この診断は事実からすれば 正しいものでしたが 00:05:30.100 --> 00:05:33.309 全体像を語ってはいませんでした 00:05:33.309 --> 00:05:34.710 およそ1年半後 00:05:34.710 --> 00:05:36.812 アイザックがもうすぐ4歳になる頃 00:05:36.812 --> 00:05:39.175 私は ある日 彼がコンピュータの前で 00:05:39.175 --> 00:05:44.628 グーグル画像検索で 女性を検索しているのを見つけました 00:05:44.628 --> 00:05:48.244 「w-i-m-e-n」というつづりで です 00:05:48.244 --> 00:05:50.984 過干渉な親がそうするように 私も 00:05:50.984 --> 00:05:52.885 「前のページに戻る」ボタンをクリックし 00:05:52.885 --> 00:05:56.248 他に何を検索していたのか知ろうとしました 00:05:56.248 --> 00:05:58.419 他の検索は 順番に「男性」 00:05:58.419 --> 00:06:05.686 「学校」 「バス」 そして「コンピュータ」でした 00:06:05.686 --> 00:06:07.756 私は呆気にとられました 00:06:07.756 --> 00:06:09.758 アイザックがスペルを知っているとも 00:06:09.758 --> 00:06:11.524 ましてや読めるとも知らなかったのです 00:06:11.524 --> 00:06:13.717 そこで息子に訊きました 「どうやったの?」 00:06:13.717 --> 00:06:16.395 アイザックは私を真剣に見て 言いました 00:06:16.395 --> 00:06:19.747 「ボックスに文字をタイプしたんだ」 00:06:19.747 --> 00:06:23.481 彼は自分で意思疎通の仕方を 学んでいたのに 00:06:23.481 --> 00:06:26.485 私たちは誤った部分に 目を向けていたのです 00:06:26.485 --> 00:06:28.780 そして こういったことが起こるのは 00:06:28.780 --> 00:06:31.176 査定や分析が ある測定基準― 00:06:31.176 --> 00:06:33.785 ここでは 言語による意思疎通― を過大評価して 00:06:33.785 --> 00:06:39.488 創造的問題解決能力のような 他の基準を過小評価する場合です 00:06:39.488 --> 00:06:41.795 アイザックにとって 他者との意思疎通は難しいので 00:06:41.795 --> 00:06:43.707 彼は自分に必要なことを知るための 00:06:43.707 --> 00:06:46.564 別の方法を見つけたのです 00:06:46.564 --> 00:06:48.454 考えてみれば 合点がいきますね 00:06:48.454 --> 00:06:50.535 質問文を構成するのは 00:06:50.535 --> 00:06:53.100 実に複雑なプロセスですが 00:06:53.100 --> 00:06:55.622 アイザックは検索ボックスに 単語を入れるだけで 00:06:55.622 --> 00:06:59.714 自力で答えにたどり着けるのです 00:06:59.714 --> 00:07:02.650 この些細な瞬間が 00:07:02.650 --> 00:07:05.486 私と家族に 00:07:05.486 --> 00:07:06.795 大きな影響を与えました 00:07:06.795 --> 00:07:09.936 なぜなら これが アイザックに何が起こっているのかを 00:07:09.936 --> 00:07:12.144 把握する方法を変えてくれたからです 00:07:12.144 --> 00:07:15.120 心配もほんの少し和らぎ 00:07:15.120 --> 00:07:17.302 彼の能力を より理解できるようになりました 00:07:17.302 --> 00:07:20.163 事実とは馬鹿げたものなのです 00:07:20.163 --> 00:07:22.560 また事実は意図的 あるいは無意図的に 00:07:22.560 --> 00:07:24.213 誤用されやすいものです 00:07:24.213 --> 00:07:27.239 私には エミリー・ウィリンガムという 科学者の友人がいますが 00:07:27.239 --> 00:07:30.040 彼女は最近フォーブス誌に 00:07:30.040 --> 00:07:32.020 「自閉症と関連付けられてきた 10のおかしな事」 00:07:32.020 --> 00:07:33.830 という記事を書きました 00:07:33.830 --> 00:07:36.835 これは 結構なリストです 00:07:36.835 --> 00:07:40.367 何でもインターネットのせいにされます ねえ? 00:07:40.367 --> 00:07:44.124 もちろん 母親も入っています 00:07:44.124 --> 00:07:45.711 実は もっとあります 00:07:45.711 --> 00:07:49.141 この「母親」のカテゴリーの中に 色々とあるのです 00:07:49.141 --> 00:07:53.956 色々な要素の入った 興味深いリストでしょう? 00:07:53.956 --> 00:07:56.149 私が好きなのは 00:07:56.149 --> 00:07:59.853 「妊娠中 高速道路のそばで 暮らしていた」ですね 00:07:59.853 --> 00:08:01.392 最後のも興味深いです 00:08:01.392 --> 00:08:04.395 「冷蔵庫のような母親」という言葉は 00:08:04.395 --> 00:08:07.000 自閉症の原因に関する 00:08:07.000 --> 00:08:08.431 元々の仮説からきており 00:08:08.431 --> 00:08:11.166 冷徹で愛情が薄い人という意味でした 00:08:11.166 --> 00:08:12.728 ここで こう考えるかもしれませんね 00:08:12.728 --> 00:08:14.385 「わかった データを測定してしまえば 00:08:14.385 --> 00:08:16.167 どんな意味づけも可能と言うんだろう」 00:08:16.167 --> 00:08:20.870 確かに 全くその通りですが 00:08:20.870 --> 00:08:26.480 難しいのは 00:08:26.480 --> 00:08:28.928 私たちは その意味を作り出す機会を 00:08:28.928 --> 00:08:31.212 自らに与えられていることです 00:08:31.212 --> 00:08:36.563 データ自身ではなく 私たちが意味を作るのです 00:08:36.563 --> 00:08:39.820 ビジネスパーソンとして 消費者として 00:08:39.820 --> 00:08:42.359 患者として 市民として 00:08:42.359 --> 00:08:44.755 私たちには より多くの時間を使って 00:08:44.755 --> 00:08:46.949 批判的に考える能力を 00:08:46.949 --> 00:08:49.819 鍛える責任があります 00:08:49.819 --> 00:08:50.897 なぜかって? 00:08:50.897 --> 00:08:54.075 なぜなら 何度も耳にしてきたように 00:08:54.075 --> 00:08:55.781 有史以来 今やものすごい速さで 00:08:55.781 --> 00:08:57.762 何エクサバイトものデータを 00:08:57.762 --> 00:08:59.915 私たちは処理することができるからです 00:08:59.915 --> 00:09:03.430 そして 間違った判断を 00:09:03.430 --> 00:09:05.264 より速く 効率的に下し 00:09:05.264 --> 00:09:10.292 これまでにないほどの影響を及ぼす 可能性があるからです 00:09:10.292 --> 00:09:11.680 すごいと思いませんか? 00:09:11.680 --> 00:09:14.710 ですから 私たちがすべきなのは 00:09:14.710 --> 00:09:17.040 時間をもう少し 00:09:17.040 --> 00:09:19.786 人文学や 00:09:19.786 --> 00:09:23.250 社会学 社会科学― 00:09:23.250 --> 00:09:25.558 修辞学や哲学 倫理学などに費やすことです 00:09:25.558 --> 00:09:28.414 これらがビッグデータに 重要な文脈を与えてくれ 00:09:28.414 --> 00:09:30.990 より批判的な考え方が 00:09:30.990 --> 00:09:33.408 できるようにしてくれるからです 00:09:33.408 --> 00:09:37.615 結局のところ 特定の議論の中に存在する問題を 00:09:37.615 --> 00:09:40.101 見つけることができれば 00:09:40.101 --> 00:09:42.860 それが言葉で表されようと 数字で表されようと関係ないのですから 00:09:42.860 --> 00:09:45.579 つまり 00:09:45.579 --> 00:09:50.000 確証バイアスや誤った相関関係を 00:09:50.000 --> 00:09:51.822 自ら見つけ出し 00:09:51.822 --> 00:09:53.960 感情に露骨に訴えるようなやり方を 00:09:53.960 --> 00:09:55.622 30m手前で見抜けるようにするのです 00:09:55.622 --> 00:09:58.144 なぜなら 何かがある出来事の後に 起こったからといって 00:09:58.144 --> 00:10:01.226 必ずしも関連があるとは限らないからです 00:10:01.226 --> 00:10:03.345 ちょっと 小難しいことを言えば 00:10:03.345 --> 00:10:07.642 ローマ人はこう言い表しました 「post hoc ergo propter hoc」 00:10:07.642 --> 00:10:10.938 「後に起きた ゆえにそれが原因なり」 という前後即因果の誤謬です 00:10:10.938 --> 00:10:14.695 つまり 人口統計学のような 学問を疑問に付すことになります 00:10:14.695 --> 00:10:17.215 なぜかって? なぜなら 人口統計学は 00:10:17.215 --> 00:10:19.521 私たちの実際の考えや行動ではなく 00:10:19.521 --> 00:10:20.983 性別や年齢 00:10:20.983 --> 00:10:24.461 住む場所による推定に基づいているからです 00:10:24.461 --> 00:10:26.124 それから データを取得した以上は 00:10:26.124 --> 00:10:29.263 適切な個人情報保護や 00:10:29.263 --> 00:10:32.839 消費者の意思を汲んで これを扱わねばなりません 00:10:32.839 --> 00:10:35.832 さらには 私たちは 00:10:35.832 --> 00:10:37.935 自身の仮説や用いる方法論 00:10:37.935 --> 00:10:40.531 そして結果の確実性について 00:10:40.531 --> 00:10:43.335 明確でなければなりません 00:10:43.335 --> 00:10:45.809 私の高校の代数の先生は よくこう言っていました 00:10:45.809 --> 00:10:47.340 「計算過程を明らかにしなさい 00:10:47.340 --> 00:10:50.781 君が踏んだ過程がわからなければ 00:10:50.781 --> 00:10:52.772 どの手順を 踏まなかったのかわからないし 00:10:52.772 --> 00:10:55.210 君がどんな問いを立てたのかが わからなければ 00:10:55.210 --> 00:10:58.407 どんな問いを 立てなかったかがわからないからね」 00:10:58.407 --> 00:10:59.930 それは最も難しい問いを 00:10:59.930 --> 00:11:01.409 自らに投げかけることなのです 00:11:01.409 --> 00:11:04.909 このデータは本当に このことを示しているのか? 00:11:04.909 --> 00:11:07.220 それともこの結果が 私たちをもっと 00:11:07.220 --> 00:11:11.098 成功しているとか 心地よく 感じさせてくれるだけなのか? と 00:11:11.098 --> 00:11:13.682 ヘルス・メディア・コラボラトリーは 00:11:13.682 --> 00:11:15.381 プロジェクトの終わりに 00:11:15.381 --> 00:11:18.789 あの非常に露骨で不快な 禁煙推奨広告に関する 00:11:18.789 --> 00:11:20.933 ツイートの87パーセントが 00:11:20.933 --> 00:11:24.971 恐れを表していたことが わかったといいます 00:11:24.971 --> 00:11:26.827 しかし 彼らは 00:11:26.827 --> 00:11:29.988 「広告が実際に人々を禁煙に導いた」 と結論付けていましたか? 00:11:29.988 --> 00:11:32.530 答えはノーです これは科学であり 魔法ではないのです 00:11:32.530 --> 00:11:35.720 ですから データの力を 00:11:35.720 --> 00:11:38.582 解き放つのであれば 00:11:38.582 --> 00:11:42.030 私たちは必ずしも オーウェルの思い描いたような 00:11:42.030 --> 00:11:45.466 全体主義的な未来や 00:11:45.466 --> 00:11:48.583 ハクスリーの描いたような 些末な事柄に溺れる未来 あるいは 00:11:48.583 --> 00:11:51.603 両者を折衷したおぞましい未来に 盲目的に突き進まずに済むのです 00:11:51.603 --> 00:11:53.982 私たちがすべきなのは 00:11:53.982 --> 00:11:56.700 批判的な思考に敬意を払い 00:11:56.700 --> 00:11:58.729 ヘルス・メディア・コラボラトリーのような 前例からインスピレーションを得ることです 00:11:58.729 --> 00:12:01.339 ヘルス・メディア・コラボラトリーのような 前例からインスピレーションを得ることです 00:12:01.339 --> 00:12:03.667 そして ヒーローものの映画に よくあるように 00:12:03.667 --> 00:12:05.489 私たちの力を善きものに使いましょう 00:12:05.489 --> 00:12:07.840 ありがとうございました 00:12:07.840 --> 00:12:10.174 (拍手)