科学技術は多くをもたらしてくれました
月面着陸 インターネット
ヒトゲノム配列の解析などです
ですが 私たちの奥深くにある
恐怖の多くにも それは入り込んでいます
およそ30年ほど前
文化批評家のニール・ポストマンは
"Amusing Ourselves to Death"
という著作で
このことを的確に述べました
彼はこの著作において
ジョージ・オーウェルとオルダス・ハクスリーの
ディストピア (反ユートピア) 思想を比べて
こう書きました
「オーウェルは私たちが
囚われの身になる文化を恐れた
ハクスリーは私たちが
取るに足らないことに耽溺する文化を恐れた
オーウェルは真実が
私たちから隠蔽されることを恐れ
ハクスリーは私たちが無関心の海で
溺れ死ぬことを恐れた」
要するに
「ビッグ・ブラザー」 に監視されるか
「ビッグ・ブラザー」を監視するかの
どちらかということです
(笑)
でも そうでなくともよいのです
私たちはデータや技術を
受け身で消費するだけではありません
生活において
データや技術が果たす役割や
その意味を見出す方法を
私たちが形作るのです
しかし そのためには
コード化の方法と同じくらいに
考え方にも注意を向けねばなりません
物を数えるだけでなく
さらにそれを理解するために
難解な問いを
投げかけねばなりません
私たちは世界に
どれ位のデータがあるか
常に聞かされていますが
ビッグデータや
それを読み解く難解さとなると
量だけがすべてではありません
データが動く速さも問題になりますし
データには様々な種類があります
ごくわずかな例を挙げると
画像
文章
映像
音声などです
これら別々の種類のデータに
共通しているのは
これらは人の手で作られ
文脈を必要としているということです
さて イリノイ大学シカゴ校出身の
データ科学者のグループがあります
このグループは
ヘルス・メディア・コラボラトリーと呼ばれ
米国疾病管理センターと一緒に仕事をし
人々が
禁煙についての言い表し方や
電子タバコについての言い表し方
禁煙を促すために協力しあえることを
より良く理解するよう努めました
興味深いことに 人がどのように
喫煙について話しているかを
理解するにはまず
「smoking (吸う)」という語で
どんな意味が表されているかを
理解せねばなりません
ツイッター上には
4つの主なカテゴリーがあります
1つ目 タバコを「吸う」
2つ目 マリファナを「吸入する」
3つ目 リブ肉を「いぶす」
4つ目 「煙が出るほどホットな」イケてる女
(笑)
電子タバコについて
どのように話されているかは
その上で考えてみなければなりません
これには 非常に様々な例が見られます
スライドからもおわかりのように
これは複雑な問いなのです
このことで思い出すのは
言語は人々によって作られたものであり
人間は厄介かつ複雑なもので
比喩やスラングや隠語を
使うものだということ
そしてそれを人間は毎日24時間
多くの言語で行い続けており
理解するやいなや
その言葉自体を変えてしまうことです
では 米国疾病管理センターが出した
喉に穴が開いた女性を
映し出すこのテレビ広告は
非常に描写が露骨で
気持ちの良いものではありませんが
この広告は実際に禁煙するように
人々を促したのでしょうか?
ヘルス・メディア・コラボラトリーは
データの限界を認めてはいますが
その結論によると
あなた方も見たことがあるかもしれない
これらの広告によって
将来の行動が
影響されるかもしれないような
思考プロセスに
人々を導いたのだそうです
私がこのプロジェクトについて
感心し 評価するのは
人間の現実的な必要性に
基づいている などの事実面はさておき
人間の現実的な必要性に
基づいている などの事実面はさておき
これが無関心の海に真っ向から
立ち向かう勇気を示す
素晴らしい例であるということです
一方 理解が難しいのは
ビッグデータだけではないのです
なぜなら 考えてもみてください
私たち人間は データの大小にかかわらず
それを台無しにしてしまった
豊かな歴史を
有しているではありませんか
何年も前に
ロナルド・レーガン元大統領が
このように述べて厳しく批判されたことを
皆さんも覚えているかもしれません
「事実とは馬鹿げたものである」と
これは言い間違いでした
公平を期すなら ですが
彼はジョン・アダムズが
ボストン虐殺事件裁判において
イギリス人兵士の弁護で述べた
「事実とは確固たるものである」を
引用したつもりだったのです
しかし このレーガンの言い間違いは
偶然ながらも 一理あると私は思います
なぜなら 事実は確固たるものですが
時に 馬鹿げてもいるからです
これが 私にとってなぜ重要なのか
個人的なお話をしたいと思います
ひと息つかせてください
息子のアイザックは 2歳の時に
自閉症の診断を受けました
彼はにこにこして 愉快で
愛情深く 優しい男の子でしたが
彼の発育評価についての測定基準が
着目したのは 話せる言葉の数や―
これは当時 ゼロでした―
意思疎通を図る身振り
アイコンタクトなどであったため
彼の発育レベルは
9か月の赤ちゃん程度でした
この診断は事実からすれば
正しいものでしたが
全体像を語ってはいませんでした
およそ1年半後
アイザックがもうすぐ4歳になる頃
私は ある日
彼がコンピュータの前で
グーグル画像検索で
女性を検索しているのを見つけました
「w-i-m-e-n」というつづりで です
過干渉な親がそうするように 私も
「前のページに戻る」ボタンをクリックし
他に何を検索していたのか知ろうとしました
他の検索は 順番に「男性」
「学校」 「バス」 そして「コンピュータ」でした
私は呆気にとられました
アイザックがスペルを知っているとも
ましてや読めるとも知らなかったのです
そこで息子に訊きました
「どうやったの?」
アイザックは私を真剣に見て 言いました
「ボックスに文字をタイプしたんだ」
彼は自分で意思疎通の仕方を
学んでいたのに
私たちは誤った部分に
目を向けていたのです
そして こういったことが起こるのは
査定や分析が ある測定基準―
ここでは 言語による意思疎通―
を過大評価して
創造的問題解決能力のような
他の基準を過小評価する場合です
アイザックにとって
他者との意思疎通は難しいので
彼は自分に必要なことを知るための
別の方法を見つけたのです
考えてみれば 合点がいきますね
質問文を構成するのは
実に複雑なプロセスですが
アイザックは検索ボックスに
単語を入れるだけで
自力で答えにたどり着けるのです
この些細な瞬間が
私と家族に
大きな影響を与えました
なぜなら これが
アイザックに何が起こっているのかを
把握する方法を変えてくれたからです
心配もほんの少し和らぎ
彼の能力を
より理解できるようになりました
事実とは馬鹿げたものなのです
また事実は意図的 あるいは無意図的に
誤用されやすいものです
私には エミリー・ウィリンガムという
科学者の友人がいますが
彼女は最近フォーブス誌に
「自閉症と関連付けられてきた
10のおかしな事」
という記事を書きました
これは 結構なリストです
何でもインターネットのせいにされます ねえ?
もちろん 母親も入っています
実は もっとあります
この「母親」のカテゴリーの中に
色々とあるのです
色々な要素の入った
興味深いリストでしょう?
私が好きなのは
「妊娠中 高速道路のそばで
暮らしていた」ですね
最後のも興味深いです
「冷蔵庫のような母親」という言葉は
自閉症の原因に関する
元々の仮説からきており
冷徹で愛情が薄い人という意味でした
ここで こう考えるかもしれませんね
「わかった データを測定してしまえば
どんな意味づけも可能と言うんだろう」
確かに 全くその通りですが
難しいのは
私たちは その意味を作り出す機会を
自らに与えられていることです
データ自身ではなく
私たちが意味を作るのです
ビジネスパーソンとして
消費者として
患者として 市民として
私たちには より多くの時間を使って
批判的に考える能力を
鍛える責任があります
なぜかって?
なぜなら 何度も耳にしてきたように
有史以来 今やものすごい速さで
何エクサバイトものデータを
私たちは処理することができるからです
そして 間違った判断を
より速く 効率的に下し
これまでにないほどの影響を及ぼす
可能性があるからです
すごいと思いませんか?
ですから 私たちがすべきなのは
時間をもう少し
人文学や
社会学 社会科学―
修辞学や哲学 倫理学などに費やすことです
これらがビッグデータに
重要な文脈を与えてくれ
より批判的な考え方が
できるようにしてくれるからです
結局のところ
特定の議論の中に存在する問題を
見つけることができれば
それが言葉で表されようと
数字で表されようと関係ないのですから
つまり
確証バイアスや誤った相関関係を
自ら見つけ出し
感情に露骨に訴えるようなやり方を
30m手前で見抜けるようにするのです
なぜなら 何かがある出来事の後に
起こったからといって
必ずしも関連があるとは限らないからです
ちょっと 小難しいことを言えば
ローマ人はこう言い表しました
「post hoc ergo propter hoc」
「後に起きた ゆえにそれが原因なり」
という前後即因果の誤謬です
つまり 人口統計学のような
学問を疑問に付すことになります
なぜかって?
なぜなら 人口統計学は
私たちの実際の考えや行動ではなく
性別や年齢
住む場所による推定に基づいているからです
それから データを取得した以上は
適切な個人情報保護や
消費者の意思を汲んで
これを扱わねばなりません
さらには 私たちは
自身の仮説や用いる方法論
そして結果の確実性について
明確でなければなりません
私の高校の代数の先生は
よくこう言っていました
「計算過程を明らかにしなさい
君が踏んだ過程がわからなければ
どの手順を
踏まなかったのかわからないし
君がどんな問いを立てたのかが
わからなければ
どんな問いを
立てなかったかがわからないからね」
それは最も難しい問いを
自らに投げかけることなのです
このデータは本当に
このことを示しているのか?
それともこの結果が 私たちをもっと
成功しているとか 心地よく
感じさせてくれるだけなのか? と
ヘルス・メディア・コラボラトリーは
プロジェクトの終わりに
あの非常に露骨で不快な
禁煙推奨広告に関する
ツイートの87パーセントが
恐れを表していたことが
わかったといいます
しかし 彼らは
「広告が実際に人々を禁煙に導いた」
と結論付けていましたか?
答えはノーです
これは科学であり 魔法ではないのです
ですから データの力を
解き放つのであれば
私たちは必ずしも
オーウェルの思い描いたような
全体主義的な未来や
ハクスリーの描いたような
些末な事柄に溺れる未来 あるいは
両者を折衷したおぞましい未来に
盲目的に突き進まずに済むのです
私たちがすべきなのは
批判的な思考に敬意を払い
ヘルス・メディア・コラボラトリーのような
前例からインスピレーションを得ることです
ヘルス・メディア・コラボラトリーのような
前例からインスピレーションを得ることです
そして ヒーローものの映画に
よくあるように
私たちの力を善きものに使いましょう
ありがとうございました
(拍手)