WEBVTT 00:00:01.354 --> 00:00:04.489 科技帶給我們很多美好的事物: 00:00:04.489 --> 00:00:06.607 登陸月球、網路、 00:00:06.607 --> 00:00:09.347 人類基因組定序。 00:00:09.347 --> 00:00:12.953 但也挖掘出我們內心深處的許多恐懼。 00:00:12.953 --> 00:00:14.906 大約 30 年前, 00:00:14.906 --> 00:00:17.511 文化評論家尼爾.波茲曼寫了一本書, 00:00:17.511 --> 00:00:19.190 叫做《娛樂至死》, 00:00:19.190 --> 00:00:22.177 書中把這個現象說得很妙。 00:00:22.177 --> 00:00:23.724 他是這樣說的: 00:00:23.724 --> 00:00:29.413 比較歐威爾和赫胥黎的兩種反烏托邦, 00:00:29.413 --> 00:00:32.896 他說,歐威爾擔心我們會成為 00:00:32.896 --> 00:00:35.072 圈養的文化。 00:00:35.072 --> 00:00:38.752 赫胥黎則擔心我們會成為庸俗的文化。 00:00:38.752 --> 00:00:42.877 歐威爾擔心真相會被隱瞞, 00:00:42.877 --> 00:00:47.663 赫胥黎則擔心我們會被瑣碎的汪洋吞沒。 00:00:47.663 --> 00:00:48.963 簡單點說, 00:00:48.963 --> 00:00:52.399 我們可以選擇「老大哥監視你」 00:00:52.399 --> 00:00:54.560 或是「你監視老大哥」 NOTE Paragraph 00:00:54.560 --> 00:00:57.024 (觀眾笑聲) NOTE Paragraph 00:00:57.024 --> 00:00:58.720 其實不必這樣, 00:00:58.720 --> 00:01:02.273 我們不是被動地消費資料和科技, 00:01:02.273 --> 00:01:04.673 我們可以決定科技在生活中扮演的角色, 00:01:04.673 --> 00:01:06.876 和它對我們的意義。 00:01:06.876 --> 00:01:08.273 但是要這麼做, 00:01:08.273 --> 00:01:11.380 我們必須重視思考的方式, 00:01:11.380 --> 00:01:13.649 不只重視編碼的方式。 00:01:13.649 --> 00:01:16.707 我們必須問問題,難解的問題, 00:01:16.707 --> 00:01:18.616 超越單純的算術, 00:01:18.616 --> 00:01:21.218 試圖去了解。 00:01:21.218 --> 00:01:26.142 我們不斷聽到世界上有多少資料, 00:01:26.142 --> 00:01:27.720 但是談到大數據, 00:01:27.720 --> 00:01:30.316 以及詮釋這些數據資料的挑戰, 00:01:30.316 --> 00:01:32.404 光看數量是不夠的, 00:01:32.404 --> 00:01:35.307 還必須關注資料成長的速度, 00:01:35.307 --> 00:01:37.353 以及眾多不同的資料類型。 00:01:37.353 --> 00:01:39.501 我略舉幾個例子: 00:01:39.501 --> 00:01:41.699 圖像、 00:01:41.699 --> 00:01:45.773 文字、 [請稍候,直到你有用處的時候,謝謝。] 00:01:45.773 --> 00:01:47.801 影片、 00:01:47.801 --> 00:01:49.631 聲音。 00:01:49.631 --> 00:01:52.673 這些不同資料類型的共通處在於 00:01:52.673 --> 00:01:54.894 它們都是人建立的, 00:01:54.894 --> 00:01:57.669 也都不能斷章取義來詮釋。 NOTE Paragraph 00:01:57.669 --> 00:02:00.114 舉例,有一個資料科學家小組, 00:02:00.114 --> 00:02:02.419 成員來自伊利諾大學芝加哥分校, 00:02:02.419 --> 00:02:04.973 這小組叫做「衛生媒體合作實驗室」。 00:02:04.973 --> 00:02:07.560 他們和美國疾病管制中心合作, 00:02:07.560 --> 00:02:09.065 想要更了解 00:02:09.065 --> 00:02:11.913 人們怎樣談論戒菸、 00:02:11.913 --> 00:02:14.593 怎樣談論電子香煙, 00:02:14.593 --> 00:02:18.098 以及怎樣一起幫助吸菸者戒菸。 00:02:18.562 --> 00:02:19.425 有趣的是, 00:02:19.425 --> 00:02:22.791 若要了解人們如何談論抽菸 smoking, 00:02:22.791 --> 00:02:27.252 就要先了解人們說 smoking 是什麼意思。 00:02:27.257 --> 00:02:31.183 在推特上大致分成四類: 00:02:31.183 --> 00:02:34.180 第一類,抽菸; 00:02:34.180 --> 00:02:36.987 第二類,抽大麻; 00:02:36.987 --> 00:02:39.630 第三類,煙熏肋排; 00:02:39.630 --> 00:02:43.183 第四類,嗆辣正妹; 00:02:43.183 --> 00:02:46.176 (觀眾笑聲) NOTE Paragraph 00:02:46.176 --> 00:02:48.602 接著要思考, 00:02:48.602 --> 00:02:50.932 人們怎麼談論電子香菸? 00:02:50.932 --> 00:02:53.997 講法五花八門, 00:02:53.997 --> 00:02:55.638 就像這張投影片所列的, 00:02:55.638 --> 00:02:58.799 這種檢索非常複雜。 00:02:58.799 --> 00:03:01.200 這提醒我們, 00:03:01.200 --> 00:03:03.611 語言是人創造的, 00:03:03.611 --> 00:03:05.951 而人是複雜、亂無章法的, 00:03:05.951 --> 00:03:08.718 我們會用隱喻、俚語、行話, 00:03:08.718 --> 00:03:11.997 無時無刻的製造,各式各樣的語言, 00:03:11.997 --> 00:03:15.221 好不容易破解語言,就立刻又改變了。 NOTE Paragraph 00:03:15.221 --> 00:03:20.339 那麼,疾管中心拍的這些戒菸文宣, 00:03:20.339 --> 00:03:24.090 電視廣告裡,一名女子喉嚨破了大洞, 00:03:24.090 --> 00:03:26.694 畫面驚悚嚇人, 00:03:26.694 --> 00:03:28.579 這些廣告真的有效嗎? 00:03:28.579 --> 00:03:31.250 真的讓人戒菸了嗎? 00:03:31.250 --> 00:03:34.557 衛生媒體合作實驗室尊重其數據的限制, 00:03:34.557 --> 00:03:36.562 但仍能做出結論, 00:03:36.562 --> 00:03:39.874 認為這些廣告—也許你們看過, 00:03:39.874 --> 00:03:44.267 成功地刺激人們開始反省, 00:03:44.267 --> 00:03:47.954 可能影響未來的行為。 00:03:47.954 --> 00:03:51.845 這個計畫讓我最欽佩、欣賞的地方是, 00:03:51.845 --> 00:03:57.394 除了它是在解決人的實際需要以外, 00:03:57.394 --> 00:03:59.557 同時它提供了絕佳的典範, 00:03:59.557 --> 00:04:04.680 展現了人類面對瑣碎汪洋的勇氣。 NOTE Paragraph 00:04:04.680 --> 00:04:09.716 所以,詮釋的挑戰不只因為資料龐大, 00:04:09.716 --> 00:04:13.505 因為,老實說,歷史上有很多的例子顯示, 00:04:13.513 --> 00:04:17.490 無論資料再少,我們向來很能把它搞砸。 00:04:17.490 --> 00:04:21.227 大家可能記得,很多年前, 00:04:21.227 --> 00:04:24.441 前總統雷根曾被痛罵, 00:04:24.441 --> 00:04:28.501 因為他說,事實是愚笨的東西。 00:04:28.501 --> 00:04:31.183 憑良心說,他只是一時口誤, 00:04:31.183 --> 00:04:33.725 他其實是想引用約翰.亞當斯在 00:04:33.725 --> 00:04:36.616 為因波士頓慘案受審的英軍辯護時說的: 00:04:36.616 --> 00:04:39.626 事實是固執難拗、不容改變的。 00:04:39.626 --> 00:04:42.250 但我其實認為, 00:04:42.250 --> 00:04:45.668 這口誤可能湊巧講出幾分智慧, 00:04:45.668 --> 00:04:48.444 因為事實確實很固執, 00:04:48.444 --> 00:04:51.367 但是有時也真的很愚笨。 NOTE Paragraph 00:04:51.367 --> 00:04:53.255 我要講一個自己的故事, 00:04:53.255 --> 00:04:56.803 解釋為什麼這對我這麼重要。 00:04:56.803 --> 00:04:59.240 我要先吸一口氣。 00:04:59.240 --> 00:05:01.994 我兒子艾薩克兩歲的時候, 00:05:01.994 --> 00:05:04.411 被診斷為自閉兒。 00:05:04.411 --> 00:05:06.572 但他是個快樂、搞笑、 00:05:06.572 --> 00:05:08.607 有愛心、喜歡親密的孩子, 00:05:08.607 --> 00:05:11.509 但是他的發展評估測驗數據 00:05:11.509 --> 00:05:12.789 檢視的是: 00:05:12.789 --> 00:05:15.876 他當時會說幾個字?零個。 00:05:17.236 --> 00:05:19.216 只靠手勢溝通, 00:05:19.216 --> 00:05:20.919 眼神接觸也極少, 00:05:20.919 --> 00:05:23.415 讓他的發展程度 00:05:23.415 --> 00:05:27.039 被評為九個月大的嬰兒。 00:05:27.039 --> 00:05:30.100 按照數據,診斷並沒有錯, 00:05:30.100 --> 00:05:33.309 卻跟實際狀況有落差。 00:05:33.309 --> 00:05:36.810 大概過了一年半,兒子快滿四歲, 00:05:36.812 --> 00:05:39.175 有一天,我看到他坐在電腦前面, 00:05:39.175 --> 00:05:44.628 在用 Google 搜尋女性的照片, 00:05:44.628 --> 00:05:48.244 他把女性 (women) 拼成 "w-i-m-e-n"。 00:05:48.244 --> 00:05:50.984 我的反應跟任何偏執妄想的父母一樣, 00:05:50.984 --> 00:05:52.885 立刻開始按瀏覽器的「返回」按鈕, 00:05:52.885 --> 00:05:56.248 看看他還搜尋過什麼。 00:05:56.248 --> 00:05:58.644 結果發現他依序搜尋過:男性 (men)、 00:05:58.644 --> 00:06:01.789 學校 (school)、公車 (bus)、 00:06:01.794 --> 00:06:05.730 和電腦(錯拼成 cpyutr)。 00:06:05.730 --> 00:06:07.756 我很吃驚, 00:06:07.756 --> 00:06:09.758 因為我們根本不知道他會拼字, 00:06:09.758 --> 00:06:10.884 更別說閱讀。 00:06:10.884 --> 00:06:13.747 所以我問他: 「艾薩克,你怎麼辦到的?」 00:06:13.747 --> 00:06:16.337 他認真的看著我,說: 00:06:16.337 --> 00:06:19.929 「在搜尋欄裡打字啊!」 NOTE Paragraph 00:06:19.929 --> 00:06:23.343 他在教自己溝通, 00:06:23.343 --> 00:06:26.423 只是我們都找錯方向了。 00:06:26.423 --> 00:06:28.063 會發生這種情況, 00:06:28.063 --> 00:06:31.174 是因為評量和分析太重視單一面向, 00:06:31.176 --> 00:06:33.785 就像他的自閉症評量, 單看口語表達, 00:06:33.785 --> 00:06:35.638 而忽視其他要素, 00:06:35.638 --> 00:06:38.317 例如,創造性地解決問題。 00:06:39.367 --> 00:06:41.836 溝通對艾薩克來說很困難, 00:06:41.836 --> 00:06:43.867 所以他找到了替代方法, 00:06:43.867 --> 00:06:46.564 來找解答。 00:06:46.564 --> 00:06:48.454 想想很有道理, 00:06:48.454 --> 00:06:53.095 因為問問題是很複雜的過程, 00:06:53.100 --> 00:06:55.819 但他只要在搜尋欄輸入一個字, 00:06:55.819 --> 00:06:59.466 就成功了一大半。 NOTE Paragraph 00:06:59.466 --> 00:07:02.650 於是這個小小的時刻 00:07:02.650 --> 00:07:05.486 對我影響深遠, 00:07:05.486 --> 00:07:06.795 對我們全家都是。 00:07:06.795 --> 00:07:09.936 因為,這改變了我們的判斷標準, 00:07:09.936 --> 00:07:12.144 用全新的眼光看待兒子的狀況, 00:07:12.144 --> 00:07:14.010 比較不那麼擔憂, 00:07:14.010 --> 00:07:17.302 轉而欣賞他解決問題的能力。 NOTE Paragraph 00:07:17.302 --> 00:07:20.163 事實,真的是愚笨的。 00:07:20.163 --> 00:07:22.560 事實也很容易被誤用, 00:07:22.560 --> 00:07:24.213 不論是有心或無意。 00:07:24.213 --> 00:07:27.239 我的朋友艾蜜莉.威靈漢是個科學家, 00:07:27.239 --> 00:07:30.040 她不久前為《富比士》寫了一篇文章, 00:07:30.040 --> 00:07:33.830 叫做〈 自閉症怪異印象十大排行榜〉, 00:07:33.830 --> 00:07:36.835 內容挺可怕的: 00:07:36.835 --> 00:07:40.367 「網路」,萬惡淵藪,對吧? 00:07:40.367 --> 00:07:42.524 當然「媽媽」也上榜, 00:07:42.524 --> 00:07:44.059 不言自明。 00:07:44.059 --> 00:07:45.854 等等,還有, 00:07:45.854 --> 00:07:49.141 這裡有一大類,都跟「媽媽」有關係, 00:07:49.141 --> 00:07:53.956 你可以看到,原因很多、很有意思。 00:07:53.956 --> 00:07:56.149 我最喜歡的是 00:07:56.149 --> 00:07:59.853 「在高速公路附近受孕」。 00:07:59.853 --> 00:08:01.392 最後一項很有趣, 00:08:01.392 --> 00:08:04.395 因為「冰箱母親」這個封號 00:08:04.395 --> 00:08:08.440 是自閉症原因最早的假說, 00:08:08.440 --> 00:08:11.166 用來描述冷漠沒有愛心的母親。 NOTE Paragraph 00:08:11.166 --> 00:08:12.728 現在,你可能會想: 00:08:12.728 --> 00:08:14.385 「好了,蘇珊,我們懂了, 00:08:14.385 --> 00:08:16.167 你可以對資料做任何詮釋。」 00:08:16.167 --> 00:08:18.521 這也沒錯, 00:08:18.521 --> 00:08:20.520 絕對正確。 00:08:21.238 --> 00:08:24.730 但是挑戰在於, 00:08:26.480 --> 00:08:28.928 我們自己有這個機會, 00:08:28.928 --> 00:08:31.212 可以賦予資料意義, 00:08:31.212 --> 00:08:34.871 因為老實說,資料不會自己產生意義。 00:08:34.871 --> 00:08:36.670 我們才可以。 00:08:36.670 --> 00:08:39.820 所以,身為商人、消費者、 00:08:39.820 --> 00:08:42.359 病人、公民等等, 00:08:42.359 --> 00:08:44.755 我想我們有責任 00:08:44.755 --> 00:08:46.949 多花點時間 00:08:46.949 --> 00:08:49.819 提升我們的批判性思考能力。 00:08:49.819 --> 00:08:50.897 為什麼? 00:08:50.897 --> 00:08:55.795 我們聽過很多次, 因為在歷史的這一刻, 00:08:55.795 --> 00:08:59.902 已經能用光速 處理數十億 GB 的資料量, 00:08:59.902 --> 00:09:05.260 可能更快速、更有效地 做出錯誤的決定, 00:09:05.264 --> 00:09:08.808 影響之大可能更甚以往。 00:09:10.292 --> 00:09:11.680 這下好了,對吧? 00:09:11.680 --> 00:09:15.073 所以,我們反而必須 00:09:15.073 --> 00:09:17.040 多花時間 00:09:17.040 --> 00:09:19.786 發展人文、 00:09:19.786 --> 00:09:23.250 社會學和社會科學, 00:09:23.250 --> 00:09:25.558 修辭、哲學、倫理, 00:09:25.558 --> 00:09:28.414 因為這些知識 構成我們的背景涵養, 00:09:28.414 --> 00:09:30.300 對大數據非常重要, 00:09:30.300 --> 00:09:33.408 也因為這能幫助我們更會思辨, 00:09:33.408 --> 00:09:35.068 因為畢竟, 00:09:35.068 --> 00:09:39.020 如果我能看出命題裡的問題, 00:09:39.021 --> 00:09:42.860 那麼無論是 用文字或數據表達都可以。 00:09:42.860 --> 00:09:45.579 這表示, 00:09:45.579 --> 00:09:47.300 要教育我們自己 00:09:47.300 --> 00:09:49.741 去發覺各種確認的偏見 00:09:49.741 --> 00:09:51.822 和謬誤的關聯, 00:09:51.822 --> 00:09:55.640 並且能對赤裸裸的情感訴求保持警覺。 00:09:55.640 --> 00:09:58.144 因為甲事之後發生了乙事, 00:09:58.144 --> 00:10:01.226 並不代表 甲事必定是乙事的肇因。 00:10:01.226 --> 00:10:03.345 如果大家容我書呆一下, 00:10:03.345 --> 00:10:07.642 羅馬人稱這現象為「後此謬誤」 "post hoc ergo propter hoc", 00:10:07.642 --> 00:10:10.938 後此,故因此。 NOTE Paragraph 00:10:10.938 --> 00:10:14.695 這表示要質疑像人口統計這樣的方法。 00:10:14.695 --> 00:10:15.725 為什麼? 00:10:15.725 --> 00:10:18.381 因為這些都假設 我們一定是某種人, 00:10:18.381 --> 00:10:21.221 只憑我們的性別、年齡、居住地, 00:10:21.221 --> 00:10:23.901 而忽視我們實際的思考和行為資料。 00:10:23.901 --> 00:10:25.901 現在有了這些資料, 00:10:25.901 --> 00:10:29.263 我們必須做好隱私權控管, 00:10:29.263 --> 00:10:33.000 以及讓消費者自願參與。 00:10:33.000 --> 00:10:34.453 再來, 00:10:34.453 --> 00:10:37.925 我們必須很清楚我們的假設、 00:10:37.925 --> 00:10:40.531 使用的方法, 00:10:40.531 --> 00:10:43.335 以及我們對結果的信心。 00:10:43.335 --> 00:10:45.809 就像我高中代數老師常說的: 00:10:45.809 --> 00:10:47.340 「算給我看。 00:10:47.340 --> 00:10:50.781 因為如果我不知道 你做了哪些步驟, 00:10:50.781 --> 00:10:52.772 就不知道哪些步驟你沒有做。 00:10:52.772 --> 00:10:55.210 如果我不知道你問了哪些問題, 00:10:55.210 --> 00:10:58.407 就不知道哪些問題你沒有問。」 00:10:58.407 --> 00:10:59.930 這表示我們要問自己 00:10:59.930 --> 00:11:01.818 最難的一個問題: 00:11:01.818 --> 00:11:04.880 「數據資料真的有這樣說嗎? 00:11:04.880 --> 00:11:07.377 還是這種結果讓我們覺得 00:11:07.377 --> 00:11:11.020 比較成功和自在?」 NOTE Paragraph 00:11:11.020 --> 00:11:14.882 衛生媒體合作實驗室在計畫結束時, 00:11:14.882 --> 00:11:18.789 發現 87% 的推文 00:11:18.789 --> 00:11:22.593 回應那些令人不安的戒菸廣告時, 00:11:22.593 --> 00:11:24.971 表達了恐懼。 00:11:24.971 --> 00:11:25.977 但是, 00:11:25.977 --> 00:11:29.808 他們有說那些廣告讓人成功戒菸嗎? 00:11:29.808 --> 00:11:32.530 沒有。這是科學,不是魔術。 NOTE Paragraph 00:11:32.530 --> 00:11:33.930 所以, 00:11:33.930 --> 00:11:37.802 如果想要釋放數據的力量, 00:11:38.582 --> 00:11:42.030 我們不必盲目地踏進 00:11:42.030 --> 00:11:45.466 歐威爾預見的極權主義未來, 00:11:45.466 --> 00:11:48.583 或是赫胥黎的瑣碎世界, 00:11:48.583 --> 00:11:51.603 或是兩者的可怕綜合體。 00:11:51.603 --> 00:11:53.982 我們必須做的是, 00:11:53.982 --> 00:11:56.700 重視批判性思考, 00:11:56.700 --> 00:12:01.319 並且向衛生媒體合作室 這樣的典範學習。 00:12:01.319 --> 00:12:03.667 就像超級英雄電影常講的: 00:12:03.667 --> 00:12:05.843 「讓我們把我們的力量用在正途。」 NOTE Paragraph 00:12:05.843 --> 00:12:06.975 謝謝。 NOTE Paragraph 00:12:06.975 --> 00:12:10.174 (觀眾掌聲)