1 00:00:01,354 --> 00:00:04,489 科技帶給我們很多美好的事物: 2 00:00:04,489 --> 00:00:06,607 登陸月球、網路、 3 00:00:06,607 --> 00:00:09,347 人類基因組定序。 4 00:00:09,347 --> 00:00:12,953 但也挖掘出我們內心深處的許多恐懼。 5 00:00:12,953 --> 00:00:14,906 大約 30 年前, 6 00:00:14,906 --> 00:00:17,511 文化評論家尼爾.波茲曼寫了一本書, 7 00:00:17,511 --> 00:00:19,190 叫做《娛樂至死》, 8 00:00:19,190 --> 00:00:22,177 書中把這個現象說得很妙。 9 00:00:22,177 --> 00:00:23,724 他是這樣說的: 10 00:00:23,724 --> 00:00:29,413 比較歐威爾和赫胥黎的兩種反烏托邦, 11 00:00:29,413 --> 00:00:32,896 他說,歐威爾擔心我們會成為 12 00:00:32,896 --> 00:00:35,072 圈養的文化。 13 00:00:35,072 --> 00:00:38,752 赫胥黎則擔心我們會成為庸俗的文化。 14 00:00:38,752 --> 00:00:42,877 歐威爾擔心真相會被隱瞞, 15 00:00:42,877 --> 00:00:47,663 赫胥黎則擔心我們會被瑣碎的汪洋吞沒。 16 00:00:47,663 --> 00:00:48,963 簡單點說, 17 00:00:48,963 --> 00:00:52,399 我們可以選擇「老大哥監視你」 18 00:00:52,399 --> 00:00:54,560 或是「你監視老大哥」 19 00:00:54,560 --> 00:00:57,024 (觀眾笑聲) 20 00:00:57,024 --> 00:00:58,720 其實不必這樣, 21 00:00:58,720 --> 00:01:02,273 我們不是被動地消費資料和科技, 22 00:01:02,273 --> 00:01:04,673 我們可以決定科技在生活中扮演的角色, 23 00:01:04,673 --> 00:01:06,876 和它對我們的意義。 24 00:01:06,876 --> 00:01:08,273 但是要這麼做, 25 00:01:08,273 --> 00:01:11,380 我們必須重視思考的方式, 26 00:01:11,380 --> 00:01:13,649 不只重視編碼的方式。 27 00:01:13,649 --> 00:01:16,707 我們必須問問題,難解的問題, 28 00:01:16,707 --> 00:01:18,616 超越單純的算術, 29 00:01:18,616 --> 00:01:21,218 試圖去了解。 30 00:01:21,218 --> 00:01:26,142 我們不斷聽到世界上有多少資料, 31 00:01:26,142 --> 00:01:27,720 但是談到大數據, 32 00:01:27,720 --> 00:01:30,316 以及詮釋這些數據資料的挑戰, 33 00:01:30,316 --> 00:01:32,404 光看數量是不夠的, 34 00:01:32,404 --> 00:01:35,307 還必須關注資料成長的速度, 35 00:01:35,307 --> 00:01:37,353 以及眾多不同的資料類型。 36 00:01:37,353 --> 00:01:39,501 我略舉幾個例子: 37 00:01:39,501 --> 00:01:41,699 圖像、 38 00:01:41,699 --> 00:01:45,773 文字、 [請稍候,直到你有用處的時候,謝謝。] 39 00:01:45,773 --> 00:01:47,801 影片、 40 00:01:47,801 --> 00:01:49,631 聲音。 41 00:01:49,631 --> 00:01:52,673 這些不同資料類型的共通處在於 42 00:01:52,673 --> 00:01:54,894 它們都是人建立的, 43 00:01:54,894 --> 00:01:57,669 也都不能斷章取義來詮釋。 44 00:01:57,669 --> 00:02:00,114 舉例,有一個資料科學家小組, 45 00:02:00,114 --> 00:02:02,419 成員來自伊利諾大學芝加哥分校, 46 00:02:02,419 --> 00:02:04,973 這小組叫做「衛生媒體合作實驗室」。 47 00:02:04,973 --> 00:02:07,560 他們和美國疾病管制中心合作, 48 00:02:07,560 --> 00:02:09,065 想要更了解 49 00:02:09,065 --> 00:02:11,913 人們怎樣談論戒菸、 50 00:02:11,913 --> 00:02:14,593 怎樣談論電子香煙, 51 00:02:14,593 --> 00:02:18,098 以及怎樣一起幫助吸菸者戒菸。 52 00:02:18,562 --> 00:02:19,425 有趣的是, 53 00:02:19,425 --> 00:02:22,791 若要了解人們如何談論抽菸 smoking, 54 00:02:22,791 --> 00:02:27,252 就要先了解人們說 smoking 是什麼意思。 55 00:02:27,257 --> 00:02:31,183 在推特上大致分成四類: 56 00:02:31,183 --> 00:02:34,180 第一類,抽菸; 57 00:02:34,180 --> 00:02:36,987 第二類,抽大麻; 58 00:02:36,987 --> 00:02:39,630 第三類,煙熏肋排; 59 00:02:39,630 --> 00:02:43,183 第四類,嗆辣正妹; 60 00:02:43,183 --> 00:02:46,176 (觀眾笑聲) 61 00:02:46,176 --> 00:02:48,602 接著要思考, 62 00:02:48,602 --> 00:02:50,932 人們怎麼談論電子香菸? 63 00:02:50,932 --> 00:02:53,997 講法五花八門, 64 00:02:53,997 --> 00:02:55,638 就像這張投影片所列的, 65 00:02:55,638 --> 00:02:58,799 這種檢索非常複雜。 66 00:02:58,799 --> 00:03:01,200 這提醒我們, 67 00:03:01,200 --> 00:03:03,611 語言是人創造的, 68 00:03:03,611 --> 00:03:05,951 而人是複雜、亂無章法的, 69 00:03:05,951 --> 00:03:08,718 我們會用隱喻、俚語、行話, 70 00:03:08,718 --> 00:03:11,997 無時無刻的製造,各式各樣的語言, 71 00:03:11,997 --> 00:03:15,221 好不容易破解語言,就立刻又改變了。 72 00:03:15,221 --> 00:03:20,339 那麼,疾管中心拍的這些戒菸文宣, 73 00:03:20,339 --> 00:03:24,090 電視廣告裡,一名女子喉嚨破了大洞, 74 00:03:24,090 --> 00:03:26,694 畫面驚悚嚇人, 75 00:03:26,694 --> 00:03:28,579 這些廣告真的有效嗎? 76 00:03:28,579 --> 00:03:31,250 真的讓人戒菸了嗎? 77 00:03:31,250 --> 00:03:34,557 衛生媒體合作實驗室尊重其數據的限制, 78 00:03:34,557 --> 00:03:36,562 但仍能做出結論, 79 00:03:36,562 --> 00:03:39,874 認為這些廣告—也許你們看過, 80 00:03:39,874 --> 00:03:44,267 成功地刺激人們開始反省, 81 00:03:44,267 --> 00:03:47,954 可能影響未來的行為。 82 00:03:47,954 --> 00:03:51,845 這個計畫讓我最欽佩、欣賞的地方是, 83 00:03:51,845 --> 00:03:57,394 除了它是在解決人的實際需要以外, 84 00:03:57,394 --> 00:03:59,557 同時它提供了絕佳的典範, 85 00:03:59,557 --> 00:04:04,680 展現了人類面對瑣碎汪洋的勇氣。 86 00:04:04,680 --> 00:04:09,716 所以,詮釋的挑戰不只因為資料龐大, 87 00:04:09,716 --> 00:04:13,505 因為,老實說,歷史上有很多的例子顯示, 88 00:04:13,513 --> 00:04:17,490 無論資料再少,我們向來很能把它搞砸。 89 00:04:17,490 --> 00:04:21,227 大家可能記得,很多年前, 90 00:04:21,227 --> 00:04:24,441 前總統雷根曾被痛罵, 91 00:04:24,441 --> 00:04:28,501 因為他說,事實是愚笨的東西。 92 00:04:28,501 --> 00:04:31,183 憑良心說,他只是一時口誤, 93 00:04:31,183 --> 00:04:33,725 他其實是想引用約翰.亞當斯在 94 00:04:33,725 --> 00:04:36,616 為因波士頓慘案受審的英軍辯護時說的: 95 00:04:36,616 --> 00:04:39,626 事實是固執難拗、不容改變的。 96 00:04:39,626 --> 00:04:42,250 但我其實認為, 97 00:04:42,250 --> 00:04:45,668 這口誤可能湊巧講出幾分智慧, 98 00:04:45,668 --> 00:04:48,444 因為事實確實很固執, 99 00:04:48,444 --> 00:04:51,367 但是有時也真的很愚笨。 100 00:04:51,367 --> 00:04:53,255 我要講一個自己的故事, 101 00:04:53,255 --> 00:04:56,803 解釋為什麼這對我這麼重要。 102 00:04:56,803 --> 00:04:59,240 我要先吸一口氣。 103 00:04:59,240 --> 00:05:01,994 我兒子艾薩克兩歲的時候, 104 00:05:01,994 --> 00:05:04,411 被診斷為自閉兒。 105 00:05:04,411 --> 00:05:06,572 但他是個快樂、搞笑、 106 00:05:06,572 --> 00:05:08,607 有愛心、喜歡親密的孩子, 107 00:05:08,607 --> 00:05:11,509 但是他的發展評估測驗數據 108 00:05:11,509 --> 00:05:12,789 檢視的是: 109 00:05:12,789 --> 00:05:15,876 他當時會說幾個字?零個。 110 00:05:17,236 --> 00:05:19,216 只靠手勢溝通, 111 00:05:19,216 --> 00:05:20,919 眼神接觸也極少, 112 00:05:20,919 --> 00:05:23,415 讓他的發展程度 113 00:05:23,415 --> 00:05:27,039 被評為九個月大的嬰兒。 114 00:05:27,039 --> 00:05:30,100 按照數據,診斷並沒有錯, 115 00:05:30,100 --> 00:05:33,309 卻跟實際狀況有落差。 116 00:05:33,309 --> 00:05:36,810 大概過了一年半,兒子快滿四歲, 117 00:05:36,812 --> 00:05:39,175 有一天,我看到他坐在電腦前面, 118 00:05:39,175 --> 00:05:44,628 在用 Google 搜尋女性的照片, 119 00:05:44,628 --> 00:05:48,244 他把女性 (women) 拼成 "w-i-m-e-n"。 120 00:05:48,244 --> 00:05:50,984 我的反應跟任何偏執妄想的父母一樣, 121 00:05:50,984 --> 00:05:52,885 立刻開始按瀏覽器的「返回」按鈕, 122 00:05:52,885 --> 00:05:56,248 看看他還搜尋過什麼。 123 00:05:56,248 --> 00:05:58,644 結果發現他依序搜尋過:男性 (men)、 124 00:05:58,644 --> 00:06:01,789 學校 (school)、公車 (bus)、 125 00:06:01,794 --> 00:06:05,730 和電腦(錯拼成 cpyutr)。 126 00:06:05,730 --> 00:06:07,756 我很吃驚, 127 00:06:07,756 --> 00:06:09,758 因為我們根本不知道他會拼字, 128 00:06:09,758 --> 00:06:10,884 更別說閱讀。 129 00:06:10,884 --> 00:06:13,747 所以我問他: 「艾薩克,你怎麼辦到的?」 130 00:06:13,747 --> 00:06:16,337 他認真的看著我,說: 131 00:06:16,337 --> 00:06:19,929 「在搜尋欄裡打字啊!」 132 00:06:19,929 --> 00:06:23,343 他在教自己溝通, 133 00:06:23,343 --> 00:06:26,423 只是我們都找錯方向了。 134 00:06:26,423 --> 00:06:28,063 會發生這種情況, 135 00:06:28,063 --> 00:06:31,174 是因為評量和分析太重視單一面向, 136 00:06:31,176 --> 00:06:33,785 就像他的自閉症評量, 單看口語表達, 137 00:06:33,785 --> 00:06:35,638 而忽視其他要素, 138 00:06:35,638 --> 00:06:38,317 例如,創造性地解決問題。 139 00:06:39,367 --> 00:06:41,836 溝通對艾薩克來說很困難, 140 00:06:41,836 --> 00:06:43,867 所以他找到了替代方法, 141 00:06:43,867 --> 00:06:46,564 來找解答。 142 00:06:46,564 --> 00:06:48,454 想想很有道理, 143 00:06:48,454 --> 00:06:53,095 因為問問題是很複雜的過程, 144 00:06:53,100 --> 00:06:55,819 但他只要在搜尋欄輸入一個字, 145 00:06:55,819 --> 00:06:59,466 就成功了一大半。 146 00:06:59,466 --> 00:07:02,650 於是這個小小的時刻 147 00:07:02,650 --> 00:07:05,486 對我影響深遠, 148 00:07:05,486 --> 00:07:06,795 對我們全家都是。 149 00:07:06,795 --> 00:07:09,936 因為,這改變了我們的判斷標準, 150 00:07:09,936 --> 00:07:12,144 用全新的眼光看待兒子的狀況, 151 00:07:12,144 --> 00:07:14,010 比較不那麼擔憂, 152 00:07:14,010 --> 00:07:17,302 轉而欣賞他解決問題的能力。 153 00:07:17,302 --> 00:07:20,163 事實,真的是愚笨的。 154 00:07:20,163 --> 00:07:22,560 事實也很容易被誤用, 155 00:07:22,560 --> 00:07:24,213 不論是有心或無意。 156 00:07:24,213 --> 00:07:27,239 我的朋友艾蜜莉.威靈漢是個科學家, 157 00:07:27,239 --> 00:07:30,040 她不久前為《富比士》寫了一篇文章, 158 00:07:30,040 --> 00:07:33,830 叫做〈 自閉症怪異印象十大排行榜〉, 159 00:07:33,830 --> 00:07:36,835 內容挺可怕的: 160 00:07:36,835 --> 00:07:40,367 「網路」,萬惡淵藪,對吧? 161 00:07:40,367 --> 00:07:42,524 當然「媽媽」也上榜, 162 00:07:42,524 --> 00:07:44,059 不言自明。 163 00:07:44,059 --> 00:07:45,854 等等,還有, 164 00:07:45,854 --> 00:07:49,141 這裡有一大類,都跟「媽媽」有關係, 165 00:07:49,141 --> 00:07:53,956 你可以看到,原因很多、很有意思。 166 00:07:53,956 --> 00:07:56,149 我最喜歡的是 167 00:07:56,149 --> 00:07:59,853 「在高速公路附近受孕」。 168 00:07:59,853 --> 00:08:01,392 最後一項很有趣, 169 00:08:01,392 --> 00:08:04,395 因為「冰箱母親」這個封號 170 00:08:04,395 --> 00:08:08,440 是自閉症原因最早的假說, 171 00:08:08,440 --> 00:08:11,166 用來描述冷漠沒有愛心的母親。 172 00:08:11,166 --> 00:08:12,728 現在,你可能會想: 173 00:08:12,728 --> 00:08:14,385 「好了,蘇珊,我們懂了, 174 00:08:14,385 --> 00:08:16,167 你可以對資料做任何詮釋。」 175 00:08:16,167 --> 00:08:18,521 這也沒錯, 176 00:08:18,521 --> 00:08:20,520 絕對正確。 177 00:08:21,238 --> 00:08:24,730 但是挑戰在於, 178 00:08:26,480 --> 00:08:28,928 我們自己有這個機會, 179 00:08:28,928 --> 00:08:31,212 可以賦予資料意義, 180 00:08:31,212 --> 00:08:34,871 因為老實說,資料不會自己產生意義。 181 00:08:34,871 --> 00:08:36,670 我們才可以。 182 00:08:36,670 --> 00:08:39,820 所以,身為商人、消費者、 183 00:08:39,820 --> 00:08:42,359 病人、公民等等, 184 00:08:42,359 --> 00:08:44,755 我想我們有責任 185 00:08:44,755 --> 00:08:46,949 多花點時間 186 00:08:46,949 --> 00:08:49,819 提升我們的批判性思考能力。 187 00:08:49,819 --> 00:08:50,897 為什麼? 188 00:08:50,897 --> 00:08:55,795 我們聽過很多次, 因為在歷史的這一刻, 189 00:08:55,795 --> 00:08:59,902 已經能用光速 處理數十億 GB 的資料量, 190 00:08:59,902 --> 00:09:05,260 可能更快速、更有效地 做出錯誤的決定, 191 00:09:05,264 --> 00:09:08,808 影響之大可能更甚以往。 192 00:09:10,292 --> 00:09:11,680 這下好了,對吧? 193 00:09:11,680 --> 00:09:15,730 所以,我們反而必須 194 00:09:15,730 --> 00:09:17,040 多花時間 195 00:09:17,040 --> 00:09:19,786 發展人文、 196 00:09:19,786 --> 00:09:23,250 社會學和社會科學, 197 00:09:23,250 --> 00:09:25,558 修辭、哲學、倫理, 198 00:09:25,558 --> 00:09:28,414 因為這些知識 構成我們的背景涵養, 199 00:09:28,414 --> 00:09:30,300 對大數據非常重要, 200 00:09:30,300 --> 00:09:33,408 也因為這能幫助我們更會思辨, 201 00:09:33,408 --> 00:09:35,680 因為畢竟, 202 00:09:35,680 --> 00:09:39,020 如果我能看出命題裡的問題, 203 00:09:39,021 --> 00:09:42,860 那麼無論是 用文字或數據表達都可以。 204 00:09:42,860 --> 00:09:45,579 這表示, 205 00:09:45,579 --> 00:09:47,300 要教育我們自己 206 00:09:47,300 --> 00:09:49,741 去發覺各種確認的偏見 207 00:09:49,741 --> 00:09:51,822 和謬誤的關聯, 208 00:09:51,822 --> 00:09:55,640 並且能對赤裸裸的情感訴求保持警覺。 209 00:09:55,640 --> 00:09:58,144 因為甲事之後發生了乙事, 210 00:09:58,144 --> 00:10:01,226 並不代表 甲事必定是乙事的肇因。 211 00:10:01,226 --> 00:10:03,345 如果大家容我書呆一下, 212 00:10:03,345 --> 00:10:07,642 羅馬人稱這現象為「後此謬誤」 "post hoc ergo propter hoc", 213 00:10:07,642 --> 00:10:10,938 後此,故因此。 214 00:10:10,938 --> 00:10:14,695 這表示要質疑像人口統計這樣的方法。 215 00:10:14,695 --> 00:10:15,725 為什麼? 216 00:10:15,725 --> 00:10:18,381 因為這些都假設 我們一定是某種人, 217 00:10:18,381 --> 00:10:21,221 只憑我們的性別、年齡、居住地, 218 00:10:21,221 --> 00:10:23,901 而忽視我們實際的思考和行為資料。 219 00:10:23,901 --> 00:10:25,901 現在有了這些資料, 220 00:10:25,901 --> 00:10:29,263 我們必須做好隱私權控管, 221 00:10:29,263 --> 00:10:33,000 以及讓消費者自願參與。 222 00:10:33,000 --> 00:10:34,453 再來, 223 00:10:34,453 --> 00:10:37,925 我們必須很清楚我們的假設、 224 00:10:37,925 --> 00:10:40,531 使用的方法, 225 00:10:40,531 --> 00:10:43,335 以及我們對結果的信心。 226 00:10:43,335 --> 00:10:45,809 就像我高中代數老師常說的: 227 00:10:45,809 --> 00:10:47,340 「算給我看。 228 00:10:47,340 --> 00:10:50,781 因為如果我不知道 你做了哪些步驟, 229 00:10:50,781 --> 00:10:52,772 就不知道哪些步驟你沒有做。 230 00:10:52,772 --> 00:10:55,210 如果我不知道你問了哪些問題, 231 00:10:55,210 --> 00:10:58,407 就不知道哪些問題你沒有問。」 232 00:10:58,407 --> 00:10:59,930 這表示我們要問自己 233 00:10:59,930 --> 00:11:01,818 最難的一個問題: 234 00:11:01,818 --> 00:11:04,880 「數據資料真的有這樣說嗎? 235 00:11:04,880 --> 00:11:07,377 還是這種結果讓我們覺得 236 00:11:07,377 --> 00:11:11,200 比較成功和自在?」 237 00:11:11,200 --> 00:11:14,882 衛生媒體合作實驗室在計畫結束時, 238 00:11:14,882 --> 00:11:18,789 發現 87% 的推文 239 00:11:18,789 --> 00:11:22,593 回應那些令人不安的戒菸廣告時, 240 00:11:22,593 --> 00:11:24,971 表達了恐懼。 241 00:11:24,971 --> 00:11:25,977 但是, 242 00:11:25,977 --> 00:11:29,808 他們有說那些廣告讓人成功戒菸嗎? 243 00:11:29,808 --> 00:11:32,530 沒有。這是科學,不是魔術。 244 00:11:32,530 --> 00:11:33,930 所以, 245 00:11:33,930 --> 00:11:37,802 如果想要釋放數據的力量, 246 00:11:38,582 --> 00:11:42,030 我們不必盲目地踏進 247 00:11:42,030 --> 00:11:45,466 歐威爾預見的極權主義未來, 248 00:11:45,466 --> 00:11:48,583 或是赫胥黎的瑣碎世界, 249 00:11:48,583 --> 00:11:51,603 或是兩者的可怕綜合體。 250 00:11:51,603 --> 00:11:53,982 我們必須做的是, 251 00:11:53,982 --> 00:11:56,700 重視批判性思考, 252 00:11:56,700 --> 00:12:01,319 並且向衛生媒體合作室 這樣的典範學習。 253 00:12:01,319 --> 00:12:03,667 就像超級英雄電影常講的: 254 00:12:03,667 --> 00:12:05,843 「讓我們把我們的力量用在正途。」 255 00:12:05,843 --> 00:12:06,975 謝謝。 256 00:12:06,975 --> 00:12:10,174 (觀眾掌聲)