我們應該拿這些大數據怎麼辦?
-
0:01 - 0:04科技帶給我們很多美好的事物:
-
0:04 - 0:07登陸月球、網路、
-
0:07 - 0:09人類基因組定序。
-
0:09 - 0:13但也挖掘出我們內心深處的許多恐懼。
-
0:13 - 0:15大約 30 年前,
-
0:15 - 0:18文化評論家尼爾.波茲曼寫了一本書,
-
0:18 - 0:19叫做《娛樂至死》,
-
0:19 - 0:22書中把這個現象說得很妙。
-
0:22 - 0:24他是這樣說的:
-
0:24 - 0:29比較歐威爾和赫胥黎的兩種反烏托邦,
-
0:29 - 0:33他說,歐威爾擔心我們會成為
-
0:33 - 0:35圈養的文化。
-
0:35 - 0:39赫胥黎則擔心我們會成為庸俗的文化。
-
0:39 - 0:43歐威爾擔心真相會被隱瞞,
-
0:43 - 0:48赫胥黎則擔心我們會被瑣碎的汪洋吞沒。
-
0:48 - 0:49簡單點說,
-
0:49 - 0:52我們可以選擇「老大哥監視你」
-
0:52 - 0:55或是「你監視老大哥」
-
0:55 - 0:57(觀眾笑聲)
-
0:57 - 0:59其實不必這樣,
-
0:59 - 1:02我們不是被動地消費資料和科技,
-
1:02 - 1:05我們可以決定科技在生活中扮演的角色,
-
1:05 - 1:07和它對我們的意義。
-
1:07 - 1:08但是要這麼做,
-
1:08 - 1:11我們必須重視思考的方式,
-
1:11 - 1:14不只重視編碼的方式。
-
1:14 - 1:17我們必須問問題,難解的問題,
-
1:17 - 1:19超越單純的算術,
-
1:19 - 1:21試圖去了解。
-
1:21 - 1:26我們不斷聽到世界上有多少資料,
-
1:26 - 1:28但是談到大數據,
-
1:28 - 1:30以及詮釋這些數據資料的挑戰,
-
1:30 - 1:32光看數量是不夠的,
-
1:32 - 1:35還必須關注資料成長的速度,
-
1:35 - 1:37以及眾多不同的資料類型。
-
1:37 - 1:40我略舉幾個例子:
-
1:40 - 1:42圖像、
-
1:42 - 1:46文字、
[請稍候,直到你有用處的時候,謝謝。] -
1:46 - 1:48影片、
-
1:48 - 1:50聲音。
-
1:50 - 1:53這些不同資料類型的共通處在於
-
1:53 - 1:55它們都是人建立的,
-
1:55 - 1:58也都不能斷章取義來詮釋。
-
1:58 - 2:00舉例,有一個資料科學家小組,
-
2:00 - 2:02成員來自伊利諾大學芝加哥分校,
-
2:02 - 2:05這小組叫做「衛生媒體合作實驗室」。
-
2:05 - 2:08他們和美國疾病管制中心合作,
-
2:08 - 2:09想要更了解
-
2:09 - 2:12人們怎樣談論戒菸、
-
2:12 - 2:15怎樣談論電子香煙,
-
2:15 - 2:18以及怎樣一起幫助吸菸者戒菸。
-
2:19 - 2:19有趣的是,
-
2:19 - 2:23若要了解人們如何談論抽菸 smoking,
-
2:23 - 2:27就要先了解人們說 smoking 是什麼意思。
-
2:27 - 2:31在推特上大致分成四類:
-
2:31 - 2:34第一類,抽菸;
-
2:34 - 2:37第二類,抽大麻;
-
2:37 - 2:40第三類,煙熏肋排;
-
2:40 - 2:43第四類,嗆辣正妹;
-
2:43 - 2:46(觀眾笑聲)
-
2:46 - 2:49接著要思考,
-
2:49 - 2:51人們怎麼談論電子香菸?
-
2:51 - 2:54講法五花八門,
-
2:54 - 2:56就像這張投影片所列的,
-
2:56 - 2:59這種檢索非常複雜。
-
2:59 - 3:01這提醒我們,
-
3:01 - 3:04語言是人創造的,
-
3:04 - 3:06而人是複雜、亂無章法的,
-
3:06 - 3:09我們會用隱喻、俚語、行話,
-
3:09 - 3:12無時無刻的製造,各式各樣的語言,
-
3:12 - 3:15好不容易破解語言,就立刻又改變了。
-
3:15 - 3:20那麼,疾管中心拍的這些戒菸文宣,
-
3:20 - 3:24電視廣告裡,一名女子喉嚨破了大洞,
-
3:24 - 3:27畫面驚悚嚇人,
-
3:27 - 3:29這些廣告真的有效嗎?
-
3:29 - 3:31真的讓人戒菸了嗎?
-
3:31 - 3:35衛生媒體合作實驗室尊重其數據的限制,
-
3:35 - 3:37但仍能做出結論,
-
3:37 - 3:40認為這些廣告—也許你們看過,
-
3:40 - 3:44成功地刺激人們開始反省,
-
3:44 - 3:48可能影響未來的行為。
-
3:48 - 3:52這個計畫讓我最欽佩、欣賞的地方是,
-
3:52 - 3:57除了它是在解決人的實際需要以外,
-
3:57 - 4:00同時它提供了絕佳的典範,
-
4:00 - 4:05展現了人類面對瑣碎汪洋的勇氣。
-
4:05 - 4:10所以,詮釋的挑戰不只因為資料龐大,
-
4:10 - 4:14因為,老實說,歷史上有很多的例子顯示,
-
4:14 - 4:17無論資料再少,我們向來很能把它搞砸。
-
4:17 - 4:21大家可能記得,很多年前,
-
4:21 - 4:24前總統雷根曾被痛罵,
-
4:24 - 4:29因為他說,事實是愚笨的東西。
-
4:29 - 4:31憑良心說,他只是一時口誤,
-
4:31 - 4:34他其實是想引用約翰.亞當斯在
-
4:34 - 4:37為因波士頓慘案受審的英軍辯護時說的:
-
4:37 - 4:40事實是固執難拗、不容改變的。
-
4:40 - 4:42但我其實認為,
-
4:42 - 4:46這口誤可能湊巧講出幾分智慧,
-
4:46 - 4:48因為事實確實很固執,
-
4:48 - 4:51但是有時也真的很愚笨。
-
4:51 - 4:53我要講一個自己的故事,
-
4:53 - 4:57解釋為什麼這對我這麼重要。
-
4:57 - 4:59我要先吸一口氣。
-
4:59 - 5:02我兒子艾薩克兩歲的時候,
-
5:02 - 5:04被診斷為自閉兒。
-
5:04 - 5:07但他是個快樂、搞笑、
-
5:07 - 5:09有愛心、喜歡親密的孩子,
-
5:09 - 5:12但是他的發展評估測驗數據
-
5:12 - 5:13檢視的是:
-
5:13 - 5:16他當時會說幾個字?零個。
-
5:17 - 5:19只靠手勢溝通,
-
5:19 - 5:21眼神接觸也極少,
-
5:21 - 5:23讓他的發展程度
-
5:23 - 5:27被評為九個月大的嬰兒。
-
5:27 - 5:30按照數據,診斷並沒有錯,
-
5:30 - 5:33卻跟實際狀況有落差。
-
5:33 - 5:37大概過了一年半,兒子快滿四歲,
-
5:37 - 5:39有一天,我看到他坐在電腦前面,
-
5:39 - 5:45在用 Google 搜尋女性的照片,
-
5:45 - 5:48他把女性 (women) 拼成 "w-i-m-e-n"。
-
5:48 - 5:51我的反應跟任何偏執妄想的父母一樣,
-
5:51 - 5:53立刻開始按瀏覽器的「返回」按鈕,
-
5:53 - 5:56看看他還搜尋過什麼。
-
5:56 - 5:59結果發現他依序搜尋過:男性 (men)、
-
5:59 - 6:02學校 (school)、公車 (bus)、
-
6:02 - 6:06和電腦(錯拼成 cpyutr)。
-
6:06 - 6:08我很吃驚,
-
6:08 - 6:10因為我們根本不知道他會拼字,
-
6:10 - 6:11更別說閱讀。
-
6:11 - 6:14所以我問他:
「艾薩克,你怎麼辦到的?」 -
6:14 - 6:16他認真的看著我,說:
-
6:16 - 6:20「在搜尋欄裡打字啊!」
-
6:20 - 6:23他在教自己溝通,
-
6:23 - 6:26只是我們都找錯方向了。
-
6:26 - 6:28會發生這種情況,
-
6:28 - 6:31是因為評量和分析太重視單一面向,
-
6:31 - 6:34就像他的自閉症評量,
單看口語表達, -
6:34 - 6:36而忽視其他要素,
-
6:36 - 6:38例如,創造性地解決問題。
-
6:39 - 6:42溝通對艾薩克來說很困難,
-
6:42 - 6:44所以他找到了替代方法,
-
6:44 - 6:47來找解答。
-
6:47 - 6:48想想很有道理,
-
6:48 - 6:53因為問問題是很複雜的過程,
-
6:53 - 6:56但他只要在搜尋欄輸入一個字,
-
6:56 - 6:59就成功了一大半。
-
6:59 - 7:03於是這個小小的時刻
-
7:03 - 7:05對我影響深遠,
-
7:05 - 7:07對我們全家都是。
-
7:07 - 7:10因為,這改變了我們的判斷標準,
-
7:10 - 7:12用全新的眼光看待兒子的狀況,
-
7:12 - 7:14比較不那麼擔憂,
-
7:14 - 7:17轉而欣賞他解決問題的能力。
-
7:17 - 7:20事實,真的是愚笨的。
-
7:20 - 7:23事實也很容易被誤用,
-
7:23 - 7:24不論是有心或無意。
-
7:24 - 7:27我的朋友艾蜜莉.威靈漢是個科學家,
-
7:27 - 7:30她不久前為《富比士》寫了一篇文章,
-
7:30 - 7:34叫做〈 自閉症怪異印象十大排行榜〉,
-
7:34 - 7:37內容挺可怕的:
-
7:37 - 7:40「網路」,萬惡淵藪,對吧?
-
7:40 - 7:43當然「媽媽」也上榜,
-
7:43 - 7:44不言自明。
-
7:44 - 7:46等等,還有,
-
7:46 - 7:49這裡有一大類,都跟「媽媽」有關係,
-
7:49 - 7:54你可以看到,原因很多、很有意思。
-
7:54 - 7:56我最喜歡的是
-
7:56 - 8:00「在高速公路附近受孕」。
-
8:00 - 8:01最後一項很有趣,
-
8:01 - 8:04因為「冰箱母親」這個封號
-
8:04 - 8:08是自閉症原因最早的假說,
-
8:08 - 8:11用來描述冷漠沒有愛心的母親。
-
8:11 - 8:13現在,你可能會想:
-
8:13 - 8:14「好了,蘇珊,我們懂了,
-
8:14 - 8:16你可以對資料做任何詮釋。」
-
8:16 - 8:19這也沒錯,
-
8:19 - 8:21絕對正確。
-
8:21 - 8:25但是挑戰在於,
-
8:26 - 8:29我們自己有這個機會,
-
8:29 - 8:31可以賦予資料意義,
-
8:31 - 8:35因為老實說,資料不會自己產生意義。
-
8:35 - 8:37我們才可以。
-
8:37 - 8:40所以,身為商人、消費者、
-
8:40 - 8:42病人、公民等等,
-
8:42 - 8:45我想我們有責任
-
8:45 - 8:47多花點時間
-
8:47 - 8:50提升我們的批判性思考能力。
-
8:50 - 8:51為什麼?
-
8:51 - 8:56我們聽過很多次,
因為在歷史的這一刻, -
8:56 - 9:00已經能用光速
處理數十億 GB 的資料量, -
9:00 - 9:05可能更快速、更有效地
做出錯誤的決定, -
9:05 - 9:09影響之大可能更甚以往。
-
9:10 - 9:12這下好了,對吧?
-
9:12 - 9:15所以,我們反而必須
-
9:15 - 9:17多花時間
-
9:17 - 9:20發展人文、
-
9:20 - 9:23社會學和社會科學,
-
9:23 - 9:26修辭、哲學、倫理,
-
9:26 - 9:28因為這些知識
構成我們的背景涵養, -
9:28 - 9:30對大數據非常重要,
-
9:30 - 9:33也因為這能幫助我們更會思辨,
-
9:33 - 9:35因為畢竟,
-
9:35 - 9:39如果我能看出命題裡的問題,
-
9:39 - 9:43那麼無論是
用文字或數據表達都可以。 -
9:43 - 9:46這表示,
-
9:46 - 9:47要教育我們自己
-
9:47 - 9:50去發覺各種確認的偏見
-
9:50 - 9:52和謬誤的關聯,
-
9:52 - 9:56並且能對赤裸裸的情感訴求保持警覺。
-
9:56 - 9:58因為甲事之後發生了乙事,
-
9:58 - 10:01並不代表
甲事必定是乙事的肇因。 -
10:01 - 10:03如果大家容我書呆一下,
-
10:03 - 10:08羅馬人稱這現象為「後此謬誤」
"post hoc ergo propter hoc", -
10:08 - 10:11後此,故因此。
-
10:11 - 10:15這表示要質疑像人口統計這樣的方法。
-
10:15 - 10:16為什麼?
-
10:16 - 10:18因為這些都假設
我們一定是某種人, -
10:18 - 10:21只憑我們的性別、年齡、居住地,
-
10:21 - 10:24而忽視我們實際的思考和行為資料。
-
10:24 - 10:26現在有了這些資料,
-
10:26 - 10:29我們必須做好隱私權控管,
-
10:29 - 10:33以及讓消費者自願參與。
-
10:33 - 10:34再來,
-
10:34 - 10:38我們必須很清楚我們的假設、
-
10:38 - 10:41使用的方法,
-
10:41 - 10:43以及我們對結果的信心。
-
10:43 - 10:46就像我高中代數老師常說的:
-
10:46 - 10:47「算給我看。
-
10:47 - 10:51因為如果我不知道
你做了哪些步驟, -
10:51 - 10:53就不知道哪些步驟你沒有做。
-
10:53 - 10:55如果我不知道你問了哪些問題,
-
10:55 - 10:58就不知道哪些問題你沒有問。」
-
10:58 - 11:00這表示我們要問自己
-
11:00 - 11:02最難的一個問題:
-
11:02 - 11:05「數據資料真的有這樣說嗎?
-
11:05 - 11:07還是這種結果讓我們覺得
-
11:07 - 11:11比較成功和自在?」
-
11:11 - 11:15衛生媒體合作實驗室在計畫結束時,
-
11:15 - 11:19發現 87% 的推文
-
11:19 - 11:23回應那些令人不安的戒菸廣告時,
-
11:23 - 11:25表達了恐懼。
-
11:25 - 11:26但是,
-
11:26 - 11:30他們有說那些廣告讓人成功戒菸嗎?
-
11:30 - 11:33沒有。這是科學,不是魔術。
-
11:33 - 11:34所以,
-
11:34 - 11:38如果想要釋放數據的力量,
-
11:39 - 11:42我們不必盲目地踏進
-
11:42 - 11:45歐威爾預見的極權主義未來,
-
11:45 - 11:49或是赫胥黎的瑣碎世界,
-
11:49 - 11:52或是兩者的可怕綜合體。
-
11:52 - 11:54我們必須做的是,
-
11:54 - 11:57重視批判性思考,
-
11:57 - 12:01並且向衛生媒體合作室
這樣的典範學習。 -
12:01 - 12:04就像超級英雄電影常講的:
-
12:04 - 12:06「讓我們把我們的力量用在正途。」
-
12:06 - 12:07謝謝。
-
12:07 - 12:10(觀眾掌聲)
- Title:
- 我們應該拿這些大數據怎麼辦?
- Speaker:
- 蘇珊‧艾特林格
- Description:
-
你會因為某些數據,而覺得更自在、更成功嗎?這樣你覺得呢?那麼你的詮釋很可能有誤。在這個動人的演講,蘇珊‧艾特林格解釋為什麼擁有了更多資料,我們更要加強批判性思考能力。因為要超越單純的計算,達到真正的了解,是非常不容易的事。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 12:23
Adrienne Lin edited Chinese, Traditional subtitles for What do we do with all this big data? | ||
Adrienne Lin approved Chinese, Traditional subtitles for What do we do with all this big data? | ||
Adrienne Lin accepted Chinese, Traditional subtitles for What do we do with all this big data? | ||
Adrienne Lin edited Chinese, Traditional subtitles for What do we do with all this big data? | ||
Adrienne Lin edited Chinese, Traditional subtitles for What do we do with all this big data? | ||
Adrienne Lin edited Chinese, Traditional subtitles for What do we do with all this big data? | ||
Yesbydefault 倪文娟 edited Chinese, Traditional subtitles for What do we do with all this big data? | ||
Yesbydefault 倪文娟 edited Chinese, Traditional subtitles for What do we do with all this big data? |