1 00:00:00,817 --> 00:00:04,269 人們因各種原因使用網際網路。 2 00:00:05,765 --> 00:00:09,569 結果發現,最熱門的網站類型之一 3 00:00:09,593 --> 00:00:12,769 是人們私下瀏覽的東西。 4 00:00:13,639 --> 00:00:15,941 它和好奇心有關, 5 00:00:16,173 --> 00:00:19,736 和看不太出來但又明顯的 放蕩不羈程度有關, 6 00:00:19,993 --> 00:00:24,573 整天沉浸在記錄別人 繁殖活動的圈圈裡。 7 00:00:24,610 --> 00:00:25,642 (笑聲) 8 00:00:25,666 --> 00:00:27,916 當然,我在說的是家譜學—— 9 00:00:27,940 --> 00:00:29,154 (笑聲) 10 00:00:29,178 --> 00:00:30,880 家族史的研究。 11 00:00:31,353 --> 00:00:33,390 說到詳細的家族歷史, 12 00:00:33,414 --> 00:00:37,357 在每個家庭中,都會 有一個人特別迷戀家譜。 13 00:00:37,381 --> 00:00:39,094 咱們就稱他為柏尼叔叔吧。 14 00:00:39,118 --> 00:00:41,756 感恩節晚餐時,你最不希望 15 00:00:41,780 --> 00:00:44,523 坐到的位子 就是柏尼叔叔的旁邊, 16 00:00:44,547 --> 00:00:47,768 因為他會一直講某個 古老親戚的獨特細節, 17 00:00:47,801 --> 00:00:49,351 講到讓你無聊死。 18 00:00:50,462 --> 00:00:51,724 但,各位都知道, 19 00:00:51,748 --> 00:00:54,220 凡事都有科學的一面, 20 00:00:54,644 --> 00:00:57,326 而我們發現,柏尼叔叔的故事 21 00:00:57,646 --> 00:01:01,078 非常有潛力可以用在 生物醫學研究上。 22 00:01:01,306 --> 00:01:04,020 我們讓柏尼叔叔 和他的家譜學者夥伴們 23 00:01:04,044 --> 00:01:08,712 透過家譜網站 geni.com 來記錄他們的家譜。 24 00:01:09,198 --> 00:01:11,326 當使用者將他們的家譜 上傳到該網站, 25 00:01:11,350 --> 00:01:13,040 網站會掃描他們的親戚, 26 00:01:13,064 --> 00:01:15,139 如果發現和既有的家譜樹有吻合, 27 00:01:15,163 --> 00:01:18,773 就會把既有的家譜 和那新的家譜合併起來。 28 00:01:19,768 --> 00:01:22,718 結果就是建造出了很大的家譜, 29 00:01:22,742 --> 00:01:26,221 超越了家譜學者 個人能做到的程度。 30 00:01:26,808 --> 00:01:30,304 如今,針對全世界數百萬人 31 00:01:30,312 --> 00:01:32,778 重覆這個流程, 32 00:01:32,802 --> 00:01:38,334 我們就能將全人類的家譜 外包給群眾來做。 33 00:01:39,292 --> 00:01:41,099 我們用這個網站, 34 00:01:41,123 --> 00:01:45,521 將一億兩千五百萬人連結起來, 35 00:01:45,737 --> 00:01:48,258 成為單一家譜樹。 36 00:01:48,967 --> 00:01:51,755 我無法在這裡的螢幕上 畫出這個家譜樹, 37 00:01:51,779 --> 00:01:54,087 因為這個家譜樹中的人數 38 00:01:54,104 --> 00:01:56,376 比螢幕的畫素還要多。 39 00:01:56,505 --> 00:02:01,515 但,可以取其中一部分 六千人的家譜給各位看。 40 00:02:02,159 --> 00:02:04,521 每個綠色節點代表一個人。 41 00:02:05,060 --> 00:02:07,661 紅色節點代表婚姻關係, 42 00:02:07,933 --> 00:02:10,343 連線則代表親子關係。 43 00:02:10,557 --> 00:02:12,929 在家譜的中間可以看到祖先。 44 00:02:12,953 --> 00:02:15,245 在外圍則是後代。 45 00:02:15,269 --> 00:02:18,683 這個家譜樹大約涵蓋了七個世代。 46 00:02:19,692 --> 00:02:22,926 當我們把人數增加到七萬人時, 47 00:02:22,950 --> 00:02:24,778 就會變成這樣—— 48 00:02:24,802 --> 00:02:29,132 相對我們所有的資料, 這仍然只是冰山一角。 49 00:02:29,629 --> 00:02:34,442 儘管如此,各位已經可以 看出有巨大的家譜樹形成了, 50 00:02:34,466 --> 00:02:37,121 當中有許多遠親。 51 00:02:37,610 --> 00:02:40,744 仰賴家譜學者的努力, 52 00:02:40,768 --> 00:02:43,871 我們可以回到數百年前。 53 00:02:44,418 --> 00:02:47,859 比如,這是亞歷山大 · 漢密爾頓, 54 00:02:47,883 --> 00:02:50,358 生於 1755 年。 55 00:02:50,872 --> 00:02:54,636 亞歷山大是美國第一位財政部長, 56 00:02:54,660 --> 00:02:58,674 但主要由於一部流行的 百老匯音樂劇而廣為人知。 57 00:02:59,137 --> 00:03:04,059 我們發現亞歷山大 在娛樂圈有更深厚的人脈。 58 00:03:04,083 --> 00:03:06,194 事實上,他是…… 59 00:03:06,781 --> 00:03:08,001 凱文貝肯的血親! 60 00:03:08,025 --> 00:03:10,057 (笑聲) 61 00:03:10,081 --> 00:03:12,687 他們兩人都是十三世紀 62 00:03:12,711 --> 00:03:14,921 一位蘇格蘭女子的後裔。 63 00:03:15,049 --> 00:03:18,151 所以,可以說亞歷山大漢密爾頓 64 00:03:18,175 --> 00:03:21,363 是凱文貝肯的三十五度宗譜。 (改自「六度分離」) 65 00:03:21,387 --> 00:03:22,828 (笑聲) 66 00:03:22,852 --> 00:03:26,337 我們的家譜樹有數百萬個 像這樣的故事。 67 00:03:28,113 --> 00:03:32,779 我們投入許多心力 去驗證我們資料的品質。 68 00:03:33,027 --> 00:03:34,714 利用 DNA,我們發現, 69 00:03:34,729 --> 00:03:39,379 我們的資料中有 0.3% 的 母子關係是錯的, 70 00:03:39,716 --> 00:03:43,459 這很符合在二次大戰之前 美國的領養率。 71 00:03:44,847 --> 00:03:46,632 就父系的這一面來說, 72 00:03:46,656 --> 00:03:48,617 狀況就沒這麼好了: 73 00:03:50,149 --> 00:03:55,492 我們的資料中,1.9% 的 父子關係是錯的。 74 00:03:55,773 --> 00:03:57,983 我看到這邊有些人在笑。 75 00:03:58,160 --> 00:03:59,877 就如各位所想的—— 76 00:03:59,901 --> 00:04:01,690 世界上有很多師奶殺手級的男人。 77 00:04:01,714 --> 00:04:02,778 (笑聲) 78 00:04:02,802 --> 00:04:05,878 然而,這 1.9% 的父子關係錯誤率 79 00:04:05,910 --> 00:04:08,584 不是我們數據獨有的 。 80 00:04:08,608 --> 00:04:11,677 過去用臨床等級家譜所做的研究, 81 00:04:11,701 --> 00:04:13,922 也有發現近似的錯誤率。 82 00:04:14,254 --> 00:04:16,779 所以我們的資料品質算不錯, 83 00:04:16,803 --> 00:04:18,936 那並不讓人意外。 84 00:04:18,960 --> 00:04:22,616 我們的系譜學家對正確記錄 85 00:04:22,647 --> 00:04:26,428 他們的家族史有著濃厚的興趣。 86 00:04:28,594 --> 00:04:33,121 我們可以善用這些資料, 來了解人類的量化資訊, 87 00:04:33,209 --> 00:04:35,805 比如,人口統計相關的問題。 88 00:04:35,829 --> 00:04:39,853 這是我們的資料在世界地圖上的樣子。 89 00:04:40,250 --> 00:04:44,731 每一個畫素就是 活在某個時點的一個人。 90 00:04:44,755 --> 00:04:46,435 因為我們有非常多資料, 91 00:04:46,459 --> 00:04:49,240 各位可以看見許多國家的輪廓, 92 00:04:49,264 --> 00:04:51,363 特別是西方世界的國家。 93 00:04:51,387 --> 00:04:56,558 在這段影片中,我們根據 1400~1900 年間出生的人, 94 00:04:56,590 --> 00:05:00,031 將剛才那張地圖做分層, 95 00:05:00,055 --> 00:05:03,196 再將結果和已知的 移民事件做比對。 96 00:05:03,482 --> 00:05:06,647 這支影片會讓各位看到, 我們資料中最深遠的連結, 97 00:05:06,671 --> 00:05:10,129 會一路連到記錄 保存得比較好的英國, 98 00:05:10,154 --> 00:05:13,436 接著再隨西方殖民路線散播出去。 99 00:05:13,460 --> 00:05:15,006 咱們來看看影片。 100 00:05:15,143 --> 00:05:16,752 (音樂) 101 00:05:16,776 --> 00:05:19,117 〔出生年:〕 102 00:05:19,705 --> 00:05:21,996 〔1492 年:哥倫布藍色海洋航行時期〕 103 00:05:23,661 --> 00:05:26,133 〔1620 年:五月花號在麻州靠岸〕 104 00:05:26,726 --> 00:05:28,908 〔1652 年:荷蘭人在南非定居〕 105 00:05:32,321 --> 00:05:35,507 〔1788 年:英國開始將受刑者運往澳洲〕 106 00:05:35,531 --> 00:05:38,122 〔1836 年:奧勒岡小徑 初次被移民使用〕 107 00:05:38,149 --> 00:05:41,332 〔所有活動〕 108 00:05:43,851 --> 00:05:45,394 我很愛這支影片。 109 00:05:45,418 --> 00:05:50,511 既然有這些移民事件 作為家族的脈絡, 110 00:05:50,535 --> 00:05:52,718 我們就能問像這樣的問題: 111 00:05:52,742 --> 00:05:56,212 先生和太太的出生地, 112 00:05:56,236 --> 00:05:58,815 通常距離多遠? 113 00:05:59,072 --> 00:06:02,749 在人口統計學上, 這距離扮演很關鍵的角色, 114 00:06:02,773 --> 00:06:06,454 因為人們遷移建構家庭的模式 115 00:06:06,478 --> 00:06:10,391 會決定基因在地理 區域上如何散播。 116 00:06:10,706 --> 00:06:13,034 我們用我們的資料 來分析這個距離, 117 00:06:13,058 --> 00:06:16,611 我們發現,在過去 用的方式並不困難。 118 00:06:16,626 --> 00:06:19,220 他們只會和鄰近村落的人結婚。 119 00:06:19,958 --> 00:06:23,663 但,工業革命讓我們的 愛情生活變複雜了。 120 00:06:23,687 --> 00:06:28,022 現今,機票大家可以付擔得起, 再加上線上社群媒體, 121 00:06:28,271 --> 00:06:33,099 人們通常從出生地遷移一百多公里, 122 00:06:33,123 --> 00:06:36,122 去尋找靈魂伴侶。 123 00:06:36,339 --> 00:06:39,876 現在各位可能會問: 好吧,從一個地方遷移到另一個地方 124 00:06:39,876 --> 00:06:43,534 去建構家庭的苦差事是誰在做呢? 125 00:06:43,548 --> 00:06:47,275 是男方或女方? 126 00:06:47,752 --> 00:06:49,907 我們用我們的資料來解這個問題, 127 00:06:49,931 --> 00:06:52,525 至少,在過去三百年間, 128 00:06:52,549 --> 00:06:55,792 我們發現從一地移民到另一地 129 00:06:55,816 --> 00:06:59,452 去組成家庭的苦差事是女方在做。 130 00:06:59,476 --> 00:07:02,577 這些結果在統計上是顯著的, 131 00:07:02,601 --> 00:07:06,072 所以男人比較懶是有科學根據的。 132 00:07:06,096 --> 00:07:09,252 (笑聲) 133 00:07:09,276 --> 00:07:11,812 我們可以從人口統計相關的問題 134 00:07:11,836 --> 00:07:14,749 換到詢問人類健康相關的問題。 135 00:07:14,773 --> 00:07:16,260 比如,我們可以問 136 00:07:16,284 --> 00:07:19,143 人與人之間的壽命差異, 137 00:07:19,166 --> 00:07:22,465 受到遺傳變異的影響有多大? 138 00:07:22,988 --> 00:07:27,518 過去有研究分析 雙胞胎壽命的相關性 139 00:07:27,542 --> 00:07:29,216 來解答這個問題。 140 00:07:29,411 --> 00:07:33,061 他們估計,人與人 之間的壽命差異, 141 00:07:33,110 --> 00:07:36,142 有四分之一是來自遺傳變異。 142 00:07:36,688 --> 00:07:39,286 但,雙胞胎之間的關聯性 有許多可能成因, 143 00:07:39,310 --> 00:07:41,614 包括各種環境的影響, 144 00:07:41,638 --> 00:07:43,260 或共同的家庭。 145 00:07:44,411 --> 00:07:48,164 大型家譜樹讓我們有機會 分析這些近親, 146 00:07:48,188 --> 00:07:49,395 比如雙胞胎, 147 00:07:49,419 --> 00:07:52,503 到遠房親戚,甚至第四代表親。 148 00:07:52,749 --> 00:07:55,438 這樣我們就能建立穩健的模型, 149 00:07:55,462 --> 00:07:58,604 從環境因素中 150 00:07:58,604 --> 00:08:01,191 分離出遺傳變異的貢獻來。 151 00:08:01,379 --> 00:08:04,278 我們用我們的資料進行這項分析, 152 00:08:04,302 --> 00:08:07,741 我們發現,遺傳變異只解釋了 153 00:08:07,773 --> 00:08:12,923 15% 的個體壽命差異 。 154 00:08:14,760 --> 00:08:17,516 平均而言,就是五年之差。 155 00:08:18,316 --> 00:08:23,024 所以,基因對壽命的影響 沒有我們以前想的那麼大。 156 00:08:23,675 --> 00:08:25,811 我認為這是大好消息, 157 00:08:26,438 --> 00:08:29,731 因為那就表示我們的行為 與壽命有較大的關係。 158 00:08:30,533 --> 00:08:34,807 比如,抽菸就能影響 十年的壽命—— 159 00:08:34,831 --> 00:08:37,477 是基因影響的兩倍。 160 00:08:38,236 --> 00:08:40,525 我們還有更驚人的發現, 161 00:08:40,549 --> 00:08:42,041 就在我們從做家譜樹到 162 00:08:42,065 --> 00:08:46,797 請家譜學家幫我們整理 DNA 資訊 並做眾包後發現的。 163 00:08:46,821 --> 00:08:48,845 結果很驚人。 164 00:08:49,255 --> 00:08:53,170 可能很難想像, 但柏尼叔叔和他的朋友 165 00:08:53,194 --> 00:08:55,840 所創造出來的 DNA 法醫鑑定能力 166 00:08:55,864 --> 00:08:59,423 甚至比目前的聯邦調查局還要強。 167 00:09:00,862 --> 00:09:03,266 當你把 DNA 放入大型的家譜樹中, 168 00:09:03,290 --> 00:09:05,407 就能有效地創造出 如燈塔般的光束, 169 00:09:05,407 --> 00:09:08,352 從 DNA 的源頭者放射出與 170 00:09:08,376 --> 00:09:11,579 數百名遠親的連結光束。 171 00:09:12,505 --> 00:09:15,418 在家譜中放入數個燈塔, 172 00:09:15,442 --> 00:09:19,162 就能針對一個未知的人 做 DNA 三角定位, 173 00:09:19,186 --> 00:09:21,900 原理和 GPS 使用多個衛星 174 00:09:21,908 --> 00:09:24,472 來定位一個地點的方法相同。 175 00:09:25,226 --> 00:09:28,850 有個主要的例子可以說明 這項技術有多強大, 176 00:09:28,874 --> 00:09:31,549 那就是追捕金州(加州)殺手, 177 00:09:32,612 --> 00:09:37,140 他是美國史上 最惡名昭彰的罪犯之一。 178 00:09:37,164 --> 00:09:40,110 聯邦調查局尋找這個人 179 00:09:40,493 --> 00:09:43,056 已經超過四十年。 180 00:09:43,588 --> 00:09:45,247 他們有他的 DNA, 181 00:09:45,447 --> 00:09:48,797 但他從來沒有出現在 任何警方資料庫中。 182 00:09:49,447 --> 00:09:54,062 大約一年前,聯邦調查局 去諮詢了一位基因系譜學家, 183 00:09:54,183 --> 00:09:58,133 她建議他們將他的 DNA 上傳到一項家譜服務中, 184 00:09:58,157 --> 00:10:00,555 這項服務能找出遠親。 185 00:10:01,117 --> 00:10:02,273 他們照做了, 186 00:10:02,297 --> 00:10:05,989 找到了金州殺手的第三代表親。 187 00:10:06,013 --> 00:10:08,357 他們建立了一個很大的家譜樹, 188 00:10:08,381 --> 00:10:10,219 掃描樹狀圖上的不同分支, 189 00:10:10,259 --> 00:10:12,799 直到他們找到完美匹配 190 00:10:12,823 --> 00:10:15,677 金州殺手資訊的檔案。 191 00:10:15,701 --> 00:10:17,845 他們從這個人身上取得 DNA 192 00:10:17,869 --> 00:10:21,342 並發現跟他們手上的 DNA 相匹配。 193 00:10:21,372 --> 00:10:25,419 他們逮捕了這個人, 這麼多年後終於將他繩之以法。 194 00:10:26,172 --> 00:10:28,829 從那之後,基因系譜學家就開始 195 00:10:28,861 --> 00:10:32,105 和美國執法單位合作, 196 00:10:32,129 --> 00:10:35,186 使用這項技術來抓罪犯。 197 00:10:35,521 --> 00:10:37,977 光是在過去六個月, 198 00:10:38,226 --> 00:10:42,522 他們就用這項技術破了 超過二十件長年未破的案件。 199 00:10:44,203 --> 00:10:48,839 很幸運,我們有柏尼叔叔 和他的家譜學家夥伴們。 200 00:10:49,045 --> 00:10:52,414 這些人不只是業餘愛好者。 201 00:10:52,602 --> 00:10:55,099 他們還是滿懷熱情 202 00:10:55,123 --> 00:10:59,021 能說「我們是誰」的公民科學家, 203 00:10:59,065 --> 00:11:03,523 他們知道過去是通向未來的鑰匙。 204 00:11:04,067 --> 00:11:05,250 感謝各位。 205 00:11:05,314 --> 00:11:08,783 (掌聲)