人們因各種原因使用網際網路。 結果發現,最熱門的網站類型之一 是人們私下瀏覽的東西。 它和好奇心有關, 和看不太出來但又明顯的 放蕩不羈程度有關, 整天沉浸在記錄別人 繁殖活動的圈圈裡。 (笑聲) 當然,我在說的是家譜學—— (笑聲) 家族史的研究。 說到詳細的家族歷史, 在每個家庭中,都會 有一個人特別迷戀家譜。 咱們就稱他為柏尼叔叔吧。 感恩節晚餐時,你最不希望 坐到的位子 就是柏尼叔叔的旁邊, 因為他會一直講某個 古老親戚的獨特細節, 講到讓你無聊死。 但,各位都知道, 凡事都有科學的一面, 而我們發現,柏尼叔叔的故事 非常有潛力可以用在 生物醫學研究上。 我們讓柏尼叔叔 和他的家譜學者夥伴們 透過家譜網站 geni.com 來記錄他們的家譜。 當使用者將他們的家譜 上傳到該網站, 網站會掃描他們的親戚, 如果發現和既有的家譜樹有吻合, 就會把既有的家譜 和那新的家譜合併起來。 結果就是建造出了很大的家譜, 超越了家譜學者 個人能做到的程度。 如今,針對全世界數百萬人 重覆這個流程, 我們就能將全人類的家譜 外包給群眾來做。 我們用這個網站, 將一億兩千五百萬人連結起來, 成為單一家譜樹。 我無法在這裡的螢幕上 畫出這個家譜樹, 因為這個家譜樹中的人數 比螢幕的畫素還要多。 但,可以取其中一部分 六千人的家譜給各位看。 每個綠色節點代表一個人。 紅色節點代表婚姻關係, 連線則代表親子關係。 在家譜的中間可以看到祖先。 在外圍則是後代。 這個家譜樹大約涵蓋了七個世代。 當我們把人數增加到七萬人時, 就會變成這樣—— 相對我們所有的資料, 這仍然只是冰山一角。 儘管如此,各位已經可以 看出有巨大的家譜樹形成了, 當中有許多遠親。 仰賴家譜學者的努力, 我們可以回到數百年前。 比如,這是亞歷山大 · 漢密爾頓, 生於 1755 年。 亞歷山大是美國第一位財政部長, 但主要由於一部流行的 百老匯音樂劇而廣為人知。 我們發現亞歷山大 在娛樂圈有更深厚的人脈。 事實上,他是…… 凱文貝肯的血親! (笑聲) 他們兩人都是十三世紀 一位蘇格蘭女子的後裔。 所以,可以說亞歷山大漢密爾頓 是凱文貝肯的三十五度宗譜。 (改自「六度分離」) (笑聲) 我們的家譜樹有數百萬個 像這樣的故事。 我們投入許多心力 去驗證我們資料的品質。 利用 DNA,我們發現, 我們的資料中有 0.3% 的 母子關係是錯的, 這很符合在二次大戰之前 美國的領養率。 就父系的這一面來說, 狀況就沒這麼好了: 我們的資料中,1.9% 的 父子關係是錯的。 我看到這邊有些人在笑。 就如各位所想的—— 世界上有很多師奶殺手級的男人。 (笑聲) 然而,這 1.9% 的父子關係錯誤率 不是我們數據獨有的 。 過去用臨床等級家譜所做的研究, 也有發現近似的錯誤率。 所以我們的資料品質算不錯, 那並不讓人意外。 我們的系譜學家對正確記錄 他們的家族史有著濃厚的興趣。 我們可以善用這些資料, 來了解人類的量化資訊, 比如,人口統計相關的問題。 這是我們的資料在世界地圖上的樣子。 每一個畫素就是 活在某個時點的一個人。 因為我們有非常多資料, 各位可以看見許多國家的輪廓, 特別是西方世界的國家。 在這段影片中,我們根據 1400~1900 年間出生的人, 將剛才那張地圖做分層, 再將結果和已知的 移民事件做比對。 這支影片會讓各位看到, 我們資料中最深遠的連結, 會一路連到記錄 保存得比較好的英國, 接著再隨西方殖民路線散播出去。 咱們來看看影片。 (音樂) 〔出生年:〕 〔1492 年:哥倫布藍色海洋航行時期〕 〔1620 年:五月花號在麻州靠岸〕 〔1652 年:荷蘭人在南非定居〕 〔1788 年:英國開始將受刑者運往澳洲〕 〔1836 年:奧勒岡小徑 初次被移民使用〕 〔所有活動〕 我很愛這支影片。 既然有這些移民事件 作為家族的脈絡, 我們就能問像這樣的問題: 先生和太太的出生地, 通常距離多遠? 在人口統計學上, 這距離扮演很關鍵的角色, 因為人們遷移建構家庭的模式 會決定基因在地理 區域上如何散播。 我們用我們的資料 來分析這個距離, 我們發現,在過去 用的方式並不困難。 他們只會和鄰近村落的人結婚。 但,工業革命讓我們的 愛情生活變複雜了。 現今,機票大家可以付擔得起, 再加上線上社群媒體, 人們通常從出生地遷移一百多公里, 去尋找靈魂伴侶。 現在各位可能會問: 好吧,從一個地方遷移到另一個地方 去建構家庭的苦差事是誰在做呢? 是男方或女方? 我們用我們的資料來解這個問題, 至少,在過去三百年間, 我們發現從一地移民到另一地 去組成家庭的苦差事是女方在做。 這些結果在統計上是顯著的, 所以男人比較懶是有科學根據的。 (笑聲) 我們可以從人口統計相關的問題 換到詢問人類健康相關的問題。 比如,我們可以問 人與人之間的壽命差異, 受到遺傳變異的影響有多大? 過去有研究分析 雙胞胎壽命的相關性 來解答這個問題。 他們估計,人與人 之間的壽命差異, 有四分之一是來自遺傳變異。 但,雙胞胎之間的關聯性 有許多可能成因, 包括各種環境的影響, 或共同的家庭。 大型家譜樹讓我們有機會 分析這些近親, 比如雙胞胎, 到遠房親戚,甚至第四代表親。 這樣我們就能建立穩健的模型, 從環境因素中 分離出遺傳變異的貢獻來。 我們用我們的資料進行這項分析, 我們發現,遺傳變異只解釋了 15% 的個體壽命差異 。 平均而言,就是五年之差。 所以,基因對壽命的影響 沒有我們以前想的那麼大。 我認為這是大好消息, 因為那就表示我們的行為 與壽命有較大的關係。 比如,抽菸就能影響 十年的壽命—— 是基因影響的兩倍。 我們還有更驚人的發現, 就在我們從做家譜樹到 請家譜學家幫我們整理 DNA 資訊 並做眾包後發現的。 結果很驚人。 可能很難想像, 但柏尼叔叔和他的朋友 所創造出來的 DNA 法醫鑑定能力 甚至比目前的聯邦調查局還要強。 當你把 DNA 放入大型的家譜樹中, 就能有效地創造出 如燈塔般的光束, 從 DNA 的源頭者放射出與 數百名遠親的連結光束。 在家譜中放入數個燈塔, 就能針對一個未知的人 做 DNA 三角定位, 原理和 GPS 使用多個衛星 來定位一個地點的方法相同。 有個主要的例子可以說明 這項技術有多強大, 那就是追捕金州(加州)殺手, 他是美國史上 最惡名昭彰的罪犯之一。 聯邦調查局尋找這個人 已經超過四十年。 他們有他的 DNA, 但他從來沒有出現在 任何警方資料庫中。 大約一年前,聯邦調查局 去諮詢了一位基因系譜學家, 她建議他們將他的 DNA 上傳到一項家譜服務中, 這項服務能找出遠親。 他們照做了, 找到了金州殺手的第三代表親。 他們建立了一個很大的家譜樹, 掃描樹狀圖上的不同分支, 直到他們找到完美匹配 金州殺手資訊的檔案。 他們從這個人身上取得 DNA 並發現跟他們手上的 DNA 相匹配。 他們逮捕了這個人, 這麼多年後終於將他繩之以法。 從那之後,基因系譜學家就開始 和美國執法單位合作, 使用這項技術來抓罪犯。 光是在過去六個月, 他們就用這項技術破了 超過二十件長年未破的案件。 很幸運,我們有柏尼叔叔 和他的家譜學家夥伴們。 這些人不只是業餘愛好者。 他們還是滿懷熱情 能說「我們是誰」的公民科學家, 他們知道過去是通向未來的鑰匙。 感謝各位。 (掌聲)