人们因各种原因使用着互联网。 一种最受欢迎的网站 是人们常常私下浏览的东西。 它涉及到好奇心, 无关自我放纵程度, 并以记录他人的生殖记录 为中心。 (笑声) 当然,我讨论的是家谱学—— (笑声) 也就是对家庭历史的研究。 当说到详细的家族历史, 在每个家庭中,我们都有 一个痴迷于家谱的人。 我们姑且叫他伯尼叔叔吧。 伯尼叔叔正是你在感恩节晚餐上, 最不想坐在一起的人, 因为他会用一些远古亲戚的奇特细节 把你烦死。 但正如你所知, 任何事物都有科学的一面, 我们发现伯尼叔叔的故事 具有巨大的生物医学研究潜力。 我们让伯尼叔叔和他的家谱同行, 通过族谱网站 geni.com 记录他们的家谱。 当用户上传他们的家谱树到网站时, 网站会扫描他们的亲戚, 如果它发现匹配上现存的家谱树, 它会合并现存的和新的家谱树。 结果是超大的家族树创建起来了, 超越了每个家谱学家的个人水平。 现在,凭借着全球数百万人 不断重复这个过程, 我们可以众包全人类家谱树的建设。 使用这个网站, 我们能够在一颗家族树上连接 1.25 亿人。 我无法在这里的屏幕上画家谱树, 因为它们的像素比 在这棵树上的人还少。 但这里有一个 6000 人的子集例子。 每一个绿色的节点是一个人。 红色的节点代表婚姻, 连接代表亲子关系。 在这个树的中央是祖先。 外围是后代。 这棵树大约有 7 代。 而这是当我们增加人数到 7 万人时 的样子—— 仍然是我们拥有的所有 数据集的一小部分。 即便如此,你已经能够看到由许多远亲 组成的一棵巨大家谱树。 感谢家谱学家的努力工作, 我们可以回到数百年前。 比如,这是亚历山大·汉密尔顿, 他出生于 1755 年。 亚历山大是首任美国财政部长, 但主要由于一部流行的百老汇 音乐剧而广为人知。 我们发现亚历山大在娱乐圈 有更深厚的人脉。 事实上,他是—— 凯文·贝肯的血亲! (笑声) 他们都是13世纪一位来自 苏格兰的女士的后代。 所以你可以说亚历山大·汉密尔顿 是 35 度凯文·贝肯的宗谱。 (笑声) 我们的家谱树有数百万类似的故事。 我们投入了不小的工作 在验证数据的质量上。 使用DNA,我们发现我们 数据中有 0.3% 的母子关系 是错误的, 这可能与二战前美国的收养率相当。 父亲方面, 消息也并不乐观: 我们的数据中 1.9% 的 父子关系是错误的。 我看到有人在这儿讪笑。 这是你们在想的—— 外面有很多挤牛奶的人。 (笑声) 然而这 1.9% 的父子关系错误率 不是我们数据独有的。 早先使用临床级血统的研究 也发现了类似的错误率。 所以我们的数据质量是良好的, 并且这也不应该是个意外。 我们的系谱学家对正确记录 他们的家族史有着浓厚的兴趣。 我们可以利用这些数据来 了解人类的定量信息, 比如,有关人口统计学的问题。 这是我们的资料在世界地图上的样子。 每个像素代表一个生活在特定位置的人。 由于我们有很多数据, 你可以看到很多国家的轮廓, 尤其在西方世界。 在这个视频片段中, 我们把给你展示的地图 根据 1400-1900 年出生 的人口进行分层, 并且跟已知的迁移事件比较。 这个视频将向你展示 我们数据中最深的血统, 可以追溯到英国, 这里有更好的记录保存, 然后他们沿着西方殖民主义 的道路传播。 让我们来看看这个。 (音乐) 【出生年份:】 【1492 - 哥伦布蓝色海洋航行时期】 【1620 - 五月花号在马萨诸塞州着陆】 【1652 - 荷兰人在南非定居】 【1788 - 英国开始向澳大利亚 进行刑事流放】】 【1836 - 第一批移民来到俄勒冈小道】 【所有活动】 我爱这个视频。 因为这些移民时间 提供了家庭的背景, 我们可以问诸如此类的问题: 丈夫和妻子出生地 的特定距离是多少? 这一距离在人口统计学中 起着重要的作用, 因为人们迁移形成家庭的模式 决定了基因如何在地理位置上传播。 我们使用我们的数据分析了这个距离, 我们发现在古时候, 人们过得很轻松。 他们只是跟村子附近的某人结婚。 但工业革命复杂化了 我们的爱情生活。 今天,凭着可负担的航班 和网络社交媒体, 人们通常从出生地迁移 100 多公里 来寻找灵魂伴侣。 所以现在你可能会问: 好吧,但是谁会卖力从一个地方 迁移到另一个地方 去构建家庭呢? 是男人还是女人? 我们使用我们的数据解答了这个问题, 至少在过去 300 年中, 我们发现女性从一个地方 迁移到另一个地方 去构建家庭上是最辛苦的。 这些结果在统计上很显著, 所以你可以把男性懒惰当作科学事实。 (笑声) 我们可以把问题从人口统计学开始 转向人类健康问题。 比如,我们可以问 遗传变异能在多大程度上影响个体的 寿命差异。 之前的研究通过分析 双胞胎寿命的相关性 来解答这个问题。 他们估计出遗传变异 对个体寿命差异的影响大约占 1/4。 但双胞胎之间的关联有很多原因, 包括多样的环境影响 或共同的家庭。 庞大的家谱树给了我们分析这些近亲, 比如双胞胎, 到远房亲戚, 甚至四代表亲这样的机会。 这样我们可以构建稳健的模型, 从环境因素中分离出 遗传变异的贡献来。 我们使用数据执行了这个分析, 发现遗传变异只解释了 15% 的 个体寿命差异。 平均而言, 就是 5 年之差。 所以基因对寿命的重要性 比我们之前想象的少。 我发现这是个好消息, 因为这意味着我们的行动更为重要。 举个例子,吸烟会影响 大约10年的预期寿命—— 是基因所能影响的两倍。 随着我们从家谱树展开, 让我们的家谱学专家建档, 并且众包DNA信息, 我们能有更多惊奇的发现。 结果将是惊人的。 可能令人难以想象, 伯尼叔叔和他的朋友 能够创建 DNA 法医能力, 甚至超过了 FBI 目前拥有的水平。 当你把 DNA 放在一棵大的家谱树中, 你就有效地创造了一个照亮 数百个远亲的灯塔, 他们都与 DNA 的拥有者有联系。 通过在一棵大的家谱树中 放置不同的灯塔, 你现在可以对一个陌生人 的 DNA 进行三角测量, 就跟 GPS 系统利用不同的卫星 来定位一样。 这种技术威力一个的主要例子 是追捕“金州杀手”, 美国历史上最臭名昭著的罪犯之一。 FBI 已经寻找这人超过 40 年。 他们有他的 DNA, 但他从未出现在警方的数据库中。 大约一年前,FBI 咨询了 一位基因谱系学家, 她建议他们提交他的 DNA 到可以定位远房亲戚 的家谱服务平台上。 FBI 这样做了, 他们找到了金州杀手的第三代表亲。 他们构建了一棵巨大的家谱树, 扫描树上的不同分支, 直到他们找到完美匹配 他们所了解的金州杀手信息的人。 他们从这人身上取得 DNA 并发现 跟他们手上的 DNA 一致。 过了这么些年,他们终于逮捕了他, 并绳之与法。 自那之后,基因谱系学家开始 跟美国当地执法机构合作, 使用这种技术来抓捕罪犯。 仅仅在过去的 6 个月, 他们使用这个技术就破获了 超过 20 个铁证悬案。 幸好,我们有这群人, 像伯尼叔叔和他的家谱学同行, 他们不只是业余爱好者。 他们是满怀热情的公民科学家, 想要揭开我们所有人身份的秘密。 他们知道,过去是通向未来的钥匙。 谢谢大家。 (鼓掌)