1 00:00:00,817 --> 00:00:04,269 人们因各种原因使用着互联网。 2 00:00:05,765 --> 00:00:09,569 一种最受欢迎的网站 3 00:00:09,593 --> 00:00:12,465 是人们常常私下浏览的东西。 4 00:00:13,639 --> 00:00:16,149 它涉及到好奇心, 5 00:00:16,173 --> 00:00:19,969 无关自我放纵程度, 6 00:00:19,993 --> 00:00:23,253 并以记录他人的生殖记录 7 00:00:23,277 --> 00:00:24,586 为中心。 8 00:00:24,610 --> 00:00:25,642 (笑声) 9 00:00:25,666 --> 00:00:27,916 当然,我讨论的是家谱学—— 10 00:00:27,940 --> 00:00:29,154 (笑声) 11 00:00:29,178 --> 00:00:30,880 也就是对家庭历史的研究。 12 00:00:31,353 --> 00:00:33,390 当说到详细的家族历史, 13 00:00:33,414 --> 00:00:37,357 在每个家庭中,我们都有 一个痴迷于家谱的人。 14 00:00:37,381 --> 00:00:39,094 我们姑且叫他伯尼叔叔吧。 15 00:00:39,118 --> 00:00:42,900 伯尼叔叔正是你在感恩节晚餐上, 16 00:00:42,924 --> 00:00:44,523 最不想坐在一起的人, 17 00:00:44,547 --> 00:00:47,361 因为他会用一些远古亲戚的奇特细节 18 00:00:47,385 --> 00:00:49,351 把你烦死。 19 00:00:50,462 --> 00:00:51,724 但正如你所知, 20 00:00:51,748 --> 00:00:54,620 任何事物都有科学的一面, 21 00:00:54,644 --> 00:00:57,622 我们发现伯尼叔叔的故事 22 00:00:57,646 --> 00:01:00,814 具有巨大的生物医学研究潜力。 23 00:01:01,306 --> 00:01:04,020 我们让伯尼叔叔和他的家谱同行, 24 00:01:04,044 --> 00:01:08,712 通过族谱网站 geni.com 记录他们的家谱。 25 00:01:09,198 --> 00:01:11,326 当用户上传他们的家谱树到网站时, 26 00:01:11,350 --> 00:01:13,040 网站会扫描他们的亲戚, 27 00:01:13,064 --> 00:01:15,139 如果它发现匹配上现存的家谱树, 28 00:01:15,163 --> 00:01:18,773 它会合并现存的和新的家谱树。 29 00:01:19,768 --> 00:01:22,718 结果是超大的家族树创建起来了, 30 00:01:22,742 --> 00:01:26,221 超越了每个家谱学家的个人水平。 31 00:01:26,808 --> 00:01:30,937 现在,凭借着全球数百万人 32 00:01:30,961 --> 00:01:32,778 不断重复这个过程, 33 00:01:32,802 --> 00:01:38,334 我们可以众包全人类家谱树的建设。 34 00:01:39,292 --> 00:01:40,876 使用这个网站, 35 00:01:40,900 --> 00:01:45,713 我们能够在一颗家族树上连接 36 00:01:45,737 --> 00:01:48,258 1.25 亿人。 37 00:01:48,967 --> 00:01:51,755 我无法在这里的屏幕上画家谱树, 38 00:01:51,779 --> 00:01:53,944 因为它们的像素比 39 00:01:53,968 --> 00:01:56,481 在这棵树上的人还少。 40 00:01:56,505 --> 00:02:01,515 但这里有一个 6000 人的子集例子。 41 00:02:02,159 --> 00:02:04,521 每一个绿色的节点是一个人。 42 00:02:05,060 --> 00:02:07,909 红色的节点代表婚姻, 43 00:02:07,933 --> 00:02:10,191 连接代表亲子关系。 44 00:02:10,557 --> 00:02:12,929 在这个树的中央是祖先。 45 00:02:12,953 --> 00:02:15,351 外围是后代。 46 00:02:15,351 --> 00:02:18,683 这棵树大约有 7 代。 47 00:02:19,692 --> 00:02:22,926 而这是当我们增加人数到 7 万人时 48 00:02:22,950 --> 00:02:24,778 的样子—— 49 00:02:24,802 --> 00:02:29,132 仍然是我们拥有的所有 数据集的一小部分。 50 00:02:29,629 --> 00:02:34,442 即便如此,你已经能够看到由许多远亲 51 00:02:34,466 --> 00:02:37,121 组成的一棵巨大家谱树。 52 00:02:37,610 --> 00:02:40,744 感谢家谱学家的努力工作, 53 00:02:40,768 --> 00:02:43,871 我们可以回到数百年前。 54 00:02:44,418 --> 00:02:47,859 比如,这是亚历山大·汉密尔顿, 55 00:02:47,883 --> 00:02:50,358 他出生于 1755 年。 56 00:02:50,872 --> 00:02:54,636 亚历山大是首任美国财政部长, 57 00:02:54,660 --> 00:02:58,491 但主要由于一部流行的百老汇 音乐剧而广为人知。 58 00:02:59,137 --> 00:03:04,059 我们发现亚历山大在娱乐圈 有更深厚的人脉。 59 00:03:04,083 --> 00:03:06,194 事实上,他是—— 60 00:03:06,781 --> 00:03:08,001 凯文·贝肯的血亲! 61 00:03:08,025 --> 00:03:10,057 (笑声) 62 00:03:10,081 --> 00:03:12,687 他们都是13世纪一位来自 63 00:03:12,711 --> 00:03:15,025 苏格兰的女士的后代。 64 00:03:15,049 --> 00:03:18,151 所以你可以说亚历山大·汉密尔顿 65 00:03:18,175 --> 00:03:21,363 是 35 度凯文·贝肯的宗谱。 66 00:03:21,387 --> 00:03:22,828 (笑声) 67 00:03:22,852 --> 00:03:26,082 我们的家谱树有数百万类似的故事。 68 00:03:28,113 --> 00:03:33,003 我们投入了不小的工作 在验证数据的质量上。 69 00:03:33,027 --> 00:03:38,418 使用DNA,我们发现我们 数据中有 0.3% 的母子关系 70 00:03:38,442 --> 00:03:39,692 是错误的, 71 00:03:39,716 --> 00:03:43,307 这可能与二战前美国的收养率相当。 72 00:03:44,847 --> 00:03:46,632 父亲方面, 73 00:03:46,656 --> 00:03:48,617 消息也并不乐观: 74 00:03:50,149 --> 00:03:55,749 我们的数据中 1.9% 的 父子关系是错误的。 75 00:03:55,773 --> 00:03:58,136 我看到有人在这儿讪笑。 76 00:03:58,160 --> 00:03:59,877 这是你们在想的—— 77 00:03:59,901 --> 00:04:01,690 外面有很多挤牛奶的人。 78 00:04:01,714 --> 00:04:02,778 (笑声) 79 00:04:02,802 --> 00:04:06,791 然而这 1.9% 的父子关系错误率 80 00:04:06,815 --> 00:04:08,584 不是我们数据独有的。 81 00:04:08,608 --> 00:04:11,677 早先使用临床级血统的研究 82 00:04:11,701 --> 00:04:13,722 也发现了类似的错误率。 83 00:04:14,254 --> 00:04:16,779 所以我们的数据质量是良好的, 84 00:04:16,803 --> 00:04:18,936 并且这也不应该是个意外。 85 00:04:18,960 --> 00:04:22,736 我们的系谱学家对正确记录 86 00:04:22,760 --> 00:04:26,428 他们的家族史有着浓厚的兴趣。 87 00:04:28,594 --> 00:04:33,185 我们可以利用这些数据来 了解人类的定量信息, 88 00:04:33,209 --> 00:04:35,805 比如,有关人口统计学的问题。 89 00:04:35,829 --> 00:04:39,686 这是我们的资料在世界地图上的样子。 90 00:04:40,250 --> 00:04:44,731 每个像素代表一个生活在特定位置的人。 91 00:04:44,755 --> 00:04:46,435 由于我们有很多数据, 92 00:04:46,459 --> 00:04:49,240 你可以看到很多国家的轮廓, 93 00:04:49,264 --> 00:04:51,363 尤其在西方世界。 94 00:04:51,387 --> 00:04:54,935 在这个视频片段中, 我们把给你展示的地图 95 00:04:54,959 --> 00:05:00,031 根据 1400-1900 年出生 的人口进行分层, 96 00:05:00,055 --> 00:05:02,821 并且跟已知的迁移事件比较。 97 00:05:03,482 --> 00:05:06,647 这个视频将向你展示 我们数据中最深的血统, 98 00:05:06,671 --> 00:05:08,298 可以追溯到英国, 99 00:05:08,322 --> 00:05:10,130 这里有更好的记录保存, 100 00:05:10,154 --> 00:05:13,436 然后他们沿着西方殖民主义 的道路传播。 101 00:05:13,460 --> 00:05:14,782 让我们来看看这个。 102 00:05:15,143 --> 00:05:16,752 (音乐) 103 00:05:16,776 --> 00:05:19,117 【出生年份:】 104 00:05:19,705 --> 00:05:21,541 【1492 - 哥伦布蓝色海洋航行时期】 105 00:05:23,661 --> 00:05:25,661 【1620 - 五月花号在马萨诸塞州着陆】 106 00:05:26,726 --> 00:05:28,501 【1652 - 荷兰人在南非定居】 107 00:05:32,321 --> 00:05:35,507 【1788 - 英国开始向澳大利亚 进行刑事流放】】 108 00:05:35,531 --> 00:05:37,458 【1836 - 第一批移民来到俄勒冈小道】 109 00:05:38,149 --> 00:05:41,332 【所有活动】 110 00:05:43,851 --> 00:05:45,394 我爱这个视频。 111 00:05:45,418 --> 00:05:50,511 因为这些移民时间 提供了家庭的背景, 112 00:05:50,535 --> 00:05:52,718 我们可以问诸如此类的问题: 113 00:05:52,742 --> 00:05:56,212 丈夫和妻子出生地 114 00:05:56,236 --> 00:05:59,048 的特定距离是多少? 115 00:05:59,072 --> 00:06:02,749 这一距离在人口统计学中 起着重要的作用, 116 00:06:02,773 --> 00:06:06,454 因为人们迁移形成家庭的模式 117 00:06:06,478 --> 00:06:10,191 决定了基因如何在地理位置上传播。 118 00:06:10,706 --> 00:06:13,034 我们使用我们的数据分析了这个距离, 119 00:06:13,058 --> 00:06:15,348 我们发现在古时候, 120 00:06:15,372 --> 00:06:16,602 人们过得很轻松。 121 00:06:16,626 --> 00:06:19,220 他们只是跟村子附近的某人结婚。 122 00:06:19,958 --> 00:06:23,663 但工业革命复杂化了 我们的爱情生活。 123 00:06:23,687 --> 00:06:28,247 今天,凭着可负担的航班 和网络社交媒体, 124 00:06:28,271 --> 00:06:33,099 人们通常从出生地迁移 100 多公里 125 00:06:33,123 --> 00:06:34,627 来寻找灵魂伴侣。 126 00:06:36,524 --> 00:06:37,711 所以现在你可能会问: 127 00:06:37,735 --> 00:06:42,231 好吧,但是谁会卖力从一个地方 迁移到另一个地方 128 00:06:42,255 --> 00:06:43,524 去构建家庭呢? 129 00:06:43,548 --> 00:06:47,275 是男人还是女人? 130 00:06:47,752 --> 00:06:49,907 我们使用我们的数据解答了这个问题, 131 00:06:49,931 --> 00:06:52,525 至少在过去 300 年中, 132 00:06:52,549 --> 00:06:56,432 我们发现女性从一个地方 迁移到另一个地方 133 00:06:56,456 --> 00:06:59,447 去构建家庭上是最辛苦的。 134 00:06:59,447 --> 00:07:02,577 这些结果在统计上很显著, 135 00:07:02,601 --> 00:07:06,072 所以你可以把男性懒惰当作科学事实。 136 00:07:06,096 --> 00:07:09,252 (笑声) 137 00:07:09,276 --> 00:07:11,812 我们可以把问题从人口统计学开始 138 00:07:11,836 --> 00:07:14,749 转向人类健康问题。 139 00:07:14,773 --> 00:07:16,260 比如,我们可以问 140 00:07:16,284 --> 00:07:21,247 遗传变异能在多大程度上影响个体的 141 00:07:21,271 --> 00:07:22,465 寿命差异。 142 00:07:22,988 --> 00:07:27,518 之前的研究通过分析 双胞胎寿命的相关性 143 00:07:27,542 --> 00:07:28,984 来解答这个问题。 144 00:07:29,411 --> 00:07:32,078 他们估计出遗传变异 145 00:07:32,102 --> 00:07:36,142 对个体寿命差异的影响大约占 1/4。 146 00:07:36,688 --> 00:07:39,286 但双胞胎之间的关联有很多原因, 147 00:07:39,310 --> 00:07:41,614 包括多样的环境影响 148 00:07:41,638 --> 00:07:43,260 或共同的家庭。 149 00:07:44,411 --> 00:07:48,164 庞大的家谱树给了我们分析这些近亲, 150 00:07:48,188 --> 00:07:49,395 比如双胞胎, 151 00:07:49,419 --> 00:07:52,336 到远房亲戚, 甚至四代表亲这样的机会。 152 00:07:52,749 --> 00:07:55,438 这样我们可以构建稳健的模型, 153 00:07:55,462 --> 00:07:59,170 从环境因素中分离出 154 00:07:59,194 --> 00:08:00,911 遗传变异的贡献来。 155 00:08:01,379 --> 00:08:04,278 我们使用数据执行了这个分析, 156 00:08:04,302 --> 00:08:10,093 发现遗传变异只解释了 15% 的 157 00:08:10,117 --> 00:08:12,923 个体寿命差异。 158 00:08:14,760 --> 00:08:17,516 平均而言, 就是 5 年之差。 159 00:08:18,316 --> 00:08:23,024 所以基因对寿命的重要性 比我们之前想象的少。 160 00:08:23,675 --> 00:08:25,811 我发现这是个好消息, 161 00:08:26,438 --> 00:08:29,731 因为这意味着我们的行动更为重要。 162 00:08:30,533 --> 00:08:34,807 举个例子,吸烟会影响 大约10年的预期寿命—— 163 00:08:34,831 --> 00:08:37,477 是基因所能影响的两倍。 164 00:08:38,236 --> 00:08:40,525 随着我们从家谱树展开, 165 00:08:40,549 --> 00:08:42,041 让我们的家谱学专家建档, 166 00:08:42,065 --> 00:08:46,797 并且众包DNA信息, 我们能有更多惊奇的发现。 167 00:08:46,821 --> 00:08:48,845 结果将是惊人的。 168 00:08:49,255 --> 00:08:53,170 可能令人难以想象, 伯尼叔叔和他的朋友 169 00:08:53,194 --> 00:08:55,840 能够创建 DNA 法医能力, 170 00:08:55,864 --> 00:08:59,423 甚至超过了 FBI 目前拥有的水平。 171 00:09:00,862 --> 00:09:03,266 当你把 DNA 放在一棵大的家谱树中, 172 00:09:03,290 --> 00:09:05,407 你就有效地创造了一个照亮 173 00:09:05,431 --> 00:09:08,065 数百个远亲的灯塔, 174 00:09:08,089 --> 00:09:11,579 他们都与 DNA 的拥有者有联系。 175 00:09:12,505 --> 00:09:15,418 通过在一棵大的家谱树中 放置不同的灯塔, 176 00:09:15,442 --> 00:09:19,162 你现在可以对一个陌生人 的 DNA 进行三角测量, 177 00:09:19,186 --> 00:09:23,124 就跟 GPS 系统利用不同的卫星 178 00:09:23,148 --> 00:09:24,472 来定位一样。 179 00:09:25,226 --> 00:09:28,850 这种技术威力一个的主要例子 180 00:09:28,874 --> 00:09:31,549 是追捕“金州杀手”, 181 00:09:32,612 --> 00:09:37,140 美国历史上最臭名昭著的罪犯之一。 182 00:09:37,164 --> 00:09:43,056 FBI 已经寻找这人超过 40 年。 183 00:09:43,588 --> 00:09:45,423 他们有他的 DNA, 184 00:09:45,447 --> 00:09:48,797 但他从未出现在警方的数据库中。 185 00:09:49,447 --> 00:09:54,159 大约一年前,FBI 咨询了 一位基因谱系学家, 186 00:09:54,183 --> 00:09:58,133 她建议他们提交他的 DNA 到可以定位远房亲戚 187 00:09:58,157 --> 00:10:00,555 的家谱服务平台上。 188 00:10:01,117 --> 00:10:02,273 FBI 这样做了, 189 00:10:02,297 --> 00:10:05,989 他们找到了金州杀手的第三代表亲。 190 00:10:06,013 --> 00:10:08,357 他们构建了一棵巨大的家谱树, 191 00:10:08,381 --> 00:10:10,367 扫描树上的不同分支, 192 00:10:10,367 --> 00:10:13,072 直到他们找到完美匹配 193 00:10:13,096 --> 00:10:15,677 他们所了解的金州杀手信息的人。 194 00:10:15,701 --> 00:10:19,293 他们从这人身上取得 DNA 并发现 195 00:10:19,317 --> 00:10:21,342 跟他们手上的 DNA 一致。 196 00:10:21,366 --> 00:10:23,716 过了这么些年,他们终于逮捕了他, 197 00:10:23,740 --> 00:10:25,164 并绳之与法。 198 00:10:26,172 --> 00:10:29,413 自那之后,基因谱系学家开始 199 00:10:29,437 --> 00:10:32,105 跟美国当地执法机构合作, 200 00:10:32,129 --> 00:10:35,491 使用这种技术来抓捕罪犯。 201 00:10:35,521 --> 00:10:38,202 仅仅在过去的 6 个月, 202 00:10:38,226 --> 00:10:42,522 他们使用这个技术就破获了 超过 20 个铁证悬案。 203 00:10:44,203 --> 00:10:48,839 幸好,我们有这群人, 像伯尼叔叔和他的家谱学同行, 204 00:10:49,045 --> 00:10:52,039 他们不只是业余爱好者。 205 00:10:52,602 --> 00:10:59,021 他们是满怀热情的公民科学家, 想要揭开我们所有人身份的秘密。 206 00:10:59,065 --> 00:11:03,523 他们知道,过去是通向未来的钥匙。 207 00:11:04,067 --> 00:11:05,250 谢谢大家。 208 00:11:05,314 --> 00:11:08,783 (鼓掌)