Return to Video

我们如何建立世界上最大的家谱树

  • 0:01 - 0:04
    人们因各种原因使用着互联网。
  • 0:06 - 0:10
    一种最受欢迎的网站
  • 0:10 - 0:12
    是人们常常私下浏览的东西。
  • 0:14 - 0:16
    它涉及到好奇心,
  • 0:16 - 0:20
    无关自我放纵程度,
  • 0:20 - 0:23
    并以记录他人的生殖记录
  • 0:23 - 0:25
    为中心。
  • 0:25 - 0:26
    (笑声)
  • 0:26 - 0:28
    当然,我讨论的是家谱学——
  • 0:28 - 0:29
    (笑声)
  • 0:29 - 0:31
    也就是对家庭历史的研究。
  • 0:31 - 0:33
    当说到详细的家族历史,
  • 0:33 - 0:37
    在每个家庭中,我们都有
    一个痴迷于家谱的人。
  • 0:37 - 0:39
    我们姑且叫他伯尼叔叔吧。
  • 0:39 - 0:43
    伯尼叔叔正是你在感恩节晚餐上,
  • 0:43 - 0:45
    最不想坐在一起的人,
  • 0:45 - 0:47
    因为他会用一些远古亲戚的奇特细节
  • 0:47 - 0:49
    把你烦死。
  • 0:50 - 0:52
    但正如你所知,
  • 0:52 - 0:55
    任何事物都有科学的一面,
  • 0:55 - 0:58
    我们发现伯尼叔叔的故事
  • 0:58 - 1:01
    具有巨大的生物医学研究潜力。
  • 1:01 - 1:04
    我们让伯尼叔叔和他的家谱同行,
  • 1:04 - 1:09
    通过族谱网站 geni.com
    记录他们的家谱。
  • 1:09 - 1:11
    当用户上传他们的家谱树到网站时,
  • 1:11 - 1:13
    网站会扫描他们的亲戚,
  • 1:13 - 1:15
    如果它发现匹配上现存的家谱树,
  • 1:15 - 1:19
    它会合并现存的和新的家谱树。
  • 1:20 - 1:23
    结果是超大的家族树创建起来了,
  • 1:23 - 1:26
    超越了每个家谱学家的个人水平。
  • 1:27 - 1:31
    现在,凭借着全球数百万人
  • 1:31 - 1:33
    不断重复这个过程,
  • 1:33 - 1:38
    我们可以众包全人类家谱树的建设。
  • 1:39 - 1:41
    使用这个网站,
  • 1:41 - 1:46
    我们能够在一颗家族树上连接
  • 1:46 - 1:48
    1.25 亿人。
  • 1:49 - 1:52
    我无法在这里的屏幕上画家谱树,
  • 1:52 - 1:54
    因为它们的像素比
  • 1:54 - 1:56
    在这棵树上的人还少。
  • 1:57 - 2:02
    但这里有一个 6000 人的子集例子。
  • 2:02 - 2:05
    每一个绿色的节点是一个人。
  • 2:05 - 2:08
    红色的节点代表婚姻,
  • 2:08 - 2:10
    连接代表亲子关系。
  • 2:11 - 2:13
    在这个树的中央是祖先。
  • 2:13 - 2:15
    外围是后代。
  • 2:15 - 2:19
    这棵树大约有 7 代。
  • 2:20 - 2:23
    而这是当我们增加人数到 7 万人时
  • 2:23 - 2:25
    的样子——
  • 2:25 - 2:29
    仍然是我们拥有的所有
    数据集的一小部分。
  • 2:30 - 2:34
    即便如此,你已经能够看到由许多远亲
  • 2:34 - 2:37
    组成的一棵巨大家谱树。
  • 2:38 - 2:41
    感谢家谱学家的努力工作,
  • 2:41 - 2:44
    我们可以回到数百年前。
  • 2:44 - 2:48
    比如,这是亚历山大·汉密尔顿,
  • 2:48 - 2:50
    他出生于 1755 年。
  • 2:51 - 2:55
    亚历山大是首任美国财政部长,
  • 2:55 - 2:58
    但主要由于一部流行的百老汇
    音乐剧而广为人知。
  • 2:59 - 3:04
    我们发现亚历山大在娱乐圈
    有更深厚的人脉。
  • 3:04 - 3:06
    事实上,他是——
  • 3:07 - 3:08
    凯文·贝肯的血亲!
  • 3:08 - 3:10
    (笑声)
  • 3:10 - 3:13
    他们都是13世纪一位来自
  • 3:13 - 3:15
    苏格兰的女士的后代。
  • 3:15 - 3:18
    所以你可以说亚历山大·汉密尔顿
  • 3:18 - 3:21
    是 35 度凯文·贝肯的宗谱。
  • 3:21 - 3:23
    (笑声)
  • 3:23 - 3:26
    我们的家谱树有数百万类似的故事。
  • 3:28 - 3:33
    我们投入了不小的工作
    在验证数据的质量上。
  • 3:33 - 3:38
    使用DNA,我们发现我们
    数据中有 0.3% 的母子关系
  • 3:38 - 3:40
    是错误的,
  • 3:40 - 3:43
    这可能与二战前美国的收养率相当。
  • 3:45 - 3:47
    父亲方面,
  • 3:47 - 3:49
    消息也并不乐观:
  • 3:50 - 3:56
    我们的数据中 1.9% 的
    父子关系是错误的。
  • 3:56 - 3:58
    我看到有人在这儿讪笑。
  • 3:58 - 4:00
    这是你们在想的——
  • 4:00 - 4:02
    外面有很多挤牛奶的人。
  • 4:02 - 4:03
    (笑声)
  • 4:03 - 4:07
    然而这 1.9% 的父子关系错误率
  • 4:07 - 4:09
    不是我们数据独有的。
  • 4:09 - 4:12
    早先使用临床级血统的研究
  • 4:12 - 4:14
    也发现了类似的错误率。
  • 4:14 - 4:17
    所以我们的数据质量是良好的,
  • 4:17 - 4:19
    并且这也不应该是个意外。
  • 4:19 - 4:23
    我们的系谱学家对正确记录
  • 4:23 - 4:26
    他们的家族史有着浓厚的兴趣。
  • 4:29 - 4:33
    我们可以利用这些数据来
    了解人类的定量信息,
  • 4:33 - 4:36
    比如,有关人口统计学的问题。
  • 4:36 - 4:40
    这是我们的资料在世界地图上的样子。
  • 4:40 - 4:45
    每个像素代表一个生活在特定位置的人。
  • 4:45 - 4:46
    由于我们有很多数据,
  • 4:46 - 4:49
    你可以看到很多国家的轮廓,
  • 4:49 - 4:51
    尤其在西方世界。
  • 4:51 - 4:55
    在这个视频片段中,
    我们把给你展示的地图
  • 4:55 - 5:00
    根据 1400-1900 年出生
    的人口进行分层,
  • 5:00 - 5:03
    并且跟已知的迁移事件比较。
  • 5:03 - 5:07
    这个视频将向你展示
    我们数据中最深的血统,
  • 5:07 - 5:08
    可以追溯到英国,
  • 5:08 - 5:10
    这里有更好的记录保存,
  • 5:10 - 5:13
    然后他们沿着西方殖民主义
    的道路传播。
  • 5:13 - 5:15
    让我们来看看这个。
  • 5:15 - 5:17
    (音乐)
  • 5:17 - 5:19
    【出生年份:】
  • 5:20 - 5:22
    【1492 - 哥伦布蓝色海洋航行时期】
  • 5:24 - 5:26
    【1620 - 五月花号在马萨诸塞州着陆】
  • 5:27 - 5:29
    【1652 - 荷兰人在南非定居】
  • 5:32 - 5:36
    【1788 - 英国开始向澳大利亚
    进行刑事流放】】
  • 5:36 - 5:37
    【1836 - 第一批移民来到俄勒冈小道】
  • 5:38 - 5:41
    【所有活动】
  • 5:44 - 5:45
    我爱这个视频。
  • 5:45 - 5:51
    因为这些移民时间
    提供了家庭的背景,
  • 5:51 - 5:53
    我们可以问诸如此类的问题:
  • 5:53 - 5:56
    丈夫和妻子出生地
  • 5:56 - 5:59
    的特定距离是多少?
  • 5:59 - 6:03
    这一距离在人口统计学中
    起着重要的作用,
  • 6:03 - 6:06
    因为人们迁移形成家庭的模式
  • 6:06 - 6:10
    决定了基因如何在地理位置上传播。
  • 6:11 - 6:13
    我们使用我们的数据分析了这个距离,
  • 6:13 - 6:15
    我们发现在古时候,
  • 6:15 - 6:17
    人们过得很轻松。
  • 6:17 - 6:19
    他们只是跟村子附近的某人结婚。
  • 6:20 - 6:24
    但工业革命复杂化了
    我们的爱情生活。
  • 6:24 - 6:28
    今天,凭着可负担的航班
    和网络社交媒体,
  • 6:28 - 6:33
    人们通常从出生地迁移 100 多公里
  • 6:33 - 6:35
    来寻找灵魂伴侣。
  • 6:37 - 6:38
    所以现在你可能会问:
  • 6:38 - 6:42
    好吧,但是谁会卖力从一个地方
    迁移到另一个地方
  • 6:42 - 6:44
    去构建家庭呢?
  • 6:44 - 6:47
    是男人还是女人?
  • 6:48 - 6:50
    我们使用我们的数据解答了这个问题,
  • 6:50 - 6:53
    至少在过去 300 年中,
  • 6:53 - 6:56
    我们发现女性从一个地方
    迁移到另一个地方
  • 6:56 - 6:59
    去构建家庭上是最辛苦的。
  • 6:59 - 7:03
    这些结果在统计上很显著,
  • 7:03 - 7:06
    所以你可以把男性懒惰当作科学事实。
  • 7:06 - 7:09
    (笑声)
  • 7:09 - 7:12
    我们可以把问题从人口统计学开始
  • 7:12 - 7:15
    转向人类健康问题。
  • 7:15 - 7:16
    比如,我们可以问
  • 7:16 - 7:21
    遗传变异能在多大程度上影响个体的
  • 7:21 - 7:22
    寿命差异。
  • 7:23 - 7:28
    之前的研究通过分析
    双胞胎寿命的相关性
  • 7:28 - 7:29
    来解答这个问题。
  • 7:29 - 7:32
    他们估计出遗传变异
  • 7:32 - 7:36
    对个体寿命差异的影响大约占 1/4。
  • 7:37 - 7:39
    但双胞胎之间的关联有很多原因,
  • 7:39 - 7:42
    包括多样的环境影响
  • 7:42 - 7:43
    或共同的家庭。
  • 7:44 - 7:48
    庞大的家谱树给了我们分析这些近亲,
  • 7:48 - 7:49
    比如双胞胎,
  • 7:49 - 7:52
    到远房亲戚,
    甚至四代表亲这样的机会。
  • 7:53 - 7:55
    这样我们可以构建稳健的模型,
  • 7:55 - 7:59
    从环境因素中分离出
  • 7:59 - 8:01
    遗传变异的贡献来。
  • 8:01 - 8:04
    我们使用数据执行了这个分析,
  • 8:04 - 8:10
    发现遗传变异只解释了 15% 的
  • 8:10 - 8:13
    个体寿命差异。
  • 8:15 - 8:18
    平均而言, 就是 5 年之差。
  • 8:18 - 8:23
    所以基因对寿命的重要性
    比我们之前想象的少。
  • 8:24 - 8:26
    我发现这是个好消息,
  • 8:26 - 8:30
    因为这意味着我们的行动更为重要。
  • 8:31 - 8:35
    举个例子,吸烟会影响
    大约10年的预期寿命——
  • 8:35 - 8:37
    是基因所能影响的两倍。
  • 8:38 - 8:41
    随着我们从家谱树展开,
  • 8:41 - 8:42
    让我们的家谱学专家建档,
  • 8:42 - 8:47
    并且众包DNA信息,
    我们能有更多惊奇的发现。
  • 8:47 - 8:49
    结果将是惊人的。
  • 8:49 - 8:53
    可能令人难以想象,
    伯尼叔叔和他的朋友
  • 8:53 - 8:56
    能够创建 DNA 法医能力,
  • 8:56 - 8:59
    甚至超过了 FBI 目前拥有的水平。
  • 9:01 - 9:03
    当你把 DNA 放在一棵大的家谱树中,
  • 9:03 - 9:05
    你就有效地创造了一个照亮
  • 9:05 - 9:08
    数百个远亲的灯塔,
  • 9:08 - 9:12
    他们都与 DNA 的拥有者有联系。
  • 9:13 - 9:15
    通过在一棵大的家谱树中
    放置不同的灯塔,
  • 9:15 - 9:19
    你现在可以对一个陌生人
    的 DNA 进行三角测量,
  • 9:19 - 9:23
    就跟 GPS 系统利用不同的卫星
  • 9:23 - 9:24
    来定位一样。
  • 9:25 - 9:29
    这种技术威力一个的主要例子
  • 9:29 - 9:32
    是追捕“金州杀手”,
  • 9:33 - 9:37
    美国历史上最臭名昭著的罪犯之一。
  • 9:37 - 9:43
    FBI 已经寻找这人超过 40 年。
  • 9:44 - 9:45
    他们有他的 DNA,
  • 9:45 - 9:49
    但他从未出现在警方的数据库中。
  • 9:49 - 9:54
    大约一年前,FBI 咨询了
    一位基因谱系学家,
  • 9:54 - 9:58
    她建议他们提交他的 DNA
    到可以定位远房亲戚
  • 9:58 - 10:01
    的家谱服务平台上。
  • 10:01 - 10:02
    FBI 这样做了,
  • 10:02 - 10:06
    他们找到了金州杀手的第三代表亲。
  • 10:06 - 10:08
    他们构建了一棵巨大的家谱树,
  • 10:08 - 10:10
    扫描树上的不同分支,
  • 10:10 - 10:13
    直到他们找到完美匹配
  • 10:13 - 10:16
    他们所了解的金州杀手信息的人。
  • 10:16 - 10:19
    他们从这人身上取得 DNA 并发现
  • 10:19 - 10:21
    跟他们手上的 DNA 一致。
  • 10:21 - 10:24
    过了这么些年,他们终于逮捕了他,
  • 10:24 - 10:25
    并绳之与法。
  • 10:26 - 10:29
    自那之后,基因谱系学家开始
  • 10:29 - 10:32
    跟美国当地执法机构合作,
  • 10:32 - 10:35
    使用这种技术来抓捕罪犯。
  • 10:36 - 10:38
    仅仅在过去的 6 个月,
  • 10:38 - 10:43
    他们使用这个技术就破获了
    超过 20 个铁证悬案。
  • 10:44 - 10:49
    幸好,我们有这群人,
    像伯尼叔叔和他的家谱学同行,
  • 10:49 - 10:52
    他们不只是业余爱好者。
  • 10:53 - 10:59
    他们是满怀热情的公民科学家,
    想要揭开我们所有人身份的秘密。
  • 10:59 - 11:04
    他们知道,过去是通向未来的钥匙。
  • 11:04 - 11:05
    谢谢大家。
  • 11:05 - 11:09
    (鼓掌)
Title:
我们如何建立世界上最大的家谱树
Speaker:
雅尼夫‧埃利希
Description:

计算遗传学家亚尼夫·埃尔利希 (Yaniv Erlich) 帮助建立了世界上最大的家谱——包括1300 万人,可以追溯到 500 多年前。他分享了一些有趣的研究模式——关于我们的爱情生活、我们的健康,甚至几十年前的刑事案件——并展示了众包家谱数据库如何不仅能揭示过去,还能揭示未来。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
11:45

Chinese, Simplified subtitles

Revisions