WEBVTT 00:00:00.817 --> 00:00:04.269 사람들은 다양한 이유로 인터넷을 사용합니다. 00:00:05.765 --> 00:00:09.569 알고 보니 가장 인기 있는 웹사이트 중 하나는 00:00:09.593 --> 00:00:12.465 대개 사람들이 개인적으로 소비하는 어떤 것이었습니다. 00:00:13.639 --> 00:00:16.149 그것은 호기심과 00:00:16.173 --> 00:00:19.969 무의미한 수준의 자기 방종을 포함하며 00:00:19.993 --> 00:00:24.603 다른 사람들의 생식 활동을 기록하는 데 중점을 둡니다. NOTE Paragraph 00:00:24.610 --> 00:00:25.642 (웃음) 00:00:25.666 --> 00:00:27.916 당연히 제가 얘기하는 건 가계도인데요. NOTE Paragraph 00:00:27.940 --> 00:00:29.154 (웃음) 00:00:29.178 --> 00:00:30.880 가족사의 연구 말입니다. NOTE Paragraph 00:00:31.353 --> 00:00:33.390 가족사를 자세히 설명하자면, 00:00:33.414 --> 00:00:37.357 모든 가족 중에는 족보에 집착하는 사람이 있죠. 00:00:37.381 --> 00:00:39.094 그를 버니 삼촌이라고 합시다. 00:00:39.118 --> 00:00:44.520 추수감사절 만찬에서 당신은 결코 버니 삼촌 옆에는 앉지 않을 겁니다. 00:00:44.547 --> 00:00:47.361 그는 어떤 고대 친척들에 관한 이상한 정보로 00:00:47.385 --> 00:00:49.351 당신을 지루하게 만들 거니까요. 00:00:50.462 --> 00:00:51.724 하지만 당신도 알다시피 00:00:51.748 --> 00:00:54.620 모든 것에는 과학적인 면이 있으며 00:00:54.644 --> 00:00:57.622 우리는 버니 삼촌의 이야기가 생명 의학 연구에 00:00:57.646 --> 00:01:00.814 엄청난 잠재력을 가졌다는 것을 알게 되었습니다. NOTE Paragraph 00:01:01.306 --> 00:01:04.020 우리는 버니 삼촌과 동료 계보학자들에게 00:01:04.044 --> 00:01:08.712 지니닷컴이라는 계보학 사이트를 통해 그들의 가계도를 기록하도록 했습니다. 00:01:09.198 --> 00:01:11.326 사용자들이 가계도를 웹사이트에 올리면, 00:01:11.350 --> 00:01:13.040 그 사이트는 친척을 찾아보고 00:01:13.064 --> 00:01:15.139 기존의 것과 일치하는 것을 발견하면 00:01:15.163 --> 00:01:18.773 새로운 것을 기존 버전과 합칩니다. 00:01:19.768 --> 00:01:22.718 그러면 각 계보학자의 개인적인 수준을 넘는 00:01:22.742 --> 00:01:26.221 더 큰 가계도가 만들어지게 됩니다. 00:01:26.808 --> 00:01:30.937 이제 이 과정을 반복해서 전 세계의 00:01:30.961 --> 00:01:32.778 수백만 명의 사람들과 함께 00:01:32.802 --> 00:01:38.334 모든 인류의 가계도 구조를 크라우드 소싱할 수 있습니다. NOTE Paragraph 00:01:39.292 --> 00:01:40.876 이 웹사이트를 사용해서 00:01:40.900 --> 00:01:45.713 1억 2천 5백만 명의 사람들을 00:01:45.737 --> 00:01:48.258 하나의 가계도로 연결할 수 있었습니다. 00:01:48.967 --> 00:01:51.755 여기 스크린에 그 가계도를 그릴 순 없습니다. 00:01:51.779 --> 00:01:53.944 이 가계도에 있는 사람들의 수보다 00:01:53.968 --> 00:01:56.481 픽셀 수가 적기 때문이죠. 00:01:56.505 --> 00:02:01.515 하지만 여기 6000명의 하위 집합의 예가 있습니다. 00:02:02.159 --> 00:02:04.521 각 녹색 점은 한 사람을 나타냅니다. 00:02:05.060 --> 00:02:07.909 빨간 점들은 결혼을 나타내고요. 00:02:07.933 --> 00:02:10.191 그리고 연결선들은 부모를 나타냅니다. 00:02:10.557 --> 00:02:12.929 이 가계도 중앙에는 조상들이 보이죠. 00:02:12.953 --> 00:02:15.557 그리고 주변부로 가면 그 자손들을 볼 수 있습니다. 00:02:15.581 --> 00:02:18.683 이 가계도에는 약 7세대가 있네요. NOTE Paragraph 00:02:19.692 --> 00:02:22.926 개인의 숫자를 7만 명까지 늘렸을 때는 00:02:22.950 --> 00:02:24.778 이렇게 되겠죠. 00:02:24.802 --> 00:02:29.132 우리가 가진 모든 데이터에 비하면 여전히 아주 작은 부분집합입니다. 00:02:29.629 --> 00:02:34.442 그럼에도 불구하고, 이미 많은 먼 친척들로 구성된 00:02:34.466 --> 00:02:37.121 거대한 가계도가 형성되는 것을 볼 수 있습니다. NOTE Paragraph 00:02:37.610 --> 00:02:40.744 많은 계보학자들의 노고 덕분에 00:02:40.768 --> 00:02:43.871 우리는 수백 년 전 과거로 돌아갈 수 있습니다. 00:02:44.418 --> 00:02:47.859 예를 들자면, 여기 알렉산더 해밀턴이 있습니다. 00:02:47.883 --> 00:02:50.358 그는 1755년에 태어났죠. 00:02:50.872 --> 00:02:54.636 알렉산더는 미국의 초대 재무 장관이었지만 00:02:54.660 --> 00:02:58.491 대부분 알려진 건 오늘날 브로드웨이 뮤지컬의 인기 덕택이죠. 00:02:59.137 --> 00:03:04.059 알렉산더가 연예 산업에 깊은 연줄이 있다는 걸 알게 됐습니다. 00:03:04.083 --> 00:03:06.194 사실, 그는 친척 관계입니다. 00:03:06.781 --> 00:03:08.001 바로 케빈 베이컨이랑요! NOTE Paragraph 00:03:08.025 --> 00:03:10.057 (웃음) NOTE Paragraph 00:03:10.081 --> 00:03:12.687 그들 모두 스코틀랜드 출신인 한 여인의 후손입니다. 00:03:12.711 --> 00:03:15.025 그녀는 13세기 사람이죠. 00:03:15.049 --> 00:03:18.151 따라서 알렉산더 해밀턴와 케빈 베이컨은 00:03:18.175 --> 00:03:21.363 35대가 차이 나는 친척이라고 할 수 있죠. NOTE Paragraph 00:03:21.387 --> 00:03:22.828 (웃음) NOTE Paragraph 00:03:22.852 --> 00:03:26.082 이처럼 우리 가계도는 수백만 개의 이야기를 가지고 있습니다. NOTE Paragraph 00:03:28.113 --> 00:03:33.003 저희는 데이터의 우수함을 입증하기 위해 상당한 노력을 기울였습니다. 00:03:33.027 --> 00:03:38.418 DNA를 이용해서 데이터에 있는 어머니와 아이들의 관계 중 0.3%가 00:03:38.442 --> 00:03:39.692 잘못됐다는 것을 발견했습니다. 00:03:39.716 --> 00:03:43.307 이것은 제2차 세계대전 이전 미국의 입양률과 일치할 겁니다. NOTE Paragraph 00:03:44.847 --> 00:03:46.632 아버지의 경우에는 00:03:46.656 --> 00:03:48.617 더 좋지 않네요. 00:03:50.149 --> 00:03:55.749 데이터 중 아버지와 아이들의 관계는 1.9%의 비율로 잘못되었습니다. 00:03:55.773 --> 00:03:58.136 여기 몇몇 분들이 웃고 계신 게 보이네요. 00:03:58.160 --> 00:03:59.877 여러분들이 생각하는 것처럼 00:03:59.901 --> 00:04:01.690 그곳엔 많은 우유배달원들이 있었죠. 00:04:01.714 --> 00:04:02.778 (웃음) 00:04:02.802 --> 00:04:06.791 하지만 이러한 부계 관계의 1.9% 오차율이 00:04:06.815 --> 00:04:08.584 우리 자료에 국한된 것은 아닙니다. 00:04:08.608 --> 00:04:11.677 임상 등급의 가계도를 사용했었던 이전 연구 자료도 00:04:11.701 --> 00:04:13.722 비슷한 오차율이 발견됐습니다. 00:04:14.254 --> 00:04:16.779 따라서 데이터의 품질은 우수한 것이고, 00:04:16.803 --> 00:04:18.936 그게 놀라운 일은 아닙니다. 00:04:18.960 --> 00:04:22.736 우리 계보학자들은 가족사를 정확하게 기록하는 데 00:04:22.760 --> 00:04:26.428 깊은 관심과 기득권을 가지고 있습니다. NOTE Paragraph 00:04:28.594 --> 00:04:33.185 우리는 이 데이터를 활용해 인류의 양적 정보를 배울 수 있습니다. 00:04:33.209 --> 00:04:35.805 예를 들면 인구통계학에 관한 문제 같은 거죠. 00:04:35.829 --> 00:04:39.686 여기 세계지도에 우리 모두의 프로필이 있습니다. 00:04:40.250 --> 00:04:44.731 각각의 픽셀은 특정 시점에 살았던 사람입니다. 00:04:44.755 --> 00:04:46.435 이 데이터는 아주 방대하기때문에, 00:04:46.459 --> 00:04:49.240 여러분은 많은 나라들, 특히 서구 세계의 00:04:49.264 --> 00:04:51.363 경계를 볼 수 있을 겁니다. 00:04:51.387 --> 00:04:54.935 이 동영상에서는 여러분들에게 보여드린 지도를 계층화했습니다. 00:04:54.959 --> 00:05:00.031 1400년부터 1900년까지 개인의 출생연도를 기준으로요. 00:05:00.055 --> 00:05:02.821 그리고 잘 알려진 이주 사건들과 그걸 비교했어요. 00:05:03.482 --> 00:05:06.647 이 동영상은 데이터의 가장 깊은 혈통이 거슬러 올라가보면 00:05:06.671 --> 00:05:08.298 영국까지 간다는 걸 보여줍니다. 00:05:08.322 --> 00:05:10.130 영국의 기록은 잘 유지되고 있었죠. 00:05:10.154 --> 00:05:13.436 그들은 서구 식민주의의 루트를 따라 퍼져나갔습니다. 00:05:13.460 --> 00:05:14.782 이걸 한 번 보시죠. 00:05:15.143 --> 00:05:16.752 (음악) 00:05:16.776 --> 00:05:19.117 [출생연도] 00:05:19.705 --> 00:05:21.541 [1492 - 콜럼버스 대양 항해] 00:05:23.661 --> 00:05:25.861 [1620 - 메이플라워호 매사추세츠 상륙] 00:05:26.726 --> 00:05:28.861 [1652 - 네덜란드인 남아프리카 정착] 00:05:32.321 --> 00:05:34.451 [1788 - 대영제국 호주로 유배 시작] 00:05:34.451 --> 00:05:36.988 [1836 - 최초 이민자들 오리건 산길 이용] 00:05:38.149 --> 00:05:41.332 [모든 활동] NOTE Paragraph 00:05:43.851 --> 00:05:45.394 저는 이 영화를 좋아합니다. NOTE Paragraph 00:05:45.418 --> 00:05:50.511 이 이주 사건들이 가족의 맥락을 말해주고 있기 때문에 00:05:50.535 --> 00:05:52.718 우리는 이런 질문을 할 수 있습니다. 00:05:52.742 --> 00:05:59.052 남편과 아내의 출생지 사이의 일반적인 거리는 얼마입니까? 00:05:59.072 --> 00:06:02.749 이 거리는 인구통계학에서 중요한 역할을 합니다. 00:06:02.773 --> 00:06:06.454 왜냐하면 사람들이 가족을 이루기 위해 이주하는 패턴이 00:06:06.478 --> 00:06:10.191 유전자가 지리적으로 어떻게 확산되는지 결정하기 때문이죠. 00:06:10.706 --> 00:06:13.034 우리는 데이터를 사용하여 이 거리를 분석했고 00:06:13.058 --> 00:06:16.578 옛날 사람들의 경우에는 분석하기 쉬웠다는 걸 알게 됐습니다. 00:06:16.626 --> 00:06:19.220 사람들은 근처 마을의 누군가와 결혼했습니다. 00:06:19.958 --> 00:06:23.663 하지만 산업혁명은 우리의 애정생활을 정말 복잡하게 만들었습니다. 00:06:23.687 --> 00:06:28.247 그리고 오늘날엔 저렴한 항공편과 온라인 소셜미디어와 함께 00:06:28.271 --> 00:06:33.099 사람들은 출생지에서 100km 이상 떨어진 곳으로 이동하죠. 00:06:33.123 --> 00:06:34.627 소울메이트를 찾기 위해서요. NOTE Paragraph 00:06:36.524 --> 00:06:37.711 여기서 나오는 질문이, 00:06:37.735 --> 00:06:42.231 좋아요. 그런데 가족을 이루기 위해 누가 이곳저곳 이동하는 00:06:42.255 --> 00:06:43.524 힘든 일을 하죠? 00:06:43.548 --> 00:06:47.275 남성들인가요, 여성들인가요? 00:06:47.752 --> 00:06:49.907 답을 찾기 위해 우리 데이터를 사용했죠. 00:06:49.931 --> 00:06:52.525 그리고 적어도 지난 300년 동안 00:06:52.549 --> 00:06:56.432 여성들이 이 힘든 일을 했다는 것을 발견했죠. 00:06:56.456 --> 00:06:59.452 가족을 이루기 위해 이곳저곳 옮겨가는 일이요. 00:06:59.476 --> 00:07:02.577 이 결과는 통계적으로 중요합니다. 00:07:02.601 --> 00:07:06.072 남자들이 게으르다는 것을 과학적 사실로 받아들일 수 있으니까요. NOTE Paragraph 00:07:06.096 --> 00:07:09.252 (웃음) NOTE Paragraph 00:07:09.276 --> 00:07:11.812 우리는 인구통계학에 관한 질문으로부터 벗어나 00:07:11.836 --> 00:07:14.749 인간의 건강에 대해 질문할 수 있습니다. 00:07:14.773 --> 00:07:16.260 예를 들면, 우리는 00:07:16.284 --> 00:07:21.247 유전자 변이가 개인 간 수명 차이를 어느 정도까지 설명할 수 있는지 00:07:21.271 --> 00:07:22.465 물어볼 수 있습니다. 00:07:22.988 --> 00:07:28.778 이전 연구들은 이 문제를 풀기 위해 쌍둥이의 장수의 상관관계를 분석했습니다. 00:07:29.411 --> 00:07:32.078 그들은 유전자 변이가 개인 간 수명 차이의 00:07:32.102 --> 00:07:36.142 약 4분의 1을 차지한다고 추정했습니다. 00:07:36.688 --> 00:07:39.286 하지만 쌍둥이는 많은 이유로 상관관계가 있겠죠. 00:07:39.310 --> 00:07:41.614 다양한 환경적 요인이나 00:07:41.638 --> 00:07:43.260 공동 가정을 포함해서요. 00:07:44.411 --> 00:07:48.164 큰 가계도는 가까운 친척 모두를 분석할 수 있는 기회가 됩니다. 00:07:48.188 --> 00:07:49.395 쌍둥이와 뿐만 아니라, 00:07:49.419 --> 00:07:52.336 심지어 10촌 같은 먼 친척까지요. 00:07:52.749 --> 00:07:55.438 이런 식으로 우리는 강력한 모델을 구축할 수 있죠. 00:07:55.462 --> 00:08:00.760 그 모델은 환경적 요인으로부터 유전자 변이의 영향을 구별할 수 있습니다. 00:08:01.379 --> 00:08:04.278 우리는 데이터를 사용하여 이 분석을 수행했고 00:08:04.302 --> 00:08:10.093 유전적 변이가 개인 간 수명 차이 중 약 15%만을 00:08:10.117 --> 00:08:12.923 설명해 준다는 것을 발견했습니다. 00:08:14.760 --> 00:08:17.516 그건 평균적으로 5년입니다. 00:08:18.316 --> 00:08:23.024 따라서 유전자는 수명에 있어 우리가 생각했던 것보다 덜 중요합니다. 00:08:23.675 --> 00:08:25.811 그리고 그건 좋은 소식입니다. 00:08:26.438 --> 00:08:29.731 우리의 행동이 더 중요할 수 있음을 의미하기 때문이죠. 00:08:30.533 --> 00:08:34.807 예를 들어 흡연이 기대수명의 10년을 결정한다면 00:08:34.831 --> 00:08:37.477 이건 유전자가 결정하는 것보다 두 배나 많습니다. NOTE Paragraph 00:08:38.236 --> 00:08:40.525 심지어 더 놀라운 결과가 있습니다. 00:08:40.549 --> 00:08:42.041 우리가 가계도를 떠나서 00:08:42.065 --> 00:08:46.797 계보학자들에게 DNA 정보를 문서화하고 크라우드 소싱하게 했을 때 00:08:46.821 --> 00:08:48.845 그 결과는 놀라웠습니다. 00:08:49.255 --> 00:08:53.170 상상하기 어렵겠지만 버니 삼촌과 그의 친구들은 00:08:53.194 --> 00:08:54.864 DNA 법의학을 만들 수 있어요. NOTE Paragraph 00:08:55.864 --> 00:08:59.423 그건 심지어 FBI의 것보다 낫죠. 00:09:00.862 --> 00:09:03.266 큰 가계도에 DNA를 넣으면, 00:09:03.290 --> 00:09:05.431 효과적인 불빛을 만들어 00:09:05.431 --> 00:09:08.065 수백 명의 먼 친척들을 표시할 수 있게 되죠. 00:09:08.089 --> 00:09:11.579 그들은 모두 특정 DNA로를 타고난 한 사람과 연결되어 있습니다. 00:09:12.505 --> 00:09:15.418 대형 가계도에 여러 개의 비콘을 배치함으로써 00:09:15.442 --> 00:09:19.162 여러분들은 알려지지 않은 사람의 DNA를 삼각측량할 수 있습니다. 00:09:19.186 --> 00:09:23.124 GPA 시스템이 위치를 찾기 위해 여러 개의 위성을 사용하는 방식과 00:09:23.148 --> 00:09:24.472 같은 방식이죠. NOTE Paragraph 00:09:25.226 --> 00:09:28.850 이 기술의 가장 큰 예는 00:09:28.874 --> 00:09:31.549 골든스테이트 킬러를 잡은 일입니다. 00:09:32.612 --> 00:09:37.140 그는 미국 역사상 가장 악명 높은 범죄자 중 한 명이죠. 00:09:37.164 --> 00:09:43.056 FBI는 40년 넘게 이 사람을 찾고 있었습니다. 00:09:43.588 --> 00:09:45.423 FBI는 그의 DNA를 가지고 있었지만 00:09:45.447 --> 00:09:48.797 그는 어떤 경찰 데이터베이스에도 나타나지 않았죠. 00:09:49.447 --> 00:09:54.159 약 1년 전, FBI는 한 유전 계보학자와 상담했고 00:09:54.183 --> 00:09:58.133 그녀는 FBI에게 그의 DNA를 계보학회에 제출하라고 했습니다. 00:09:58.157 --> 00:10:00.555 그걸로 먼 친척을 찾을 수 있으니까요. 00:10:01.117 --> 00:10:02.273 그들은 그렇게 했고 00:10:02.297 --> 00:10:05.989 골든스테이트 킬러의 8촌을 찾았습니다. 00:10:06.013 --> 00:10:08.357 그들은 큰 가계도를 만들었고 00:10:08.381 --> 00:10:10.483 그 가계도의 다른 가지들을 훑어봤습니다. 00:10:10.507 --> 00:10:13.072 골든스테이트 킬러에 대해 알고 있는 것과 00:10:13.096 --> 00:10:15.677 정확히 일치하는 프로필을 찾을 때까지요. 00:10:15.701 --> 00:10:19.293 이 사람으로부터 얻은 DNA가 그들이 가지고 있는 DNA와 00:10:19.317 --> 00:10:21.342 정확히 일치하는 것을 발견했습니다. 00:10:21.366 --> 00:10:23.716 그는 체포됐고 법의 심판을 받게 됐습니다. 00:10:23.740 --> 00:10:25.164 이 모든 세월이 지난 후에요. 00:10:26.172 --> 00:10:29.413 그 이후로 유전 계보학자들은 미국 지방 법 집행기관과 00:10:29.437 --> 00:10:32.105 함께 일하기 시작했습니다. 00:10:32.129 --> 00:10:35.491 범인을 잡는데 이 기술을 사용하기 위해서죠. 00:10:35.521 --> 00:10:38.202 그리고 지난 6개월 동안만 해도 00:10:38.226 --> 00:10:42.522 이 기술로 20개 넘는 미제 사건들을 해결할 수 있었습니다. NOTE Paragraph 00:10:44.203 --> 00:10:48.839 다행히도 우리에게는 버니 삼촌과 동료 계보학자와 같은 사람들이 있죠. 00:10:49.045 --> 00:10:52.039 그들은 이기적인 취미를 가진 아마추어가 아닙니다. 00:10:52.602 --> 00:10:59.021 그들은 우리가 누구인지 알려주려는 깊은 열정을 가진 시민과학자이며 00:10:59.065 --> 00:11:03.523 과거가 미래의 열쇠를 쥐고 있다는 것을 압니다. 00:11:04.066 --> 00:11:05.306 대단히 감사합니다. NOTE Paragraph 00:11:05.310 --> 00:11:06.130 (박수)