1 00:00:00,817 --> 00:00:04,269 사람들은 다양한 이유로 인터넷을 사용합니다. 2 00:00:05,765 --> 00:00:09,569 알고 보니 가장 인기 있는 웹사이트 중 하나는 3 00:00:09,593 --> 00:00:12,465 대개 사람들이 개인적으로 소비하는 어떤 것이었습니다. 4 00:00:13,639 --> 00:00:16,149 그것은 호기심과 5 00:00:16,173 --> 00:00:19,969 무의미한 수준의 자기 방종을 포함하며 6 00:00:19,993 --> 00:00:24,603 다른 사람들의 생식 활동을 기록하는 데 중점을 둡니다. 7 00:00:24,610 --> 00:00:25,642 (웃음) 8 00:00:25,666 --> 00:00:27,916 당연히 제가 얘기하는 건 가계도인데요. 9 00:00:27,940 --> 00:00:29,154 (웃음) 10 00:00:29,178 --> 00:00:30,880 가족사의 연구 말입니다. 11 00:00:31,353 --> 00:00:33,390 가족사를 자세히 설명하자면, 12 00:00:33,414 --> 00:00:37,357 모든 가족 중에는 족보에 집착하는 사람이 있죠. 13 00:00:37,381 --> 00:00:39,094 그를 버니 삼촌이라고 합시다. 14 00:00:39,118 --> 00:00:44,520 추수감사절 만찬에서 당신은 결코 버니 삼촌 옆에는 앉지 않을 겁니다. 15 00:00:44,547 --> 00:00:47,361 그는 어떤 고대 친척들에 관한 이상한 정보로 16 00:00:47,385 --> 00:00:49,351 당신을 지루하게 만들 거니까요. 17 00:00:50,462 --> 00:00:51,724 하지만 당신도 알다시피 18 00:00:51,748 --> 00:00:54,620 모든 것에는 과학적인 면이 있으며 19 00:00:54,644 --> 00:00:57,622 우리는 버니 삼촌의 이야기가 생명 의학 연구에 20 00:00:57,646 --> 00:01:00,814 엄청난 잠재력을 가졌다는 것을 알게 되었습니다. 21 00:01:01,306 --> 00:01:04,020 우리는 버니 삼촌과 동료 계보학자들에게 22 00:01:04,044 --> 00:01:08,712 지니닷컴이라는 계보학 사이트를 통해 그들의 가계도를 기록하도록 했습니다. 23 00:01:09,198 --> 00:01:11,326 사용자들이 가계도를 웹사이트에 올리면, 24 00:01:11,350 --> 00:01:13,040 그 사이트는 친척을 찾아보고 25 00:01:13,064 --> 00:01:15,139 기존의 것과 일치하는 것을 발견하면 26 00:01:15,163 --> 00:01:18,773 새로운 것을 기존 버전과 합칩니다. 27 00:01:19,768 --> 00:01:22,718 그러면 각 계보학자의 개인적인 수준을 넘는 28 00:01:22,742 --> 00:01:26,221 더 큰 가계도가 만들어지게 됩니다. 29 00:01:26,808 --> 00:01:30,937 이제 이 과정을 반복해서 전 세계의 30 00:01:30,961 --> 00:01:32,778 수백만 명의 사람들과 함께 31 00:01:32,802 --> 00:01:38,334 모든 인류의 가계도 구조를 크라우드 소싱할 수 있습니다. 32 00:01:39,292 --> 00:01:40,876 이 웹사이트를 사용해서 33 00:01:40,900 --> 00:01:45,713 1억 2천 5백만 명의 사람들을 34 00:01:45,737 --> 00:01:48,258 하나의 가계도로 연결할 수 있었습니다. 35 00:01:48,967 --> 00:01:51,755 여기 스크린에 그 가계도를 그릴 순 없습니다. 36 00:01:51,779 --> 00:01:53,944 이 가계도에 있는 사람들의 수보다 37 00:01:53,968 --> 00:01:56,481 픽셀 수가 적기 때문이죠. 38 00:01:56,505 --> 00:02:01,515 하지만 여기 6000명의 하위 집합의 예가 있습니다. 39 00:02:02,159 --> 00:02:04,521 각 녹색 점은 한 사람을 나타냅니다. 40 00:02:05,060 --> 00:02:07,909 빨간 점들은 결혼을 나타내고요. 41 00:02:07,933 --> 00:02:10,191 그리고 연결선들은 부모를 나타냅니다. 42 00:02:10,557 --> 00:02:12,929 이 가계도 중앙에는 조상들이 보이죠. 43 00:02:12,953 --> 00:02:15,557 그리고 주변부로 가면 그 자손들을 볼 수 있습니다. 44 00:02:15,581 --> 00:02:18,683 이 가계도에는 약 7세대가 있네요. 45 00:02:19,692 --> 00:02:22,926 개인의 숫자를 7만 명까지 늘렸을 때는 46 00:02:22,950 --> 00:02:24,778 이렇게 되겠죠. 47 00:02:24,802 --> 00:02:29,132 우리가 가진 모든 데이터에 비하면 여전히 아주 작은 부분집합입니다. 48 00:02:29,629 --> 00:02:34,442 그럼에도 불구하고, 이미 많은 먼 친척들로 구성된 49 00:02:34,466 --> 00:02:37,121 거대한 가계도가 형성되는 것을 볼 수 있습니다. 50 00:02:37,610 --> 00:02:40,744 많은 계보학자들의 노고 덕분에 51 00:02:40,768 --> 00:02:43,871 우리는 수백 년 전 과거로 돌아갈 수 있습니다. 52 00:02:44,418 --> 00:02:47,859 예를 들자면, 여기 알렉산더 해밀턴이 있습니다. 53 00:02:47,883 --> 00:02:50,358 그는 1755년에 태어났죠. 54 00:02:50,872 --> 00:02:54,636 알렉산더는 미국의 초대 재무 장관이었지만 55 00:02:54,660 --> 00:02:58,491 대부분 알려진 건 오늘날 브로드웨이 뮤지컬의 인기 덕택이죠. 56 00:02:59,137 --> 00:03:04,059 알렉산더가 연예 산업에 깊은 연줄이 있다는 걸 알게 됐습니다. 57 00:03:04,083 --> 00:03:06,194 사실, 그는 친척 관계입니다. 58 00:03:06,781 --> 00:03:08,001 바로 케빈 베이컨이랑요! 59 00:03:08,025 --> 00:03:10,057 (웃음) 60 00:03:10,081 --> 00:03:12,687 그들 모두 스코틀랜드 출신인 한 여인의 후손입니다. 61 00:03:12,711 --> 00:03:15,025 그녀는 13세기 사람이죠. 62 00:03:15,049 --> 00:03:18,151 따라서 알렉산더 해밀턴와 케빈 베이컨은 63 00:03:18,175 --> 00:03:21,363 35대가 차이 나는 친척이라고 할 수 있죠. 64 00:03:21,387 --> 00:03:22,828 (웃음) 65 00:03:22,852 --> 00:03:26,082 이처럼 우리 가계도는 수백만 개의 이야기를 가지고 있습니다. 66 00:03:28,113 --> 00:03:33,003 저희는 데이터의 우수함을 입증하기 위해 상당한 노력을 기울였습니다. 67 00:03:33,027 --> 00:03:38,418 DNA를 이용해서 데이터에 있는 어머니와 아이들의 관계 중 0.3%가 68 00:03:38,442 --> 00:03:39,692 잘못됐다는 것을 발견했습니다. 69 00:03:39,716 --> 00:03:43,307 이것은 제2차 세계대전 이전 미국의 입양률과 일치할 겁니다. 70 00:03:44,847 --> 00:03:46,632 아버지의 경우에는 71 00:03:46,656 --> 00:03:48,617 더 좋지 않네요. 72 00:03:50,149 --> 00:03:55,749 데이터 중 아버지와 아이들의 관계는 1.9%의 비율로 잘못되었습니다. 73 00:03:55,773 --> 00:03:58,136 여기 몇몇 분들이 웃고 계신 게 보이네요. 74 00:03:58,160 --> 00:03:59,877 여러분들이 생각하는 것처럼 75 00:03:59,901 --> 00:04:01,690 그곳엔 많은 우유배달원들이 있었죠. 76 00:04:01,714 --> 00:04:02,778 (웃음) 77 00:04:02,802 --> 00:04:06,791 하지만 이러한 부계 관계의 1.9% 오차율이 78 00:04:06,815 --> 00:04:08,584 우리 자료에 국한된 것은 아닙니다. 79 00:04:08,608 --> 00:04:11,677 임상 등급의 가계도를 사용했었던 이전 연구 자료도 80 00:04:11,701 --> 00:04:13,722 비슷한 오차율이 발견됐습니다. 81 00:04:14,254 --> 00:04:16,779 따라서 데이터의 품질은 우수한 것이고, 82 00:04:16,803 --> 00:04:18,936 그게 놀라운 일은 아닙니다. 83 00:04:18,960 --> 00:04:22,736 우리 계보학자들은 가족사를 정확하게 기록하는 데 84 00:04:22,760 --> 00:04:26,428 깊은 관심과 기득권을 가지고 있습니다. 85 00:04:28,594 --> 00:04:33,185 우리는 이 데이터를 활용해 인류의 양적 정보를 배울 수 있습니다. 86 00:04:33,209 --> 00:04:35,805 예를 들면 인구통계학에 관한 문제 같은 거죠. 87 00:04:35,829 --> 00:04:39,686 여기 세계지도에 우리 모두의 프로필이 있습니다. 88 00:04:40,250 --> 00:04:44,731 각각의 픽셀은 특정 시점에 살았던 사람입니다. 89 00:04:44,755 --> 00:04:46,435 이 데이터는 아주 방대하기때문에, 90 00:04:46,459 --> 00:04:49,240 여러분은 많은 나라들, 특히 서구 세계의 91 00:04:49,264 --> 00:04:51,363 경계를 볼 수 있을 겁니다. 92 00:04:51,387 --> 00:04:54,935 이 동영상에서는 여러분들에게 보여드린 지도를 계층화했습니다. 93 00:04:54,959 --> 00:05:00,031 1400년부터 1900년까지 개인의 출생연도를 기준으로요. 94 00:05:00,055 --> 00:05:02,821 그리고 잘 알려진 이주 사건들과 그걸 비교했어요. 95 00:05:03,482 --> 00:05:06,647 이 동영상은 데이터의 가장 깊은 혈통이 거슬러 올라가보면 96 00:05:06,671 --> 00:05:08,298 영국까지 간다는 걸 보여줍니다. 97 00:05:08,322 --> 00:05:10,130 영국의 기록은 잘 유지되고 있었죠. 98 00:05:10,154 --> 00:05:13,436 그들은 서구 식민주의의 루트를 따라 퍼져나갔습니다. 99 00:05:13,460 --> 00:05:14,782 이걸 한 번 보시죠. 100 00:05:15,143 --> 00:05:16,752 (음악) 101 00:05:16,776 --> 00:05:19,117 [출생연도] 102 00:05:19,705 --> 00:05:21,541 [1492 - 콜럼버스 대양 항해] 103 00:05:23,661 --> 00:05:25,861 [1620 - 메이플라워호 매사추세츠 상륙] 104 00:05:26,726 --> 00:05:28,861 [1652 - 네덜란드인 남아프리카 정착] 105 00:05:32,321 --> 00:05:34,451 [1788 - 대영제국 호주로 유배 시작] 106 00:05:34,451 --> 00:05:36,988 [1836 - 최초 이민자들 오리건 산길 이용] 107 00:05:38,149 --> 00:05:41,332 [모든 활동] 108 00:05:43,851 --> 00:05:45,394 저는 이 영화를 좋아합니다. 109 00:05:45,418 --> 00:05:50,511 이 이주 사건들이 가족의 맥락을 말해주고 있기 때문에 110 00:05:50,535 --> 00:05:52,718 우리는 이런 질문을 할 수 있습니다. 111 00:05:52,742 --> 00:05:59,052 남편과 아내의 출생지 사이의 일반적인 거리는 얼마입니까? 112 00:05:59,072 --> 00:06:02,749 이 거리는 인구통계학에서 중요한 역할을 합니다. 113 00:06:02,773 --> 00:06:06,454 왜냐하면 사람들이 가족을 이루기 위해 이주하는 패턴이 114 00:06:06,478 --> 00:06:10,191 유전자가 지리적으로 어떻게 확산되는지 결정하기 때문이죠. 115 00:06:10,706 --> 00:06:13,034 우리는 데이터를 사용하여 이 거리를 분석했고 116 00:06:13,058 --> 00:06:16,578 옛날 사람들의 경우에는 분석하기 쉬웠다는 걸 알게 됐습니다. 117 00:06:16,626 --> 00:06:19,220 사람들은 근처 마을의 누군가와 결혼했습니다. 118 00:06:19,958 --> 00:06:23,663 하지만 산업혁명은 우리의 애정생활을 정말 복잡하게 만들었습니다. 119 00:06:23,687 --> 00:06:28,247 그리고 오늘날엔 저렴한 항공편과 온라인 소셜미디어와 함께 120 00:06:28,271 --> 00:06:33,099 사람들은 출생지에서 100km 이상 떨어진 곳으로 이동하죠. 121 00:06:33,123 --> 00:06:34,627 소울메이트를 찾기 위해서요. 122 00:06:36,524 --> 00:06:37,711 여기서 나오는 질문이, 123 00:06:37,735 --> 00:06:42,231 좋아요. 그런데 가족을 이루기 위해 누가 이곳저곳 이동하는 124 00:06:42,255 --> 00:06:43,524 힘든 일을 하죠? 125 00:06:43,548 --> 00:06:47,275 남성들인가요, 여성들인가요? 126 00:06:47,752 --> 00:06:49,907 답을 찾기 위해 우리 데이터를 사용했죠. 127 00:06:49,931 --> 00:06:52,525 그리고 적어도 지난 300년 동안 128 00:06:52,549 --> 00:06:56,432 여성들이 이 힘든 일을 했다는 것을 발견했죠. 129 00:06:56,456 --> 00:06:59,452 가족을 이루기 위해 이곳저곳 옮겨가는 일이요. 130 00:06:59,476 --> 00:07:02,577 이 결과는 통계적으로 중요합니다. 131 00:07:02,601 --> 00:07:06,072 남자들이 게으르다는 것을 과학적 사실로 받아들일 수 있으니까요. 132 00:07:06,096 --> 00:07:09,252 (웃음) 133 00:07:09,276 --> 00:07:11,812 우리는 인구통계학에 관한 질문으로부터 벗어나 134 00:07:11,836 --> 00:07:14,749 인간의 건강에 대해 질문할 수 있습니다. 135 00:07:14,773 --> 00:07:16,260 예를 들면, 우리는 136 00:07:16,284 --> 00:07:21,247 유전자 변이가 개인 간 수명 차이를 어느 정도까지 설명할 수 있는지 137 00:07:21,271 --> 00:07:22,465 물어볼 수 있습니다. 138 00:07:22,988 --> 00:07:28,778 이전 연구들은 이 문제를 풀기 위해 쌍둥이의 장수의 상관관계를 분석했습니다. 139 00:07:29,411 --> 00:07:32,078 그들은 유전자 변이가 개인 간 수명 차이의 140 00:07:32,102 --> 00:07:36,142 약 4분의 1을 차지한다고 추정했습니다. 141 00:07:36,688 --> 00:07:39,286 하지만 쌍둥이는 많은 이유로 상관관계가 있겠죠. 142 00:07:39,310 --> 00:07:41,614 다양한 환경적 요인이나 143 00:07:41,638 --> 00:07:43,260 공동 가정을 포함해서요. 144 00:07:44,411 --> 00:07:48,164 큰 가계도는 가까운 친척 모두를 분석할 수 있는 기회가 됩니다. 145 00:07:48,188 --> 00:07:49,395 쌍둥이와 뿐만 아니라, 146 00:07:49,419 --> 00:07:52,336 심지어 10촌 같은 먼 친척까지요. 147 00:07:52,749 --> 00:07:55,438 이런 식으로 우리는 강력한 모델을 구축할 수 있죠. 148 00:07:55,462 --> 00:08:00,760 그 모델은 환경적 요인으로부터 유전자 변이의 영향을 구별할 수 있습니다. 149 00:08:01,379 --> 00:08:04,278 우리는 데이터를 사용하여 이 분석을 수행했고 150 00:08:04,302 --> 00:08:10,093 유전적 변이가 개인 간 수명 차이 중 약 15%만을 151 00:08:10,117 --> 00:08:12,923 설명해 준다는 것을 발견했습니다. 152 00:08:14,760 --> 00:08:17,516 그건 평균적으로 5년입니다. 153 00:08:18,316 --> 00:08:23,024 따라서 유전자는 수명에 있어 우리가 생각했던 것보다 덜 중요합니다. 154 00:08:23,675 --> 00:08:25,811 그리고 그건 좋은 소식입니다. 155 00:08:26,438 --> 00:08:29,731 우리의 행동이 더 중요할 수 있음을 의미하기 때문이죠. 156 00:08:30,533 --> 00:08:34,807 예를 들어 흡연이 기대수명의 10년을 결정한다면 157 00:08:34,831 --> 00:08:37,477 이건 유전자가 결정하는 것보다 두 배나 많습니다. 158 00:08:38,236 --> 00:08:40,525 심지어 더 놀라운 결과가 있습니다. 159 00:08:40,549 --> 00:08:42,041 우리가 가계도를 떠나서 160 00:08:42,065 --> 00:08:46,797 계보학자들에게 DNA 정보를 문서화하고 크라우드 소싱하게 했을 때 161 00:08:46,821 --> 00:08:48,845 그 결과는 놀라웠습니다. 162 00:08:49,255 --> 00:08:53,170 상상하기 어렵겠지만 버니 삼촌과 그의 친구들은 163 00:08:53,194 --> 00:08:54,864 DNA 법의학을 만들 수 있어요. 164 00:08:55,864 --> 00:08:59,423 그건 심지어 FBI의 것보다 낫죠. 165 00:09:00,862 --> 00:09:03,266 큰 가계도에 DNA를 넣으면, 166 00:09:03,290 --> 00:09:05,431 효과적인 불빛을 만들어 167 00:09:05,431 --> 00:09:08,065 수백 명의 먼 친척들을 표시할 수 있게 되죠. 168 00:09:08,089 --> 00:09:11,579 그들은 모두 특정 DNA로를 타고난 한 사람과 연결되어 있습니다. 169 00:09:12,505 --> 00:09:15,418 대형 가계도에 여러 개의 비콘을 배치함으로써 170 00:09:15,442 --> 00:09:19,162 여러분들은 알려지지 않은 사람의 DNA를 삼각측량할 수 있습니다. 171 00:09:19,186 --> 00:09:23,124 GPA 시스템이 위치를 찾기 위해 여러 개의 위성을 사용하는 방식과 172 00:09:23,148 --> 00:09:24,472 같은 방식이죠. 173 00:09:25,226 --> 00:09:28,850 이 기술의 가장 큰 예는 174 00:09:28,874 --> 00:09:31,549 골든스테이트 킬러를 잡은 일입니다. 175 00:09:32,612 --> 00:09:37,140 그는 미국 역사상 가장 악명 높은 범죄자 중 한 명이죠. 176 00:09:37,164 --> 00:09:43,056 FBI는 40년 넘게 이 사람을 찾고 있었습니다. 177 00:09:43,588 --> 00:09:45,423 FBI는 그의 DNA를 가지고 있었지만 178 00:09:45,447 --> 00:09:48,797 그는 어떤 경찰 데이터베이스에도 나타나지 않았죠. 179 00:09:49,447 --> 00:09:54,159 약 1년 전, FBI는 한 유전 계보학자와 상담했고 180 00:09:54,183 --> 00:09:58,133 그녀는 FBI에게 그의 DNA를 계보학회에 제출하라고 했습니다. 181 00:09:58,157 --> 00:10:00,555 그걸로 먼 친척을 찾을 수 있으니까요. 182 00:10:01,117 --> 00:10:02,273 그들은 그렇게 했고 183 00:10:02,297 --> 00:10:05,989 골든스테이트 킬러의 8촌을 찾았습니다. 184 00:10:06,013 --> 00:10:08,357 그들은 큰 가계도를 만들었고 185 00:10:08,381 --> 00:10:10,483 그 가계도의 다른 가지들을 훑어봤습니다. 186 00:10:10,507 --> 00:10:13,072 골든스테이트 킬러에 대해 알고 있는 것과 187 00:10:13,096 --> 00:10:15,677 정확히 일치하는 프로필을 찾을 때까지요. 188 00:10:15,701 --> 00:10:19,293 이 사람으로부터 얻은 DNA가 그들이 가지고 있는 DNA와 189 00:10:19,317 --> 00:10:21,342 정확히 일치하는 것을 발견했습니다. 190 00:10:21,366 --> 00:10:23,716 그는 체포됐고 법의 심판을 받게 됐습니다. 191 00:10:23,740 --> 00:10:25,164 이 모든 세월이 지난 후에요. 192 00:10:26,172 --> 00:10:29,413 그 이후로 유전 계보학자들은 미국 지방 법 집행기관과 193 00:10:29,437 --> 00:10:32,105 함께 일하기 시작했습니다. 194 00:10:32,129 --> 00:10:35,491 범인을 잡는데 이 기술을 사용하기 위해서죠. 195 00:10:35,521 --> 00:10:38,202 그리고 지난 6개월 동안만 해도 196 00:10:38,226 --> 00:10:42,522 이 기술로 20개 넘는 미제 사건들을 해결할 수 있었습니다. 197 00:10:44,203 --> 00:10:48,839 다행히도 우리에게는 버니 삼촌과 동료 계보학자와 같은 사람들이 있죠. 198 00:10:49,045 --> 00:10:52,039 그들은 이기적인 취미를 가진 아마추어가 아닙니다. 199 00:10:52,602 --> 00:10:59,021 그들은 우리가 누구인지 알려주려는 깊은 열정을 가진 시민과학자이며 200 00:10:59,065 --> 00:11:03,523 과거가 미래의 열쇠를 쥐고 있다는 것을 압니다. 201 00:11:04,066 --> 00:11:05,306 대단히 감사합니다. 202 00:11:05,310 --> 00:11:06,130 (박수)