1 00:00:01,006 --> 00:00:06,156 역사적인 기록을 통해 고대 그리스인들이 어떤 옷을 입었고 2 00:00:06,180 --> 00:00:08,974 어떻게 살았고, 어떻게 싸웠는지 알죠. 3 00:00:09,004 --> 00:00:10,528 하지만 그들은 어떻게 생각했을 까요? 4 00:00:11,432 --> 00:00:15,872 한 가지 자연스런 생각은 인간 사고의 가장 심오한 면인 5 00:00:15,896 --> 00:00:17,768 상상하는 능력 6 00:00:17,792 --> 00:00:19,189 의식하는 것 7 00:00:19,213 --> 00:00:20,444 꿈 꾸는 능력이 8 00:00:20,468 --> 00:00:22,087 늘 동일했다고 합니다. 9 00:00:22,872 --> 00:00:24,371 다른 가능성도 있습니다. 10 00:00:24,395 --> 00:00:28,118 문화를 만든 사회적 변화가 인간 사고의 구조적 기둥도 11 00:00:28,142 --> 00:00:31,927 변화시켰을 수도 있다는거죠. 12 00:00:32,911 --> 00:00:35,435 이것에 대한 견해는 각자 다를 수 있습니다. 13 00:00:35,459 --> 00:00:38,176 사실 이건 오랫동안 이어져온 철학적 논쟁입니다. 14 00:00:38,644 --> 00:00:41,371 하지만 이 질문이 과학과 상통하기는 할까요? 15 00:00:42,834 --> 00:00:45,340 저는 이런 얘기를 하고 싶습니다. 16 00:00:45,364 --> 00:00:50,136 벽돌 몇 개로 그리스 도시 모습을 재구성하는 것과 17 00:00:50,160 --> 00:00:52,548 같은 방법으로 18 00:00:52,572 --> 00:00:56,698 어떤 문화의 문서들은 인간 사고의 고고학적 기록이자 19 00:00:56,722 --> 00:00:58,865 화석이라고요. 20 00:00:59,905 --> 00:01:01,079 사실 21 00:01:01,103 --> 00:01:03,309 인간 문화에 대한 가장 오래된 서적에 22 00:01:03,333 --> 00:01:06,877 몇 가지 심리학적 분석을 해봄으로써 23 00:01:06,901 --> 00:01:12,856 줄리안 제인스는 70년대에 매우 무모하고 급진적인 가설을 냈습니다. 24 00:01:12,880 --> 00:01:15,293 불과 3,000년 전만 해도 25 00:01:15,317 --> 00:01:20,205 사람들은 모두 정신분열증 환자였다는 겁니다. 26 00:01:21,753 --> 00:01:23,261 줄리안의 주장의 근거는 27 00:01:23,285 --> 00:01:26,586 이 고서들에 묘사된 첫 인류가 28 00:01:26,610 --> 00:01:28,514 다른 전통에서나 29 00:01:28,538 --> 00:01:31,554 다른 지역에서 신이나 뮤즈의 목소리로 30 00:01:31,578 --> 00:01:35,110 여겨졌던 목소리를 31 00:01:35,134 --> 00:01:39,464 듣고 복종하는 것처럼 항상 행동했다는 겁니다. 32 00:01:40,063 --> 00:01:42,832 오늘날 환각이라고 하는 거죠. 33 00:01:43,888 --> 00:01:46,514 그리고 시간이 흐르면서 34 00:01:46,538 --> 00:01:50,189 사람들은 자신이 창조자이자 내면의 소리의 주인이라는 걸 35 00:01:50,213 --> 00:01:52,728 인식하기 시작한겁니다. 36 00:01:53,316 --> 00:01:56,031 이걸 인식하면서 사람들은 자아 성찰을 할 수 있게 됩니다. 37 00:01:56,055 --> 00:01:58,538 자신의 생각에 대해 생각할 수 있는 능력이죠. 38 00:01:59,785 --> 00:02:03,182 그러니까 제인스의 이론이 주장하는 건 39 00:02:03,206 --> 00:02:06,372 적어도 오늘날 우리가 40 00:02:06,396 --> 00:02:09,936 존재의 주도권을 자신이 갖고 있다는 느낌이라고 여기는 의식에 한해서는 41 00:02:09,960 --> 00:02:12,697 의식은 최근에 일어난 문화적 발전이라는 겁니다. 42 00:02:13,456 --> 00:02:15,242 꽤 멋있는 이론입니다. 43 00:02:15,266 --> 00:02:16,699 하지만 명백히 보이는 문제도 있죠. 44 00:02:16,723 --> 00:02:20,715 몇 개의 매우 특수한 예시에 근거한다는 겁니다. 45 00:02:21,085 --> 00:02:22,848 그러니까 문제는 46 00:02:22,872 --> 00:02:27,623 인간 역사에서 3,000년 전에서부터 자아 성찰이 시작됐다는 이론이 47 00:02:27,647 --> 00:02:30,631 양적이고 객관적인 방법으로 검토될 수 있는가 입니다. 48 00:02:31,543 --> 00:02:35,106 이렇게 하기 힘든 이유는 뻔합니다. 49 00:02:35,130 --> 00:02:38,590 플라톤이 어느날 아침에 일어나서 이렇게 적은 건 아니잖아요. 50 00:02:38,614 --> 00:02:40,273 "안녕. 난 플라톤이야. 51 00:02:40,297 --> 00:02:43,186 오늘부터 난 완전한 자아 성찰을 할 수 있는 의식이 있어." 52 00:02:43,210 --> 00:02:45,503 (웃음) 53 00:02:45,527 --> 00:02:48,860 이게 사실은 문제의 본질을 보여줍니다. 54 00:02:49,467 --> 00:02:53,522 기록된 적 없는 관념의 출현을 찾아내야 합니다. 55 00:02:54,434 --> 00:02:58,744 문자를 통한 성찰은 우리가 분석하려는 서적에 56 00:02:58,768 --> 00:03:00,687 여러 번 나옵니다. 57 00:03:01,728 --> 00:03:05,815 이것에 대한 우리의 해결방법은 단어로 된 공간을 만드는 겁니다. 58 00:03:06,571 --> 00:03:09,858 이 커다란 공간에는 온갖 단어가 다 들어있는데 59 00:03:09,882 --> 00:03:12,684 어떤 두 단어 사이의 거리는 60 00:03:12,708 --> 00:03:15,591 그 둘이 얼마나 밀접한 관계를 갖는지 알려줍니다. 61 00:03:16,460 --> 00:03:17,365 예를 들어 62 00:03:17,365 --> 00:03:20,532 "개"와 "고양이"는 가까이 있어야겠지만 63 00:03:20,556 --> 00:03:24,387 "자몽"과 "로그"는 매우 멀리 떨어져 있어야겠죠. 64 00:03:24,809 --> 00:03:28,705 공간 안에 있는 어느 두 단어에나 해당되는 일입니다. 65 00:03:29,626 --> 00:03:32,967 단어 공간을 만드는 데는 여러 방법이 있습니다. 66 00:03:32,991 --> 00:03:34,634 하나는 전문가의 자문을 구하는 것입니다. 67 00:03:34,658 --> 00:03:36,554 사전으로 하는 것처럼요. 68 00:03:36,896 --> 00:03:38,324 다른 방법은 69 00:03:38,348 --> 00:03:42,063 두 단어가 연관이 있으면, 확률상으로보다 더 자주 70 00:03:42,087 --> 00:03:47,046 같은 문장이나, 같은 단락, 같은 문서에 71 00:03:47,051 --> 00:03:50,913 등장하는 경향이 있다는 단순한 추정을 따르는 것입니다. 72 00:03:52,231 --> 00:03:54,281 이 단순한 가설은 73 00:03:54,305 --> 00:03:55,611 이 단순한 방식은 74 00:03:55,635 --> 00:03:57,242 이게 굉장히 복잡하고 75 00:03:57,266 --> 00:03:58,655 고차원적인 공간이라는 사실과 76 00:03:58,679 --> 00:04:01,743 관련된 계산 요령 몇 가지와 함께 77 00:04:01,767 --> 00:04:03,432 굉장히 효과가 있습니다. 78 00:04:04,155 --> 00:04:06,957 이게 얼마나 효과있는지 조금 보여드릴게요. 79 00:04:06,981 --> 00:04:10,893 이 단어들을 익숙한 단어로 분석했을 때의 결과입니다. 80 00:04:11,607 --> 00:04:12,792 먼저 단어들이 자동적으로 81 00:04:12,816 --> 00:04:16,094 의미론적 집합으로 구성되는 걸 보실 수 있을 겁니다. 82 00:04:16,118 --> 00:04:17,949 과일이 있고, 신체부위가 있고 83 00:04:17,949 --> 00:04:20,784 컴퓨터 부품, 과학 용어 등등이요. 84 00:04:21,119 --> 00:04:25,341 이 알고리즘은 우리가 개념을 계층적으로 체계화한다는 것도 보여줍니다. 85 00:04:25,852 --> 00:04:27,003 예를 들어 86 00:04:27,027 --> 00:04:30,624 과학 용어가 두 개의 하위 범주로 나눠지는 걸 볼 수 있습니다. 87 00:04:30,648 --> 00:04:32,748 천문학 용어와 물리 용어로요. 88 00:04:33,338 --> 00:04:35,584 그리고 세세한 부분들이 있습니다. 89 00:04:35,608 --> 00:04:37,513 예를 들어, 천문학이라는 단어는 90 00:04:37,537 --> 00:04:39,352 저기 있는 게 이상해 보이지만 91 00:04:39,376 --> 00:04:41,424 사실은 있어야 할 곳에 있습니다. 92 00:04:41,448 --> 00:04:43,043 천문학의 본질인 93 00:04:43,067 --> 00:04:44,337 실제 과학과 94 00:04:44,361 --> 00:04:45,897 천문학이 나타내는 95 00:04:45,921 --> 00:04:47,413 천문학적 용어 사이에 있어요. 96 00:04:48,182 --> 00:04:50,073 더 얘기할 수도 있습니다. 97 00:04:50,097 --> 00:04:52,157 사실, 이걸 오랫동안 쳐다보면서 98 00:04:52,181 --> 00:04:54,039 임의의 궤적을 그려나가면 99 00:04:54,063 --> 00:04:57,229 시를 쓰는 것과 같다는 느낌을 받을 수 있을 겁니다. 100 00:04:58,018 --> 00:04:59,900 그 이유는, 공간 안에서 걷는 것이 101 00:04:59,924 --> 00:05:03,154 마음 속에서 걷는 것과 한편으로 유사하기 때문입니다. 102 00:05:04,027 --> 00:05:05,644 마지막 방법은 이 알고리즘인데 103 00:05:05,668 --> 00:05:09,708 어떤 단어들이 성찰의 이웃에 속하는지와 104 00:05:09,732 --> 00:05:13,628 우리의 직감이 무엇인지를 밝혀주는 것입니다. 105 00:05:13,652 --> 00:05:14,875 예를 들어 106 00:05:14,899 --> 00:05:18,878 자신, 죄책감, 이성, 감성같은 단어들은 107 00:05:18,902 --> 00:05:20,791 "성찰"과 매우 가깝습니다. 108 00:05:20,815 --> 00:05:21,740 하지만 다른 단어들은 109 00:05:21,740 --> 00:05:24,157 빨강, 축구, 양초, 바나나는 110 00:05:24,181 --> 00:05:25,633 매우 멀어요. 111 00:05:26,054 --> 00:05:28,816 공간을 세우고 나면 112 00:05:28,840 --> 00:05:31,666 이전에는 추상적이고 113 00:05:31,690 --> 00:05:34,023 모호해 보였던 114 00:05:34,047 --> 00:05:38,826 성찰이나 다른 관념들의 역사에 관한 질문이 115 00:05:38,850 --> 00:05:40,454 구체화됩니다. 116 00:05:40,478 --> 00:05:43,216 정량과학에 부합될 수 있습니다. 117 00:05:44,216 --> 00:05:46,978 우리가 해야하는 일은 책을 가지고 118 00:05:47,002 --> 00:05:48,383 디지털화 시켜서 119 00:05:48,407 --> 00:05:51,216 일련의 단어들을 궤적에 만들고 120 00:05:51,240 --> 00:05:53,209 공간에 투영시켜서 121 00:05:53,233 --> 00:05:56,987 이 궤적이 많은 시간동안 성찰이라는 개념에 근접하게 122 00:05:57,011 --> 00:06:00,003 선회하는지 묻는 것이 전부입니다. 123 00:06:00,760 --> 00:06:01,956 이걸 통해서 124 00:06:01,980 --> 00:06:04,092 우리에게 가장 잘 명문화되어있는 125 00:06:04,116 --> 00:06:06,037 고대 그리스 전통 속의 126 00:06:06,061 --> 00:06:08,663 성찰의 역사를 분석할 수 있습니다. 127 00:06:09,631 --> 00:06:11,886 그래서 우리는 모든 서적들을 가져다가 128 00:06:11,910 --> 00:06:14,194 시간에 따라 나열하고 129 00:06:14,218 --> 00:06:15,970 각각의 서적에서 단어를 가져다가 130 00:06:15,994 --> 00:06:17,955 공간에 투영시켜서 131 00:06:17,979 --> 00:06:21,011 각 단어가 성찰과 얼마나 가까운지 묻고 132 00:06:21,035 --> 00:06:22,265 그것으로 평균을 냈습니다. 133 00:06:22,590 --> 00:06:25,788 그리고 시간이 흐르면서 이 고서들이 점점 더 134 00:06:25,812 --> 00:06:30,864 성찰의 개념에 근접하게 다가가는지를 물었습니다. 135 00:06:30,866 --> 00:06:34,667 바로 이게 고대 그리스의 전통에서 일어나는 일입니다. 136 00:06:35,698 --> 00:06:38,825 호메로스의 전통의 가장 오래된 고서들에서 볼 수 있듯 137 00:06:38,849 --> 00:06:42,261 성찰에 가까워지는 책이 약간 증가합니다. 138 00:06:42,285 --> 00:06:44,491 하지만 서력 기원전 약 4세기 쯤에 139 00:06:44,515 --> 00:06:49,223 성찰에 더 가까워지는 고서의 양이 140 00:06:49,247 --> 00:06:51,747 거의 5배 가까이 141 00:06:51,771 --> 00:06:53,453 급격히 증가하기 시작합니다. 142 00:06:54,159 --> 00:06:56,583 이것의 좋은 점 중 하나는 143 00:06:56,607 --> 00:06:57,805 우리가 이제 144 00:06:57,829 --> 00:07:01,976 다른, 독립적인 관습에도 똑같이 해당되는지 물을 수 있다는 겁니다. 145 00:07:02,962 --> 00:07:06,138 그래서 유대교와 기독교의 공통적인 관습에 대해서도 146 00:07:06,162 --> 00:07:08,883 똑같은 분석을 하여 사실상 똑같은 패턴을 얻었습니다. 147 00:07:09,548 --> 00:07:14,183 똑같이, 구약성서의 가장 오래된 서적에서 약간의 증가를 볼 수 있고 148 00:07:14,207 --> 00:07:16,121 신약성서의 새 책에서 149 00:07:16,145 --> 00:07:17,984 더 급격히 증가합니다. 150 00:07:18,008 --> 00:07:20,040 그리고 성찰의 정점을 151 00:07:20,064 --> 00:07:22,191 "성 어거스틴의 참회록"에서 볼 수 있습니다. 152 00:07:22,215 --> 00:07:24,072 서력 기원전 4세기 쯤에요. 153 00:07:24,897 --> 00:07:26,841 이게 굉장히 중요한 이유는 154 00:07:26,865 --> 00:07:31,528 성 어거스틴이 학자들이나, 문헌학자, 사학자들에게 155 00:07:31,528 --> 00:07:34,714 성찰의 창설자 중 한 사람으로 인정받기 때문입니다. 156 00:07:35,060 --> 00:07:38,357 사실 일부는 성 어거스틴이 근대 심리학의 아버지라고 생각합니다. 157 00:07:39,012 --> 00:07:40,851 그래서 정량적이고 158 00:07:40,875 --> 00:07:43,717 객관적인 미덕을 지닌 159 00:07:43,741 --> 00:07:45,754 그리고 찰나에 계산이 가능해서 160 00:07:45,754 --> 00:07:49,504 매우 빠르기도 한 우리의 알고리즘은 161 00:07:49,504 --> 00:07:52,992 이 기나긴 역사를 가진 수사에 가장 중요한 결론들을 162 00:07:53,016 --> 00:07:55,238 잡아내 줄 수 있습니다. 163 00:07:56,317 --> 00:07:59,968 이게 사실 과학의 아름다운 이유 중의 하나라고 볼 수 있습니다. 164 00:07:59,992 --> 00:08:03,468 이 아이디어가 수많은 다른 영역들로 165 00:08:03,492 --> 00:08:06,063 번역되고 일반화될 수 있다는 것 말이죠. 166 00:08:06,769 --> 00:08:11,536 그래서 인간의 의식이 과거에 어땠는지 물었던 것과 같은 방식으로 167 00:08:11,560 --> 00:08:14,966 어쩌면 우리가 물을 수 있는 것 중 가장 어려운 질문을 물었습니다. 168 00:08:14,990 --> 00:08:19,127 이것이 우리의 정신의 미래에 대해 무언가를 말해줄 수 있는지를요. 169 00:08:19,550 --> 00:08:21,020 더 정확히 말하자면 170 00:08:21,044 --> 00:08:23,460 우리가 오늘날 쓰는 단어가 171 00:08:23,484 --> 00:08:28,681 며칠 뒤나, 몇 달 뒤, 혹은 몇 년 뒤에 우리의 정신 상태가 172 00:08:28,705 --> 00:08:30,826 어떨지를 알려줄 수 있을지 말입니다. 173 00:08:31,597 --> 00:08:34,617 많은 사람들이 병을 예방하기 위해 174 00:08:34,641 --> 00:08:37,737 심박수나 호흡 175 00:08:37,744 --> 00:08:39,411 유전 인자를 측정하는 센서를 176 00:08:39,435 --> 00:08:43,086 오늘날 착용하는 것처럼 177 00:08:43,110 --> 00:08:46,631 우리가 말하고, 트위터에 올리고, 메일로 보내고, 쓰는 단어들을 178 00:08:46,655 --> 00:08:49,338 관찰하고 분석하는 것이 179 00:08:49,362 --> 00:08:54,170 우리의 정신에 문제가 생길지를 미리 알려줄 수 있을지를 물을 수 있습니다. 180 00:08:55,087 --> 00:08:56,621 저에게 이 연구를 하는 데 있어 181 00:08:56,645 --> 00:08:59,646 형제와도 같았던 기예르모 체키와 함께 182 00:08:59,670 --> 00:09:01,225 우리는 이 작업에 착수했습니다. 183 00:09:02,228 --> 00:09:07,760 정신분열증에 걸릴 위험이 높은 34명의 젊은이들의 184 00:09:07,784 --> 00:09:10,585 녹음된 발화 내용을 분석했습니다. 185 00:09:11,434 --> 00:09:14,315 우리는 첫째날에 녹음된 말을 측정하고 186 00:09:14,339 --> 00:09:17,581 앞으로 3년 이내의 시간 동안 정신병에 걸릴지를 187 00:09:17,605 --> 00:09:20,101 그들이 한 말의 특징들로 188 00:09:20,125 --> 00:09:22,160 예측할 수 있는지 물었습니다. 189 00:09:23,427 --> 00:09:25,793 하지만 안타깝게도 190 00:09:25,817 --> 00:09:28,934 계속 실패했습니다. 191 00:09:29,793 --> 00:09:33,675 미래의 정신 구조를 예측하기엔 192 00:09:33,699 --> 00:09:36,492 의미론에 있는 정보가 충분하지 않았습니다. 193 00:09:36,516 --> 00:09:38,325 고대 문서로 했던 것처럼 194 00:09:38,349 --> 00:09:40,908 정신분열증 환자 집단과 195 00:09:40,908 --> 00:09:45,260 통제 집단을 구분짓기에는 충분했지만 196 00:09:45,284 --> 00:09:48,278 미래의 정신병 발달 가능성을 예측하기엔 부족했습니다. 197 00:09:49,164 --> 00:09:50,870 그런데 우리는 깨달았습니다. 198 00:09:50,894 --> 00:09:54,982 가장 중요한 것은 그들의 말의 내용이 아니라 199 00:09:55,006 --> 00:09:56,679 말하는 방법일지도 모른다고요. 200 00:09:57,679 --> 00:09:58,899 더 자세히 말하자면 201 00:09:58,923 --> 00:10:01,750 의미론적으로 어느 단어 집단에 근접하느냐가 아니라 202 00:10:01,774 --> 00:10:04,374 한 의미론적 집단에서 다른 집단으로 203 00:10:04,398 --> 00:10:06,699 얼마나 멀리, 그리고 빠르게 건너뛰느냐는 것이죠. 204 00:10:07,247 --> 00:10:08,978 그래서 우리는 의미론적 일관성이라고 명명한 205 00:10:09,002 --> 00:10:11,391 이 측정법을 고안해냈습니다. 206 00:10:11,415 --> 00:10:16,219 하나의 의미론적 범주 안에 있는 하나의 의미론적 주제의 지속성을 207 00:10:16,243 --> 00:10:17,772 측정하는 방법이죠. 208 00:10:19,294 --> 00:10:23,341 그리고 결과적으로 의미론적 일관성에 기반한 알고리즘은 209 00:10:23,365 --> 00:10:26,218 이 34명으로 이루어진 집단을 210 00:10:26,218 --> 00:10:32,168 누가 정신병에 걸리고 안 걸릴지 100%의 정확도로 예측할 수 있었습니다. 211 00:10:32,976 --> 00:10:35,913 이건 현존하는 그 어떤 임상 측정도 212 00:10:35,937 --> 00:10:40,545 근접하게조차 해낼 수 없었던 일입니다. 213 00:10:42,525 --> 00:10:46,104 저는 생생하게 기억납니다. 이 연구를 하는 동안 214 00:10:46,128 --> 00:10:48,445 저는 컴퓨터 앞에 앉아서 215 00:10:48,469 --> 00:10:51,104 제가 부에노스 아이레스에 있을 당시 216 00:10:51,128 --> 00:10:54,295 제 첫 제자였던, 그리고 연구 당시에는 뉴욕에 살고 있던 폴로가 쓴 217 00:10:54,319 --> 00:10:56,389 트윗을 잔뜩 읽었습니다. 218 00:10:56,413 --> 00:10:58,501 명시적으로 드러난 건 없었기에 219 00:10:58,525 --> 00:11:02,026 무엇인지 정확히 말은 못하지만 트윗에는 뭔가가 있었습니다. 220 00:11:02,050 --> 00:11:04,071 저는 뭔가 잘못되고 있다는 걸 221 00:11:04,095 --> 00:11:07,050 직감적으로 강하게 느꼈습니다. 222 00:11:08,347 --> 00:11:11,070 그래서 폴로에게 전화를 했는데 223 00:11:11,094 --> 00:11:13,013 그는 실제로 아픈 상태였습니다. 224 00:11:13,362 --> 00:11:15,299 그리고 이 단순한 사실을 통해서 225 00:11:15,323 --> 00:11:17,814 글 속의 의미를 찾아내서 226 00:11:17,838 --> 00:11:22,100 그의 감정을 느낄 수 있는 것이 간단하지만 매우 효과적으로 227 00:11:22,124 --> 00:11:24,743 도울 수 있는 방법임을 알 수 있었습니다. 228 00:11:25,987 --> 00:11:27,625 오늘 말씀드리는 것은 229 00:11:27,649 --> 00:11:30,157 우리 모두가 가지고 있고, 공유하는 직감을 230 00:11:30,181 --> 00:11:34,467 알고리즘으로 변환시키는 방법을 이해하는 데 231 00:11:34,491 --> 00:11:37,356 점점 더 가까워지고 있다는 것입니다. 232 00:11:38,102 --> 00:11:39,563 그럼으로써 233 00:11:39,587 --> 00:11:44,237 정신 건강의 전혀 다른 형태를 미래에 보게 될 수도 있습니다. 234 00:11:44,261 --> 00:11:49,882 우리가 쓰고, 말하는 단어의 235 00:11:49,906 --> 00:11:53,225 객관적, 양적, 자동적 분석에 기반해서요. 236 00:11:53,225 --> 00:11:54,351 감사합니다. 237 00:11:54,375 --> 00:11:59,978 (박수)