WEBVTT 00:00:06.070 --> 00:00:06.595 안녕하세요. 저는 John입니다. 00:00:06.595 --> 00:00:06.660 저는 구글에서 검색 및 머신 러닝팀을 이끌고 있습니다. 00:00:06.660 --> 00:00:06.693 저는 전세계의 모든 사람들이 00:00:06.693 --> 00:00:06.709 소소한 질문부터 00:00:06.709 --> 00:00:06.726 매우 중요한 문제까지 답을 찾기 위해 검색 엔진을 켜는 것이 00:00:06.726 --> 00:00:06.791 놀랍도록 고무적인 일이라 생각합니다. 00:00:06.791 --> 00:00:06.857 그래서 우리는 큰 책임감을 갖고 00:00:06.857 --> 00:00:07.120 가능한 한 최선의 답을 제공하고자 합니다. 00:00:07.510 --> 00:00:08.825 안녕하세요. 제 이름은 Akshaya이고 Bing 검색팀에서 일하고 있습니다. 00:00:08.825 --> 00:00:09.482 우리는 수 차례에 걸쳐 인공지능과 머신러닝 00:00:09.482 --> 00:00:10.140 조사를 시작할 수 있었지만 00:00:12.130 --> 00:00:14.230 결국 가장 중요한 것은 우리가 사회에 영향을 주길 원했기 때문에 00:00:14.230 --> 00:00:15.222 사용자가 이를 어떻게 이용할지에 관해 답을 찾아야 합니다. 00:00:15.222 --> 00:00:15.718 간단한 질문을 하나를 해보죠. 00:00:15.718 --> 00:00:15.842 화성까지 가는 데 얼마나 걸릴까요? 00:00:15.842 --> 00:00:15.904 검색결과가 어디에서 나왔으며, 00:00:15.904 --> 00:00:15.919 다른 결과 보다 이것들이 먼저 나열된 이유가 무엇일까요? 00:00:15.919 --> 00:00:15.923 좋아요, 검색 엔진이 요청을 결과로 어떻게 바꿔놓는지 00:00:15.923 --> 00:00:15.925 한번 살펴볼까요. 00:00:15.925 --> 00:00:15.926 먼저 알아야 할 것은 검색을 언제 하는가 입니다. 00:00:15.926 --> 00:00:15.926 사실 검색엔진은 실시간 검색을 위해 00:00:15.926 --> 00:00:15.926 월드와이드웹으로 나가지 않습니다. 00:00:15.926 --> 00:00:15.926 인터넷에는 수 십억개 이상의 웹사이트가 있고 00:00:15.926 --> 00:00:15.926 매 일분마다 수 백개 이상이 새로 만들어지기 때문입니다. 00:00:15.926 --> 00:00:15.926 그래서 검색엔진이 사용자가 원하는 것을 찾고자 00:00:15.926 --> 00:00:15.926 각 사이트 하나 하나를 조사하는 일이 어려우면, 00:00:15.926 --> 00:00:15.927 그냥 한없이 시간을 끌게 될 것입니다. 00:00:15.927 --> 00:00:15.931 그래서 더 빠르게 검색하기 위해, 00:00:15.931 --> 00:00:15.935 검색엔진은 미리 웹을 계속해서 스캐닝하여 00:00:15.935 --> 00:00:15.950 나중의 검색에 도움이 될만한 정보를 기록합니다. 00:00:15.950 --> 00:00:15.966 이런 식으로, 화성까지의 여행에 관한 검색을 할 때, 00:00:15.966 --> 00:00:16.214 검색엔진은 이미 실시간 으로 답을 주기위해 필요한 00:00:16.215 --> 00:00:19.160 내용을 갖게 됩니다. 00:00:19.160 --> 00:00:20.930 어떤식으로 이루어지는지 볼까요. 00:00:20.930 --> 00:00:23.450 인터넷은 하이퍼링크에 의해 서로 연결된 페이지들의 웹(거미줄)입니다. 00:00:23.450 --> 00:00:24.864 검색엔진은 이러한 웹 페이지를 서로 이어주는 00:00:26.710 --> 00:00:30.610 스파이더라고 불리는 프로그램을 계속해서 실행하여 00:00:30.910 --> 00:00:33.190 그것들에 관한 정보를 수집합니다. 00:00:33.190 --> 00:00:35.800 하이퍼링크를 찾을 때마다 00:00:35.830 --> 00:00:39.010 전체 인터넷 상에서 그것이 찾을 수 있는 00:00:39.140 --> 00:00:42.390 모든 페이지를 방문할 때까지 그것을 따라갑니다. 00:00:43.780 --> 00:00:45.400 스파이더가 방문하는 각 페이지마다 00:00:45.820 --> 00:00:48.070 검색 인덱스라고 부르는 특수 데이터베이스를 추가함으로써 00:00:49.330 --> 00:00:50.950 검색에 필요한 정보를 기록합니다. 00:00:51.370 --> 00:00:54.100 이제, 더 이전의 검색으로 되돌아 가서 00:00:55.700 --> 00:00:58.150 검색엔진이 검색결과를 어떻게 생성하는지 00:00:58.150 --> 00:00:59.860 살펴보도록 할까요. 00:01:00.690 --> 00:01:03.360 화성까지 가는데 어느 정도 걸리는지 물어볼 때, 00:01:03.430 --> 00:01:06.480 검색엔진은 검색인덱스에 타이핑된 단어 하나 하나를 00:01:06.480 --> 00:01:08.010 보고 그 단어가 들어 있는 인터넷 상의 모든 페이지 00:01:08.140 --> 00:01:10.610 목록을 즉시 가져옵니다. 00:01:10.610 --> 00:01:14.140 하지만 검색 용어만을 기준으로 하면 00:01:14.140 --> 00:01:16.210 수 백개의 페이지가 나열될 수 있습니다. 00:01:16.240 --> 00:01:18.690 그래서, 검색엔진은 맨 처음 표시할 요청에 가장 잘 일치하는 결과를 00:01:18.690 --> 00:01:20.120 결정할 수 있어야 합니다. 00:01:20.500 --> 00:01:21.940 00:01:21.970 --> 00:01:24.940 00:01:25.420 --> 00:01:28.560 00:01:28.930 --> 00:01:31.270 00:01:31.630 --> 00:01:33.700 00:01:33.700 --> 00:01:35.728 00:01:36.250 --> 00:01:37.540 00:01:37.900 --> 00:01:42.010 00:01:42.400 --> 00:01:44.680 00:01:44.680 --> 00:01:47.380 00:01:47.380 --> 00:01:49.040 00:01:49.780 --> 00:01:51.550 00:01:52.090 --> 00:01:55.000 00:01:55.030 --> 00:01:57.240 00:01:57.335 --> 00:01:59.170 00:01:59.200 --> 00:02:02.320 00:02:02.500 --> 00:02:05.650 00:02:07.166 --> 00:02:09.530 00:02:09.590 --> 00:02:11.990 00:02:11.990 --> 00:02:13.333 00:02:13.640 --> 00:02:16.460 00:02:16.640 --> 00:02:18.860 00:02:18.920 --> 00:02:21.410 00:02:21.410 --> 00:02:24.500 00:02:24.890 --> 00:02:26.870 00:02:26.870 --> 00:02:28.760 00:02:28.760 --> 00:02:31.110 00:02:31.110 --> 00:02:33.120 00:02:33.340 --> 00:02:36.010 00:02:36.010 --> 00:02:38.040 00:02:38.930 --> 00:02:41.360 00:02:41.360 --> 00:02:44.230 00:02:44.930 --> 00:02:47.660 00:02:47.990 --> 00:02:50.360 00:02:50.900 --> 00:02:53.820 00:02:54.520 --> 00:02:57.020 00:02:57.020 --> 00:02:58.610 00:02:58.670 --> 00:03:01.420 00:03:02.960 --> 00:03:04.960 00:03:04.960 --> 00:03:08.530 00:03:08.560 --> 00:03:11.230 00:03:11.830 --> 00:03:14.140 00:03:14.140 --> 00:03:15.660 00:03:15.660 --> 00:03:17.940 00:03:18.190 --> 00:03:20.020 00:03:20.590 --> 00:03:22.330 00:03:22.570 --> 00:03:25.210 00:03:25.480 --> 00:03:27.333 00:03:27.940 --> 00:03:30.520 00:03:30.820 --> 00:03:32.950 00:03:32.950 --> 00:03:35.741 00:03:35.742 --> 00:03:37.931 00:03:38.260 --> 00:03:40.750 00:03:40.750 --> 00:03:44.296 00:03:44.680 --> 00:03:47.350 00:03:47.500 --> 00:03:49.450 00:03:49.690 --> 00:03:52.990 00:03:53.680 --> 00:03:55.390 00:03:55.420 --> 00:03:58.420 00:03:58.540 --> 00:04:00.460 00:04:01.000 --> 00:04:03.100 00:04:03.100 --> 00:04:06.820 00:04:07.150 --> 00:04:10.120 00:04:10.240 --> 00:04:12.190 00:04:12.190 --> 00:04:13.840 00:04:14.080 --> 00:04:16.260 00:04:17.800 --> 00:04:20.530 00:04:20.530 --> 00:04:22.060 00:04:22.300 --> 00:04:24.970 00:04:24.970 --> 00:04:26.750 00:04:27.130 --> 00:04:29.980 00:04:30.280 --> 00:04:32.300 00:04:32.500 --> 00:04:34.450 00:04:34.450 --> 00:04:36.730 00:04:38.420 --> 00:04:41.910 00:04:41.910 --> 00:04:43.985 00:04:43.985 --> 00:04:46.050 00:04:46.090 --> 00:04:48.400 00:04:48.400 --> 00:04:51.280 00:04:53.690 --> 00:04:55.850 00:04:56.210 --> 00:04:59.810 00:05:00.080 --> 00:05:04.090