[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:02.02,Default,,0000,0000,0000,,[Себастьян Тран] Как ты думаешь, как написать поисковую машину Dialogue: 0,0:00:02.02,0:00:03.08,Default,,0000,0000,0000,,ты ведь создал уже одну раньше, так ведь? Dialogue: 0,0:00:03.08,0:00:06.01,Default,,0000,0000,0000,,[Сергей Брин, сооснователь Google] Да, я думаю, что самая важная вещь, Dialogue: 0,0:00:06.01,0:00:08.01,Default,,0000,0000,0000,,если ты собираешся создать поисковую машину, Dialogue: 0,0:00:08.01,0:00:12.05,Default,,0000,0000,0000,,это иметь хорошую базу с которой начнёшь Dialogue: 0,0:00:12.05,0:00:19.02,Default,,0000,0000,0000,,В нашем случае мы использовали всемирную паутину, которая в то время была, конечно, меньше, чем сегодня Dialogue: 0,0:00:19.02,0:00:21.04,Default,,0000,0000,0000,,Но она была также новой и захватывающей Dialogue: 0,0:00:21.04,0:00:23.08,Default,,0000,0000,0000,,Были всякие неожиданные вещи. Dialogue: 0,0:00:23.08,0:00:26.10,Default,,0000,0000,0000,,[David Evans] Итак, цель наших трех первых разделов курса в создании этой базы Dialogue: 0,0:00:27.00,0:00:30.01,Default,,0000,0000,0000,,И мы собираемся создать базу для нашего поисковой машины Dialogue: 0,0:00:30.01,0:00:32.09,Default,,0000,0000,0000,,сканируя сеть, это то, что делает сетевой "паук". Dialogue: 0,0:00:32.09,0:00:36.04,Default,,0000,0000,0000,,Сетевой паук - это программа, которая собирает содержание сети. Dialogue: 0,0:00:36.04,0:00:40.05,Default,,0000,0000,0000,,Если представить веб-страницу которую ты видишь в браузере, у тебя есть страница наподобие этой. Dialogue: 0,0:00:40.05,0:00:43.10,Default,,0000,0000,0000,,Рассмотрим сайт udacity как пример веб-страницы Dialogue: 0,0:00:43.10,0:00:47.10,Default,,0000,0000,0000,,На ней много информации, в виде картинок, в виде текта Dialogue: 0,0:00:47.10,0:00:51.04,Default,,0000,0000,0000,,Все это получает твой браузер, когда запрашивает страницу Dialogue: 0,0:00:51.04,0:00:53.07,Default,,0000,0000,0000,,Важная вещь это ссылки Dialogue: 0,0:00:53.07,0:00:57.09,Default,,0000,0000,0000,,Ссылка это что-то, что ссылается на другую страницу Dialogue: 0,0:00:57.09,0:01:00.05,Default,,0000,0000,0000,,Так у нас есть ссылка на часто задаваемые вопросы Dialogue: 0,0:01:00.05,0:01:02.05,Default,,0000,0000,0000,,есть ссылка на страницу CS101 Dialogue: 0,0:01:02.05,0:01:04.04,Default,,0000,0000,0000,,И ещё несколько остальных ссылок Dialogue: 0,0:01:04.04,0:01:07.05,Default,,0000,0000,0000,,И эта ссылка может быть показана в браузере с подчёркиванием Dialogue: 0,0:01:07.05,0:01:09.09,Default,,0000,0000,0000,,или нет, в зависимости от настроек браузера Dialogue: 0,0:01:09.09,0:01:11.10,Default,,0000,0000,0000,,Но важная вещь это то, Dialogue: 0,0:01:11.10,0:01:13.09,Default,,0000,0000,0000,,что они указывают на какие-то другие страницы Dialogue: 0,0:01:13.09,0:01:16.04,Default,,0000,0000,0000,,И эти страницы могут тоже содеражить ссылки Dialogue: 0,0:01:16.04,0:01:19.07,Default,,0000,0000,0000,,так у нас есть другая ссылка на эту страницу Dialogue: 0,0:01:19.07,0:01:23.05,Default,,0000,0000,0000,,Может быть с моим именем, ты можешь попасть на мою домашную страницу Dialogue: 0,0:01:23.05,0:01:26.09,Default,,0000,0000,0000,,И все страницы, которые мы можем найти нашим пауком Dialogue: 0,0:01:26.09,0:01:29.01,Default,,0000,0000,0000,,находятся по переходу по ссылкам. Dialogue: 0,0:01:29.01,0:01:31.07,Default,,0000,0000,0000,,Так, что нам не нужно искать каждую страницу в сети Dialogue: 0,0:01:31.07,0:01:33.06,Default,,0000,0000,0000,,Если мы начнем с хорошей начальной страницы Dialogue: 0,0:01:33.06,0:01:35.00,Default,,0000,0000,0000,,мы найдем множество страниц. Dialogue: 0,0:01:35.00,0:01:37.05,Default,,0000,0000,0000,,И всё что паук будет делать, это начинать с одной страницы, Dialogue: 0,0:01:37.05,0:01:41.06,Default,,0000,0000,0000,,находить на ней все ссылки и переходить по ним, находя другие страницы Dialogue: 0,0:01:41.06,0:01:45.01,Default,,0000,0000,0000,,и затем на других страницах он перейдет по следующим ссылкам Dialogue: 0,0:01:45.01,0:01:48.03,Default,,0000,0000,0000,,обнаруживая другие страницы и на этих страницах будет ещё больше ссылок Dialogue: 0,0:01:48.03,0:01:51.04,Default,,0000,0000,0000,,И в конце концов у нас будет коллекция множества страниц в сети. Dialogue: 0,0:01:51.04,0:01:54.01,Default,,0000,0000,0000,,Вот что мы хотим делать, создавая веб паука. Dialogue: 0,0:01:54.01,0:01:56.10,Default,,0000,0000,0000,,Мы собираемся каким-либо образом начать с первоначальной страницы Dialogue: 0,0:01:56.10,0:01:59.06,Default,,0000,0000,0000,,выделить ссылки на ней, Dialogue: 0,0:01:59.06,0:02:01.08,Default,,0000,0000,0000,,перейти по этим ссылкам на другие страницы, Dialogue: 0,0:02:01.08,0:02:03.07,Default,,0000,0000,0000,,затем собрать ссылки с этих других страниц, Dialogue: 0,0:02:03.07,0:02:05.02,Default,,0000,0000,0000,,переходя по ним, собирая всё содеражние Dialogue: 0,0:02:05.02,0:02:07.04,Default,,0000,0000,0000,,Похоже чтобы реализовать это, нужно много работы Dialogue: 0,0:02:07.04,0:02:09.01,Default,,0000,0000,0000,,Мы не собираемся делать это всё в первом разделе Dialogue: 0,0:02:09.01,0:02:12.07,Default,,0000,0000,0000,,Всё что мы собираемся сделать в первом разделе, просто выделить ссылку. Dialogue: 0,0:02:12.07,0:02:14.06,Default,,0000,0000,0000,,Итак, мы начнем с отрывка текста. Dialogue: 0,0:02:14.06,0:02:17.03,Default,,0000,0000,0000,,Он будет иметь ссылки с URL. Dialogue: 0,0:02:17.03,0:02:19.06,Default,,0000,0000,0000,,Всё что мы хотим найти это этот URL, Dialogue: 0,0:02:19.06,0:02:21.09,Default,,0000,0000,0000,,так чтобы мы могли запросить следующую страницу. Dialogue: 0,0:02:21.09,0:02:23.08,Default,,0000,0000,0000,,Цель второго раздела Dialogue: 0,0:02:23.08,0:02:25.02,Default,,0000,0000,0000,,возможность продолжить дальше, Dialogue: 0,0:02:25.02,0:02:28.05,Default,,0000,0000,0000,,если на странице много ссылок, ты захочешь найти их все. Dialogue: 0,0:02:28.05,0:02:30.01,Default,,0000,0000,0000,,Это то, чем мы займемся во втором разделе, Dialogue: 0,0:02:30.01,0:02:32.07,Default,,0000,0000,0000,,выяснить, как продолжить, чтобы выделить все эти ссылки Dialogue: 0,0:02:32.07,0:02:36.06,Default,,0000,0000,0000,,В третьем разделе, мы хотим выйти за рамки только одной страницы. Dialogue: 0,0:02:36.06,0:02:40.03,Default,,0000,0000,0000,,Так что к концу раздела 2 мы сможем вывести все ссылки с одной страницы Dialogue: 0,0:02:40.03,0:02:44.00,Default,,0000,0000,0000,,Для третьего раздела нам нужно собрать всё эти ссылки, так что мы можем продолжить, Dialogue: 0,0:02:44.00,0:02:47.02,Default,,0000,0000,0000,,чтобы в конечном итоге, наш паук собрал много страниц. Dialogue: 0,0:02:47.02,0:02:50.01,Default,,0000,0000,0000,,Так что к концу третьего раздела мы доделаем веб паука. Dialogue: 0,0:02:50.01,0:02:52.03,Default,,0000,0000,0000,,У нас будет возможность сделать базу. Dialogue: 0,0:02:52.03,0:02:57.08,Default,,0000,0000,0000,,Тогда в оставшихся трёх разделах взглянем на то, как отвечать на запросы. Dialogue: 0,0:02:57.08,0:03:01.03,Default,,0000,0000,0000,,Таким образом в четвертом разделе подумаем над тем как получить хороший отклик. Dialogue: 0,0:03:01.03,0:03:08.02,Default,,0000,0000,0000,,Если ты ищешь какое-либо слово, ты хочешь получить в ответ список страниц, Dialogue: 0,0:03:08.02,0:03:10.06,Default,,0000,0000,0000,,где встречается это слово. Dialogue: 0,0:03:10.06,0:03:15.09,Default,,0000,0000,0000,,И в 5 разделе мы найдём способ сделать это, если у нас очень большая база. Dialogue: 0,0:03:15.09,0:03:19.08,Default,,0000,0000,0000,,Затем в шестом разделе, что мы хотим сделать, это не просто найти список страниц, Dialogue: 0,0:03:19.08,0:03:21.07,Default,,0000,0000,0000,,мы хотим найти наиболее подходящую. Dialogue: 0,0:03:21.07,0:03:24.08,Default,,0000,0000,0000,,Мы подумаем над тем, как расставить страницы, где это слово встречается. Dialogue: 0,0:03:24.08,0:03:27.07,Default,,0000,0000,0000,,Но мы сейчас немного забежали вперед, Dialogue: 0,0:03:27.07,0:03:30.04,Default,,0000,0000,0000,,потому что всё что мы собираемся сделать в первом разделе, Dialogue: 0,0:03:30.04,0:03:32.06,Default,,0000,0000,0000,,это выяснить как извлечь ссылку со страницы. Dialogue: 0,0:03:32.06,0:03:35.07,Default,,0000,0000,0000,,И поисковая машина, которую мы создадим в конце Dialogue: 0,0:03:35.07,0:03:37.03,Default,,0000,0000,0000,,будет вполне действующей поисковой машиной. Dialogue: 0,0:03:37.03,0:03:40.06,Default,,0000,0000,0000,,Она будет содержать такие же главные компоненты, как и у поисковой машину Google. Dialogue: 0,0:03:40.06,0:03:43.01,Default,,0000,0000,0000,,Она определенно не будет такой же мощной, как Google, Dialogue: 0,0:03:43.01,0:03:44.03,Default,,0000,0000,0000,,мы не хотим всё сильно усложнять. Dialogue: 0,0:03:44.03,0:03:46.06,Default,,0000,0000,0000,,Нам нужно будет написать не так много кода. Dialogue: 0,0:03:46.06,0:03:48.01,Default,,0000,0000,0000,,Мы хотим напомнить, что наша настоящая цель Dialogue: 0,0:03:48.01,0:03:50.02,Default,,0000,0000,0000,,не сколько написать поисковую машину, Dialogue: 0,0:03:50.02,0:03:52.08,Default,,0000,0000,0000,,а сколько воспользоваться необходимостью Dialogue: 0,0:03:52.08,0:03:55.02,Default,,0000,0000,0000,,написания поисковой машины для того, Dialogue: 0,0:03:55.02,0:03:56.08,Default,,0000,0000,0000,,чтобы изучить информатику и программирование Dialogue: 0,0:03:56.08,0:03:58.02,Default,,0000,0000,0000,,так, что вещи, которые мы изучим, делая поисковую машину Dialogue: 0,0:03:58.02,9:59:59.99,Default,,0000,0000,0000,,позволят нам в дальнейшем решить много других проблем.