Return to Video

The Internet: How Search Works

  • 0:06 - 0:07
    안녕하세요. 저는 John입니다.
  • 0:08 - 0:10
    저는 구글에서 검색 및
    머신 러닝팀을 이끌고 있습니다.
  • 0:12 - 0:15
    저는 전세계의 모든 사람들이
  • 0:15 - 0:18
    소소한 질문부터
  • 0:18 - 0:20
    매우 중요한 문제까지
    답을 찾기 위해 검색 엔진을 켜는 것이
  • 0:20 - 0:23
    놀랍도록 고무적인 일이라 생각합니다.
  • 0:23 - 0:25
    그래서 우리는 큰 책임감을 갖고
  • 0:25 - 0:27
    가능한 한 최선의 답을 제공하고자 합니다.
  • 0:27 - 0:31
    안녕하세요. 제 이름은 Akshaya이고
    Bing 검색팀에서 일하고 있습니다.
  • 0:31 - 0:33
    우리는 수 차례에 걸쳐
    인공지능과 머신러닝
  • 0:33 - 0:36
    조사를 시작할 수 있었지만
  • 0:36 - 0:39
    결국 가장 중요한 것은
    우리가 사회에 영향을 주길 원했기 때문에
  • 0:39 - 0:42
    사용자가 이를 어떻게 이용할지에 관해
    답을 찾아야 합니다.
  • 0:44 - 0:45
    간단한 질문을 하나를 해보죠.
  • 0:46 - 0:48
    화성까지 가는 데 얼마나 걸릴까요?
  • 0:49 - 0:51
    검색결과가 어디에서 나왔으며,
  • 0:51 - 0:54
    다른 결과 보다 이것들이
    먼저 나열된 이유가 무엇일까요?
  • 0:56 - 0:58
    좋아요, 검색 엔진이
    요청을 결과로 어떻게 바꿔놓는지
  • 0:58 - 1:00
    한번 살펴볼까요.
  • 1:01 - 1:03
    먼저 알아야 할 것은
    검색을 언제 하는가 입니다.
  • 1:03 - 1:06
    사실 검색엔진은 실시간
    검색을 위해
  • 1:06 - 1:08
    월드와이드웹으로 나가지 않습니다.
  • 1:08 - 1:11
    인터넷에는 수 십억개 이상의
    웹사이트가 있고
  • 1:11 - 1:14
    매 일분마다 수 백개 이상이
    새로 만들어지기 때문입니다.
  • 1:14 - 1:16
    그래서 검색엔진이
    사용자가 원하는 것을 찾고자
  • 1:16 - 1:19
    각 사이트 하나 하나를
    조사하는 일이 어려우면,
  • 1:19 - 1:20
    그냥 한없이 시간을 끌게 될 것입니다.
  • 1:20 - 1:22
    그래서 더 빠르게 검색하기 위해,
  • 1:22 - 1:25
    검색엔진은 미리 웹을
    계속해서 스캐닝하여
  • 1:25 - 1:29
    나중의 검색에 도움이 될만한
    정보를 기록합니다.
  • 1:29 - 1:31
    이런 식으로, 화성까지의
    여행에 관한 검색을 할 때,
  • 1:32 - 1:34
    검색엔진은 이미 실시간
    으로 답을 주기위해 필요한
  • 1:34 - 1:36
    내용을 갖게 됩니다.
  • 1:36 - 1:38
    어떤식으로 이루어지는지 볼까요.
  • 1:38 - 1:42
    인터넷은 하이퍼링크에 의해
    서로 연결된 페이지들의 웹(거미줄)입니다.
  • 1:42 - 1:45
    검색엔진은 이러한 웹 페이지를
    서로 이어주는
  • 1:45 - 1:47
    스파이더라고 불리는 프로그램을
    계속해서 실행하여
  • 1:47 - 1:49
    그것들에 관한 정보를 수집합니다.
  • 1:50 - 1:52
    하이퍼링크를 찾을 때마다
  • 1:52 - 1:55
    전체 인터넷 상에서
    그것이 찾을 수 있는
  • 1:55 - 1:57
    모든 페이지를 방문할 때까지
    그것을 따라갑니다.
  • 1:57 - 1:59
    스파이더가 방문하는 각 페이지마다
  • 1:59 - 2:02
    검색 인덱스라고 부르는 특수
    데이터베이스를 추가함으로써
  • 2:02 - 2:06
    검색에 필요한
    정보를 기록합니다.
  • 2:07 - 2:10
    이제, 더 이전의 검색으로
    되돌아 가서
  • 2:10 - 2:12
    검색엔진이 검색결과를
    어떻게 생성하는지
  • 2:12 - 2:13
    살펴보도록 할까요.
  • 2:14 - 2:16
    화성까지 가는데 어느 정도
    걸리는지 물어볼 때,
  • 2:17 - 2:19
    검색엔진은 검색인덱스에
    타이핑된 단어 하나 하나를
  • 2:19 - 2:21
    보고 그 단어가 들어 있는
    인터넷 상의 모든 페이지
  • 2:21 - 2:24
    목록을 즉시
    가져옵니다.
  • 2:25 - 2:27
    하지만 검색 용어만을 기준으로 하면
  • 2:27 - 2:29
    수 백만개의 페이지가 나열될 수 있습니다.
  • 2:29 - 2:31
    그래서, 검색엔진은 맨 처음 표시할
    요청에 가장 잘 일치하는 결과를
  • 2:31 - 2:33
    결정할 수 있어야 합니다.
  • 2:33 - 2:36
    이러한 결정은 검색엔진이
    사용자가 무엇을 찾고 있는지
  • 2:36 - 2:38
    추축해야 하기 때문에
    힘들 수 있습니다.
  • 2:39 - 2:41
    각 검색엔진은 각자
    자체 알고리즘을 사용하여
  • 2:41 - 2:44
    사용자가 원한다고 생각하는 바에
    기초하여 페이지 순위를 정합니다.
  • 2:45 - 2:48
    검색엔진의 순위 알고리즘은
    사용자의 검색용어가
  • 2:48 - 2:50
    페이지 타이틀에 들어 있는지
    확인할 것입니다.
  • 2:51 - 2:54
    검색엔진은 단어 모두가 옆에 나란히
    표시되어 있는지 확인하거나
  • 2:55 - 2:57
    또는 사용자가 보길 원하는 페이지와 그렇지 않을
  • 2:57 - 2:59
    페이지를 결정하는데 더 도움이 될
  • 2:59 - 3:01
    다른 계산을
    확인할 것입니다.
  • 3:03 - 3:05
    구글은 어느 한 주어진 페이지에
    몇 개의 다른 웹 페이지가
  • 3:05 - 3:09
    연결되었는지를 고려함으로써
    검색과의 관련성이 가장 큰
  • 3:09 - 3:11
    결과를 선택하기 위한 가장 유명한
    알고리즘을 발명했습니다.
  • 3:12 - 3:14
    이 알고리즘은 많은
    웹사이트가 어느 한 웹페이지가
  • 3:14 - 3:16
    흥미롭다고 생각하면,
  • 3:16 - 3:18
    그 웹페이지가 사용자가 찾고 있는
    것이라는 생각에 바탕을 둡니다.
  • 3:18 - 3:20
    이 알고리즘을 페이지 랭크라고 부르는데
  • 3:21 - 3:22
    이것은 웹 페이지를 평가한다는 의미가 아니라
  • 3:23 - 3:25
    이 알고리즘의 발명자이자 구글 창립자 중 한명인
    래리 페이지의 이름을 따서
  • 3:25 - 3:27
    페이지 랭크라 부르는 것입니다.
  • 3:28 - 3:31
    웹사이트는 사용자가 그 사이트를
    방문할 때 수익을 창출하기 때문에
  • 3:31 - 3:33
    스패머는 검색 알고리즘을
    교란하여
  • 3:33 - 3:36
    그들 페이지가 결과 목록에서
    상위에 표시되게 하는 방법을
  • 3:36 - 3:38
    계속해서 찾고 있습니다.
  • 3:38 - 3:41
    검색엔진은 정기적으로
    알고리즘을 업데이트하여
  • 3:41 - 3:44
    가짜 또는 신뢰할 수 없는 사이트가
    상위에 표시되는 걸 방지합니다.
  • 3:45 - 3:47
    궁극적으로, 웹 주소를 잘 살피고
    신뢰할 수 있는 출처인지
  • 3:48 - 3:49
    확인함으로써 신뢰할 수 없는 페이지를
  • 3:50 - 3:53
    계속해서 분별해 내는 일은
    사용자의 능력에 의해 좌우됩니다.
  • 3:54 - 3:55
    검색 프로그램은 항상 진화하여
  • 3:55 - 3:58
    경쟁자보다 더 나은 결과를
    더 빠르게 보여주도록
  • 3:59 - 4:00
    알고리즘을 개선합니다.
  • 4:01 - 4:03
    오늘날의 검색엔진은
    심지어 명쾌하게 제공되지 않은
  • 4:03 - 4:07
    정보를 사용하여 검색 범위를
    좁혀나갈 수 있게 합니다.
  • 4:07 - 4:10
    그래서, 예를 들어,
    강아지 공원을 검색한다면,
  • 4:10 - 4:12
    현재 위치를 입력하지 않아도
    많은 검색 엔진이
  • 4:12 - 4:14
    근처에 있는
  • 4:14 - 4:16
    모든 강아지 공원에 관한 검색 결과를
    제공할 것입니다.
  • 4:18 - 4:21
    현대 검색엔진 역시
    사용자가 찾고 있는 것과
  • 4:21 - 4:22
    가장 잘 일치하는 결과를 찾기 위해
  • 4:22 - 4:25
    페이지 상의 단어만이 아닌
    그것이 실제로 의미하는 바를
  • 4:25 - 4:27
    이해합니다.
  • 4:27 - 4:30
    예를 들어, 사용자가
    빠른 투수를 검색하면
  • 4:30 - 4:32
    검색엔진은 사용자가 운동선수를
    찾고 있음을 알것입니다.
  • 4:32 - 4:34
    하지만, 큰 피처를 검색하면
  • 4:34 - 4:37
    검색엔진은 주방용품을
    찾을 것입니다.
  • 4:38 - 4:42
    단어를 더 잘 이해하기 위해,
    우리는 인공지능의 한 유형인
  • 4:42 - 4:44
    머신 러닝이라 부르는 것을 사용합니다.
  • 4:44 - 4:46
    이것은 검색
    알고리즘에게
  • 4:46 - 4:48
    단순히 페이지 상의 개별 문자
    또는 단어만이 아닌
  • 4:48 - 4:51
    그러한 단어에 숨겨진 의미를
    찾아내게 합니다.
  • 4:54 - 4:56
    인터넷은 기하급수적으로 성장하고 있습니다.
  • 4:56 - 5:00
    하지만 검색엔진을 설계하는 팀이
    우리의 일을 제대로 잘하면,
  • 5:00 - 5:04
    사용자는 항상 원하는 정보를 단지
    몇 번의 키보드 입력으로 얻을 수 있어야 합니다.
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Korean subtitles

Revisions Compare revisions