The Internet: How Search Works

0:06 - 0:07

안녕하세요. 저는 John입니다.
0:08 - 0:10

저는 구글에서 검색 및
머신 러닝팀을 이끌고 있습니다.
0:12 - 0:15

저는 전세계의 모든 사람들이
0:15 - 0:18

소소한 질문부터
0:18 - 0:20

매우 중요한 문제까지
답을 찾기 위해 검색 엔진을 켜는 것이
0:20 - 0:23

놀랍도록 고무적인 일이라 생각합니다.
0:23 - 0:25

그래서 우리는 큰 책임감을 갖고
0:25 - 0:27

가능한 한 최선의 답을 제공하고자 합니다.
0:27 - 0:31

안녕하세요. 제 이름은 Akshaya이고
Bing 검색팀에서 일하고 있습니다.
0:31 - 0:33

우리는 수 차례에 걸쳐
인공지능과 머신러닝
0:33 - 0:36

조사를 시작할 수 있었지만
0:36 - 0:39

결국 가장 중요한 것은
우리가 사회에 영향을 주길 원했기 때문에
0:39 - 0:42

사용자가 이를 어떻게 이용할지에 관해
답을 찾아야 합니다.
0:44 - 0:45

간단한 질문을 하나를 해보죠.
0:46 - 0:48

화성까지 가는 데 얼마나 걸릴까요?
0:49 - 0:51

검색결과가 어디에서 나왔으며,
0:51 - 0:54

다른 결과 보다 이것들이
먼저 나열된 이유가 무엇일까요?
0:56 - 0:58

좋아요, 검색 엔진이
요청을 결과로 어떻게 바꿔놓는지
0:58 - 1:00

한번 살펴볼까요.
1:01 - 1:03

먼저 알아야 할 것은
검색을 언제 하는가 입니다.
1:03 - 1:06

사실 검색엔진은 실시간
검색을 위해
1:06 - 1:08

월드와이드웹으로 나가지 않습니다.
1:08 - 1:11

인터넷에는 수 십억개 이상의
웹사이트가 있고
1:11 - 1:14

매 일분마다 수 백개 이상이
새로 만들어지기 때문입니다.
1:14 - 1:16

그래서 검색엔진이
사용자가 원하는 것을 찾고자
1:16 - 1:19

각 사이트 하나 하나를
조사하는 일이 어려우면,
1:19 - 1:20

그냥 한없이 시간을 끌게 될 것입니다.
1:20 - 1:22

그래서 더 빠르게 검색하기 위해,
1:22 - 1:25

검색엔진은 미리 웹을
계속해서 스캐닝하여
1:25 - 1:29

나중의 검색에 도움이 될만한
정보를 기록합니다.
1:29 - 1:31

이런 식으로, 화성까지의
여행에 관한 검색을 할 때,
1:32 - 1:34

검색엔진은 이미 실시간
으로 답을 주기위해 필요한
1:34 - 1:36

내용을 갖게 됩니다.
1:36 - 1:38

어떤식으로 이루어지는지 볼까요.
1:38 - 1:42

인터넷은 하이퍼링크에 의해
서로 연결된 페이지들의 웹(거미줄)입니다.
1:42 - 1:45

검색엔진은 이러한 웹 페이지를
서로 이어주는
1:45 - 1:47

스파이더라고 불리는 프로그램을
계속해서 실행하여
1:47 - 1:49

그것들에 관한 정보를 수집합니다.
1:50 - 1:52

하이퍼링크를 찾을 때마다
1:52 - 1:55

전체 인터넷 상에서
그것이 찾을 수 있는
1:55 - 1:57

모든 페이지를 방문할 때까지
그것을 따라갑니다.
1:57 - 1:59

스파이더가 방문하는 각 페이지마다
1:59 - 2:02

검색 인덱스라고 부르는 특수
데이터베이스를 추가함으로써
2:02 - 2:06

검색에 필요한
정보를 기록합니다.
2:07 - 2:10

이제, 더 이전의 검색으로
되돌아 가서
2:10 - 2:12

검색엔진이 검색결과를
어떻게 생성하는지
2:12 - 2:13

살펴보도록 할까요.
2:14 - 2:16

화성까지 가는데 어느 정도
걸리는지 물어볼 때,
2:17 - 2:19

검색엔진은 검색인덱스에
타이핑된 단어 하나 하나를
2:19 - 2:21

보고 그 단어가 들어 있는
인터넷 상의 모든 페이지
2:21 - 2:24

목록을 즉시
가져옵니다.
2:25 - 2:27

하지만 검색 용어만을 기준으로 하면
2:27 - 2:29

수 백만개의 페이지가 나열될 수 있습니다.
2:29 - 2:31

그래서, 검색엔진은 맨 처음 표시할
요청에 가장 잘 일치하는 결과를
2:31 - 2:33

결정할 수 있어야 합니다.
2:33 - 2:36

이러한 결정은 검색엔진이
사용자가 무엇을 찾고 있는지
2:36 - 2:38

추축해야 하기 때문에
힘들 수 있습니다.
2:39 - 2:41

각 검색엔진은 각자
자체 알고리즘을 사용하여
2:41 - 2:44

사용자가 원한다고 생각하는 바에
기초하여 페이지 순위를 정합니다.
2:45 - 2:48

검색엔진의 순위 알고리즘은
사용자의 검색용어가
2:48 - 2:50

페이지 타이틀에 들어 있는지
확인할 것입니다.
2:51 - 2:54

검색엔진은 단어 모두가 옆에 나란히
표시되어 있는지 확인하거나
2:55 - 2:57

또는 사용자가 보길 원하는 페이지와 그렇지 않을
2:57 - 2:59

페이지를 결정하는데 더 도움이 될
2:59 - 3:01

다른 계산을
확인할 것입니다.
3:03 - 3:05

구글은 어느 한 주어진 페이지에
몇 개의 다른 웹 페이지가
3:05 - 3:09

연결되었는지를 고려함으로써
검색과의 관련성이 가장 큰
3:09 - 3:11

결과를 선택하기 위한 가장 유명한
알고리즘을 발명했습니다.
3:12 - 3:14

이 알고리즘은 많은
웹사이트가 어느 한 웹페이지가
3:14 - 3:16

흥미롭다고 생각하면,
3:16 - 3:18

그 웹페이지가 사용자가 찾고 있는
것이라는 생각에 바탕을 둡니다.
3:18 - 3:20

이 알고리즘을 페이지 랭크라고 부르는데
3:21 - 3:22

이것은 웹 페이지를 평가한다는 의미가 아니라
3:23 - 3:25

이 알고리즘의 발명자이자 구글 창립자 중 한명인
래리 페이지의 이름을 따서
3:25 - 3:27

페이지 랭크라 부르는 것입니다.
3:28 - 3:31

웹사이트는 사용자가 그 사이트를
방문할 때 수익을 창출하기 때문에
3:31 - 3:33

스패머는 검색 알고리즘을
교란하여
3:33 - 3:36

그들 페이지가 결과 목록에서
상위에 표시되게 하는 방법을
3:36 - 3:38

계속해서 찾고 있습니다.
3:38 - 3:41

검색엔진은 정기적으로
알고리즘을 업데이트하여
3:41 - 3:44

가짜 또는 신뢰할 수 없는 사이트가
상위에 표시되는 걸 방지합니다.
3:45 - 3:47

궁극적으로, 웹 주소를 잘 살피고
신뢰할 수 있는 출처인지
3:48 - 3:49

확인함으로써 신뢰할 수 없는 페이지를
3:50 - 3:53

계속해서 분별해 내는 일은
사용자의 능력에 의해 좌우됩니다.
3:54 - 3:55

검색 프로그램은 항상 진화하여
3:55 - 3:58

경쟁자보다 더 나은 결과를
더 빠르게 보여주도록
3:59 - 4:00

알고리즘을 개선합니다.
4:01 - 4:03

오늘날의 검색엔진은
심지어 명쾌하게 제공되지 않은
4:03 - 4:07

정보를 사용하여 검색 범위를
좁혀나갈 수 있게 합니다.
4:07 - 4:10

그래서, 예를 들어,
강아지 공원을 검색한다면,
4:10 - 4:12

현재 위치를 입력하지 않아도
많은 검색 엔진이
4:12 - 4:14

근처에 있는
4:14 - 4:16

모든 강아지 공원에 관한 검색 결과를
제공할 것입니다.
4:18 - 4:21

현대 검색엔진 역시
사용자가 찾고 있는 것과
4:21 - 4:22

가장 잘 일치하는 결과를 찾기 위해
4:22 - 4:25

페이지 상의 단어만이 아닌
그것이 실제로 의미하는 바를
4:25 - 4:27

이해합니다.
4:27 - 4:30

예를 들어, 사용자가
빠른 투수를 검색하면
4:30 - 4:32

검색엔진은 사용자가 운동선수를
찾고 있음을 알것입니다.
4:32 - 4:34

하지만, 큰 피처를 검색하면
4:34 - 4:37

검색엔진은 주방용품을
찾을 것입니다.
4:38 - 4:42

단어를 더 잘 이해하기 위해,
우리는 인공지능의 한 유형인
4:42 - 4:44

머신 러닝이라 부르는 것을 사용합니다.
4:44 - 4:46

이것은 검색
알고리즘에게
4:46 - 4:48

단순히 페이지 상의 개별 문자
또는 단어만이 아닌
4:48 - 4:51

그러한 단어에 숨겨진 의미를
찾아내게 합니다.
4:54 - 4:56

인터넷은 기하급수적으로 성장하고 있습니다.
4:56 - 5:00

하지만 검색엔진을 설계하는 팀이
우리의 일을 제대로 잘하면,
5:00 - 5:04

사용자는 항상 원하는 정보를 단지
몇 번의 키보드 입력으로 얻을 수 있어야 합니다.

Title:: The Internet: How Search Works
Description:: more » « less
Video Language:: English
Team:: Code.org
Project:: How Internet Works
Duration:: 05:13

	Tomedes edited Korean subtitles for The Internet: How Search Works
	Tomedes edited Korean subtitles for The Internet: How Search Works
	Tomedes edited Korean subtitles for The Internet: How Search Works

Korean subtitles

Revisions Compare revisions

Revision 3 Edited

Tomedes
Revision 2 Edited

Tomedes
Revision 1 Edited

Tomedes

	Revision Number	Author	Created
	3	Tomedes
	2	Tomedes
	1	Tomedes

The Internet: How Search Works

Revisions Compare revisions

Our website uses cookies

Operating cookies (Required)