Return to Video

Data Sources - Intro to Hadoop and MapReduce

  • 0:00 - 0:03
    오래전부터 여러 기관들은 데이터를 생성해왔습니다.
  • 0:03 - 0:06
    그러나 시간이 지날 수록 더 많은 데이터들이 생성되었죠.
  • 0:06 - 0:12
    IBM에서는 전 세계 데이터의 90%가
    지난 2년 동안 생성되었다고 보고 있습니다.
  • 0:12 - 0:15
    간단한 예를 하나 들어보죠.
    당신의 휴대폰을 생각해보세요.
  • 0:15 - 0:18
    당신이 휴대폰 전원을 켜면,
    휴대폰은 기지국에 연결이 됩니다.
  • 0:18 - 0:20
    당신이 이동할 때마다 휴대폰은 서로 다른 신호망을 가진
  • 0:20 - 0:22
    기지국에 연결이 됩니다.
  • 0:22 - 0:26
    모든 연결 데이터는 통신사에 의해 수집되고 로그가 남게됩니다.
  • 0:26 - 0:28
    통신사는 이 데이터를 이용해서 수신이
    원활하지 않은 지역을 찾을 수 있습니다.
  • 0:29 - 0:32
    또는 어떤 기지국이 제일 붐비는지, 그래서 그 기지국의 용량을
    더 늘려야 할지 확인하는데 사용될 수도 있습니다.
  • 0:32 - 0:35
    만약 당신이 긴급 통화를 시도했는데 당신의 정확한 위치를 파악할 수 없다면
  • 0:35 - 0:37
    데이터를 이용해 당신의 위치를 추적할 수도 있습니다.
  • 0:37 - 0:40
    이것은 정말 방대한 데이터입니다.
  • 0:40 - 0:43
    또 다른 예로 당신이 아마존이나 넷플릭스와 같은
    웹사이트에 접속했다고 합시다.
  • 0:43 - 0:48
    이 때 당신이 웹사이트에서 했던 모든 행동들은 로그가 남게됩니다.
    당신이 어떤 페이지를 방문했고, 그 곳에서 얼마나 머물러 있었는지
  • 0:48 - 0:50
    그리고 당신이 어디에서 접속했는지까지 기록이 남게됩니다.
  • 0:50 - 0:53
    심지어 당신이 어떤 웹 브라우저를 사용했는지조차 기록을 남깁니다.
  • 0:53 - 0:55
    이러한 데이터 또한 무척 큰 데이터입니다.
  • 0:55 - 0:59
    휴대폰 데이터, 그리고 웹사이트 로그를 예로 들어봤습니다.
  • 0:59 - 1:03
    그리고 X-ray와 같은 기계나 종양의 유사성에 대해 연구하는 사람들도
  • 1:03 - 1:06
    매우 큰 데이터를 만들어냅니다.
  • 1:06 - 1:10
    이런 데이터 양의 증가는 거대한 가능성을 만들어줍니다.
  • 1:10 - 1:12
    하지만 이는 문제를 유발하기도 합니다.
  • 1:12 - 1:15
    우리는 이러한 데이터를 어디에 보관하고 어떻게 처리해야 할까요?
タイトル:
Data Sources - Intro to Hadoop and MapReduce
Video Language:
English
Team:
Udacity
プロジェクト:
ud617 - Intro to Hadoop and Mapreduce
Duration:
01:16

Korean subtitles

改訂 Compare revisions