Return to Video

数据源 - Hadoop 与 MapReduce简介

  • 0:00 - 0:03
    各种组织从很久之前就开始生成数据了
  • 0:03 - 0:06
    但是随着时间的推移,数据越来越多
  • 0:07 - 0:12
    IBM估计,世界上大约90%的数据都是过去两年里生成的
  • 0:12 - 0:14
    举一个简单的例子,想想你们的手机
  • 0:15 - 0:18
    只要你们的手机开机,它就与信号塔建立了连接
  • 0:18 - 0:19
    当你移动的时候,它就会连接到不同的信号塔
  • 0:20 - 0:22
    在不同的信号带
  • 0:22 - 0:26
    电话公司收集并存储了所有连接数据
  • 0:26 - 0:28
    他们可以用这些数据来寻找信号覆盖的死角
  • 0:29 - 0:32
    或者来认识到哪些信号塔是最繁忙的,哪些需要扩容
  • 0:32 - 0:35
    他们甚至可以在你打紧急电话的时候追踪到你
  • 0:35 - 0:37
    但是他们获取不了你的精确位置
  • 0:37 - 0:40
    这是我们有庞大的数据量的一个例子
  • 0:40 - 0:43
    另外一个例子是,当你访问一个网站比如说亚马逊或者Netflix
  • 0:43 - 0:48
    你在上边做的任何事情都被记录了:比如说你浏览了什么网页,花了多长时间
  • 0:48 - 0:50
    或者是你从哪个网页过来的
  • 0:50 - 0:53
    他们甚至可以获得你用了哪个浏览器的信息
  • 0:53 - 0:55
    这也是一个巨量信息的例子
  • 0:55 - 0:59
    电话数据和网站日志只是两个例子
  • 0:59 - 1:03
    另外,像X光一样的东西也产生了巨量的数据
  • 1:03 - 1:06
    人们可以用这些数据来检测肿瘤间的相似度
  • 1:06 - 1:10
    我们制造的不断增长的数据产生了很多机会
  • 1:10 - 1:12
    但也伴随着很多问题
  • 1:12 - 1:15
    我们要在哪存储这些数据?要如何处理它们?
タイトル:
数据源 - Hadoop 与 MapReduce简介
Video Language:
English
Team:
Udacity
プロジェクト:
ud617 - Intro to Hadoop and Mapreduce
Duration:
01:16

Chinese, Simplified subtitles

改訂 Compare revisions