Organizations have been generating data since way back, but as
time goes on more and more data is being generated. IBM
estimates that 90% of the world's data was created in the
last two years alone. Just as a simple example, think of
your cell phone. Whenever your cell phone's turned on, it's
connected to cell towers. As you move around it will connect
to different towers. Net difference signal strengths. All of that connection
data is collected by the phone company and it's being logged.
They can use that information to find dead spots in
the coverage and know which towers are busiest and need
increased capacity. They can even trace you if you make
an emergency phone call but don't give your exact location.
This is an enormous amount of data we have. Another
example is when you visit a website like Amazon or
Netflix. Everything you do there is logged. What pages you
view, how long you spend there, where you're coming from.
They can even capture things like what browser you're using.
Again this is a huge amount of data. Phone data
and website logs are just examples. In addition, things like
x-rays are creating huge amounts of data, and people are
doing research to detect similarities in tumors. The increase in
the amount of data we're generating opens up huge possibilities,
but it comes with problems too. We need to be
able to store all this data and process it too.
組織は昔からデータを作り出していますが
現在はより多くのデータが生成されています
IBMによると世界のデータの90%は
過去2年間で作成されました
例えば携帯電話は電源を入れると
電波塔に接続されます
携帯が移動すると電波の強さの違いを捉え
別の電波塔に接続されます
電話会社は接続記録を収集しログを取り
圏外の場所を調査したり
アクセスが集中している塔を調べ
電波の許容量を上げたりします
救急電話がかけられた場所の特定なども可能です
これらは膨大なデータとなります
Amazonなどのサイトを閲覧すると
そこでの行動はすべて記録されます
どのページをどのくらい見たか
どこのサイトからやって来たか
利用したブラウザのデータも取られています
ここでも膨大なデータが発生します
携帯のデータとWebサイトのログはほんの一例です
医療用X線などのデータや
腫瘍の類似性の研究データなども同様です
データ量の増加で大きな可能性が広がる一方
データを保存し処理するという問題も発生します