-
Thời gian trôi đi.
-
Thật sự là gần 20 năm trước
-
khi tôi muốn hệ thống lại
cách chúng ta sử dụng thông tin,
-
cách ta làm việc cùng nhau:
tôi đã phát minh ra mạng toàn cầu.
-
Bây giờ, đã là 20 năm, tại TED,
-
tôi muốn nhờ sự giúp đỡ từ các bạn
trong việc hệ thống mới.
-
Quay ngược về năm 1989,
-
tôi đã viết một bản ghi nhớ về
hệ thống siêu văn bản toàn cầu.
-
Thật sự thì không có ai làm gì với nó hết.
-
Nhưng 18 tháng sau - đây là cách
sự đổi mới diễn ra -
-
18 tháng sau, ông chủ nói tôi
có thể thực hiện nó ở bên ngoài,
-
như là một loại dự án cho vui,
-
khởi động loại máy tính mới.
-
Và do đó ông ấy đã cho tôi thời gian
để mã hóa nó.
-
Vì thế về cơ bản là tôi phác thảo
HTML nên trông như thế nào:
-
giao thức siêu văn bản, HTTP;
-
ý tưởng về URLs,
những cái tên cho những thứ khác
-
mà bắt nguồn từ HTTP.
-
Tôi viết bảng mã và để ra chỗ khác.
-
Tại sao tôi làm vậy?
-
Cơ bản là thất bại.
-
Tôi đã thất bại - tôi đã làm việc
như một kĩ sư phần mềm
-
trong phòng thí nghiệm khổng lồ
và thú vị,
-
rất nhiều người
từ khắp nơi trên thế giới.
-
Họ mang theo tất cả
các loại máy tính khác nhau.
-
Họ có tất cả các kiểu
định dạng dữ liệu khác nhau,
-
tất cả các kiểu, loại
hệ thống tư liệu.
-
Cho nên, trong sự đa dạng đó,
-
nếu tôi muốn tìm ra
cách xây dựng cái gì đó
-
ngoài chỗ này một chút và chỗ kia một chút
-
mọi thứ tôi nghiên cứu,
tôi phải kết nối với vài thiết bị mới,
-
tôi phải học vận hành chương trình mới,
-
tôi sẽ tìm ra thông tin tôi cần
trong định dang dữ liệu mới.
-
Và tất cả những thứ đó không tương thích.
-
Đó chỉ là thất bại.
-
Thất bại là những tiềm
tiềm năng chưa mở ra.
-
Thực tế, trong tất cả những cái đĩa này
đều có những tư liệu.
-
Nên nếu bạn chỉ
tưởng tượng ra tất cả chúng
-
trở thành một cái gì đó lớn lao,
hệ thống tư liệu ảo trên trời,
-
ví như là trên Internet,
-
thế thì cuộc sống sẽ dễ dàng hơn nhiều.
-
Một khi bạn đã có ý tưởng
thì nó như kiểu trêu ngươi bạn
-
ngay cả nếu người ta
không đọc ghi chép của bạn --
-
-- thật ra là, sau khi chết
bản thảo của ông được tìm thấy.
-
Ông ghi bằng bút chì ở trong góc,
"không rõ ràng, nhưng thú vị"
-
(Tiếng cười)
-
Nhưng nói chung là khó -
nó thật sự khó để giải thích
-
mạng web trông như thế nào.
-
Khó để giải thích rằng
hồi đó đã rất khó.
-
Nhưng sau đó - OK, khi TED bắt đầu,
không hề có mạng
-
vậy nên những thứ như "click"
không hề có nghĩa tương tự.
-
Tôi có thể cho xem một phần siêu văn bản,
-
một trang có đường liên kết,
-
và khi ta bấm vào đường truyền và bing
- một trang siêu văn bản khác mở ra.
-
Không ấn tượng gì.
-
Bạn biết đó, ta có các thứ
trong siêu văn bản trong CD_ROMs.
-
Cái khó là khiến họ tưởng tượng:
-
vậy, hãy tưởng tượng
đường truyền có thể đi đến
-
tới hầu hết các tư liệu
có thể tưởng tượng.
-
Đó là bước nhảy mà rất khó để thực hiện.
-
Ờ thì, một số người đã làm.
-
Vậy nên, rất khó để giải thích,
nhưng có một chuyển biến cơ sở.
-
Và đó là cái làm nó trở nên hay nhất.
-
Đó là điều thú vị nhất,
-
không là kỹ thuật,
không là thứ người ta đã làm
-
mà là xã hội,
tinh thần của mọi người
-
làm cùng nhau, gửi thư điện tử.
-
Đó là cái giống như vậy.
-
Bạn biết không? Nó buồn cười,
nhưng giờ thì nó lại giống vậy.
-
Tôi yêu cầu, nhiều hay ít,
hãy đưa tư liệu
-
Tôi nói, "Bạn có thể
đưa các tư liệu lên trang web này không?"
-
Và họ đã làm.
-
Cảm ơn.
-
Đó là một cú huých, đúng không?
-
Ý tôi là, điều đó khá là thú vị
-
vì ta khám phá
các thứ trên trang web
-
thật sự quá tuyệt vời.
-
Hơn rất nhiều so với tưởng tượng ban đầu
-
khi đặt địa chỉ web nhỏ ban đầu với nhau
-
mà chúng ta bắt đầu với.
-
Bây giờ, tôi muốn bạn
đưa dữ liệu của bạn lên trang mạng.
-
Hóa ra rằng vẫn có những
tiềm năng khổng lồ chưa được mở khóa.
-
Vẫn còn là sự thất bại lớn
-
bởi vì ta không có dữ liệu trên trang mạng
như là dữ liệu.
-
Ý là sao, "dữ liệu"?
Khác gì nhau - tư liệu, dữ liệu?
-
Tư liệu bạn đọc, đúng không?
-
Nhiều hay ít, bạn đọc nó,
bạn có thể theo đường dẫn, thế thôi.
-
Dữ liệu-bạn có thể làm tất cả với máy tính
-
Ai đã ở đây hoặc cách khác
xem bài nói của Hans Rosling?
-
Một trong những người tuyệt với -
vâng nhiều người đã xem nó -
-
một trong những bài nói tuyệt với của TED.
-
Hans đưa ra bài thuyết trình
-
trong đó ông đã chỉ ra, cho những đất nước
khác nhau, trong màu sắc khác nhau -
-
ông cho thấy mức độ thu nhập trên một trục
-
ông cho thấy số tử vong trẻ sơ sinh,
và biến đổi theo thời gian
-
Do đó, ông đã lấy dữ liệu này
và làm bài thuyết trình
-
mà đã phá hủy
rất nhiều chuyện hoang đường
-
về kinh tế trong thế giới đang phát triển.
-
Ông thiết lập một trình chiếu nhỏ như vậy.
-
Nó có chứa ngầm tất cả các dữ liệu
-
Dữ liệu là màu nâu, hình hộp
và nhàm chán
-
và đó là thứ ta nghĩ về nó, đúng không?
-
Vì dữ liệu không thể tự dùng
một cách tự nhiên
-
nhưng thực tế, dữ liệu chứa một lượng lớn
những gì xảy ra trong cuộc sống chúng ta
-
và nó như thế là vì ai đó lấy dữ liệu
và làm cái gì đó với nó.
-
Trường hợp này, Hans đặt dữ liệu với nhau
-
ông đã tìm từ tất cả trang mạng và các thứ
của nước Mỹ.
-
Ông đã đặt chúng với nhau,
-
kết hợp nó với vài thứ thú vị hơn bản gốc
-
và sau đó ông đưa nó vào phần mềm này,
-
mà tôi nghĩ con trai ông đã phát triển nó,
-
và tạo ra bài thuyết trình tuyệt vời này.
-
Và Hans đã tạo một điểm nhấn
-
khi nói, "Nhìn xem, có nhiều dữ liệu
thật sự rất quan trọng".
-
Và tôi hạnh phúc khi thấy điều đó
tại bữa tiệc tối qua
-
khi ông ấy vẫn nói, rất mạnh mẽ,
"Có nhiều dữ liệu thật sự rất quan trọng".
-
Vậy tôi muốn bây giờ
chúng ta hãy nghĩ
-
không chỉ hai mảnh dữ liệu được kết nối,
hay sáu giống như ông ấy đã làm,
-
nhưng tôi muốn nghĩ về một thế giới
mà ở đó mọi người đều đưa dữ liệu lên mạng
-
mọi thứ tưởng tượng ban đầu
đều trên mạng
-
và sau đó gọi là dữ liệu liên kết.
-
Kỹ thuật là dữ liệu liên kết,
rất đơn giản.
-
Nếu bạn muốn đưa cái gì lên mạng
thì có ba quy tắc:
-
đầu tiên là tên HTTP -
-
những thứ này bắt đầu với "http:" -
-
bây giờ chúng tôi dùng chúng
không chỉ cho tư liệu,
-
chúng tôi dùng cho các thứ tư liệu đề cập.
-
Chúng tôi dùng cho con người, địa điểm,
-
chúng tôi dùng nó cho sản phẩm của bạn,
dùng cho các sự kiện.
-
Tất cả loại khái niệm,
họ có tên bắt đầu với HTTP.
-
Quy tắc thứ hai, nếu bạn lấy một
trong số các tên HTTP và bạn tra cứu nó
-
và tôi làm về mạng với nó
và lấy dữ liệu
-
sử dụng giao thức HTTP từ mạng,
-
tôi sẽ lấy về một vài dữ liệu
với định dạng chuẩn
-
là loại dữ liệu có ích
mà vài người muốn biết
-
về điều đó, về sự kiện đó.
-
Ai ở sự kiện? Bất cứ gì về người đó,
-
họ sinh ra ở đâu, những thứ như thế.
-
Quy tắc hai
tôi lấy về thông tin quan trọng
-
Quy tắc ba là khi tôi lấy lại thông tin đó
-
nó không chỉ là chiều cao và cân nặng
và nơi sinh của ai đó,
-
nó có cả những mối quan hệ.
-
Dữ liệu là những nối quan hệ.
-
Thú vị là, dữ liệu là các mối quan hệ.
-
Người này sinh ở Berlin;
Berlin ở Đức.
-
Khi có các mối quan hệ,
bất cứ khi nào diễn tả một mối quan hệ
-
khi đó những thứ khác có liên quan
-
được đưa ra là
một trong các tên bắt đầu với HTTP
-
Do đó, tôi có thể tiếp tục tra cứu cái đó.
-
Vậy tôi tìm một người -
sau đó tôi có thể tìm thành phố sinh ra
-
sau đó tôi có thể tìm nó thuộc vùng nào,
trong thị trấn nào,
-
dân số của nó, vân vân.
-
Do đó tôi có thể duyệt những thứ đó.
-
Vậy nó thật sự là như thế.
-
Đó là dữ liệu kết nối.
-
Một vài năm trước tôi viết một bài báo
tựa đề "Dữ liệu liên kết"
-
và sớm sau đó, vài thứ bắt đầu xuất hiện.
-
Ý tưởng về dữ liệu liên kết
mà chúng tôi có rất rất nhiều
-
về những cái hộp của Hans
-
và có rất rất nhiều
những thứ được nảy mầm.
-
Nó không chỉ là toàn bộ
nhiều cái cây khác.
-
Nó không chỉ là rễ nuôi lớn cái cây,
-
nhưng với mỗi cái cây, bất kể là gì -
-
bài thuyết trình, phân tích,
ai đó tìm các mẫu trong dữ liệu -
-
họ sẽ thấy tất cả các dữ liệu
-
và họ sẽ thấy nó liên kết với nhau,
-
và điều thật sự quan trọng về dữ liệu
-
là càng kết nối nhiều thứ,
nó càng mạnh hơn.
-
Vậy, dữ liệu liên kết.
-
Sự lan truyền đã vươn ra ngoài.
-
Và, cũng khá sớm Chris Bizer
tại trường Đại học Freie ở Berlin
-
trong số người đầu tiên
đưa lên thứ thú vị,
-
ông để ý rằng Wikipedia -
-
các bạn biết Wikipedia,
bách khoa trực tuyến duy nhất
-
với rất rất nhiều tư liệu thú vị trong đó.
-
Trong tư liệu, có hình vuông,
hình hộp nhỏ.
-
Và trong hầu hết các hộp thông tin,
là dữ liệu.
-
Nên ông ấy viết chương trình lấy dữ liệu,
trích nó từ Wikipedia,
-
và bỏ vào một phần nhỏ dữ liệu liên kết
-
trên trang mạng, mà ông gọi là dbpedia.
-
Dbpedia thể hiện bằng khung màu xanh
ở giữa trình chiếu này
-
và nếu bạn thật sự tìm kiếm về Berlin,
-
bạn sẽ thấy rằng có
các vùng thông tin khác
-
mà cũng có những thứ về Berlin,
và chúng được liên kết với nhau.
-
Vậy nếu bạn kéo dữ liệu về Berlin
từ Dbpedia,
-
bạn kết thúc bằng việc kéo cả các thứ khác
-
Và thứ đang tồn tại bắt đầu phát triển.
-
Đó cũng lại là cấp cơ sở.
-
Hãy nghĩ một chút về dữ liệu.
-
Dữ liệu đến từ thực tế
dưới rất rất nhiều hình thức khác nhau.
-
Nghĩ về sự đa dạng của trang mạng.
Nó thật sự rất quan trọng
-
rằng trang mạng cho phép bạn
đưa tất cả loại dữ liệu lên đó.
-
Nó với dữ liệu,
Tôi có thể nói về mọi loại.
-
Ta có thể nói về dữ liệu chính phủ,
dữ liệu doanh nghiệp rất quan trọng,
-
có dữ liệu khoa học, có dữ liệu cá nhân,
-
có dữ liệu thời tiết, dữ liệu về sự kiện,
-
có dữ liệu về các bài nói, và có tin tức
và có tất cả các thứ.
-
Tôi chỉ định đề cập một vài trong số đó
-
để bạn hiểu được sự đa dạng của nó,
-
cũng để bạn thấy tiềm năng chưa mở khóa
nhiều như thế nào.
-
Bắt đầu với dữ liệu chính phủ.
-
Barack Obama đã nói trong bài diễn văn,
-
rằng ông ấy -
dữ liệu về chính phủ Mỹ sẽ có trên mạng
-
dưới định dạng có thể tiếp cận.
-
Hy vọng họ đưa nó lên như dữ liệu liên kết
-
Điều đó là quan trọng. Tại sao quan trọng?
-
Không chỉ vì minh bạch,
minh bạch trong chính phủ là quan trọng
-
nhưng dữ liệu này -
đây là dữ liêu từ tất cả cơ quan chính phủ
-
Nghĩ xem dữ liệu đó có giá bao nhiêu,
nghĩ về cuộc sống ở Mỹ như thế nào.
-
Nó thật ra rất hũu dụng. Nó có giá trị.
-
Tôi có thể dùng nó trong công ty tôi.
-
Tôi có thể dùng nó như
đứa trẻ làm bài tập
-
Vậy ta đang nói về việc tạo ra địa điểm,
cho thế giới tốt hơn
-
bằng cách tạo ra dữ liệu có sẵn.
-
Thực tế nếu bạn có trách nhiệm -
nếu bạn biết về vài dữ liệu
-
trong cơ quan chính phủ, bạn thường thấy
-
những người đó, họ rất muốn giữ kín nó -
-
Hans gọi đó là ôm chặt cơ sở dữ liệu.
-
Bạn ôm cơ sở dữ liệu, bạn không muốn bỏ ra
-
tới khi bạn tạo một trang mạng đẹp cho nó.
-
Ừ thì, tôi muốn đề nghị thay vào đó -
-
vâng, làm một trang mạng đẹp,
-
tôi là ai mà nói là
đừng làm một trang đẹp?
-
Hãy làm một trang mạng đẹp,
nhưng đầu tiên
-
hãy cho chúng tôi dữ liệu không giả tạo,
-
chúng tôi muốn dữ liệu.
-
Chúng tôi muốn dữ liệu không giả tạo.
-
Bây giờ,
chúng ta phải yêu cầu dữ liệu thô.
-
Và tôi sẽ yêu cầu bạn thực hành, được chứ?
-
Hãy nói từ "thô"?
-
Khán giả: Thô.
-
Hãy nói "dữ liệu"
-
Khán giả: Dữ liệu.
-
L: Hãy nói "bây giờ"
-
Khán giả: Bây giờ!
-
Được rồi, "dữ liệu thô ngay bây giờ"!
-
Khán giả: Dữ liệu thô ngay bây giờ!
-
Thực hiện như vậy. Điều đó là quan trọng
vì bạn không biết có bao nhiêu lý do đâu.
-
Mọi người tìm cách để giữ dữ liệu của họ
-
và không đưa nó cho bạn, cho dù bạn
trả tiền cho nó như một người đóng thuế.
-
Và đó không chỉ ở Mỹ. Mà toàn thế giới.
-
Và dĩ nhiên không chỉ chính phủ-
mà cũng có cả các doanh nghiệp.
-
Vì vậy tôi chỉ đề cập
một vài suy nghĩ về dữ liệu.
-
Bầy giờ chúng ta ở tại TED,
và ta lúc nào cũng tỉnh táo
-
với những thử thách khổng lồ
trong xã hội loài nguời ngày nay
-
chữa trị ung thư,
hiểu bộ não cho bệnh Alzheimer,
-
Hiểu nền kinh tế
để làm cho nó ổn định hơn,
-
Hiểu cách thế giới hoạt động.
-
Giải quyết
việc này là nhà khoa học
-
Họ có nửa ý tưởng trong đầu,
-
Họ cố giao tiếp những thứ đó
qua mạng.
-
Nhưng bây giờ có rất nhiều
loại tri thức về loài người
-
trong các cơ sở dữ liệu,
thường nằm trong máy tính,
-
và thật ra, là không được chia sẻ.
-
Thực tế, tôi sẽ chỉ
đi vào một chuyện,
-
ví dụ, bệnh Alzhelmer.
-
Sự phát minh ra thuốc - toàn bộ
dữ liệu liên kết sẽ xuất hiện
-
vì nhà khoa học lĩnh vực này
nhận ra rằng
-
đây là cách tuyệt vời
để ra khỏi những kho chứa,
-
vì họ có dữ liệu gen
trong một cơ sở dữ liệu
-
trong một tòa nhà, và họ có
dữ liệu về chất hữu cơ ở chỗ khác.
-
Ngày nay, họ đang gắn bó với
- dữ liệu liên kết -
-
và bây giờ họ có thể hỏi những câu,
mà bạn có thể sẽ không hỏi,
-
tôi không hỏi - họ hỏi.
-
Loại protein nào tham gia vào
việc truyền tín hiệu
-
và cũng liên quan với tế bào
thần kinh hình tháp?
-
Bạn tiếp nhận thật nhiều
và bạn đưa nó lên Google.
-
Dĩ nhiên, không có trang mạng nào
trả lời câu hỏi đó
-
vì không có ai đã trả lời nó trước đây.
-
Bạn có 223,000 kết quả -
-
không kết quả nào dùng được
-
Bạn hỏi dữ liệu liên kết -
đang được đặt cùng nhau
-
32 kết quả, mỗi một đó là một chất đạm
có các thuộc tính
-
và bạn có thể nhìn thấy nó.
-
Sức mạnh để hỏi những câu hỏi đó
như một nhà khoa học -
-
câu hỏi vượt qua
các quy tắc khác nhau
-
đó thật sự là
sự thay đổi hoàn toàn.
-
Điều đó rất rất quan trọng.
-
Lúc này,
nhà khoa học hoàn toàn lúng túng -
-
sức mạnh của dữ liệu mà các
nhà khoa học khác thu thập đc đã bị khóa
-
và ta cần mở khóa nó
để giải quyết những vấn đề khổng lồ.
-
Bây giờ, nếu tiếp tục thế này, bạn sẽ nghĩ
tất cả dữ liệu đến từ tổ chức khổng lồ
-
và không có gì liên quan tới bạn.
-
Nhưng điều đó không đúng.
-
Thực tế, dữ liệu là về cuộc sống.
-
Bạn chỉ - đăng nhập vào địa chỉ mạng xã hội,
-
cái bạn thích,
nói, "Đây là bạn tôi"
-
Bing! Mối quan hệ. Dữ liệu.
-
Bạn nói,
"Tấm ảnh này, nó mô tả người này".
-
Bìng! Đó là dữ liệu.
Dữ liệu, dữ liệu, dữ liệu.
-
Mỗi lần bạn làm gì đó với mạng xã hội,
-
trang mạng xã hội lấy dữ liệu và dùng nó
- tái tạo nó
-
và dùng nó để làm cho
cuộc sống con người thú vị hơn.
-
Nhưng, khi tới vị trí dữ liệu kết nối khác
-
và lần này hãy nói về du lịch,
-
và nói, "Tôi muốn gửi tấm ảnh này
đến mọi người trong nhóm"
-
bạn không thể vượt qua bức tường,
-
Nhà Kinh tế viết về nó,
nhiều người bàn tán
-
sự thất bại to lớn.
-
Cách đạp đổ các kho chứa
là để đạt đồng bộ
-
giữa các địa chỉ mạng xã hội.
-
Ta cần làm vậy với dữ liệu liên kết.
-
Loại dữ liệu cuối cùng tôi nói đến,
có lẽ thú vị nhất.
-
Trước khi tôi xuống đây,
tôi đã tìm trên OpenStreetMap
-
OpenStreetMap là bản đồ,
cũng là Wiki.
-
Phóng to và cái hình vuông đó
là nhà hát mà ta đang ngồi
-
Nhà hát Terrace.
Không có tên trên đó.
-
Tôi vào phần biên tập,
chọn nhà hát,
-
Tôi có thể thêm cái tên vào bên dưới,
và lưu nó lại.
-
Và bây giờ nếu bạn vào
OpenStreetMap.org,
-
Khi tìm nơi này, bạn sẽ thấy
Nhà hát Terrace có tên ở đó
-
Tôi đã làm điều đó. Là tôi!
-
Tôi làm thế với bản đồ.
Vừa làm đó!
-
Tôi đưa nó lên đó. Bạn biết gì không?
-
Nếu bản đồ phố xá
là về mọi nguời làm bổn phận của họ
-
và nó tạo ra một nguồn không thể tin được
-
vì mọi người khác làm việc của họ.
-
Và đó là những gì về dữ liệu liên kết.
-
Nó nói về mọi người
đang làm phần của họ
-
để làm ra một ít,
và tất cả chúng đều kết nối với nhau.
-
Đó là cách dữ liệu liên kết làm việc.
-
Bạn làm bổn phận của mình.
Những người khác làm của họ.
-
Bạn có thể không tự có nhiều dữ liệu
để đưa lên đây
-
nhưng bạn biết yêu cầu nó.
-
Và chúng ta sẽ tập luyện điều đó.
-
Vậy, dữ liệu liên kết - nó khổng lồ.
-
Tôi chỉ nói một số ít rất nhỏ
trong các thứ
-
Có dữ liệu ở mỗi khía cạnh cuộc sống,
-
mỗi khía cạnh của công việc và sở thích,
-
và nó không chỉ là con số
của nơi có dữ liệu,
-
mà nó kết nối với nhau.
-
Và khi bạn kết nối dữ liệu với nhau,
bạn có sức mạnh
-
theo cách không chỉ xảy ra
với trang mạng, mà còn với tư liệu.
-
Bạn sẽ có sức mạnh khổng lồ nhờ nó.
-
Vậy, bây giờ chúng ta
đang ở tại sân khấu
-
nơi mà ta phải làm điều đó -
những nguời nghĩ đó là ý hay.
-
Tất cả mọi người - tôi nghĩ
rất nhiều người ở TED làm nhiều thứ
-
mặc dù không có sự hoàn vốn ngay tức khắc
-
vì nó sẽ chỉ thật sự chi trả
khi mọi người khác hoàn thành nó -
-
họ sẽ làm bởi vì
họ là kiểu người làm những thứ
-
mà chỉ tốt nếu
người khác đã làm nó.
-
Nên nó được gọi là dữ liệu liên kết
-
Tôi muốn bạn làm điều đó
-
Tôi muốn bạn yêu cầu nó.
-
Và tôi nghĩ nó là ý tường toàn cầu
-
Cảm ơn.
-
(Vỗ tay)