1 00:00:00,000 --> 00:00:02,000 Thời gian trôi đi. 2 00:00:02,000 --> 00:00:04,000 Thật sự là gần 20 năm trước 3 00:00:04,000 --> 00:00:08,000 khi tôi muốn hệ thống lại cách chúng ta sử dụng thông tin, 4 00:00:08,000 --> 00:00:11,000 cách ta làm việc cùng nhau: tôi đã phát minh ra mạng toàn cầu. 5 00:00:11,000 --> 00:00:14,000 Bây giờ, đã là 20 năm, tại TED, 6 00:00:14,000 --> 00:00:18,000 tôi muốn nhờ sự giúp đỡ từ các bạn trong việc hệ thống mới. 7 00:00:19,000 --> 00:00:23,000 Quay ngược về năm 1989, 8 00:00:23,000 --> 00:00:26,000 tôi đã viết một bản ghi nhớ về hệ thống siêu văn bản toàn cầu. 9 00:00:26,000 --> 00:00:29,000 Thật sự thì không có ai làm gì với nó hết. 10 00:00:29,000 --> 00:00:33,000 Nhưng 18 tháng sau - đây là cách sự đổi mới diễn ra - 11 00:00:33,000 --> 00:00:37,000 18 tháng sau, ông chủ nói tôi có thể thực hiện nó ở bên ngoài, 12 00:00:37,000 --> 00:00:39,000 như là một loại dự án cho vui, 13 00:00:39,000 --> 00:00:41,000 khởi động loại máy tính mới. 14 00:00:41,000 --> 00:00:44,000 Và do đó ông ấy đã cho tôi thời gian để mã hóa nó. 15 00:00:44,000 --> 00:00:49,000 Vì thế về cơ bản là tôi phác thảo HTML nên trông như thế nào: 16 00:00:49,000 --> 00:00:52,000 giao thức siêu văn bản, HTTP; 17 00:00:52,000 --> 00:00:55,000 ý tưởng về URLs, những cái tên cho những thứ khác 18 00:00:55,000 --> 00:00:57,000 mà bắt nguồn từ HTTP. 19 00:00:57,000 --> 00:00:59,000 Tôi viết bảng mã và để ra chỗ khác. 20 00:00:59,000 --> 00:01:01,000 Tại sao tôi làm vậy? 21 00:01:01,000 --> 00:01:03,000 Cơ bản là thất bại. 22 00:01:03,000 --> 00:01:07,000 Tôi đã thất bại - tôi đã làm việc như một kĩ sư phần mềm 23 00:01:07,000 --> 00:01:09,000 trong phòng thí nghiệm khổng lồ và thú vị, 24 00:01:09,000 --> 00:01:11,000 rất nhiều người từ khắp nơi trên thế giới. 25 00:01:11,000 --> 00:01:14,000 Họ mang theo tất cả các loại máy tính khác nhau. 26 00:01:14,000 --> 00:01:17,000 Họ có tất cả các kiểu định dạng dữ liệu khác nhau, 27 00:01:17,000 --> 00:01:19,000 tất cả các kiểu, loại hệ thống tư liệu. 28 00:01:19,000 --> 00:01:22,000 Cho nên, trong sự đa dạng đó, 29 00:01:22,000 --> 00:01:24,000 nếu tôi muốn tìm ra cách xây dựng cái gì đó 30 00:01:24,000 --> 00:01:26,000 ngoài chỗ này một chút và chỗ kia một chút 31 00:01:26,000 --> 00:01:30,000 mọi thứ tôi nghiên cứu, tôi phải kết nối với vài thiết bị mới, 32 00:01:30,000 --> 00:01:32,000 tôi phải học vận hành chương trình mới, 33 00:01:32,000 --> 00:01:37,000 tôi sẽ tìm ra thông tin tôi cần trong định dang dữ liệu mới. 34 00:01:37,000 --> 00:01:39,000 Và tất cả những thứ đó không tương thích. 35 00:01:39,000 --> 00:01:41,000 Đó chỉ là thất bại. 36 00:01:41,000 --> 00:01:43,000 Thất bại là những tiềm tiềm năng chưa mở ra. 37 00:01:43,000 --> 00:01:46,000 Thực tế, trong tất cả những cái đĩa này đều có những tư liệu. 38 00:01:46,000 --> 00:01:49,000 Nên nếu bạn chỉ tưởng tượng ra tất cả chúng 39 00:01:49,000 --> 00:01:54,000 trở thành một cái gì đó lớn lao, hệ thống tư liệu ảo trên trời, 40 00:01:54,000 --> 00:01:56,000 ví như là trên Internet, 41 00:01:56,000 --> 00:01:58,000 thế thì cuộc sống sẽ dễ dàng hơn nhiều. 42 00:01:58,000 --> 00:02:02,000 Một khi bạn đã có ý tưởng thì nó như kiểu trêu ngươi bạn 43 00:02:02,000 --> 00:02:04,000 ngay cả nếu người ta không đọc ghi chép của bạn -- 44 00:02:04,000 --> 00:02:07,000 -- thật ra là, sau khi chết bản thảo của ông được tìm thấy. 45 00:02:07,000 --> 00:02:10,000 Ông ghi bằng bút chì ở trong góc, "không rõ ràng, nhưng thú vị" 46 00:02:10,000 --> 00:02:12,000 (Tiếng cười) 47 00:02:12,000 --> 00:02:16,000 Nhưng nói chung là khó - nó thật sự khó để giải thích 48 00:02:16,000 --> 00:02:18,000 mạng web trông như thế nào. 49 00:02:18,000 --> 00:02:20,000 Khó để giải thích rằng hồi đó đã rất khó. 50 00:02:20,000 --> 00:02:23,000 Nhưng sau đó - OK, khi TED bắt đầu, không hề có mạng 51 00:02:23,000 --> 00:02:26,000 vậy nên những thứ như "click" không hề có nghĩa tương tự. 52 00:02:26,000 --> 00:02:28,000 Tôi có thể cho xem một phần siêu văn bản, 53 00:02:28,000 --> 00:02:30,000 một trang có đường liên kết, 54 00:02:30,000 --> 00:02:34,000 và khi ta bấm vào đường truyền và bing - một trang siêu văn bản khác mở ra. 55 00:02:34,000 --> 00:02:36,000 Không ấn tượng gì. 56 00:02:36,000 --> 00:02:39,000 Bạn biết đó, ta có các thứ trong siêu văn bản trong CD_ROMs. 57 00:02:39,000 --> 00:02:42,000 Cái khó là khiến họ tưởng tượng: 58 00:02:42,000 --> 00:02:43,000 vậy, hãy tưởng tượng đường truyền có thể đi đến 59 00:02:46,000 --> 00:02:48,000 tới hầu hết các tư liệu có thể tưởng tượng. 60 00:02:49,000 --> 00:02:53,000 Đó là bước nhảy mà rất khó để thực hiện. 61 00:02:53,000 --> 00:02:55,000 Ờ thì, một số người đã làm. 62 00:02:55,000 --> 00:02:58,000 Vậy nên, rất khó để giải thích, nhưng có một chuyển biến cơ sở. 63 00:02:59,000 --> 00:03:03,000 Và đó là cái làm nó trở nên hay nhất. 64 00:03:03,000 --> 00:03:05,000 Đó là điều thú vị nhất, 65 00:03:05,000 --> 00:03:07,000 không là kỹ thuật, không là thứ người ta đã làm 66 00:03:07,000 --> 00:03:09,000 mà là xã hội, tinh thần của mọi người 67 00:03:09,000 --> 00:03:11,000 làm cùng nhau, gửi thư điện tử. 68 00:03:11,000 --> 00:03:13,000 Đó là cái giống như vậy. 69 00:03:13,000 --> 00:03:16,000 Bạn biết không? Nó buồn cười, nhưng giờ thì nó lại giống vậy. 70 00:03:16,000 --> 00:03:18,000 Tôi yêu cầu, nhiều hay ít, hãy đưa tư liệu 71 00:03:18,000 --> 00:03:21,000 Tôi nói, "Bạn có thể đưa các tư liệu lên trang web này không?" 72 00:03:21,000 --> 00:03:24,000 Và họ đã làm. 73 00:03:24,000 --> 00:03:25,000 Cảm ơn. 74 00:03:25,000 --> 00:03:27,000 Đó là một cú huých, đúng không? 75 00:03:27,000 --> 00:03:29,000 Ý tôi là, điều đó khá là thú vị 76 00:03:29,000 --> 00:03:31,000 vì ta khám phá các thứ trên trang web 77 00:03:31,000 --> 00:03:33,000 thật sự quá tuyệt vời. 78 00:03:33,000 --> 00:03:35,000 Hơn rất nhiều so với tưởng tượng ban đầu 79 00:03:35,000 --> 00:03:37,000 khi đặt địa chỉ web nhỏ ban đầu với nhau 80 00:03:37,000 --> 00:03:39,000 mà chúng ta bắt đầu với. 81 00:03:39,000 --> 00:03:42,000 Bây giờ, tôi muốn bạn đưa dữ liệu của bạn lên trang mạng. 82 00:03:42,000 --> 00:03:46,000 Hóa ra rằng vẫn có những tiềm năng khổng lồ chưa được mở khóa. 83 00:03:46,000 --> 00:03:48,000 Vẫn còn là sự thất bại lớn 84 00:03:48,000 --> 00:03:52,000 bởi vì ta không có dữ liệu trên trang mạng như là dữ liệu. 85 00:03:52,000 --> 00:03:54,000 Ý là sao, "dữ liệu"? Khác gì nhau - tư liệu, dữ liệu? 86 00:03:54,000 --> 00:03:57,000 Tư liệu bạn đọc, đúng không? 87 00:03:57,000 --> 00:04:00,000 Nhiều hay ít, bạn đọc nó, bạn có thể theo đường dẫn, thế thôi. 88 00:04:00,000 --> 00:04:02,000 Dữ liệu-bạn có thể làm tất cả với máy tính 89 00:04:02,000 --> 00:04:08,000 Ai đã ở đây hoặc cách khác xem bài nói của Hans Rosling? 90 00:04:08,000 --> 00:04:12,000 Một trong những người tuyệt với - vâng nhiều người đã xem nó - 91 00:04:12,000 --> 00:04:14,000 một trong những bài nói tuyệt với của TED. 92 00:04:14,000 --> 00:04:16,000 Hans đưa ra bài thuyết trình 93 00:04:16,000 --> 00:04:21,000 trong đó ông đã chỉ ra, cho những đất nước khác nhau, trong màu sắc khác nhau - 94 00:04:21,000 --> 00:04:24,000 ông cho thấy mức độ thu nhập trên một trục 95 00:04:24,000 --> 00:04:27,000 ông cho thấy số tử vong trẻ sơ sinh, và biến đổi theo thời gian 96 00:04:27,000 --> 00:04:31,000 Do đó, ông đã lấy dữ liệu này và làm bài thuyết trình 97 00:04:31,000 --> 00:04:34,000 mà đã phá hủy rất nhiều chuyện hoang đường 98 00:04:34,000 --> 00:04:38,000 về kinh tế trong thế giới đang phát triển. 99 00:04:38,000 --> 00:04:40,000 Ông thiết lập một trình chiếu nhỏ như vậy. 100 00:04:40,000 --> 00:04:42,000 Nó có chứa ngầm tất cả các dữ liệu 101 00:04:42,000 --> 00:04:45,000 Dữ liệu là màu nâu, hình hộp và nhàm chán 102 00:04:45,000 --> 00:04:47,000 và đó là thứ ta nghĩ về nó, đúng không? 103 00:04:47,000 --> 00:04:50,000 Vì dữ liệu không thể tự dùng một cách tự nhiên 104 00:04:50,000 --> 00:04:54,000 nhưng thực tế, dữ liệu chứa một lượng lớn những gì xảy ra trong cuộc sống chúng ta 105 00:04:54,000 --> 00:04:57,000 và nó như thế là vì ai đó lấy dữ liệu và làm cái gì đó với nó. 106 00:04:57,000 --> 00:04:59,000 Trường hợp này, Hans đặt dữ liệu với nhau 107 00:04:59,000 --> 00:05:04,000 ông đã tìm từ tất cả trang mạng và các thứ của nước Mỹ. 108 00:05:04,000 --> 00:05:06,000 Ông đã đặt chúng với nhau, 109 00:05:06,000 --> 00:05:09,000 kết hợp nó với vài thứ thú vị hơn bản gốc 110 00:05:09,000 --> 00:05:14,000 và sau đó ông đưa nó vào phần mềm này, 111 00:05:14,000 --> 00:05:16,000 mà tôi nghĩ con trai ông đã phát triển nó, 112 00:05:16,000 --> 00:05:19,000 và tạo ra bài thuyết trình tuyệt vời này. 113 00:05:19,000 --> 00:05:21,000 Và Hans đã tạo một điểm nhấn 114 00:05:21,000 --> 00:05:25,000 khi nói, "Nhìn xem, có nhiều dữ liệu thật sự rất quan trọng". 115 00:05:25,000 --> 00:05:28,000 Và tôi hạnh phúc khi thấy điều đó tại bữa tiệc tối qua 116 00:05:28,000 --> 00:05:32,000 khi ông ấy vẫn nói, rất mạnh mẽ, "Có nhiều dữ liệu thật sự rất quan trọng". 117 00:05:32,000 --> 00:05:34,000 Vậy tôi muốn bây giờ chúng ta hãy nghĩ 118 00:05:34,000 --> 00:05:38,000 không chỉ hai mảnh dữ liệu được kết nối, hay sáu giống như ông ấy đã làm, 119 00:05:38,000 --> 00:05:43,000 nhưng tôi muốn nghĩ về một thế giới mà ở đó mọi người đều đưa dữ liệu lên mạng 120 00:05:43,000 --> 00:05:45,000 mọi thứ tưởng tượng ban đầu đều trên mạng 121 00:05:45,000 --> 00:05:47,000 và sau đó gọi là dữ liệu liên kết. 122 00:05:47,000 --> 00:05:49,000 Kỹ thuật là dữ liệu liên kết, rất đơn giản. 123 00:05:49,000 --> 00:05:53,000 Nếu bạn muốn đưa cái gì lên mạng thì có ba quy tắc: 124 00:05:53,000 --> 00:05:56,000 đầu tiên là tên HTTP - 125 00:05:56,000 --> 00:05:58,000 những thứ này bắt đầu với "http:" - 126 00:05:58,000 --> 00:06:02,000 bây giờ chúng tôi dùng chúng không chỉ cho tư liệu, 127 00:06:02,000 --> 00:06:04,000 chúng tôi dùng cho các thứ tư liệu đề cập. 128 00:06:04,000 --> 00:06:06,000 Chúng tôi dùng cho con người, địa điểm, 129 00:06:06,000 --> 00:06:10,000 chúng tôi dùng nó cho sản phẩm của bạn, dùng cho các sự kiện. 130 00:06:10,000 --> 00:06:14,000 Tất cả loại khái niệm, họ có tên bắt đầu với HTTP. 131 00:06:14,000 --> 00:06:19,000 Quy tắc thứ hai, nếu bạn lấy một trong số các tên HTTP và bạn tra cứu nó 132 00:06:19,000 --> 00:06:21,000 và tôi làm về mạng với nó và lấy dữ liệu 133 00:06:21,000 --> 00:06:23,000 sử dụng giao thức HTTP từ mạng, 134 00:06:23,000 --> 00:06:26,000 tôi sẽ lấy về một vài dữ liệu với định dạng chuẩn 135 00:06:26,000 --> 00:06:31,000 là loại dữ liệu có ích mà vài người muốn biết 136 00:06:31,000 --> 00:06:33,000 về điều đó, về sự kiện đó. 137 00:06:33,000 --> 00:06:35,000 Ai ở sự kiện? Bất cứ gì về người đó, 138 00:06:35,000 --> 00:06:37,000 họ sinh ra ở đâu, những thứ như thế. 139 00:06:37,000 --> 00:06:39,000 Quy tắc hai tôi lấy về thông tin quan trọng 140 00:06:39,000 --> 00:06:43,000 Quy tắc ba là khi tôi lấy lại thông tin đó 141 00:06:43,000 --> 00:06:46,000 nó không chỉ là chiều cao và cân nặng và nơi sinh của ai đó, 142 00:06:46,000 --> 00:06:48,000 nó có cả những mối quan hệ. 143 00:06:48,000 --> 00:06:50,000 Dữ liệu là những nối quan hệ. 144 00:06:50,000 --> 00:06:52,000 Thú vị là, dữ liệu là các mối quan hệ. 145 00:06:52,000 --> 00:06:56,000 Người này sinh ở Berlin; Berlin ở Đức. 146 00:06:56,000 --> 00:06:59,000 Khi có các mối quan hệ, bất cứ khi nào diễn tả một mối quan hệ 147 00:06:59,000 --> 00:07:02,000 khi đó những thứ khác có liên quan 148 00:07:02,000 --> 00:07:06,000 được đưa ra là một trong các tên bắt đầu với HTTP 149 00:07:06,000 --> 00:07:08,000 Do đó, tôi có thể tiếp tục tra cứu cái đó. 150 00:07:08,000 --> 00:07:11,000 Vậy tôi tìm một người - sau đó tôi có thể tìm thành phố sinh ra 151 00:07:11,000 --> 00:07:14,000 sau đó tôi có thể tìm nó thuộc vùng nào, trong thị trấn nào, 152 00:07:14,000 --> 00:07:17,000 dân số của nó, vân vân. 153 00:07:17,000 --> 00:07:19,000 Do đó tôi có thể duyệt những thứ đó. 154 00:07:19,000 --> 00:07:21,000 Vậy nó thật sự là như thế. 155 00:07:21,000 --> 00:07:23,000 Đó là dữ liệu kết nối. 156 00:07:23,000 --> 00:07:26,000 Một vài năm trước tôi viết một bài báo tựa đề "Dữ liệu liên kết" 157 00:07:26,000 --> 00:07:30,000 và sớm sau đó, vài thứ bắt đầu xuất hiện. 158 00:07:30,000 --> 00:07:34,000 Ý tưởng về dữ liệu liên kết mà chúng tôi có rất rất nhiều 159 00:07:34,000 --> 00:07:36,000 về những cái hộp của Hans 160 00:07:36,000 --> 00:07:38,000 và có rất rất nhiều những thứ được nảy mầm. 161 00:07:38,000 --> 00:07:41,000 Nó không chỉ là toàn bộ nhiều cái cây khác. 162 00:07:41,000 --> 00:07:43,000 Nó không chỉ là rễ nuôi lớn cái cây, 163 00:07:43,000 --> 00:07:46,000 nhưng với mỗi cái cây, bất kể là gì - 164 00:07:46,000 --> 00:07:49,000 bài thuyết trình, phân tích, ai đó tìm các mẫu trong dữ liệu - 165 00:07:49,000 --> 00:07:52,000 họ sẽ thấy tất cả các dữ liệu 166 00:07:52,000 --> 00:07:54,000 và họ sẽ thấy nó liên kết với nhau, 167 00:07:54,000 --> 00:07:56,000 và điều thật sự quan trọng về dữ liệu 168 00:07:56,000 --> 00:07:58,000 là càng kết nối nhiều thứ, nó càng mạnh hơn. 169 00:07:58,000 --> 00:08:00,000 Vậy, dữ liệu liên kết. 170 00:08:00,000 --> 00:08:02,000 Sự lan truyền đã vươn ra ngoài. 171 00:08:02,000 --> 00:08:06,000 Và, cũng khá sớm Chris Bizer tại trường Đại học Freie ở Berlin 172 00:08:06,000 --> 00:08:08,000 trong số người đầu tiên đưa lên thứ thú vị, 173 00:08:08,000 --> 00:08:10,000 ông để ý rằng Wikipedia - 174 00:08:10,000 --> 00:08:13,000 các bạn biết Wikipedia, bách khoa trực tuyến duy nhất 175 00:08:13,000 --> 00:08:15,000 với rất rất nhiều tư liệu thú vị trong đó. 176 00:08:17,000 --> 00:08:19,000 Trong tư liệu, có hình vuông, hình hộp nhỏ. 177 00:08:19,000 --> 00:08:22,000 Và trong hầu hết các hộp thông tin, là dữ liệu. 178 00:08:22,000 --> 00:08:26,000 Nên ông ấy viết chương trình lấy dữ liệu, trích nó từ Wikipedia, 179 00:08:26,000 --> 00:08:28,000 và bỏ vào một phần nhỏ dữ liệu liên kết 180 00:08:28,000 --> 00:08:31,000 trên trang mạng, mà ông gọi là dbpedia. 181 00:08:31,000 --> 00:08:35,000 Dbpedia thể hiện bằng khung màu xanh ở giữa trình chiếu này 182 00:08:35,000 --> 00:08:37,000 và nếu bạn thật sự tìm kiếm về Berlin, 183 00:08:37,000 --> 00:08:39,000 bạn sẽ thấy rằng có các vùng thông tin khác 184 00:08:39,000 --> 00:08:42,000 mà cũng có những thứ về Berlin, và chúng được liên kết với nhau. 185 00:08:42,000 --> 00:08:45,000 Vậy nếu bạn kéo dữ liệu về Berlin từ Dbpedia, 186 00:08:45,000 --> 00:08:47,000 bạn kết thúc bằng việc kéo cả các thứ khác 187 00:08:47,000 --> 00:08:50,000 Và thứ đang tồn tại bắt đầu phát triển. 188 00:08:50,000 --> 00:08:52,000 Đó cũng lại là cấp cơ sở. 189 00:08:52,000 --> 00:08:55,000 Hãy nghĩ một chút về dữ liệu. 190 00:08:55,000 --> 00:08:58,000 Dữ liệu đến từ thực tế dưới rất rất nhiều hình thức khác nhau. 191 00:08:58,000 --> 00:09:01,000 Nghĩ về sự đa dạng của trang mạng. Nó thật sự rất quan trọng 192 00:09:01,000 --> 00:09:04,000 rằng trang mạng cho phép bạn đưa tất cả loại dữ liệu lên đó. 193 00:09:04,000 --> 00:09:06,000 Nó với dữ liệu, Tôi có thể nói về mọi loại. 194 00:09:07,000 --> 00:09:11,000 Ta có thể nói về dữ liệu chính phủ, dữ liệu doanh nghiệp rất quan trọng, 195 00:09:11,000 --> 00:09:14,000 có dữ liệu khoa học, có dữ liệu cá nhân, 196 00:09:14,000 --> 00:09:16,000 có dữ liệu thời tiết, dữ liệu về sự kiện, 197 00:09:16,000 --> 00:09:20,000 có dữ liệu về các bài nói, và có tin tức và có tất cả các thứ. 198 00:09:20,000 --> 00:09:23,000 Tôi chỉ định đề cập một vài trong số đó 199 00:09:23,000 --> 00:09:25,000 để bạn hiểu được sự đa dạng của nó, 200 00:09:25,000 --> 00:09:29,000 cũng để bạn thấy tiềm năng chưa mở khóa nhiều như thế nào. 201 00:09:29,000 --> 00:09:31,000 Bắt đầu với dữ liệu chính phủ. 202 00:09:31,000 --> 00:09:33,000 Barack Obama đã nói trong bài diễn văn, 203 00:09:33,000 --> 00:09:38,000 rằng ông ấy - dữ liệu về chính phủ Mỹ sẽ có trên mạng 204 00:09:38,000 --> 00:09:40,000 dưới định dạng có thể tiếp cận. 205 00:09:40,000 --> 00:09:42,000 Hy vọng họ đưa nó lên như dữ liệu liên kết 206 00:09:42,000 --> 00:09:44,000 Điều đó là quan trọng. Tại sao quan trọng? 207 00:09:44,000 --> 00:09:47,000 Không chỉ vì minh bạch, minh bạch trong chính phủ là quan trọng 208 00:09:47,000 --> 00:09:50,000 nhưng dữ liệu này - đây là dữ liêu từ tất cả cơ quan chính phủ 209 00:09:50,000 --> 00:09:55,000 Nghĩ xem dữ liệu đó có giá bao nhiêu, nghĩ về cuộc sống ở Mỹ như thế nào. 210 00:09:55,000 --> 00:09:57,000 Nó thật ra rất hũu dụng. Nó có giá trị. 211 00:09:57,000 --> 00:09:59,000 Tôi có thể dùng nó trong công ty tôi. 212 00:09:59,000 --> 00:10:01,000 Tôi có thể dùng nó như đứa trẻ làm bài tập 213 00:10:01,000 --> 00:10:04,000 Vậy ta đang nói về việc tạo ra địa điểm, cho thế giới tốt hơn 214 00:10:04,000 --> 00:10:06,000 bằng cách tạo ra dữ liệu có sẵn. 215 00:10:06,000 --> 00:10:10,000 Thực tế nếu bạn có trách nhiệm - nếu bạn biết về vài dữ liệu 216 00:10:10,000 --> 00:10:12,000 trong cơ quan chính phủ, bạn thường thấy 217 00:10:12,000 --> 00:10:15,000 những người đó, họ rất muốn giữ kín nó - 218 00:10:15,000 --> 00:10:18,000 Hans gọi đó là ôm chặt cơ sở dữ liệu. 219 00:10:18,000 --> 00:10:20,000 Bạn ôm cơ sở dữ liệu, bạn không muốn bỏ ra 220 00:10:20,000 --> 00:10:22,000 tới khi bạn tạo một trang mạng đẹp cho nó. 221 00:10:22,000 --> 00:10:24,000 Ừ thì, tôi muốn đề nghị thay vào đó - 222 00:10:24,000 --> 00:10:26,000 vâng, làm một trang mạng đẹp, 223 00:10:26,000 --> 00:10:28,000 tôi là ai mà nói là đừng làm một trang đẹp? 224 00:10:28,000 --> 00:10:31,000 Hãy làm một trang mạng đẹp, nhưng đầu tiên 225 00:10:31,000 --> 00:10:34,000 hãy cho chúng tôi dữ liệu không giả tạo, 226 00:10:34,000 --> 00:10:36,000 chúng tôi muốn dữ liệu. 227 00:10:36,000 --> 00:10:38,000 Chúng tôi muốn dữ liệu không giả tạo. 228 00:10:38,000 --> 00:10:41,000 Bây giờ, chúng ta phải yêu cầu dữ liệu thô. 229 00:10:41,000 --> 00:10:43,000 Và tôi sẽ yêu cầu bạn thực hành, được chứ? 230 00:10:43,000 --> 00:10:44,000 Hãy nói từ "thô"? 231 00:10:44,000 --> 00:10:45,000 Khán giả: Thô. 232 00:10:45,000 --> 00:10:46,000 Hãy nói "dữ liệu" 233 00:10:46,000 --> 00:10:47,000 Khán giả: Dữ liệu. 234 00:10:47,000 --> 00:10:48,000 L: Hãy nói "bây giờ" 235 00:10:48,000 --> 00:10:49,000 Khán giả: Bây giờ! 236 00:10:49,000 --> 00:10:51,000 Được rồi, "dữ liệu thô ngay bây giờ"! 237 00:10:51,000 --> 00:10:53,000 Khán giả: Dữ liệu thô ngay bây giờ! 238 00:10:53,000 --> 00:10:57,000 Thực hiện như vậy. Điều đó là quan trọng vì bạn không biết có bao nhiêu lý do đâu. 239 00:10:57,000 --> 00:10:59,000 Mọi người tìm cách để giữ dữ liệu của họ 240 00:10:59,000 --> 00:11:03,000 và không đưa nó cho bạn, cho dù bạn trả tiền cho nó như một người đóng thuế. 241 00:11:03,000 --> 00:11:05,000 Và đó không chỉ ở Mỹ. Mà toàn thế giới. 242 00:11:05,000 --> 00:11:08,000 Và dĩ nhiên không chỉ chính phủ- mà cũng có cả các doanh nghiệp. 243 00:11:08,000 --> 00:11:11,000 Vì vậy tôi chỉ đề cập một vài suy nghĩ về dữ liệu. 244 00:11:11,000 --> 00:11:16,000 Bầy giờ chúng ta ở tại TED, và ta lúc nào cũng tỉnh táo 245 00:11:16,000 --> 00:11:21,000 với những thử thách khổng lồ trong xã hội loài nguời ngày nay 246 00:11:21,000 --> 00:11:24,000 chữa trị ung thư, hiểu bộ não cho bệnh Alzheimer, 247 00:11:24,000 --> 00:11:27,000 Hiểu nền kinh tế để làm cho nó ổn định hơn, 248 00:11:27,000 --> 00:11:29,000 Hiểu cách thế giới hoạt động. 249 00:11:29,000 --> 00:11:31,000 Giải quyết việc này là nhà khoa học 250 00:11:31,000 --> 00:11:33,000 Họ có nửa ý tưởng trong đầu, 251 00:11:33,000 --> 00:11:36,000 Họ cố giao tiếp những thứ đó qua mạng. 252 00:11:36,000 --> 00:11:39,000 Nhưng bây giờ có rất nhiều loại tri thức về loài người 253 00:11:39,000 --> 00:11:42,000 trong các cơ sở dữ liệu, thường nằm trong máy tính, 254 00:11:42,000 --> 00:11:45,000 và thật ra, là không được chia sẻ. 255 00:11:45,000 --> 00:11:48,000 Thực tế, tôi sẽ chỉ đi vào một chuyện, 256 00:11:48,000 --> 00:11:50,000 ví dụ, bệnh Alzhelmer. 257 00:11:50,000 --> 00:11:53,000 Sự phát minh ra thuốc - toàn bộ dữ liệu liên kết sẽ xuất hiện 258 00:11:53,000 --> 00:11:55,000 vì nhà khoa học lĩnh vực này nhận ra rằng 259 00:11:55,000 --> 00:11:58,000 đây là cách tuyệt vời để ra khỏi những kho chứa, 260 00:11:58,000 --> 00:12:02,000 vì họ có dữ liệu gen trong một cơ sở dữ liệu 261 00:12:02,000 --> 00:12:05,000 trong một tòa nhà, và họ có dữ liệu về chất hữu cơ ở chỗ khác. 262 00:12:05,000 --> 00:12:08,000 Ngày nay, họ đang gắn bó với - dữ liệu liên kết - 263 00:12:08,000 --> 00:12:11,000 và bây giờ họ có thể hỏi những câu, mà bạn có thể sẽ không hỏi, 264 00:12:11,000 --> 00:12:13,000 tôi không hỏi - họ hỏi. 265 00:12:13,000 --> 00:12:15,000 Loại protein nào tham gia vào việc truyền tín hiệu 266 00:12:15,000 --> 00:12:17,000 và cũng liên quan với tế bào thần kinh hình tháp? 267 00:12:17,000 --> 00:12:20,000 Bạn tiếp nhận thật nhiều và bạn đưa nó lên Google. 268 00:12:20,000 --> 00:12:23,000 Dĩ nhiên, không có trang mạng nào trả lời câu hỏi đó 269 00:12:23,000 --> 00:12:25,000 vì không có ai đã trả lời nó trước đây. 270 00:12:25,000 --> 00:12:27,000 Bạn có 223,000 kết quả - 271 00:12:27,000 --> 00:12:29,000 không kết quả nào dùng được 272 00:12:29,000 --> 00:12:32,000 Bạn hỏi dữ liệu liên kết - đang được đặt cùng nhau 273 00:12:32,000 --> 00:12:36,000 32 kết quả, mỗi một đó là một chất đạm có các thuộc tính 274 00:12:36,000 --> 00:12:38,000 và bạn có thể nhìn thấy nó. 275 00:12:38,000 --> 00:12:41,000 Sức mạnh để hỏi những câu hỏi đó như một nhà khoa học - 276 00:12:41,000 --> 00:12:43,000 câu hỏi vượt qua các quy tắc khác nhau 277 00:12:43,000 --> 00:12:46,000 đó thật sự là sự thay đổi hoàn toàn. 278 00:12:46,000 --> 00:12:48,000 Điều đó rất rất quan trọng. 279 00:12:48,000 --> 00:12:50,000 Lúc này, nhà khoa học hoàn toàn lúng túng - 280 00:12:50,000 --> 00:12:55,000 sức mạnh của dữ liệu mà các nhà khoa học khác thu thập đc đã bị khóa 281 00:12:55,000 --> 00:12:58,000 và ta cần mở khóa nó để giải quyết những vấn đề khổng lồ. 282 00:12:58,000 --> 00:13:02,000 Bây giờ, nếu tiếp tục thế này, bạn sẽ nghĩ tất cả dữ liệu đến từ tổ chức khổng lồ 283 00:13:02,000 --> 00:13:05,000 và không có gì liên quan tới bạn. 284 00:13:05,000 --> 00:13:07,000 Nhưng điều đó không đúng. 285 00:13:07,000 --> 00:13:09,000 Thực tế, dữ liệu là về cuộc sống. 286 00:13:09,000 --> 00:13:12,000 Bạn chỉ - đăng nhập vào địa chỉ mạng xã hội, 287 00:13:12,000 --> 00:13:14,000 cái bạn thích, nói, "Đây là bạn tôi" 288 00:13:14,000 --> 00:13:17,000 Bing! Mối quan hệ. Dữ liệu. 289 00:13:17,000 --> 00:13:20,000 Bạn nói, "Tấm ảnh này, nó mô tả người này". 290 00:13:20,000 --> 00:13:23,000 Bìng! Đó là dữ liệu. Dữ liệu, dữ liệu, dữ liệu. 291 00:13:23,000 --> 00:13:25,000 Mỗi lần bạn làm gì đó với mạng xã hội, 292 00:13:25,000 --> 00:13:29,000 trang mạng xã hội lấy dữ liệu và dùng nó - tái tạo nó 293 00:13:29,000 --> 00:13:33,000 và dùng nó để làm cho cuộc sống con người thú vị hơn. 294 00:13:33,000 --> 00:13:35,000 Nhưng, khi tới vị trí dữ liệu kết nối khác 295 00:13:35,000 --> 00:13:38,000 và lần này hãy nói về du lịch, 296 00:13:38,000 --> 00:13:41,000 và nói, "Tôi muốn gửi tấm ảnh này đến mọi người trong nhóm" 297 00:13:41,000 --> 00:13:43,000 bạn không thể vượt qua bức tường, 298 00:13:43,000 --> 00:13:45,000 Nhà Kinh tế viết về nó, nhiều người bàn tán 299 00:13:45,000 --> 00:13:46,000 sự thất bại to lớn. 300 00:13:46,000 --> 00:13:48,000 Cách đạp đổ các kho chứa là để đạt đồng bộ 301 00:13:48,000 --> 00:13:50,000 giữa các địa chỉ mạng xã hội. 302 00:13:50,000 --> 00:13:52,000 Ta cần làm vậy với dữ liệu liên kết. 303 00:13:52,000 --> 00:13:55,000 Loại dữ liệu cuối cùng tôi nói đến, có lẽ thú vị nhất. 304 00:13:55,000 --> 00:13:58,000 Trước khi tôi xuống đây, tôi đã tìm trên OpenStreetMap 305 00:13:58,000 --> 00:14:00,000 OpenStreetMap là bản đồ, cũng là Wiki. 306 00:14:00,000 --> 00:14:03,000 Phóng to và cái hình vuông đó là nhà hát mà ta đang ngồi 307 00:14:03,000 --> 00:14:05,000 Nhà hát Terrace. Không có tên trên đó. 308 00:14:05,000 --> 00:14:07,000 Tôi vào phần biên tập, chọn nhà hát, 309 00:14:07,000 --> 00:14:12,000 Tôi có thể thêm cái tên vào bên dưới, và lưu nó lại. 310 00:14:12,000 --> 00:14:15,000 Và bây giờ nếu bạn vào OpenStreetMap.org, 311 00:14:15,000 --> 00:14:18,000 Khi tìm nơi này, bạn sẽ thấy Nhà hát Terrace có tên ở đó 312 00:14:18,000 --> 00:14:20,000 Tôi đã làm điều đó. Là tôi! 313 00:14:20,000 --> 00:14:22,000 Tôi làm thế với bản đồ. Vừa làm đó! 314 00:14:22,000 --> 00:14:24,000 Tôi đưa nó lên đó. Bạn biết gì không? 315 00:14:24,000 --> 00:14:27,000 Nếu bản đồ phố xá là về mọi nguời làm bổn phận của họ 316 00:14:27,000 --> 00:14:30,000 và nó tạo ra một nguồn không thể tin được 317 00:14:30,000 --> 00:14:33,000 vì mọi người khác làm việc của họ. 318 00:14:33,000 --> 00:14:36,000 Và đó là những gì về dữ liệu liên kết. 319 00:14:36,000 --> 00:14:39,000 Nó nói về mọi người đang làm phần của họ 320 00:14:39,000 --> 00:14:42,000 để làm ra một ít, và tất cả chúng đều kết nối với nhau. 321 00:14:42,000 --> 00:14:45,000 Đó là cách dữ liệu liên kết làm việc. 322 00:14:45,000 --> 00:14:49,000 Bạn làm bổn phận của mình. Những người khác làm của họ. 323 00:14:49,000 --> 00:14:53,000 Bạn có thể không tự có nhiều dữ liệu để đưa lên đây 324 00:14:53,000 --> 00:14:56,000 nhưng bạn biết yêu cầu nó. 325 00:14:56,000 --> 00:14:58,000 Và chúng ta sẽ tập luyện điều đó. 326 00:14:58,000 --> 00:15:02,000 Vậy, dữ liệu liên kết - nó khổng lồ. 327 00:15:02,000 --> 00:15:05,000 Tôi chỉ nói một số ít rất nhỏ trong các thứ 328 00:15:05,000 --> 00:15:07,000 Có dữ liệu ở mỗi khía cạnh cuộc sống, 329 00:15:07,000 --> 00:15:10,000 mỗi khía cạnh của công việc và sở thích, 330 00:15:10,000 --> 00:15:13,000 và nó không chỉ là con số của nơi có dữ liệu, 331 00:15:13,000 --> 00:15:16,000 mà nó kết nối với nhau. 332 00:15:16,000 --> 00:15:19,000 Và khi bạn kết nối dữ liệu với nhau, bạn có sức mạnh 333 00:15:19,000 --> 00:15:22,000 theo cách không chỉ xảy ra với trang mạng, mà còn với tư liệu. 334 00:15:22,000 --> 00:15:26,000 Bạn sẽ có sức mạnh khổng lồ nhờ nó. 335 00:15:26,000 --> 00:15:29,000 Vậy, bây giờ chúng ta đang ở tại sân khấu 336 00:15:29,000 --> 00:15:33,000 nơi mà ta phải làm điều đó - những nguời nghĩ đó là ý hay. 337 00:15:33,000 --> 00:15:36,000 Tất cả mọi người - tôi nghĩ rất nhiều người ở TED làm nhiều thứ 338 00:15:36,000 --> 00:15:38,000 mặc dù không có sự hoàn vốn ngay tức khắc 339 00:15:38,000 --> 00:15:41,000 vì nó sẽ chỉ thật sự chi trả khi mọi người khác hoàn thành nó - 340 00:15:41,000 --> 00:15:45,000 họ sẽ làm bởi vì họ là kiểu người làm những thứ 341 00:15:45,000 --> 00:15:48,000 mà chỉ tốt nếu người khác đã làm nó. 342 00:15:48,000 --> 00:15:50,000 Nên nó được gọi là dữ liệu liên kết 343 00:15:50,000 --> 00:15:52,000 Tôi muốn bạn làm điều đó 344 00:15:52,000 --> 00:15:54,000 Tôi muốn bạn yêu cầu nó. 345 00:15:54,000 --> 00:15:56,000 Và tôi nghĩ nó là ý tường toàn cầu 346 00:15:56,000 --> 00:15:57,000 Cảm ơn. 347 00:15:57,000 --> 00:16:00,000 (Vỗ tay)