WEBVTT 00:00:00.120 --> 00:00:07.950 [nhạc đếm ngược: 7, 6, 5, 4, 3, 2, 1] Internet: Gói tin, Định tuyến & Độ ổn định 00:00:07.950 --> 00:00:13.650 Xin chào, tôi là Lynn, kỹ sư phần mềm tại Spotify và tôi thừa nhận trước rằng 00:00:13.650 --> 00:00:18.970 tôi thường coi thường độ ổn định của Internet. Lượng thông tin khổng lồ 00:00:18.970 --> 00:00:23.170 có trên Internet thực sự đáng kinh ngạc. Nhưng làm thế nào để chắc chắn từng mẩu 00:00:23.170 --> 00:00:29.080 dữ liệu sẽ được truyền đến bạn? Nếu muốn phát nhạc trên Spotify, dường như 00:00:29.080 --> 00:00:33.989 máy tính nối thẳng đến máy chủ Spotify rồi Spotify gửi bài hát cho bạn qua 00:00:33.989 --> 00:00:39.410 đường dẫn trực tiếp, riêng biệt. Thực ra, Internet không hoạt động thế. Nếu Internet 00:00:39.410 --> 00:00:43.640 cấu thành từ kết nối riêng, trực tiếp thì sẽ chẳng thể nào hoạt động được 00:00:43.640 --> 00:00:48.050 khi hàng triệu người cùng tham gia. Nhất là khi không gì đảm bảo mọi đường dẫn 00:00:48.050 --> 00:00:53.350 và máy tính luôn hoạt động. Thay vào đó, dữ liệu sẽ di chuyển trên Internet kiểu 00:00:53.350 --> 00:01:01.210 gián tiếp hơn. Cách đây rất lâu, vào đầu những năm 1970, tôi và cộng sự Bob Kahn 00:01:01.210 --> 00:01:06.870 bắt đầu nghiên cứu thiết kế tiền thân của Internet ngày nay. Bob và tôi có nhiệm vụ 00:01:06.870 --> 00:01:14.790 và cơ hội thiết kế các giao thức và cấu trúc Internet. Rồi chúng tôi kiên trì 00:01:14.790 --> 00:01:20.000 tham gia phát triển và cải tiến Internet suốt từ thời đó cho đến tận 00:01:20.000 --> 00:01:25.500 bây giờ. Cách thức truyền tải thông tin từ máy tính này qua máy tính khác 00:01:25.500 --> 00:01:30.900 cũng rất thú vị, không cần theo đường dẫn cố định, thực ra đường dẫn có thể thay đổi 00:01:30.900 --> 00:01:36.100 ngay khi hai máy đang trao đổi với nhau. Thông tin trên Internet đi từ máy tính 00:01:36.100 --> 00:01:42.050 này sang máy tính kia dưới dạng gọi là gói tin và cách gói tin di chuyển từ nơi này 00:01:42.050 --> 00:01:46.360 đến nơi khác trên Internet cũng rất giống với cách chúng ta di chuyển giữa các nơi 00:01:46.360 --> 00:01:51.420 bằng xe hơi. Tùy thuộc vào mật độ giao thông hay tình trạng đường sá, bạn có thể chọn hoặc 00:01:51.420 --> 00:01:59.000 buộc phải chọn tuyến đường khác để đi đến nơi đó cho mỗi lần di chuyển. Và cũng giống 00:01:59.000 --> 00:02:03.980 việc bạn có thể vận chuyển mọi thứ đồ bên trong xe hơi, cũng có rất nhiều loại thông tin số có thể 00:02:03.980 --> 00:02:10.359 được gửi đi bằng gói tin IP tuy nhiên, cũng có vài hạn chế. Ví dụ giả sử bạn cần di chuyển 00:02:10.359 --> 00:02:14.200 tàu con thoi từ nơi xây dựng đến nơi phóng tàu. Tàu sẽ không 00:02:14.200 --> 00:02:18.780 để vừa trong xe tải nên cần phải tách nó ra thành nhiều phần và vận chuyển bằng cả đoàn 00:02:18.780 --> 00:02:23.099 xe tải. Các xe tải có thể đi các tuyến đường khác nhau và đến điểm đích vào những thời điểm 00:02:23.099 --> 00:02:28.109 khác nhau. Nhưng một khi tất cả đã đến đó, bạn có thể lắp ráp các phần thành 00:02:28.109 --> 00:02:34.329 con tàu con thoi hoàn chỉnh và có thể phóng nó lên. Thông tin trên Internet cũng hoạt động tương tự. 00:02:34.329 --> 00:02:40.090 Nếu bạn muốn gửi một bức ảnh dung lượng lớn cho bạn bè hoặc đăng lên trang web, 00:02:40.090 --> 00:02:44.819 bức ảnh đó có thể bao gồm cả hàng chục triệu bit 1 và 0, quá nặng để gửi cùng 00:02:44.819 --> 00:02:49.810 trong một gói tin. Vì đó là dữ liệu trên máy tính, máy tính gửi bức ảnh đó có thể nhanh chóng 00:02:49.810 --> 00:02:55.719 chia nhỏ nó ra thành hàng trăm hoặc thậm chí hàng nghìn phần nhỏ hơn gọi là gói tin. Không giống như xe hơi 00:02:55.719 --> 00:03:00.230 hay xe tải, những gói tin này không cần tài xế và chúng không tự chọn đường đi cho mình. Mỗi gói tin 00:03:00.230 --> 00:03:04.650 sẽ có địa chỉ Internet của nơi nó đi và nơi nó đến. Các máy tính đặc biệt 00:03:04.650 --> 00:03:09.430 trên Internet mang tên định tuyến đóng vai trò như viên quản lý giao thông, đảm bảo cho các gói tin di chuyển 00:03:09.430 --> 00:03:15.239 thông suốt trên mạng. Nếu một định tuyến bị nghẽn, các gói tin đơn lẻ có thể đi đường khác 00:03:15.239 --> 00:03:20.370 trên Internet và có thể sẽ đến điểm đích vào thời gian hơi lệch một chút 00:03:20.370 --> 00:03:26.569 hoặc thậm chí là bị hư. Cùng tìm hiểu xem nó diễn ra thế nào nào. Là một phần trong giao thức Internet, 00:03:26.569 --> 00:03:31.169 mỗi định tuyến sẽ theo dõi nhiều đường dẫn để gửi gói tin và chọn đường dẫn phù hợp 00:03:31.169 --> 00:03:37.079 rẻ nhất cho từng mẩu dữ liệu dựa trên địa chỉ IP của điểm đến cho gói tin. 00:03:37.079 --> 00:03:42.120 Rẻ nhất ở đây không phải chỉ chi phí mà là thời gian và các yếu tố phi kỹ thuật như chính trị 00:03:42.120 --> 00:03:47.499 và quan hệ giữa các công ty. Thông thường, định tuyến di chuyển tốt nhất của dữ liệu không nhất thiết 00:03:47.499 --> 00:03:53.150 phải là cái trực tiếp nhất. Có nhiều đường dẫn để lựa chọn cho phép mạng có thể chấp nhận sai sót. Có nghĩa là 00:03:53.150 --> 00:03:57.700 mạng có thể liên tục gửi gói tin ngay cả khi có lỗi nghiêm trọng ở đâu đó. 00:03:57.700 --> 00:04:04.849 Đây là cơ sở cho nguyên tắc chính của Internet: độ ổn định. Giờ, nếu bạn muốn 00:04:04.849 --> 00:04:09.349 yêu cầu một vài dữ liệu và không phải tất cả được truyền đến thì sao? Giả sử bạn muốn nghe nhạc. 00:04:09.349 --> 00:04:14.829 Làm sao bạn chắc chắn được 100% rằng toàn bộ dữ liệu sẽ được truyền đến để bài hát chạy thật mượt? 00:04:14.829 --> 00:04:21.440 Giới thiệu với bạn một người bạn mới, TCP (giao thức điều khiển truyền nhận). TCP quản lý việc gửi 00:04:21.440 --> 00:04:26.530 và nhận toàn bộ dữ liệu của bạn dưới dạng gói tin. Nó như kiểu dịch vụ gửi thư đảm bảo. 00:04:26.530 --> 00:04:31.669 Khi bạn yêu cầu một bài hát trên thiết bị của mình, Spotify sẽ gửi đi một bài hát đã được chia nhỏ thành nhiều gói tin. 00:04:31.669 --> 00:04:37.210 Khi các gói tin của bạn đến nơi, TCP tiến hoàn kiểm định toàn diện và gửi lại xác nhận 00:04:37.210 --> 00:04:42.840 đã nhận từng gói tin. Nếu tất cả các gói tin đều ở đó, TCP sẽ ký nhận giao hàng và thế là 00:04:42.840 --> 00:04:54.819 hoàn tất. (bài hát được phát) Nếu TCP thấy thiếu vài gói tin, nó sẽ không ký hoặc không thì 00:04:54.819 --> 00:04:59.930 bài hát của bạn sẽ nghe chẳng mượt hoặc có thể bị thiếu vài đoạn. Với mỗi gói tin bị thiếu hoặc 00:04:59.930 --> 00:05:05.930 chưa hoàn chỉnh, Spotify sẽ tiến hành gửi lại. Một khi TCP xác thực đã nhận được nhiều gói tin 00:05:05.930 --> 00:05:13.370 của bài hát yêu cầu, bài hát sẽ bắt đầu được phát. TCP và hệ thống 00:05:13.370 --> 00:05:19.220 định tuyến tuyệt vời ở chỗ chúng có thể mở rộng. Chúng có thể kết nối với 8 hoặc 8 tỷ thiết bị. Trên thực tế, 00:05:19.220 --> 00:05:23.449 nhờ những nguyên tắc chấp nhận sai sót và dự phòng này mà chúng ta thêm càng nhiều định tuyến 00:05:23.449 --> 00:05:28.069 thì Internet lại càng ổn định. Điều tuyệt vời nữa là chúng ta có thể phát triển và mở rộng Internet 00:05:28.069 --> 00:05:34.379 mà không làm gián đoạn dịch vụ của bất kỳ ai đang sử dụng. Internet cấu thành từ hàng trăm nghìn 00:05:34.379 --> 00:05:39.280 mạng lưới và hàng tỷ máy tính và thiết bị kết nối với nhau về mặt vật lý. 00:05:39.280 --> 00:05:44.360 Những hệ thống cấu thành nên Internet này kết nối và giao tiếp với nhau 00:05:44.360 --> 00:05:51.289 và phối hợp với nhau nhờ vào những tiêu chuẩn đã được thống nhất về cách thức gửi dữ liệu trên Internet. 00:05:51.289 --> 00:05:56.000 Thiết bị điện toán hay các định tuyến trên Internet giúp tất cả các gói tin tìm được đường 00:05:56.000 --> 00:06:02.789 đến nơi chúng sẽ được tập hợp lại theo thứ tự nếu cần. Việc này diễn ra hàng tỷ 00:06:02.789 --> 00:06:08.889 lần mỗi ngày bất kể khi bạn và mọi người đang gửi email, lướt web 00:06:08.889 --> 00:06:13.870 gọi video, dùng ứng dụng điện thoại hay khi các cảm biến hay thiết bị trên Internet 00:06:13.870 --> 00:06:14.910 giao tiếp với nhau.