Internet: Mã hóa và khóa công khai Xin chào, tôi là Mia Gil-Epner, tôi học chuyên ngành Khoa học máy tính tại UC Berkeley và tôi làm việc cho Bộ Quốc phòng, nơi tôi tìm cách đảm bảo thông tin được an toàn. Internet là một hệ thống mở và công khai. Tất cả chúng ta đều gửi và nhận thông tin thông qua các đường dẫn và kết nối chung. Nhưng mặc dù đó là một hệ thống mở, chúng ta vẫn trao đổi rất nhiều dữ liệu riêng tư. Những thứ như số thẻ tín dụng, thông tin ngân hàng, mật khẩu và email. Vậy tất cả những thứ riêng tư này được bảo mật như thế nào? Mọi loại dữ liệu đều có thể được bảo mật thông qua quá trình gọi là mã hóa, tức xáo trộn hoặc biến đổi thông điệp để ẩn nội dung gốc. Ngày nay, giải mã là quá trình sắp xếp lại để có thể đọc được thông điệp đó. Đây là ý tưởng cơ bản và con người đã làm việc này hàng thế kỷ qua. Một trong những phương pháp mã hóa phổ biến đầu tiên là Mật mã Caesar. Đặt theo tên của Julius Caesar, vị tướng người La Mã đã mã hóa các mệnh lệnh quân sự của mình để đảm bảo nếu bị can thiệp, quân địch cũng sẽ không đọc được những mệnh lệnh ấy. Mật mã Caesar là một Thuật toán thay thế từng chữ cái trong thông điệp gốc bằng một chữ cái cách đó một số chữ cái nhất định trong bảng chữ cái. Nếu đó là số chỉ có người gửi và người nhận được biết, số đó gọi là chìa khóa. Nó cho phép người đọc giải mã được thông điệp bí mật. Ví dụ: Nếu thông điệp gốc là "HELLO" thì khi dùng thuật toán Mật mã Caesar với chìa khóa là 5, thông điệp được mã hóa sẽ là thế này… Để giải mã thông điệp, người nhận đơn giản sẽ dùng chìa khóa để đảo ngược quá trình. Nhưng một vấn đề lớn của Mật mã Caesar chính là ai cũng có thể dễ dàng giải mã hoặc bẻ khóa thông điệp được mã hóa bằng cách thử mọi chìa khóa khả dụng và trong bảng chữ cái tiếng Anh, chỉ có 26 chữ cái, có nghĩa là bạn sẽ chỉ cần thử tối đa 26 chìa khóa để giải mã thông điệp. Ngày nay, việc thử 26 chìa khóa khả dụng chẳng mấy khó khăn, chỉ mất tối đa 1 hoặc 2 giờ. Vậy hãy làm cho việc này khó hơn. Thay vì dịch chuyển mọi chữ cái theo cùng một số, hãy dịch chuyển mỗi chữ cái theo một số khác nhau. Trong ví dụ này, chìa khóa mười chữ số cho biết số lượng vị trí mỗi chữ cái liên tiếp sẽ được thay đổi để mã hóa thông điệp dài hơn. Sẽ rất khó để đoán ra chìa khóa này. Sử dụng mã hóa 10 chữ số có thể tồn tại 10 tỷ kết quả là chìa khóa khả dụng. Rõ ràng, đó là điều mà không con người nào có thể giải mã vì sẽ mất hàng thế kỷ. Nhưng một máy tính bình thường ngày nay chỉ mất một vài giây để thử hết 10 tỷ khả năng. Vậy, trong thế giới hiện đại, nơi kẻ xấu được trang bị máy tính thay vì bút chì, làm sao để mã hóa thông điệp bảo mật tới mức việc bẻ khóa là quá khó? Giờ đây, quá khó nghĩa là có quá nhiều khả năng cần tính toán trong khoảng thời gian hợp lý. Các giao tiếp bảo mật ngày nay được mã hóa bằng các chìa khóa 256 bit. Điều đó đồng nghĩa với việc máy tính của kẻ xấu can thiệp thông điệp của bạn cần phải thử chừng này phương án khả thi… cho đến khi tìm ra được chìa khóa và bẻ khóa thông điệp. Ngay cả nếu bạn có 100.000 máy tính ưu việt và mỗi một máy có thể thử một triệu tỷ chìa khóa mỗi giây sẽ mất khoảng hàng nghìn nghìn tỷ năm mới thử hết các phương án, chỉ để bẻ khóa một thông điệp được bảo vệ bằng mã hóa 256 bit. Tất nhiên, vi mạch máy tính sẽ nhanh hơn hai lần và nhỏ hơn một nửa sau mỗi năm. Nếu tốc độ tiến triển theo cấp số nhân ấy cứ tiếp tục thì những bài toán hóc búa hôm nay sẽ có lời giải chỉ sau vài trăm năm nữa và 256 bit sẽ không còn đủ an toàn nữa. Trên thực tế, chúng ta đã phải tăng độ dài chìa khóa tiêu chuẩn để theo kịp tốc độ của máy tính. Tin vui là dùng chìa khóa dài hơn sẽ không làm việc mã hóa thông điệp thêm khó khăn nhưng nó sẽ tăng số lượng phán đoán phải đưa ra để bẻ khóa một mật mã lên theo cấp số nhân. Trường hợp người gửi và người nhận dùng chung một chìa khóa để xáo trộn và sắp xếp lại thông điệp được gọi là Mã hóa đối xứng. Giống như Mật mã Caesar, trong Mã hóa đối xứng, chìa khóa bí mật phải được bí mật thống nhất từ trước bởi hai người. Điều này rất tiện cho con người nhưng Internet là hệ thống mở và công khai nên hai máy tính không thể nào "gặp" riêng để thống nhất chìa khóa bí mật. Thay vào đó, máy tính dùng các chìa khóa Mã hóa bất đối xứng, một chìa khóa công khai có thể trao đổi với bất kỳ ai và một chìa khóa bảo mật giữ kín. Khóa công khai được dùng để mã hóa dữ liệu và ai cũng có thể dùng nó để tạo thông điệp bí mật nhưng bí mật chỉ có thể được giải mã bởi máy tính có quyền truy cập khóa bảo mật. Cơ chế hoạt động của nó liên quan đến vài phép toán mà chúng ta sẽ chưa tìm hiểu vào lúc này. Cứ nghĩ thế này nhé, tưởng tượng bạn có một hộp thư cá nhân, mọi người đều có thể bỏ thư vào nhưng họ cần có chìa khóa mới gửi được. Giờ bạn có thể tạo rất nhiều bản chìa khóa gửi thư và gửi đến cho bạn bè hoặc thậm chí là công khai luôn chìa khóa ấy. Bạn của bạn hoặc thậm chí người lạ có thể dùng chìa khóa công khai để tiếp cận hộp thư và bỏ thư vào khe. Nhưng chỉ có bạn mới có thể mở hộp thư bằng chìa khóa bảo mật và gom hết tất cả những lá thư bí mật bạn nhận được. Và bạn có thể gửi lại thư bảo mật cho bạn bè bằng cách dùng chìa khóa gửi công khai vào hộp thư của họ. Bằng cách này, người ta có thể trao đổi thông điệp bảo mật mà không cần phải thống nhất với nhau về chìa khóa bảo mật. Mã hóa bằng khóa công khai là nền tảng cho mọi trao đổi thông tin bảo mật trên mạng Internet mở. Bao gồm cả các Giao thức Internet phổ biến như SSL và TLS, giúp bảo vệ chúng ta khi chúng ta lướt web. Ngày nay, máy tính của bạn dùng khóa này bất cứ khi nào bạn nhìn thấy một cái khóa nhỏ hoặc các chữ cái https trên thanh địa chỉ trình duyệt của bạn. Điều này có nghĩa là máy tính của bạn đang dùng mã hóa khóa công khai để trao đổi thông tin an toàn với trang web bạn đang truy cập. Khi ngày càng có nhiều người truy cập Internet, sẽ ngày càng có nhiều dữ liệu riêng tư được trao đổi và nhu cầu bảo mật dữ liệu ấy sẽ ngày càng thêm quan trọng. Và khi máy tính ngày càng thêm nhanh, chúng ta sẽ phải phát triển nhiều cách thức mới để máy tính khó lòng phá vỡ các mã hóa. Đây là điều tôi đang làm và nó liên tục thay đổi.