WEBVTT 00:00:00.800 --> 00:00:03.924 Tôi là trưởng nhóm nghiên cứu Trí tuệ nhân tạo tại Google; 00:00:03.948 --> 00:00:08.598 nói cách khác, đó là những quy tắc công nghệ để máy tính và thiết bị 00:00:08.622 --> 00:00:11.041 làm được những gì mà não người làm được. 00:00:11.439 --> 00:00:14.538 Và việc này làm chúng tôi thấy hứng thú với não người thật 00:00:14.562 --> 00:00:15.951 cũng như khoa học thần kinh, 00:00:15.951 --> 00:00:20.047 và đặc biệt là với những gì mà não của chúng ta có thể 00:00:20.071 --> 00:00:24.113 thực hiện tốt hơn nhiều so với máy tính. NOTE Paragraph 00:00:25.209 --> 00:00:28.818 Về lịch sử, một trong số đó chính là khả năng tri nhận, 00:00:28.842 --> 00:00:31.881 là quá trình biến đổi những gì ở thế giới bên ngoài 00:00:31.905 --> 00:00:33.489 như âm thanh và hình ảnh 00:00:33.513 --> 00:00:35.691 thành dạng khái niệm trong tư duy. 00:00:36.235 --> 00:00:38.752 Khái niệm rất quan trọng với não, 00:00:38.776 --> 00:00:41.240 cũng khá hữu ích trên máy tính. 00:00:41.636 --> 00:00:44.986 Ví dụ, những thuật toán tri giác cho máy mà nhóm tôi viết ra, 00:00:45.010 --> 00:00:48.884 chính là thứ giúp bạn tìm được hình ảnh trên Google Photo, 00:00:48.908 --> 00:00:50.305 căn cứ vào trong hình có gì. 00:00:51.594 --> 00:00:55.087 Đối lập với tri nhận là sáng tạo: 00:00:55.111 --> 00:00:58.031 là biến khái niệm đã biết thành sản phẩm của thế giới. 00:00:58.068 --> 00:01:02.098 Trong năm qua, khả năng tri nhận nhân tạo mà nhóm tôi nghiên cứu 00:01:02.098 --> 00:01:06.611 đã bất ngờ kết nối được với khả năng sáng tạo nhân tạo 00:01:06.635 --> 00:01:08.555 và nghệ thuật nhân tạo. NOTE Paragraph 00:01:08.565 --> 00:01:11.840 Tôi nghĩ Michlangelo có một hiểu biết sâu sắc 00:01:11.864 --> 00:01:15.520 về mối quan hệ song đôi giữa tri nhận và sáng tạo. 00:01:16.023 --> 00:01:18.029 Đây là câu trích dẫn ưa thích của ông: 00:01:18.053 --> 00:01:21.376 "Tảng đá nào cũng có linh hồn là bức tượng, 00:01:22.036 --> 00:01:25.038 và một thợ điêu khắc có nhiệm vụ khám phá ra nó." 00:01:26.029 --> 00:01:29.245 Nên tôi nghĩ điều Michelangelo muốn nói đến chính là 00:01:29.269 --> 00:01:32.449 chúng ta sáng tạo được nhờ tri nhận, 00:01:32.473 --> 00:01:35.496 và bản thân sự tri nhận đó là hành động tưởng tượng 00:01:35.520 --> 00:01:37.981 và là nguyên liệu cho sáng tạo. NOTE Paragraph 00:01:38.691 --> 00:01:42.616 Cơ quan thực hiện mọi quá trình tri nhận và sáng tạo diễn ra, 00:01:42.640 --> 00:01:44.228 tất nhiên, là bộ não. 00:01:45.089 --> 00:01:47.634 Tôi sẽ bắt đầu bằng một chút lịch sử 00:01:47.658 --> 00:01:49.960 nói về hiểu biết của chúng ta về não. 00:01:50.496 --> 00:01:52.942 Nói thế này, khác hẳn trái tim hay nội tạng, 00:01:52.966 --> 00:01:56.110 bạn thật sự không nói được gì nhiều chỉ bằng việc quan sát bộ não, 00:01:56.134 --> 00:01:57.896 nhất là khi nhìn bằng mắt thường. 00:01:57.923 --> 00:02:00.399 Những bác sĩ phẫu thuật đầu tiên quan sát bộ não 00:02:00.423 --> 00:02:04.230 đã đặt tên cho cấu trúc bề mặt của nó mọi cái tên thú vị, 00:02:04.254 --> 00:02:06.687 chẳng hạn như thuỳ hải mã, nghĩa là "con tôm nhỏ". 00:02:06.711 --> 00:02:09.475 Nhưng tất nhiên cái tên đó cũng không nói được gì nhiều 00:02:09.499 --> 00:02:11.817 về những gì đang thực sự diễn ra bên trong. NOTE Paragraph 00:02:12.780 --> 00:02:16.393 Tôi nghĩ người đầu tiên phát triển hiểu biết thật sự 00:02:16.417 --> 00:02:18.347 về những gì đang diễn ra trong não bộ 00:02:18.371 --> 00:02:22.291 là nhà giải phẫu thần kinh vĩ đại người Tây Ban Nha, Santiago Ramón y Cajal, 00:02:22.315 --> 00:02:23.859 vào thế kỷ 19, 00:02:23.883 --> 00:02:27.638 ông là người dùng kính hiển vi và chất nhuộm màu đặc biệt 00:02:27.662 --> 00:02:31.832 có thể điền vào hay minh hoạ kĩ lưỡng từng tế bào trong não 00:02:31.856 --> 00:02:33.864 với độ tương phản cao, 00:02:33.888 --> 00:02:37.042 để bắt đầu hiểu được hình thái của chúng. 00:02:37.972 --> 00:02:40.863 Và đây là kiểu bản vẽ mà ông diễn tả các nơ-ron thần kinh 00:02:40.887 --> 00:02:42.096 vào thế kỷ 19. NOTE Paragraph 00:02:42.120 --> 00:02:44.004 Đây là ảnh minh hoạ cho não chim. 00:02:44.028 --> 00:02:47.085 Như bạn thấy, có cực kỳ nhiều loại tế bào khác nhau, 00:02:47.109 --> 00:02:50.544 mà ngay cả thuyết tế bào cũng còn khá lạ lẫm với chúng. 00:02:50.568 --> 00:02:51.846 Và những cấu trúc này, 00:02:51.870 --> 00:02:54.129 những tế bào này có nhiều nhánh, 00:02:54.153 --> 00:02:56.761 các nhánh có thể truyền đi rất rất xa 00:02:56.785 --> 00:02:58.751 lúc bấy giờ, điều này nghe thật khó tin. 00:02:58.779 --> 00:03:01.682 Tất nhiên khi đó nhìn chúng như những sợi dây điện. 00:03:01.706 --> 00:03:05.163 Những người ở thế kỷ 19 sẽ thấy chúng y như vậy; 00:03:05.187 --> 00:03:09.501 cuộc cách mạng về lưới điện và điện khi ấy đang diễn ra. 00:03:09.964 --> 00:03:11.142 Nhưng bằng nhiều cách, 00:03:11.166 --> 00:03:14.479 những bản vẽ giải phẫu kích thước µm của Ramón y Cajal's, như ảnh này, 00:03:14.503 --> 00:03:16.835 vẫn còn vài điểm chưa vượt trội. NOTE Paragraph 00:03:16.859 --> 00:03:18.713 Hơn một thế kỷ sau, giờ đây chúng ta 00:03:18.737 --> 00:03:21.562 vẫn đang nỗ lực hoàn thành điều mà Ramón y Cajal đã bắt đầu. 00:03:21.586 --> 00:03:24.720 Đây là những dữ liệu thô từ các cộng tác viên 00:03:24.744 --> 00:03:27.625 làm việc tại Viện nghiên cứu khoa học thần kinh Max Planck. 00:03:27.649 --> 00:03:29.439 Cộng tác viên của chúng tôi đã vẽ 00:03:29.463 --> 00:03:34.464 từng mẩu nhỏ của mô não. 00:03:34.488 --> 00:03:37.814 Toàn bộ hình mẫu ở đây có kích thước thật chỉ 1 mm khối, 00:03:37.838 --> 00:03:40.459 và ở đây, các bạn đang xem một mẩu rất rất nhỏ của nó. 00:03:40.483 --> 00:03:42.829 Đường kẻ bên trái khoảng 1 micrômét (µm). 00:03:42.853 --> 00:03:45.262 Những cấu trúc bạn đang thấy là ti tể 00:03:45.286 --> 00:03:47.330 có kích thước cấp độ vi khuẩn. 00:03:47.354 --> 00:03:48.975 Và đây là những lát cắt liên tiếp 00:03:48.975 --> 00:03:52.077 của khối mô vô cùng nhỏ này. 00:03:52.101 --> 00:03:54.504 Chỉ với mục đích đối chiếu, 00:03:54.528 --> 00:03:58.074 thì đường kính trung bình của 1 sợi tóc khoảng 100 µm. 00:03:58.074 --> 00:04:00.618 Do đó, ta đang nhìn thấy một thứ nhỏ hơn rất rất nhiều 00:04:00.642 --> 00:04:02.040 so với một sợi tóc. NOTE Paragraph 00:04:02.064 --> 00:04:06.095 Và từ hàng loạt những lát cắt có kích thước hiển vi của hạt electron, 00:04:06.119 --> 00:04:11.127 ta có thể tạo ra bản vẽ 3D để dựng lại cấu trúc nơron như thế này. 00:04:11.151 --> 00:04:14.308 Vậy nên những bản vẽ này cũng giống với bản của Ramón y Cajal. 00:04:14.332 --> 00:04:15.824 Chỉ có vài nơron sáng lên thôi, 00:04:15.848 --> 00:04:18.629 vì nếu không, chúng ta sẽ không thấy được gì hết. 00:04:18.653 --> 00:04:19.965 Quá nhiều nơron chen chúc, 00:04:19.989 --> 00:04:21.319 cấu tạo vô cùng phức tạp, 00:04:21.343 --> 00:04:24.517 tất cả các sợi nơron đều nối với nhau, tạo ra mạng lưới chằng chịt. NOTE Paragraph 00:04:25.293 --> 00:04:28.217 Do đó, Ramón y Cajal có hơi cấp tiến so với thời của mình, 00:04:28.217 --> 00:04:30.676 và những hiểu biết về bộ não 00:04:30.700 --> 00:04:32.971 dần phát triển trong những thập kỷ tiếp theo. 00:04:33.455 --> 00:04:36.308 Nhưng chúng ta vốn biết nơron sử dụng điện để hoạt động, 00:04:36.332 --> 00:04:39.268 và cho đến Thế chiến II, công nghệ mới đủ tiên tiến 00:04:39.292 --> 00:04:42.098 để tiến hành các thí nghiệm điện thật sự trên nơron thật 00:04:42.122 --> 00:04:44.228 để hiểu rõ hơn cách chúng vận hành. 00:04:44.631 --> 00:04:48.987 Đây cũng là thời điểm máy vi tính được phát minh, 00:04:49.011 --> 00:04:52.111 chủ yếu dựa trên ý tưởng mô phỏng lại bộ não 00:04:52.135 --> 00:04:55.004 nó là một "cái máy thông minh", như cách mà Alan Turing gọi, 00:04:55.004 --> 00:04:57.765 một trong những người tiên phong cho khoa học máy tính. NOTE Paragraph 00:04:57.923 --> 00:05:02.555 Warren McCulloch và Walter Pitts quan sát bản vẽ của Ramón y Cajal 00:05:02.579 --> 00:05:03.896 mô tả vỏ não thị giác, 00:05:03.920 --> 00:05:05.482 như bạn đang thấy. 00:05:05.506 --> 00:05:09.948 Đây là phần vỏ não phụ trách xử lý hình ảnh được mắt ghi nhận. 00:05:10.424 --> 00:05:13.932 Với McCulloch và Pitts, trông nó như một sơ đồ mạch điện. 00:05:14.353 --> 00:05:18.188 Nên có rất nhiều chi tiết trong bản vẽ của hai người 00:05:18.212 --> 00:05:19.564 không chính xác cho lắm. 00:05:19.588 --> 00:05:20.757 Nhưng về ý tưởng cốt lõi 00:05:20.757 --> 00:05:24.909 xem vỏ não thị giác như vi mạch điện tử 00:05:24.909 --> 00:05:27.609 truyền thông tin từ mạch này qua mạch khác theo tầng, 00:05:27.633 --> 00:05:29.235 lại hoàn toàn chính xác. NOTE Paragraph 00:05:29.259 --> 00:05:31.609 Chúng ta hãy bàn một chút 00:05:31.633 --> 00:05:35.665 sẽ cần những gì để quá trình xử lý thông tin hình ảnh diễn ra. 00:05:36.228 --> 00:05:38.969 Bước căn bản chính trong quá trình tri nhận 00:05:38.993 --> 00:05:43.187 là nhìn vào ảnh, như hình này, và nói: 00:05:43.211 --> 00:05:44.387 "Đó là một con chim" 00:05:44.411 --> 00:05:47.285 là chuyện vô cùng đơn giản mà não ta thực hiện. 00:05:47.309 --> 00:05:50.730 Nhưng bạn nên hiểu rằng để máy tính hiểu được hình ảnh, 00:05:50.754 --> 00:05:53.841 vài năm trước vẫn còn là chuyện bất khả thi. 00:05:53.865 --> 00:05:55.781 Với hệ thống máy tính thế hệ đầu 00:05:55.805 --> 00:05:58.312 thì việc này không dễ thực hiện. NOTE Paragraph 00:05:59.366 --> 00:06:01.918 Vậy những gì diễn ra giữa các điểm ảnh, 00:06:01.942 --> 00:06:05.970 giữa hình vẽ một con chim, và từ "con chim", 00:06:05.994 --> 00:06:08.808 về bản chất là một tập hợp nơron với các nơron nối với nhau 00:06:08.832 --> 00:06:09.987 thành mạng lưới nơron, 00:06:10.011 --> 00:06:11.048 như sơ đồ tôi vẽ đây. 00:06:11.048 --> 00:06:14.500 Mạng lưới này có thể mang tính sinh học, nằm trong hai vỏ não thị giác, 00:06:14.500 --> 00:06:16.716 hay ngày nay, chúng ta có thể 00:06:16.740 --> 00:06:19.194 mô phỏng những mạng lưới như vậy trên máy tính. 00:06:19.834 --> 00:06:22.187 Và tôi sẽ cho bạn xem nó trông thế nào. NOTE Paragraph 00:06:22.211 --> 00:06:25.627 Bạn có thể xem các điểm ảnh là lớp nơron thứ nhất, 00:06:25.651 --> 00:06:27.890 và thật ra, đó là cách mà mắt hoạt động 00:06:27.914 --> 00:06:29.577 đó là các nơron trong võng mạc. 00:06:29.601 --> 00:06:31.351 Tiếp theo chúng chạy thẳng ra trước 00:06:31.351 --> 00:06:34.528 đi lần lượt vào trong các lớp nơron sau, từng lớp một, 00:06:34.552 --> 00:06:37.585 tất cả nối lại bằng các sợi xi-náp có khối lượng khác nhau. 00:06:37.609 --> 00:06:38.944 Trạng thái của mạng lưới này 00:06:38.968 --> 00:06:42.252 đặc trưng bởi độ bền của những sợi xi-náp. 00:06:42.276 --> 00:06:45.564 Chúng khắc hoạ đặc tính giống hệ mạch điện tử của mạng lưới này. 00:06:45.588 --> 00:06:47.058 Và cuối cùng, 00:06:47.082 --> 00:06:49.609 bạn có một sợi nơron hay một bó nhỏ gồm các sợi nơron 00:06:49.609 --> 00:06:51.200 bật sáng và hô lên "con chim". NOTE Paragraph 00:06:51.824 --> 00:06:54.956 Giờ tôi sẽ biểu diễn ba thành phần: 00:06:54.980 --> 00:06:59.676 điểm ảnh ở đầu vào, sợi tiếp hợp xi-náp trong mạng lưới nơron, 00:06:59.700 --> 00:07:01.285 và con chim ở đầu ra 00:07:01.309 --> 00:07:04.366 là ba biến số: X, W và Y. 00:07:04.853 --> 00:07:06.664 Biến X có thể có hàng triệu giá trị. 00:07:06.688 --> 00:07:08.641 nghĩa là hàng triệu điểm ảnh trong hình. 00:07:08.665 --> 00:07:11.111 Biến W có hàng tỉ hay cả ngàn tỉ giá trị, 00:07:11.135 --> 00:07:14.556 tương ứng với khối lượng khác nhau của toàn bộ xi-náp trong mạng nơron. 00:07:14.580 --> 00:07:16.455 Và với biến Y, chỉ có 4 giá trị, 00:07:16.479 --> 00:07:18.337 là số giá trị mà mạng nơron xuất ra. 00:07:18.361 --> 00:07:20.110 "B-i-r-d" có 4 kí tự đúng không? 00:07:21.088 --> 00:07:24.514 Giờ thì hãy giả sử ta có biểu thức đơn giản này: 00:07:24.538 --> 00:07:26.701 X "x" W =Y. 00:07:26.725 --> 00:07:28.761 Tôi đặt dấu nhân trong ngoặc kép 00:07:28.785 --> 00:07:31.065 vì đó mới là những gì đang thực sự diễn ra, 00:07:31.089 --> 00:07:34.135 tất nhiên rất phức tạp, gồm hàng loạt các bài toán được giải. NOTE Paragraph 00:07:35.172 --> 00:07:36.393 Đây là một biểu thức. 00:07:36.417 --> 00:07:38.089 Gồm có 3 biến số. 00:07:38.113 --> 00:07:40.839 Và ta đều biết nếu như ta có 1 đẳng thức, 00:07:40.863 --> 00:07:44.505 bạn sẽ tìm được 1 biến khi biết 2 biến còn lại. 00:07:45.158 --> 00:07:48.538 Nên vấn đề mắc phải 00:07:48.562 --> 00:07:51.435 để nhận ra đó là hình vẽ một con chim 00:07:51.459 --> 00:07:52.733 chính là đây: 00:07:52.757 --> 00:07:56.216 đây là nơi Y là biến chưa biết, và W, X là 2 biến đã biết. 00:07:56.240 --> 00:07:58.699 Bạn biết được mạng nơron, bạn biết số điểm ảnh. 00:07:58.723 --> 00:08:02.050 Như bạn thấy, chuyện này khá dễ giải quyết. 00:08:02.074 --> 00:08:04.260 Chỉ cần lấy tích của 2 x 3 là xong. 00:08:04.862 --> 00:08:07.105 Tôi sẽ cho bạn xem một mạng lưới neuron nhân tạo 00:08:07.105 --> 00:08:09.305 mà nhóm tôi dựng mới đây, dựng lại hệt như vậy. NOTE Paragraph 00:08:09.634 --> 00:08:12.494 Mạng lưới này đang chạy trên một chiếc điện thoại di động, 00:08:12.518 --> 00:08:15.831 và tất nhiên, khả năng tuyệt vời vốn có của chiếc điện thoại 00:08:15.855 --> 00:08:19.323 chính là nó có thể thực hiện hàng tỉ, hàng ngàn tỉ thao tác 00:08:19.347 --> 00:08:20.595 mỗi giây. 00:08:20.619 --> 00:08:22.514 Bạn đang nhìn thấy một chiếc điện thoại 00:08:22.514 --> 00:08:25.805 đang nhìn lần lượt những bức ảnh có hình chim, 00:08:25.829 --> 00:08:28.544 và nó không hô lên "Đúng rồi, đây là chim," 00:08:28.568 --> 00:08:31.979 mà lại xác định mỗi loài chim với một mạng lưới tương tự như bộ não. 00:08:32.890 --> 00:08:34.716 Nên trong bức tranh đó, 00:08:34.740 --> 00:08:38.542 X và W là hai đại lượng đã có, và Y là ẩn. 00:08:38.566 --> 00:08:41.344 Tôi đang chú thích cho một phần rất hóc búa, dĩ nhiên rồi, 00:08:41.344 --> 00:08:44.843 để hiểu làm cách nào mà ta tìm được biến W. 00:08:44.843 --> 00:08:47.054 não chúng ta thật sự làm được chuyện này sao? 00:08:47.054 --> 00:08:49.978 Nhưng chúng ta chưa học về những mô hình thế này bao giờ mà? NOTE Paragraph 00:08:49.978 --> 00:08:52.651 Nên bước này chúng ta học cách giải ra W, 00:08:52.675 --> 00:08:55.322 nếu ta làm giả bài này với cách giải của đơn thức 00:08:55.346 --> 00:08:57.346 bằng cách xem chúng là các con số, 00:08:57.370 --> 00:08:59.847 chúng ta biết cách giải đúng: 6 = 2 x W, 00:08:59.917 --> 00:09:03.393 thì lấy 6 chia 2 là tiêu đời. 00:09:04.001 --> 00:09:06.221 Vấn đề chính là phép chia này đây. 00:09:06.823 --> 00:09:07.974 Vậy, phép chia này... 00:09:07.998 --> 00:09:11.119 Chúng ta sử dụng phép chia vì nó nó nghịch đảo với phép nhân, 00:09:11.143 --> 00:09:12.583 nhưng tôi đã nói vừa nãy, 00:09:12.607 --> 00:09:15.176 Phép nhân này thật ra không chỉ là một phép nhân. 00:09:15.176 --> 00:09:18.406 Đây là một phép tính cực kỳ phức tạp, vô cùng lắt léo; 00:09:18.430 --> 00:09:20.134 và không có phép tính nghịch đảo. 00:09:20.158 --> 00:09:23.308 Nên chúng ta phải tìm cách khác để giải biểu thức này 00:09:23.332 --> 00:09:25.356 mà không được dùng phép chia. 00:09:25.380 --> 00:09:28.603 Trong khi cách giải lại không rối rắm. 00:09:28.603 --> 00:09:30.908 Đừng sợ, hãy dùng một mẹo nhỏ trong môn đại số, 00:09:30.908 --> 00:09:33.348 hãy chuyển 6 qua vế bên phải. 00:09:33.372 --> 00:09:35.368 Giờ thì chúng ta vẫn đang dùng phép nhân. 00:09:35.675 --> 00:09:39.255 Và số 0 đó, hãy coi nó là lỗi đi. 00:09:39.279 --> 00:09:41.794 Có nghĩa là, nếu ta giải đúng được W, 00:09:41.818 --> 00:09:43.474 thì lỗi sẽ bằng 0. 00:09:43.498 --> 00:09:45.436 Và nếu ta chưa giải đúng được, 00:09:45.460 --> 00:09:47.209 thì lỗi đó sẽ lớn hơn 0 nhiều. NOTE Paragraph 00:09:47.233 --> 00:09:50.599 Nên giờ ta chỉ có thể đoán sao để lỗi có giá trị nhỏ nhất, 00:09:50.623 --> 00:09:53.310 và đó là chuyện mà máy vi tính rất thành thạo. 00:09:53.334 --> 00:09:54.927 Vậy bạn vừa mới đoán: 00:09:54.951 --> 00:09:56.107 giả sử W = 0 ? 00:09:56.131 --> 00:09:57.371 Vậy thì số lỗi = 6. 00:09:57.395 --> 00:09:58.825 W = 4 thì sao? Vậy lỗi = 4. 00:09:58.825 --> 00:10:01.282 Rồi sau đó máy tính sẽ như chơi trò bịt mắt bắt dê, 00:10:01.282 --> 00:10:03.623 và đuổi theo lỗi cho đến khi nó gần chạm tới 0. 00:10:03.647 --> 00:10:06.151 Nó sẽ tiến dần về giá trị đúng của W. 00:10:06.151 --> 00:10:10.701 Thật ra sẽ không có giá trị hoàn toàn chính xác, nhưng sau mười mấy lần, 00:10:10.725 --> 00:10:15.349 chúng ta có được W = 2.999, là giá trị gần đúng nhất. 00:10:16.302 --> 00:10:18.116 Và đây chính là quá trình học tập. NOTE Paragraph 00:10:18.140 --> 00:10:20.870 Hãy nhớ điều đang diễn ra từ nãy đến giờ 00:10:20.894 --> 00:10:25.272 là cách thức chúng ta sử dụng rất nhiều giá trị đã biết của X và Y 00:10:25.296 --> 00:10:28.750 để tìm ra mối quan tâm của ta là W, thông qua quá trình lặp đi lặp lại. 00:10:28.774 --> 00:10:32.330 Đó cũng chính là phương pháp học tập của chúng ta. 00:10:32.354 --> 00:10:35.504 Khi còn nhỏ người lớn cho ta xem rất nhiều hình ảnh và nói 00:10:35.504 --> 00:10:37.991 "đây là con chim", "còn đây không phải". 00:10:37.991 --> 00:10:40.162 Qua thời gian, và qua việc học đi học lại, 00:10:40.162 --> 00:10:43.214 chúng ta giải được W, là giải được các kết nối nơron. NOTE Paragraph 00:10:43.460 --> 00:10:47.546 Nên giờ đây chúng ta đem X và W đã cố định để tìm Y; 00:10:47.570 --> 00:10:49.417 đó là sự tri nhận nhanh hằng ngày. 00:10:49.441 --> 00:10:51.334 Chúng ta hiểu rằng mình có thể giải W, 00:10:51.334 --> 00:10:53.131 đó là học tập, khó hơn nhiều, 00:10:53.155 --> 00:10:55.140 vì chúng ta phải giảm thiểu lỗi sai, 00:10:55.164 --> 00:10:57.281 bằng cách sử dụng phương pháp luyện tập. NOTE Paragraph 00:10:57.281 --> 00:11:00.162 Khoảng 1 năm trước,thành viên Alex Mordvinstev của nhóm tôi, 00:11:00.162 --> 00:11:03.636 quyết định làm thí nghiệm xem chuyện gì xảy ra nếu ta cố tìm X, 00:11:03.660 --> 00:11:05.697 khi đã biết 1 giá trị W và 1 giá trị Y. 00:11:06.124 --> 00:11:07.275 Nói cách khác, 00:11:07.299 --> 00:11:08.651 bạn biết đó là con chim, 00:11:08.675 --> 00:11:11.978 và bạn cũng biết là hệ thần kinh của mình được dạy, đó là chim 00:11:12.002 --> 00:11:14.346 vậy thì bức hình một con chim là gì? 00:11:15.034 --> 00:11:20.058 Hoá ra khi sử dụng 1 quá trình giống như quá trình giảm thiểu lỗi, 00:11:20.082 --> 00:11:23.092 có thể giảm thiểu sai sót của mạng lưới 00:11:23.092 --> 00:11:26.104 được dạy để nhận ra chim, và kết quả... 00:11:30.400 --> 00:11:32.495 là một bức hình gồm nhiều loài chim. 00:11:32.814 --> 00:11:36.551 Đây là bức hình có nhiều loài chim được tạo ra hoàn toàn từ 1 hệ thần kinh 00:11:36.575 --> 00:11:38.401 đã được dạy để nhận ra các loài chim, 00:11:38.425 --> 00:11:41.963 chỉ bằng việc tìm X thay vì tìm Y, 00:11:41.987 --> 00:11:43.655 và làm đi làm lại quá trình đó. NOTE Paragraph 00:11:43.732 --> 00:11:45.579 Đây là một ví dụ khác. 00:11:45.603 --> 00:11:49.040 Đây là tác phẩm của thành viên Mike Tyka của nhóm tôi, 00:11:49.064 --> 00:11:51.372 cậu ấy gọi nó là "Đoàn thú tuần hành". 00:11:51.396 --> 00:11:54.272 Nó làm tôi nhớ tới các tác phẩm của William Kentridge, 00:11:54.296 --> 00:11:56.785 khi ông cứ phác ra các hình vẽ, rồi bôi, 00:11:56.809 --> 00:11:58.269 rồi vẽ phác lại, rồi lại bôi, 00:11:58.293 --> 00:12:00.111 và tạo ra một kiểu phim theo cách này. 00:12:00.141 --> 00:12:01.186 Trong tranh này, 00:12:01.196 --> 00:12:04.011 Mike đã đa dạng hoá biến Y thành nhiều loài thú khác nhau, 00:12:04.011 --> 00:12:06.953 trong một mạng lưới được thiết kế để nhận biết và phân biệt 00:12:06.953 --> 00:12:08.537 mỗi loài có nhiều loài khác nữa. 00:12:08.537 --> 00:12:12.182 Và giờ bạn có được một bức như tranh biến hình động vật của hoạ sĩ Escher. NOTE Paragraph 00:12:14.221 --> 00:12:18.835 Ở đây cậu ấy và Alex cùng thử 00:12:18.859 --> 00:12:21.618 giảm không gian của biến Y còn 2 chiều, 00:12:21.642 --> 00:12:25.080 để tạo ra một bản đồ có mặt mọi thứ khác nhau 00:12:25.104 --> 00:12:26.823 mà mạng lưới này nhận ra. 00:12:26.847 --> 00:12:28.870 Khi thực hiện tổng hợp như vậy 00:12:28.894 --> 00:12:31.276 hay tạo ra hình ảnh trên toàn bộ bề mặt, 00:12:31.300 --> 00:12:34.246 đa dạng giá trị Y trên mặt phẳng, bạn có thể tạo ra 00:12:34.246 --> 00:12:37.311 một loại bản đồ có tất cả những thứ mà mạng lưới nhận biết được. 00:12:37.335 --> 00:12:40.660 Tất cả các loài thú đều ở ngay đây; "armadillo" ngay vị trí trung tâm. NOTE Paragraph 00:12:40.919 --> 00:12:43.398 Bạn có thể tạo bản đồ cho những mạng lưới khác nữa. 00:12:43.422 --> 00:12:46.296 Đây là mạng lưới được thiết kế để nhận diện các khuôn mặt, 00:12:46.320 --> 00:12:48.320 để phân biệt mặt người này, người kia. 00:12:48.344 --> 00:12:51.593 Còn đây, chúng ta đang chọn Y có giá trị là "tôi", 00:12:51.617 --> 00:12:53.592 là thông số giúp nhận ra gương mặt tôi. 00:12:53.592 --> 00:12:54.922 Và khi dùng Y để tìm X, 00:12:54.946 --> 00:12:57.564 nó cho ra một thứ rất điên, 00:12:57.588 --> 00:13:02.016 đại loại như tranh lập thể, siêu thực vẽ tôi đang phê thuốc 00:13:02.040 --> 00:13:03.846 từ nhiều góc nhìn khác nhau cùng lúc. 00:13:03.870 --> 00:13:06.604 Sở dĩ nó như nhiều góc nhìn khác nhau cùng một lúc là vì 00:13:06.628 --> 00:13:10.049 mạng lưới được thiết kế để tránh sự mơ hồ khi nhận diện 00:13:10.049 --> 00:13:13.125 một gương mặt khi nhìn ở góc này so với khi nhìn ở góc khác, 00:13:13.125 --> 00:13:16.215 hay trong điều kiện chiếu sáng khác nhau. 00:13:16.239 --> 00:13:18.324 Nên khi bạn thực hiện việc tái cấu tạo, 00:13:18.348 --> 00:13:20.652 nếu không sử dụng kiểu hình ảnh hướng dẫn 00:13:20.676 --> 00:13:22.307 hay thông số hướng dẫn để làm mẫu, 00:13:22.307 --> 00:13:25.676 thì bạn sản phẩm nhận được là một bức hình rối mắt ở mọi góc nhìn, 00:13:25.700 --> 00:13:27.068 vì mọi thứ trông rất mờ ảo. 00:13:27.786 --> 00:13:32.009 Đây là kết quả khi Ales sử dụng mặt mình làm hình ảnh mẫu 00:13:32.033 --> 00:13:35.354 trong quá trình tối ưu hoá mạng lưới để tái hiện gương mặt tôi. 00:13:36.284 --> 00:13:38.612 Nên có thể bạn thấy nó không hoàn hảo. 00:13:38.636 --> 00:13:40.510 Vẫn còn khá nhiều chuyện để làm 00:13:40.534 --> 00:13:43.007 để cải thiện tối đa quá trình tái cấu trúc. 00:13:43.007 --> 00:13:45.838 Nhưng giờ thì có được bức tranh một gương mặt liền mạch 00:13:45.862 --> 00:13:47.876 sử dụng mặt tôi làm hình hướng dẫn. NOTE Paragraph 00:13:48.892 --> 00:13:51.393 Bạn không cần phải bắt đầu vẽ với tờ giấy trắng 00:13:51.417 --> 00:13:52.573 hay tiếng ồn trắng. 00:13:52.597 --> 00:13:53.901 Khi tìm X, 00:13:53.925 --> 00:13:57.814 bạn có thể bắt đầu với X, bản thân nó đã là một hình. 00:13:57.838 --> 00:14:00.394 Đó là điều mà tôi minh hoạ hôm nay. 00:14:00.418 --> 00:14:04.540 Hệ thần kinh nhân tạo này được thiết kế để phân loại 00:14:04.564 --> 00:14:07.683 tất cả vật thể khác nhau, như công trình nhân tạo, động vật... 00:14:07.707 --> 00:14:10.300 Ở đây, đầu tiên ta có bức tranh với những đám mây, 00:14:10.324 --> 00:14:11.995 và khi ta tối ưu hoá hình này, 00:14:12.019 --> 00:14:16.505 về căn bản, hệ thần kinh nhân tạo đang xác định mấy đám mây có hình gì. 00:14:16.931 --> 00:14:19.251 Và khi nhìn bức hình này càng lâu, 00:14:19.275 --> 00:14:22.028 bạn càng thấy được nhiều thứ tạo ra từ những đám mây đó. 00:14:23.004 --> 00:14:26.379 Bạn cũng có thể dùng hệ nhận diện khuôn mặt để tạo ảo giác cho nền này, 00:14:26.403 --> 00:14:28.215 và sẽ có được một sản phẩm điên khùng. NOTE Paragraph 00:14:28.239 --> 00:14:29.389 (Cười) NOTE Paragraph 00:14:30.401 --> 00:14:33.145 Hay như vầy, Mike có vài thí nghiệm nữa 00:14:33.169 --> 00:14:37.074 cậu ấy lấy hình đám mây, 00:14:37.098 --> 00:14:40.605 tạo hiệu ứng ảo, phóng đại, rồi chỉnh ảo, phóng, rồi chỉnh, rồi lại phóng. 00:14:40.629 --> 00:14:41.780 Và bằng cách này, 00:14:41.804 --> 00:14:45.479 tôi nghĩ bạn sẽ nhận được một hệ thần kinh đang thấy lâng lâng, 00:14:45.503 --> 00:14:49.183 hay là sự kết hợp tự do, 00:14:49.207 --> 00:14:52.094 trong đó bạn sẽ thấy mạng lưới ấy đang ăn cái đuôi của mình. 00:14:52.094 --> 00:14:54.879 Nên mỗi hình đều là ảnh nền cho 00:14:54.903 --> 00:14:56.324 hình "tôi sẽ thấy gì kế tiếp? 00:14:56.348 --> 00:14:59.151 tôi sẽ nhìn thấy gì kế tiếp? tôi sẽ nhìn thấy gì kế tiếp?" NOTE Paragraph 00:14:59.487 --> 00:15:02.423 Tôi đã đem trưng bày bức tranh 00:15:02.447 --> 00:15:07.884 cho nhóm dự thính bài giảng "Giáo dục Cấp cao" ở Seattle xem 00:15:07.908 --> 00:15:10.855 ngay sau khi ma tuý được hợp thức hoá. NOTE Paragraph 00:15:10.855 --> 00:15:12.784 (Cười) NOTE Paragraph 00:15:14.627 --> 00:15:16.731 Tôi sẽ kết thúc nhanh thôi 00:15:16.755 --> 00:15:21.010 bằng việc nhấn mạnh rằng công nghệ không có giới hạn. 00:15:21.034 --> 00:15:24.699 Tôi chỉ mới cho bạn xem những ví dụ thị giác vì chúng nhìn vui mắt. 00:15:24.723 --> 00:15:27.048 Chứ công nghệ không chỉ thuần về thị giác. 00:15:27.048 --> 00:15:29.451 Cộng tác viên của chúng tôi, hoạ sĩ Ross Goodwin, 00:15:29.451 --> 00:15:32.886 đã có nhiều thí nghiệm có cả một camera chụp hình, 00:15:32.910 --> 00:15:37.144 và sau đó 1 cái máy tính trong balô của cậu ấy viết 1 bài thơ bằng mạng nơron, 00:15:37.168 --> 00:15:39.112 dựa vào nội dung của hình ảnh ghi nhận. 00:15:39.136 --> 00:15:42.093 Hệ thần kinh nhân tạo viết ra bài thơ đó đã được học 00:15:42.093 --> 00:15:44.341 một kho ngữ liệu lớn về thơ ca thế kỷ 20. 00:15:44.365 --> 00:15:45.864 Và bài thơ đó, bạn biết không, 00:15:45.888 --> 00:15:47.802 thật ra cũng không dở lắm đâu. NOTE Paragraph 00:15:47.826 --> 00:15:49.210 (Cười) NOTE Paragraph 00:15:49.234 --> 00:15:50.393 Tóm lại, 00:15:50.417 --> 00:15:52.549 Tôi nghĩ người tên Michelangelo đó, 00:15:52.573 --> 00:15:53.807 Ông ấy đã đúng; 00:15:53.831 --> 00:15:57.267 Sự tri nhận và sáng tạo có liên quan mật thiết với nhau. 00:15:57.611 --> 00:16:00.245 Những hệ thần kinh nhân tạo mà ta vừa thấy 00:16:00.269 --> 00:16:02.486 vốn chỉ được thiết kế để tiếp nhận, phân biệt, 00:16:02.486 --> 00:16:05.518 để nhận biết những sự vật khác nhau của thế giới, 00:16:05.518 --> 00:16:08.023 giờ có thể làm ngược lại, tạo ra cái mới. 00:16:08.047 --> 00:16:09.904 Một trong những điều tôi cảm giác được 00:16:09.924 --> 00:16:12.252 không chỉ là Michelangelo thật sự nhìn ra 00:16:12.276 --> 00:16:14.728 bức điêu khắc bên trong tảng đá, 00:16:14.752 --> 00:16:18.390 mà ông thấy bất kì sinh vật nào, thực thể nào, trong hay ngoài hành tinh 00:16:18.414 --> 00:16:22.071 chỉ cần biết tri nhận, 00:16:22.095 --> 00:16:23.470 sẽ có thể sáng tạo 00:16:23.494 --> 00:16:26.718 vì có cơ chế chung dùng cho cả hai quá trình ấy. NOTE Paragraph 00:16:26.742 --> 00:16:31.274 Tôi cũng nghĩ rằng sự tri nhận và sáng tạo không thể nào 00:16:31.298 --> 00:16:32.508 chỉ con người mới có. 00:16:32.532 --> 00:16:36.240 Chúng ta bắt đầu có những mẫu máy tính làm được những thứ này. 00:16:36.264 --> 00:16:39.592 Và điều đó không có gì lạ; bộ não chính là bộ máy. NOTE Paragraph 00:16:39.616 --> 00:16:41.273 Và sau cùng, 00:16:41.297 --> 00:16:45.965 máy tính bắt đầu trở thành công cụ thiết kế trí tuệ nhân tạo. 00:16:45.989 --> 00:16:48.451 Điện tử đã trở thành bằng chứng 00:16:48.475 --> 00:16:51.488 chứng minh rằng ta có thể làm ra trì tuệ nhân tạo. 00:16:51.512 --> 00:16:53.674 Và cuối cùng chúng ta đã có thể hoàn thành 00:16:53.698 --> 00:16:56.104 những hoài bão mà các tiền nhân để lại, 00:16:56.128 --> 00:16:57.841 chính là Turing, Von Neumann 00:16:57.865 --> 00:17:00.130 McCulloch và Pitts. 00:17:00.154 --> 00:17:04.252 Và tôi nghĩ điện toán không chỉ tập trung cho việc tính toán, 00:17:04.276 --> 00:17:06.423 để chơi Candy Crush hoặc những trò khác. 00:17:06.447 --> 00:17:09.265 Từ đầu, máy tính được tạo ra theo hình mẫu là não người. 00:17:09.265 --> 00:17:12.318 Và nhờ máy tính, chúng ta hiểu về bộ não mình rõ hơn 00:17:12.342 --> 00:17:13.871 để có thể cải tiến chúng. NOTE Paragraph 00:17:14.627 --> 00:17:15.794 Cám ơn rất nhiều. NOTE Paragraph 00:17:15.818 --> 00:17:21.757 (Vỗ tay)