1 00:00:00,800 --> 00:00:03,924 Tôi là trưởng nhóm nghiên cứu Trí tuệ nhân tạo tại Google; 2 00:00:03,948 --> 00:00:08,598 nói cách khác, đó là những quy tắc công nghệ để máy tính và thiết bị 3 00:00:08,622 --> 00:00:11,041 làm được những gì mà não người làm được. 4 00:00:11,439 --> 00:00:14,538 Và việc này làm chúng tôi thấy hứng thú với não người thật 5 00:00:14,562 --> 00:00:15,951 cũng như khoa học thần kinh, 6 00:00:15,951 --> 00:00:20,047 và đặc biệt là với những gì mà não của chúng ta có thể 7 00:00:20,071 --> 00:00:24,113 thực hiện tốt hơn nhiều so với máy tính. 8 00:00:25,209 --> 00:00:28,818 Về lịch sử, một trong số đó chính là khả năng tri nhận, 9 00:00:28,842 --> 00:00:31,881 là quá trình biến đổi những gì ở thế giới bên ngoài 10 00:00:31,905 --> 00:00:33,489 như âm thanh và hình ảnh 11 00:00:33,513 --> 00:00:35,691 thành dạng khái niệm trong tư duy. 12 00:00:36,235 --> 00:00:38,752 Khái niệm rất quan trọng với não, 13 00:00:38,776 --> 00:00:41,240 cũng khá hữu ích trên máy tính. 14 00:00:41,636 --> 00:00:44,986 Ví dụ, những thuật toán tri giác cho máy mà nhóm tôi viết ra, 15 00:00:45,010 --> 00:00:48,884 chính là thứ giúp bạn tìm được hình ảnh trên Google Photo, 16 00:00:48,908 --> 00:00:50,305 căn cứ vào trong hình có gì. 17 00:00:51,594 --> 00:00:55,087 Đối lập với tri nhận là sáng tạo: 18 00:00:55,111 --> 00:00:58,031 là biến khái niệm đã biết thành sản phẩm của thế giới. 19 00:00:58,068 --> 00:01:02,098 Trong năm qua, khả năng tri nhận nhân tạo mà nhóm tôi nghiên cứu 20 00:01:02,098 --> 00:01:06,611 đã bất ngờ kết nối được với khả năng sáng tạo nhân tạo 21 00:01:06,635 --> 00:01:08,555 và nghệ thuật nhân tạo. 22 00:01:08,565 --> 00:01:11,840 Tôi nghĩ Michlangelo có một hiểu biết sâu sắc 23 00:01:11,864 --> 00:01:15,520 về mối quan hệ song đôi giữa tri nhận và sáng tạo. 24 00:01:16,023 --> 00:01:18,029 Đây là câu trích dẫn ưa thích của ông: 25 00:01:18,053 --> 00:01:21,376 "Tảng đá nào cũng có linh hồn là bức tượng, 26 00:01:22,036 --> 00:01:25,038 và một thợ điêu khắc có nhiệm vụ khám phá ra nó." 27 00:01:26,029 --> 00:01:29,245 Nên tôi nghĩ điều Michelangelo muốn nói đến chính là 28 00:01:29,269 --> 00:01:32,449 chúng ta sáng tạo được nhờ tri nhận, 29 00:01:32,473 --> 00:01:35,496 và bản thân sự tri nhận đó là hành động tưởng tượng 30 00:01:35,520 --> 00:01:37,981 và là nguyên liệu cho sáng tạo. 31 00:01:38,691 --> 00:01:42,616 Cơ quan thực hiện mọi quá trình tri nhận và sáng tạo diễn ra, 32 00:01:42,640 --> 00:01:44,228 tất nhiên, là bộ não. 33 00:01:45,089 --> 00:01:47,634 Tôi sẽ bắt đầu bằng một chút lịch sử 34 00:01:47,658 --> 00:01:49,960 nói về hiểu biết của chúng ta về não. 35 00:01:50,496 --> 00:01:52,942 Nói thế này, khác hẳn trái tim hay nội tạng, 36 00:01:52,966 --> 00:01:56,110 bạn thật sự không nói được gì nhiều chỉ bằng việc quan sát bộ não, 37 00:01:56,134 --> 00:01:57,896 nhất là khi nhìn bằng mắt thường. 38 00:01:57,923 --> 00:02:00,399 Những bác sĩ phẫu thuật đầu tiên quan sát bộ não 39 00:02:00,423 --> 00:02:04,230 đã đặt tên cho cấu trúc bề mặt của nó mọi cái tên thú vị, 40 00:02:04,254 --> 00:02:06,687 chẳng hạn như thuỳ hải mã, nghĩa là "con tôm nhỏ". 41 00:02:06,711 --> 00:02:09,475 Nhưng tất nhiên cái tên đó cũng không nói được gì nhiều 42 00:02:09,499 --> 00:02:11,817 về những gì đang thực sự diễn ra bên trong. 43 00:02:12,780 --> 00:02:16,393 Tôi nghĩ người đầu tiên phát triển hiểu biết thật sự 44 00:02:16,417 --> 00:02:18,347 về những gì đang diễn ra trong não bộ 45 00:02:18,371 --> 00:02:22,291 là nhà giải phẫu thần kinh vĩ đại người Tây Ban Nha, Santiago Ramón y Cajal, 46 00:02:22,315 --> 00:02:23,859 vào thế kỷ 19, 47 00:02:23,883 --> 00:02:27,638 ông là người dùng kính hiển vi và chất nhuộm màu đặc biệt 48 00:02:27,662 --> 00:02:31,832 có thể điền vào hay minh hoạ kĩ lưỡng từng tế bào trong não 49 00:02:31,856 --> 00:02:33,864 với độ tương phản cao, 50 00:02:33,888 --> 00:02:37,042 để bắt đầu hiểu được hình thái của chúng. 51 00:02:37,972 --> 00:02:40,863 Và đây là kiểu bản vẽ mà ông diễn tả các nơ-ron thần kinh 52 00:02:40,887 --> 00:02:42,096 vào thế kỷ 19. 53 00:02:42,120 --> 00:02:44,004 Đây là ảnh minh hoạ cho não chim. 54 00:02:44,028 --> 00:02:47,085 Như bạn thấy, có cực kỳ nhiều loại tế bào khác nhau, 55 00:02:47,109 --> 00:02:50,544 mà ngay cả thuyết tế bào cũng còn khá lạ lẫm với chúng. 56 00:02:50,568 --> 00:02:51,846 Và những cấu trúc này, 57 00:02:51,870 --> 00:02:54,129 những tế bào này có nhiều nhánh, 58 00:02:54,153 --> 00:02:56,761 các nhánh có thể truyền đi rất rất xa 59 00:02:56,785 --> 00:02:58,751 lúc bấy giờ, điều này nghe thật khó tin. 60 00:02:58,779 --> 00:03:01,682 Tất nhiên khi đó nhìn chúng như những sợi dây điện. 61 00:03:01,706 --> 00:03:05,163 Những người ở thế kỷ 19 sẽ thấy chúng y như vậy; 62 00:03:05,187 --> 00:03:09,501 cuộc cách mạng về lưới điện và điện khi ấy đang diễn ra. 63 00:03:09,964 --> 00:03:11,142 Nhưng bằng nhiều cách, 64 00:03:11,166 --> 00:03:14,479 những bản vẽ giải phẫu kích thước µm của Ramón y Cajal's, như ảnh này, 65 00:03:14,503 --> 00:03:16,835 vẫn còn vài điểm chưa vượt trội. 66 00:03:16,859 --> 00:03:18,713 Hơn một thế kỷ sau, giờ đây chúng ta 67 00:03:18,737 --> 00:03:21,562 vẫn đang nỗ lực hoàn thành điều mà Ramón y Cajal đã bắt đầu. 68 00:03:21,586 --> 00:03:24,720 Đây là những dữ liệu thô từ các cộng tác viên 69 00:03:24,744 --> 00:03:27,625 làm việc tại Viện nghiên cứu khoa học thần kinh Max Planck. 70 00:03:27,649 --> 00:03:29,439 Cộng tác viên của chúng tôi đã vẽ 71 00:03:29,463 --> 00:03:34,464 từng mẩu nhỏ của mô não. 72 00:03:34,488 --> 00:03:37,814 Toàn bộ hình mẫu ở đây có kích thước thật chỉ 1 mm khối, 73 00:03:37,838 --> 00:03:40,459 và ở đây, các bạn đang xem một mẩu rất rất nhỏ của nó. 74 00:03:40,483 --> 00:03:42,829 Đường kẻ bên trái khoảng 1 micrômét (µm). 75 00:03:42,853 --> 00:03:45,262 Những cấu trúc bạn đang thấy là ti tể 76 00:03:45,286 --> 00:03:47,330 có kích thước cấp độ vi khuẩn. 77 00:03:47,354 --> 00:03:48,975 Và đây là những lát cắt liên tiếp 78 00:03:48,975 --> 00:03:52,077 của khối mô vô cùng nhỏ này. 79 00:03:52,101 --> 00:03:54,504 Chỉ với mục đích đối chiếu, 80 00:03:54,528 --> 00:03:58,074 thì đường kính trung bình của 1 sợi tóc khoảng 100 µm. 81 00:03:58,074 --> 00:04:00,618 Do đó, ta đang nhìn thấy một thứ nhỏ hơn rất rất nhiều 82 00:04:00,642 --> 00:04:02,040 so với một sợi tóc. 83 00:04:02,064 --> 00:04:06,095 Và từ hàng loạt những lát cắt có kích thước hiển vi của hạt electron, 84 00:04:06,119 --> 00:04:11,127 ta có thể tạo ra bản vẽ 3D để dựng lại cấu trúc nơron như thế này. 85 00:04:11,151 --> 00:04:14,308 Vậy nên những bản vẽ này cũng giống với bản của Ramón y Cajal. 86 00:04:14,332 --> 00:04:15,824 Chỉ có vài nơron sáng lên thôi, 87 00:04:15,848 --> 00:04:18,629 vì nếu không, chúng ta sẽ không thấy được gì hết. 88 00:04:18,653 --> 00:04:19,965 Quá nhiều nơron chen chúc, 89 00:04:19,989 --> 00:04:21,319 cấu tạo vô cùng phức tạp, 90 00:04:21,343 --> 00:04:24,517 tất cả các sợi nơron đều nối với nhau, tạo ra mạng lưới chằng chịt. 91 00:04:25,293 --> 00:04:28,217 Do đó, Ramón y Cajal có hơi cấp tiến so với thời của mình, 92 00:04:28,217 --> 00:04:30,676 và những hiểu biết về bộ não 93 00:04:30,700 --> 00:04:32,971 dần phát triển trong những thập kỷ tiếp theo. 94 00:04:33,455 --> 00:04:36,308 Nhưng chúng ta vốn biết nơron sử dụng điện để hoạt động, 95 00:04:36,332 --> 00:04:39,268 và cho đến Thế chiến II, công nghệ mới đủ tiên tiến 96 00:04:39,292 --> 00:04:42,098 để tiến hành các thí nghiệm điện thật sự trên nơron thật 97 00:04:42,122 --> 00:04:44,228 để hiểu rõ hơn cách chúng vận hành. 98 00:04:44,631 --> 00:04:48,987 Đây cũng là thời điểm máy vi tính được phát minh, 99 00:04:49,011 --> 00:04:52,111 chủ yếu dựa trên ý tưởng mô phỏng lại bộ não 100 00:04:52,135 --> 00:04:55,004 nó là một "cái máy thông minh", như cách mà Alan Turing gọi, 101 00:04:55,004 --> 00:04:57,765 một trong những người tiên phong cho khoa học máy tính. 102 00:04:57,923 --> 00:05:02,555 Warren McCulloch và Walter Pitts quan sát bản vẽ của Ramón y Cajal 103 00:05:02,579 --> 00:05:03,896 mô tả vỏ não thị giác, 104 00:05:03,920 --> 00:05:05,482 như bạn đang thấy. 105 00:05:05,506 --> 00:05:09,948 Đây là phần vỏ não phụ trách xử lý hình ảnh được mắt ghi nhận. 106 00:05:10,424 --> 00:05:13,932 Với McCulloch và Pitts, trông nó như một sơ đồ mạch điện. 107 00:05:14,353 --> 00:05:18,188 Nên có rất nhiều chi tiết trong bản vẽ của hai người 108 00:05:18,212 --> 00:05:19,564 không chính xác cho lắm. 109 00:05:19,588 --> 00:05:20,757 Nhưng về ý tưởng cốt lõi 110 00:05:20,757 --> 00:05:24,909 xem vỏ não thị giác như vi mạch điện tử 111 00:05:24,909 --> 00:05:27,609 truyền thông tin từ mạch này qua mạch khác theo tầng, 112 00:05:27,633 --> 00:05:29,235 lại hoàn toàn chính xác. 113 00:05:29,259 --> 00:05:31,609 Chúng ta hãy bàn một chút 114 00:05:31,633 --> 00:05:35,665 sẽ cần những gì để quá trình xử lý thông tin hình ảnh diễn ra. 115 00:05:36,228 --> 00:05:38,969 Bước căn bản chính trong quá trình tri nhận 116 00:05:38,993 --> 00:05:43,187 là nhìn vào ảnh, như hình này, và nói: 117 00:05:43,211 --> 00:05:44,387 "Đó là một con chim" 118 00:05:44,411 --> 00:05:47,285 là chuyện vô cùng đơn giản mà não ta thực hiện. 119 00:05:47,309 --> 00:05:50,730 Nhưng bạn nên hiểu rằng để máy tính hiểu được hình ảnh, 120 00:05:50,754 --> 00:05:53,841 vài năm trước vẫn còn là chuyện bất khả thi. 121 00:05:53,865 --> 00:05:55,781 Với hệ thống máy tính thế hệ đầu 122 00:05:55,805 --> 00:05:58,312 thì việc này không dễ thực hiện. 123 00:05:59,366 --> 00:06:01,918 Vậy những gì diễn ra giữa các điểm ảnh, 124 00:06:01,942 --> 00:06:05,970 giữa hình vẽ một con chim, và từ "con chim", 125 00:06:05,994 --> 00:06:08,808 về bản chất là một tập hợp nơron với các nơron nối với nhau 126 00:06:08,832 --> 00:06:09,987 thành mạng lưới nơron, 127 00:06:10,011 --> 00:06:11,048 như sơ đồ tôi vẽ đây. 128 00:06:11,048 --> 00:06:14,500 Mạng lưới này có thể mang tính sinh học, nằm trong hai vỏ não thị giác, 129 00:06:14,500 --> 00:06:16,716 hay ngày nay, chúng ta có thể 130 00:06:16,740 --> 00:06:19,194 mô phỏng những mạng lưới như vậy trên máy tính. 131 00:06:19,834 --> 00:06:22,187 Và tôi sẽ cho bạn xem nó trông thế nào. 132 00:06:22,211 --> 00:06:25,627 Bạn có thể xem các điểm ảnh là lớp nơron thứ nhất, 133 00:06:25,651 --> 00:06:27,890 và thật ra, đó là cách mà mắt hoạt động 134 00:06:27,914 --> 00:06:29,577 đó là các nơron trong võng mạc. 135 00:06:29,601 --> 00:06:31,351 Tiếp theo chúng chạy thẳng ra trước 136 00:06:31,351 --> 00:06:34,528 đi lần lượt vào trong các lớp nơron sau, từng lớp một, 137 00:06:34,552 --> 00:06:37,585 tất cả nối lại bằng các sợi xi-náp có khối lượng khác nhau. 138 00:06:37,609 --> 00:06:38,944 Trạng thái của mạng lưới này 139 00:06:38,968 --> 00:06:42,252 đặc trưng bởi độ bền của những sợi xi-náp. 140 00:06:42,276 --> 00:06:45,564 Chúng khắc hoạ đặc tính giống hệ mạch điện tử của mạng lưới này. 141 00:06:45,588 --> 00:06:47,058 Và cuối cùng, 142 00:06:47,082 --> 00:06:49,609 bạn có một sợi nơron hay một bó nhỏ gồm các sợi nơron 143 00:06:49,609 --> 00:06:51,200 bật sáng và hô lên "con chim". 144 00:06:51,824 --> 00:06:54,956 Giờ tôi sẽ biểu diễn ba thành phần: 145 00:06:54,980 --> 00:06:59,676 điểm ảnh ở đầu vào, sợi tiếp hợp xi-náp trong mạng lưới nơron, 146 00:06:59,700 --> 00:07:01,285 và con chim ở đầu ra 147 00:07:01,309 --> 00:07:04,366 là ba biến số: X, W và Y. 148 00:07:04,853 --> 00:07:06,664 Biến X có thể có hàng triệu giá trị. 149 00:07:06,688 --> 00:07:08,641 nghĩa là hàng triệu điểm ảnh trong hình. 150 00:07:08,665 --> 00:07:11,111 Biến W có hàng tỉ hay cả ngàn tỉ giá trị, 151 00:07:11,135 --> 00:07:14,556 tương ứng với khối lượng khác nhau của toàn bộ xi-náp trong mạng nơron. 152 00:07:14,580 --> 00:07:16,455 Và với biến Y, chỉ có 4 giá trị, 153 00:07:16,479 --> 00:07:18,337 là số giá trị mà mạng nơron xuất ra. 154 00:07:18,361 --> 00:07:20,110 "B-i-r-d" có 4 kí tự đúng không? 155 00:07:21,088 --> 00:07:24,514 Giờ thì hãy giả sử ta có biểu thức đơn giản này: 156 00:07:24,538 --> 00:07:26,701 X "x" W =Y. 157 00:07:26,725 --> 00:07:28,761 Tôi đặt dấu nhân trong ngoặc kép 158 00:07:28,785 --> 00:07:31,065 vì đó mới là những gì đang thực sự diễn ra, 159 00:07:31,089 --> 00:07:34,135 tất nhiên rất phức tạp, gồm hàng loạt các bài toán được giải. 160 00:07:35,172 --> 00:07:36,393 Đây là một biểu thức. 161 00:07:36,417 --> 00:07:38,089 Gồm có 3 biến số. 162 00:07:38,113 --> 00:07:40,839 Và ta đều biết nếu như ta có 1 đẳng thức, 163 00:07:40,863 --> 00:07:44,505 bạn sẽ tìm được 1 biến khi biết 2 biến còn lại. 164 00:07:45,158 --> 00:07:48,538 Nên vấn đề mắc phải 165 00:07:48,562 --> 00:07:51,435 để nhận ra đó là hình vẽ một con chim 166 00:07:51,459 --> 00:07:52,733 chính là đây: 167 00:07:52,757 --> 00:07:56,216 đây là nơi Y là biến chưa biết, và W, X là 2 biến đã biết. 168 00:07:56,240 --> 00:07:58,699 Bạn biết được mạng nơron, bạn biết số điểm ảnh. 169 00:07:58,723 --> 00:08:02,050 Như bạn thấy, chuyện này khá dễ giải quyết. 170 00:08:02,074 --> 00:08:04,260 Chỉ cần lấy tích của 2 x 3 là xong. 171 00:08:04,862 --> 00:08:07,105 Tôi sẽ cho bạn xem một mạng lưới neuron nhân tạo 172 00:08:07,105 --> 00:08:09,305 mà nhóm tôi dựng mới đây, dựng lại hệt như vậy. 173 00:08:09,634 --> 00:08:12,494 Mạng lưới này đang chạy trên một chiếc điện thoại di động, 174 00:08:12,518 --> 00:08:15,831 và tất nhiên, khả năng tuyệt vời vốn có của chiếc điện thoại 175 00:08:15,855 --> 00:08:19,323 chính là nó có thể thực hiện hàng tỉ, hàng ngàn tỉ thao tác 176 00:08:19,347 --> 00:08:20,595 mỗi giây. 177 00:08:20,619 --> 00:08:22,514 Bạn đang nhìn thấy một chiếc điện thoại 178 00:08:22,514 --> 00:08:25,805 đang nhìn lần lượt những bức ảnh có hình chim, 179 00:08:25,829 --> 00:08:28,544 và nó không hô lên "Đúng rồi, đây là chim," 180 00:08:28,568 --> 00:08:31,979 mà lại xác định mỗi loài chim với một mạng lưới tương tự như bộ não. 181 00:08:32,890 --> 00:08:34,716 Nên trong bức tranh đó, 182 00:08:34,740 --> 00:08:38,542 X và W là hai đại lượng đã có, và Y là ẩn. 183 00:08:38,566 --> 00:08:41,344 Tôi đang chú thích cho một phần rất hóc búa, dĩ nhiên rồi, 184 00:08:41,344 --> 00:08:44,843 để hiểu làm cách nào mà ta tìm được biến W. 185 00:08:44,843 --> 00:08:47,054 não chúng ta thật sự làm được chuyện này sao? 186 00:08:47,054 --> 00:08:49,978 Nhưng chúng ta chưa học về những mô hình thế này bao giờ mà? 187 00:08:49,978 --> 00:08:52,651 Nên bước này chúng ta học cách giải ra W, 188 00:08:52,675 --> 00:08:55,322 nếu ta làm giả bài này với cách giải của đơn thức 189 00:08:55,346 --> 00:08:57,346 bằng cách xem chúng là các con số, 190 00:08:57,370 --> 00:08:59,847 chúng ta biết cách giải đúng: 6 = 2 x W, 191 00:08:59,917 --> 00:09:03,393 thì lấy 6 chia 2 là tiêu đời. 192 00:09:04,001 --> 00:09:06,221 Vấn đề chính là phép chia này đây. 193 00:09:06,823 --> 00:09:07,974 Vậy, phép chia này... 194 00:09:07,998 --> 00:09:11,119 Chúng ta sử dụng phép chia vì nó nó nghịch đảo với phép nhân, 195 00:09:11,143 --> 00:09:12,583 nhưng tôi đã nói vừa nãy, 196 00:09:12,607 --> 00:09:15,176 Phép nhân này thật ra không chỉ là một phép nhân. 197 00:09:15,176 --> 00:09:18,406 Đây là một phép tính cực kỳ phức tạp, vô cùng lắt léo; 198 00:09:18,430 --> 00:09:20,134 và không có phép tính nghịch đảo. 199 00:09:20,158 --> 00:09:23,308 Nên chúng ta phải tìm cách khác để giải biểu thức này 200 00:09:23,332 --> 00:09:25,356 mà không được dùng phép chia. 201 00:09:25,380 --> 00:09:28,603 Trong khi cách giải lại không rối rắm. 202 00:09:28,603 --> 00:09:30,908 Đừng sợ, hãy dùng một mẹo nhỏ trong môn đại số, 203 00:09:30,908 --> 00:09:33,348 hãy chuyển 6 qua vế bên phải. 204 00:09:33,372 --> 00:09:35,368 Giờ thì chúng ta vẫn đang dùng phép nhân. 205 00:09:35,675 --> 00:09:39,255 Và số 0 đó, hãy coi nó là lỗi đi. 206 00:09:39,279 --> 00:09:41,794 Có nghĩa là, nếu ta giải đúng được W, 207 00:09:41,818 --> 00:09:43,474 thì lỗi sẽ bằng 0. 208 00:09:43,498 --> 00:09:45,436 Và nếu ta chưa giải đúng được, 209 00:09:45,460 --> 00:09:47,209 thì lỗi đó sẽ lớn hơn 0 nhiều. 210 00:09:47,233 --> 00:09:50,599 Nên giờ ta chỉ có thể đoán sao để lỗi có giá trị nhỏ nhất, 211 00:09:50,623 --> 00:09:53,310 và đó là chuyện mà máy vi tính rất thành thạo. 212 00:09:53,334 --> 00:09:54,927 Vậy bạn vừa mới đoán: 213 00:09:54,951 --> 00:09:56,107 giả sử W = 0 ? 214 00:09:56,131 --> 00:09:57,371 Vậy thì số lỗi = 6. 215 00:09:57,395 --> 00:09:58,825 W = 4 thì sao? Vậy lỗi = 4. 216 00:09:58,825 --> 00:10:01,282 Rồi sau đó máy tính sẽ như chơi trò bịt mắt bắt dê, 217 00:10:01,282 --> 00:10:03,623 và đuổi theo lỗi cho đến khi nó gần chạm tới 0. 218 00:10:03,647 --> 00:10:06,151 Nó sẽ tiến dần về giá trị đúng của W. 219 00:10:06,151 --> 00:10:10,701 Thật ra sẽ không có giá trị hoàn toàn chính xác, nhưng sau mười mấy lần, 220 00:10:10,725 --> 00:10:15,349 chúng ta có được W = 2.999, là giá trị gần đúng nhất. 221 00:10:16,302 --> 00:10:18,116 Và đây chính là quá trình học tập. 222 00:10:18,140 --> 00:10:20,870 Hãy nhớ điều đang diễn ra từ nãy đến giờ 223 00:10:20,894 --> 00:10:25,272 là cách thức chúng ta sử dụng rất nhiều giá trị đã biết của X và Y 224 00:10:25,296 --> 00:10:28,750 để tìm ra mối quan tâm của ta là W, thông qua quá trình lặp đi lặp lại. 225 00:10:28,774 --> 00:10:32,330 Đó cũng chính là phương pháp học tập của chúng ta. 226 00:10:32,354 --> 00:10:35,504 Khi còn nhỏ người lớn cho ta xem rất nhiều hình ảnh và nói 227 00:10:35,504 --> 00:10:37,991 "đây là con chim", "còn đây không phải". 228 00:10:37,991 --> 00:10:40,162 Qua thời gian, và qua việc học đi học lại, 229 00:10:40,162 --> 00:10:43,214 chúng ta giải được W, là giải được các kết nối nơron. 230 00:10:43,460 --> 00:10:47,546 Nên giờ đây chúng ta đem X và W đã cố định để tìm Y; 231 00:10:47,570 --> 00:10:49,417 đó là sự tri nhận nhanh hằng ngày. 232 00:10:49,441 --> 00:10:51,334 Chúng ta hiểu rằng mình có thể giải W, 233 00:10:51,334 --> 00:10:53,131 đó là học tập, khó hơn nhiều, 234 00:10:53,155 --> 00:10:55,140 vì chúng ta phải giảm thiểu lỗi sai, 235 00:10:55,164 --> 00:10:57,281 bằng cách sử dụng phương pháp luyện tập. 236 00:10:57,281 --> 00:11:00,162 Khoảng 1 năm trước,thành viên Alex Mordvinstev của nhóm tôi, 237 00:11:00,162 --> 00:11:03,636 quyết định làm thí nghiệm xem chuyện gì xảy ra nếu ta cố tìm X, 238 00:11:03,660 --> 00:11:05,697 khi đã biết 1 giá trị W và 1 giá trị Y. 239 00:11:06,124 --> 00:11:07,275 Nói cách khác, 240 00:11:07,299 --> 00:11:08,651 bạn biết đó là con chim, 241 00:11:08,675 --> 00:11:11,978 và bạn cũng biết là hệ thần kinh của mình được dạy, đó là chim 242 00:11:12,002 --> 00:11:14,346 vậy thì bức hình một con chim là gì? 243 00:11:15,034 --> 00:11:20,058 Hoá ra khi sử dụng 1 quá trình giống như quá trình giảm thiểu lỗi, 244 00:11:20,082 --> 00:11:23,092 có thể giảm thiểu sai sót của mạng lưới 245 00:11:23,092 --> 00:11:26,104 được dạy để nhận ra chim, và kết quả... 246 00:11:30,400 --> 00:11:32,495 là một bức hình gồm nhiều loài chim. 247 00:11:32,814 --> 00:11:36,551 Đây là bức hình có nhiều loài chim được tạo ra hoàn toàn từ 1 hệ thần kinh 248 00:11:36,575 --> 00:11:38,401 đã được dạy để nhận ra các loài chim, 249 00:11:38,425 --> 00:11:41,963 chỉ bằng việc tìm X thay vì tìm Y, 250 00:11:41,987 --> 00:11:43,655 và làm đi làm lại quá trình đó. 251 00:11:43,732 --> 00:11:45,579 Đây là một ví dụ khác. 252 00:11:45,603 --> 00:11:49,040 Đây là tác phẩm của thành viên Mike Tyka của nhóm tôi, 253 00:11:49,064 --> 00:11:51,372 cậu ấy gọi nó là "Đoàn thú tuần hành". 254 00:11:51,396 --> 00:11:54,272 Nó làm tôi nhớ tới các tác phẩm của William Kentridge, 255 00:11:54,296 --> 00:11:56,785 khi ông cứ phác ra các hình vẽ, rồi bôi, 256 00:11:56,809 --> 00:11:58,269 rồi vẽ phác lại, rồi lại bôi, 257 00:11:58,293 --> 00:12:00,111 và tạo ra một kiểu phim theo cách này. 258 00:12:00,141 --> 00:12:01,186 Trong tranh này, 259 00:12:01,196 --> 00:12:04,011 Mike đã đa dạng hoá biến Y thành nhiều loài thú khác nhau, 260 00:12:04,011 --> 00:12:06,953 trong một mạng lưới được thiết kế để nhận biết và phân biệt 261 00:12:06,953 --> 00:12:08,537 mỗi loài có nhiều loài khác nữa. 262 00:12:08,537 --> 00:12:12,182 Và giờ bạn có được một bức như tranh biến hình động vật của hoạ sĩ Escher. 263 00:12:14,221 --> 00:12:18,835 Ở đây cậu ấy và Alex cùng thử 264 00:12:18,859 --> 00:12:21,618 giảm không gian của biến Y còn 2 chiều, 265 00:12:21,642 --> 00:12:25,080 để tạo ra một bản đồ có mặt mọi thứ khác nhau 266 00:12:25,104 --> 00:12:26,823 mà mạng lưới này nhận ra. 267 00:12:26,847 --> 00:12:28,870 Khi thực hiện tổng hợp như vậy 268 00:12:28,894 --> 00:12:31,276 hay tạo ra hình ảnh trên toàn bộ bề mặt, 269 00:12:31,300 --> 00:12:34,246 đa dạng giá trị Y trên mặt phẳng, bạn có thể tạo ra 270 00:12:34,246 --> 00:12:37,311 một loại bản đồ có tất cả những thứ mà mạng lưới nhận biết được. 271 00:12:37,335 --> 00:12:40,660 Tất cả các loài thú đều ở ngay đây; "armadillo" ngay vị trí trung tâm. 272 00:12:40,919 --> 00:12:43,398 Bạn có thể tạo bản đồ cho những mạng lưới khác nữa. 273 00:12:43,422 --> 00:12:46,296 Đây là mạng lưới được thiết kế để nhận diện các khuôn mặt, 274 00:12:46,320 --> 00:12:48,320 để phân biệt mặt người này, người kia. 275 00:12:48,344 --> 00:12:51,593 Còn đây, chúng ta đang chọn Y có giá trị là "tôi", 276 00:12:51,617 --> 00:12:53,592 là thông số giúp nhận ra gương mặt tôi. 277 00:12:53,592 --> 00:12:54,922 Và khi dùng Y để tìm X, 278 00:12:54,946 --> 00:12:57,564 nó cho ra một thứ rất điên, 279 00:12:57,588 --> 00:13:02,016 đại loại như tranh lập thể, siêu thực vẽ tôi đang phê thuốc 280 00:13:02,040 --> 00:13:03,846 từ nhiều góc nhìn khác nhau cùng lúc. 281 00:13:03,870 --> 00:13:06,604 Sở dĩ nó như nhiều góc nhìn khác nhau cùng một lúc là vì 282 00:13:06,628 --> 00:13:10,049 mạng lưới được thiết kế để tránh sự mơ hồ khi nhận diện 283 00:13:10,049 --> 00:13:13,125 một gương mặt khi nhìn ở góc này so với khi nhìn ở góc khác, 284 00:13:13,125 --> 00:13:16,215 hay trong điều kiện chiếu sáng khác nhau. 285 00:13:16,239 --> 00:13:18,324 Nên khi bạn thực hiện việc tái cấu tạo, 286 00:13:18,348 --> 00:13:20,652 nếu không sử dụng kiểu hình ảnh hướng dẫn 287 00:13:20,676 --> 00:13:22,307 hay thông số hướng dẫn để làm mẫu, 288 00:13:22,307 --> 00:13:25,676 thì bạn sản phẩm nhận được là một bức hình rối mắt ở mọi góc nhìn, 289 00:13:25,700 --> 00:13:27,068 vì mọi thứ trông rất mờ ảo. 290 00:13:27,786 --> 00:13:32,009 Đây là kết quả khi Ales sử dụng mặt mình làm hình ảnh mẫu 291 00:13:32,033 --> 00:13:35,354 trong quá trình tối ưu hoá mạng lưới để tái hiện gương mặt tôi. 292 00:13:36,284 --> 00:13:38,612 Nên có thể bạn thấy nó không hoàn hảo. 293 00:13:38,636 --> 00:13:40,510 Vẫn còn khá nhiều chuyện để làm 294 00:13:40,534 --> 00:13:43,007 để cải thiện tối đa quá trình tái cấu trúc. 295 00:13:43,007 --> 00:13:45,838 Nhưng giờ thì có được bức tranh một gương mặt liền mạch 296 00:13:45,862 --> 00:13:47,876 sử dụng mặt tôi làm hình hướng dẫn. 297 00:13:48,892 --> 00:13:51,393 Bạn không cần phải bắt đầu vẽ với tờ giấy trắng 298 00:13:51,417 --> 00:13:52,573 hay tiếng ồn trắng. 299 00:13:52,597 --> 00:13:53,901 Khi tìm X, 300 00:13:53,925 --> 00:13:57,814 bạn có thể bắt đầu với X, bản thân nó đã là một hình. 301 00:13:57,838 --> 00:14:00,394 Đó là điều mà tôi minh hoạ hôm nay. 302 00:14:00,418 --> 00:14:04,540 Hệ thần kinh nhân tạo này được thiết kế để phân loại 303 00:14:04,564 --> 00:14:07,683 tất cả vật thể khác nhau, như công trình nhân tạo, động vật... 304 00:14:07,707 --> 00:14:10,300 Ở đây, đầu tiên ta có bức tranh với những đám mây, 305 00:14:10,324 --> 00:14:11,995 và khi ta tối ưu hoá hình này, 306 00:14:12,019 --> 00:14:16,505 về căn bản, hệ thần kinh nhân tạo đang xác định mấy đám mây có hình gì. 307 00:14:16,931 --> 00:14:19,251 Và khi nhìn bức hình này càng lâu, 308 00:14:19,275 --> 00:14:22,028 bạn càng thấy được nhiều thứ tạo ra từ những đám mây đó. 309 00:14:23,004 --> 00:14:26,379 Bạn cũng có thể dùng hệ nhận diện khuôn mặt để tạo ảo giác cho nền này, 310 00:14:26,403 --> 00:14:28,215 và sẽ có được một sản phẩm điên khùng. 311 00:14:28,239 --> 00:14:29,389 (Cười) 312 00:14:30,401 --> 00:14:33,145 Hay như vầy, Mike có vài thí nghiệm nữa 313 00:14:33,169 --> 00:14:37,074 cậu ấy lấy hình đám mây, 314 00:14:37,098 --> 00:14:40,605 tạo hiệu ứng ảo, phóng đại, rồi chỉnh ảo, phóng, rồi chỉnh, rồi lại phóng. 315 00:14:40,629 --> 00:14:41,780 Và bằng cách này, 316 00:14:41,804 --> 00:14:45,479 tôi nghĩ bạn sẽ nhận được một hệ thần kinh đang thấy lâng lâng, 317 00:14:45,503 --> 00:14:49,183 hay là sự kết hợp tự do, 318 00:14:49,207 --> 00:14:52,094 trong đó bạn sẽ thấy mạng lưới ấy đang ăn cái đuôi của mình. 319 00:14:52,094 --> 00:14:54,879 Nên mỗi hình đều là ảnh nền cho 320 00:14:54,903 --> 00:14:56,324 hình "tôi sẽ thấy gì kế tiếp? 321 00:14:56,348 --> 00:14:59,151 tôi sẽ nhìn thấy gì kế tiếp? tôi sẽ nhìn thấy gì kế tiếp?" 322 00:14:59,487 --> 00:15:02,423 Tôi đã đem trưng bày bức tranh 323 00:15:02,447 --> 00:15:07,884 cho nhóm dự thính bài giảng "Giáo dục Cấp cao" ở Seattle xem 324 00:15:07,908 --> 00:15:10,855 ngay sau khi ma tuý được hợp thức hoá. 325 00:15:10,855 --> 00:15:12,784 (Cười) 326 00:15:14,627 --> 00:15:16,731 Tôi sẽ kết thúc nhanh thôi 327 00:15:16,755 --> 00:15:21,010 bằng việc nhấn mạnh rằng công nghệ không có giới hạn. 328 00:15:21,034 --> 00:15:24,699 Tôi chỉ mới cho bạn xem những ví dụ thị giác vì chúng nhìn vui mắt. 329 00:15:24,723 --> 00:15:27,048 Chứ công nghệ không chỉ thuần về thị giác. 330 00:15:27,048 --> 00:15:29,451 Cộng tác viên của chúng tôi, hoạ sĩ Ross Goodwin, 331 00:15:29,451 --> 00:15:32,886 đã có nhiều thí nghiệm có cả một camera chụp hình, 332 00:15:32,910 --> 00:15:37,144 và sau đó 1 cái máy tính trong balô của cậu ấy viết 1 bài thơ bằng mạng nơron, 333 00:15:37,168 --> 00:15:39,112 dựa vào nội dung của hình ảnh ghi nhận. 334 00:15:39,136 --> 00:15:42,093 Hệ thần kinh nhân tạo viết ra bài thơ đó đã được học 335 00:15:42,093 --> 00:15:44,341 một kho ngữ liệu lớn về thơ ca thế kỷ 20. 336 00:15:44,365 --> 00:15:45,864 Và bài thơ đó, bạn biết không, 337 00:15:45,888 --> 00:15:47,802 thật ra cũng không dở lắm đâu. 338 00:15:47,826 --> 00:15:49,210 (Cười) 339 00:15:49,234 --> 00:15:50,393 Tóm lại, 340 00:15:50,417 --> 00:15:52,549 Tôi nghĩ người tên Michelangelo đó, 341 00:15:52,573 --> 00:15:53,807 Ông ấy đã đúng; 342 00:15:53,831 --> 00:15:57,267 Sự tri nhận và sáng tạo có liên quan mật thiết với nhau. 343 00:15:57,611 --> 00:16:00,245 Những hệ thần kinh nhân tạo mà ta vừa thấy 344 00:16:00,269 --> 00:16:02,486 vốn chỉ được thiết kế để tiếp nhận, phân biệt, 345 00:16:02,486 --> 00:16:05,518 để nhận biết những sự vật khác nhau của thế giới, 346 00:16:05,518 --> 00:16:08,023 giờ có thể làm ngược lại, tạo ra cái mới. 347 00:16:08,047 --> 00:16:09,904 Một trong những điều tôi cảm giác được 348 00:16:09,924 --> 00:16:12,252 không chỉ là Michelangelo thật sự nhìn ra 349 00:16:12,276 --> 00:16:14,728 bức điêu khắc bên trong tảng đá, 350 00:16:14,752 --> 00:16:18,390 mà ông thấy bất kì sinh vật nào, thực thể nào, trong hay ngoài hành tinh 351 00:16:18,414 --> 00:16:22,071 chỉ cần biết tri nhận, 352 00:16:22,095 --> 00:16:23,470 sẽ có thể sáng tạo 353 00:16:23,494 --> 00:16:26,718 vì có cơ chế chung dùng cho cả hai quá trình ấy. 354 00:16:26,742 --> 00:16:31,274 Tôi cũng nghĩ rằng sự tri nhận và sáng tạo không thể nào 355 00:16:31,298 --> 00:16:32,508 chỉ con người mới có. 356 00:16:32,532 --> 00:16:36,240 Chúng ta bắt đầu có những mẫu máy tính làm được những thứ này. 357 00:16:36,264 --> 00:16:39,592 Và điều đó không có gì lạ; bộ não chính là bộ máy. 358 00:16:39,616 --> 00:16:41,273 Và sau cùng, 359 00:16:41,297 --> 00:16:45,965 máy tính bắt đầu trở thành công cụ thiết kế trí tuệ nhân tạo. 360 00:16:45,989 --> 00:16:48,451 Điện tử đã trở thành bằng chứng 361 00:16:48,475 --> 00:16:51,488 chứng minh rằng ta có thể làm ra trì tuệ nhân tạo. 362 00:16:51,512 --> 00:16:53,674 Và cuối cùng chúng ta đã có thể hoàn thành 363 00:16:53,698 --> 00:16:56,104 những hoài bão mà các tiền nhân để lại, 364 00:16:56,128 --> 00:16:57,841 chính là Turing, Von Neumann 365 00:16:57,865 --> 00:17:00,130 McCulloch và Pitts. 366 00:17:00,154 --> 00:17:04,252 Và tôi nghĩ điện toán không chỉ tập trung cho việc tính toán, 367 00:17:04,276 --> 00:17:06,423 để chơi Candy Crush hoặc những trò khác. 368 00:17:06,447 --> 00:17:09,265 Từ đầu, máy tính được tạo ra theo hình mẫu là não người. 369 00:17:09,265 --> 00:17:12,318 Và nhờ máy tính, chúng ta hiểu về bộ não mình rõ hơn 370 00:17:12,342 --> 00:17:13,871 để có thể cải tiến chúng. 371 00:17:14,627 --> 00:17:15,794 Cám ơn rất nhiều. 372 00:17:15,818 --> 00:17:21,757 (Vỗ tay)