WEBVTT

00:00:00.800 --> 00:00:03.924
Tôi là trưởng nhóm nghiên cứu
Trí tuệ nhân tạo tại Google;

00:00:03.948 --> 00:00:08.598
nói cách khác, đó là những quy tắc
công nghệ để máy tính và thiết bị

00:00:08.622 --> 00:00:11.041
làm được những gì mà
não người làm được.

00:00:11.439 --> 00:00:14.538
Và việc này làm chúng tôi 
thấy hứng thú với não người thật

00:00:14.562 --> 00:00:15.951
cũng như khoa học thần kinh,

00:00:15.951 --> 00:00:20.047
và đặc biệt là với những gì
mà não của chúng ta có thể

00:00:20.071 --> 00:00:24.113
thực hiện tốt hơn nhiều so với máy tính.

NOTE Paragraph

00:00:25.209 --> 00:00:28.818
Về lịch sử, một trong số đó
chính là khả năng tri nhận,

00:00:28.842 --> 00:00:31.881
là quá trình biến đổi những gì
ở thế giới bên ngoài

00:00:31.905 --> 00:00:33.489
như âm thanh và hình ảnh

00:00:33.513 --> 00:00:35.691
thành dạng khái niệm trong tư duy.

00:00:36.235 --> 00:00:38.752
Khái niệm rất quan trọng với não,

00:00:38.776 --> 00:00:41.240
cũng khá hữu ích trên máy tính.

00:00:41.636 --> 00:00:44.986
Ví dụ, những thuật toán tri giác 
cho máy mà nhóm tôi viết ra,

00:00:45.010 --> 00:00:48.884
chính là thứ giúp bạn tìm
được hình ảnh trên Google Photo,

00:00:48.908 --> 00:00:50.305
căn cứ vào trong hình có gì.

00:00:51.594 --> 00:00:55.087
Đối lập với tri nhận là sáng tạo:

00:00:55.111 --> 00:00:58.031
là biến khái niệm đã biết thành
sản phẩm của thế giới.

00:00:58.068 --> 00:01:02.098
Trong năm qua, khả năng tri nhận 
nhân tạo mà nhóm tôi nghiên cứu

00:01:02.098 --> 00:01:06.611
đã bất ngờ kết nối được với 
khả năng sáng tạo nhân tạo

00:01:06.635 --> 00:01:08.555
và nghệ thuật nhân tạo.

NOTE Paragraph

00:01:08.565 --> 00:01:11.840
Tôi nghĩ Michlangelo 
có một hiểu biết sâu sắc

00:01:11.864 --> 00:01:15.520
về mối quan hệ song đôi giữa
tri nhận và sáng tạo.

00:01:16.023 --> 00:01:18.029
Đây là câu trích dẫn ưa thích của ông:

00:01:18.053 --> 00:01:21.376
"Tảng đá nào cũng có linh hồn
là bức tượng,

00:01:22.036 --> 00:01:25.038
và một thợ điêu khắc có nhiệm vụ
khám phá ra nó."

00:01:26.029 --> 00:01:29.245
Nên tôi nghĩ điều Michelangelo
muốn nói đến chính là

00:01:29.269 --> 00:01:32.449
chúng ta sáng tạo được nhờ tri nhận,

00:01:32.473 --> 00:01:35.496
và bản thân sự tri nhận đó 
là hành động tưởng tượng

00:01:35.520 --> 00:01:37.981
và là nguyên liệu cho sáng tạo.

NOTE Paragraph

00:01:38.691 --> 00:01:42.616
Cơ quan thực hiện mọi quá trình
tri nhận và sáng tạo diễn ra,

00:01:42.640 --> 00:01:44.228
tất nhiên, là bộ não.

00:01:45.089 --> 00:01:47.634
Tôi sẽ bắt đầu bằng một chút lịch sử

00:01:47.658 --> 00:01:49.960
nói về hiểu biết của chúng ta về não.

00:01:50.496 --> 00:01:52.942
Nói thế này, khác hẳn trái tim
hay nội tạng,

00:01:52.966 --> 00:01:56.110
bạn thật sự không nói được gì nhiều
chỉ bằng việc quan sát bộ não,

00:01:56.134 --> 00:01:57.896
nhất là khi nhìn bằng mắt thường.

00:01:57.923 --> 00:02:00.399
Những bác sĩ phẫu thuật 
đầu tiên quan sát bộ não

00:02:00.423 --> 00:02:04.230
đã đặt tên cho cấu trúc bề mặt 
của nó mọi cái tên thú vị,

00:02:04.254 --> 00:02:06.687
chẳng hạn như thuỳ hải mã, 
nghĩa là "con tôm nhỏ".

00:02:06.711 --> 00:02:09.475
Nhưng tất nhiên cái tên đó
cũng không nói được gì nhiều

00:02:09.499 --> 00:02:11.817
về những gì đang thực sự 
diễn ra bên trong.

NOTE Paragraph

00:02:12.780 --> 00:02:16.393
Tôi nghĩ người đầu tiên 
phát triển hiểu biết thật sự

00:02:16.417 --> 00:02:18.347
về những gì đang diễn ra trong não bộ

00:02:18.371 --> 00:02:22.291
là nhà giải phẫu thần kinh vĩ đại người
Tây Ban Nha, Santiago Ramón y Cajal,

00:02:22.315 --> 00:02:23.859
vào thế kỷ 19,

00:02:23.883 --> 00:02:27.638
ông là người dùng kính hiển vi và 
chất nhuộm màu đặc biệt

00:02:27.662 --> 00:02:31.832
có thể điền vào hay minh hoạ kĩ lưỡng
từng tế bào trong não

00:02:31.856 --> 00:02:33.864
với độ tương phản cao,

00:02:33.888 --> 00:02:37.042
để bắt đầu hiểu được
hình thái của chúng.

00:02:37.972 --> 00:02:40.863
Và đây là kiểu bản vẽ mà ông 
diễn tả các nơ-ron thần kinh

00:02:40.887 --> 00:02:42.096
vào thế kỷ 19.

NOTE Paragraph

00:02:42.120 --> 00:02:44.004
Đây là ảnh minh hoạ cho não chim.

00:02:44.028 --> 00:02:47.085
Như bạn thấy, có cực kỳ nhiều loại
tế bào khác nhau,

00:02:47.109 --> 00:02:50.544
mà ngay cả thuyết tế bào cũng
còn khá lạ lẫm với chúng.

00:02:50.568 --> 00:02:51.846
Và những cấu trúc này,

00:02:51.870 --> 00:02:54.129
những tế bào này có nhiều nhánh,

00:02:54.153 --> 00:02:56.761
các nhánh có thể truyền đi rất rất xa

00:02:56.785 --> 00:02:58.751
lúc bấy giờ, điều này nghe thật khó tin.

00:02:58.779 --> 00:03:01.682
Tất nhiên khi đó nhìn chúng như
những sợi dây điện.

00:03:01.706 --> 00:03:05.163
Những người ở thế kỷ 19 
sẽ thấy chúng y như vậy;

00:03:05.187 --> 00:03:09.501
cuộc cách mạng về lưới điện và điện
khi ấy đang diễn ra.

00:03:09.964 --> 00:03:11.142
Nhưng bằng nhiều cách,

00:03:11.166 --> 00:03:14.479
những bản vẽ giải phẫu kích thước µm
của Ramón y Cajal's, như ảnh này,

00:03:14.503 --> 00:03:16.835
vẫn còn vài điểm chưa vượt trội.

NOTE Paragraph

00:03:16.859 --> 00:03:18.713
Hơn một thế kỷ sau, giờ đây chúng ta

00:03:18.737 --> 00:03:21.562
vẫn đang nỗ lực hoàn thành điều
mà Ramón y Cajal đã bắt đầu.

00:03:21.586 --> 00:03:24.720
Đây là những dữ liệu thô 
từ các cộng tác viên

00:03:24.744 --> 00:03:27.625
làm việc tại Viện nghiên cứu 
khoa học thần kinh Max Planck.

00:03:27.649 --> 00:03:29.439
Cộng tác viên của chúng tôi đã vẽ

00:03:29.463 --> 00:03:34.464
từng mẩu nhỏ của mô não.

00:03:34.488 --> 00:03:37.814
Toàn bộ hình mẫu ở đây có kích thước
thật chỉ 1 mm khối,

00:03:37.838 --> 00:03:40.459
và ở đây, các bạn đang xem 
một mẩu rất rất nhỏ của nó.

00:03:40.483 --> 00:03:42.829
Đường kẻ bên trái khoảng
1 micrômét (µm).

00:03:42.853 --> 00:03:45.262
Những cấu trúc bạn đang thấy là ti tể

00:03:45.286 --> 00:03:47.330
có kích thước cấp độ vi khuẩn.

00:03:47.354 --> 00:03:48.975
Và đây là những lát cắt liên tiếp

00:03:48.975 --> 00:03:52.077
của khối mô vô cùng nhỏ này.

00:03:52.101 --> 00:03:54.504
Chỉ với mục đích đối chiếu,

00:03:54.528 --> 00:03:58.074
thì đường kính trung bình của 1 sợi tóc
khoảng 100 µm.

00:03:58.074 --> 00:04:00.618
Do đó, ta đang nhìn thấy một thứ
nhỏ hơn rất rất nhiều

00:04:00.642 --> 00:04:02.040
so với một sợi tóc.

NOTE Paragraph

00:04:02.064 --> 00:04:06.095
Và từ hàng loạt những lát cắt có 
kích thước hiển vi của hạt electron,

00:04:06.119 --> 00:04:11.127
ta có thể tạo ra bản vẽ 3D để
dựng lại cấu trúc nơron như thế này.

00:04:11.151 --> 00:04:14.308
Vậy nên những bản vẽ này cũng
giống với bản của Ramón y Cajal.

00:04:14.332 --> 00:04:15.824
Chỉ có vài nơron sáng lên thôi,

00:04:15.848 --> 00:04:18.629
vì nếu không, chúng ta sẽ không
thấy được gì hết.

00:04:18.653 --> 00:04:19.965
Quá nhiều nơron chen chúc,

00:04:19.989 --> 00:04:21.319
cấu tạo vô cùng phức tạp,

00:04:21.343 --> 00:04:24.517
tất cả các sợi nơron đều nối với nhau,
tạo ra mạng lưới chằng chịt.

NOTE Paragraph

00:04:25.293 --> 00:04:28.217
Do đó, Ramón y Cajal có hơi cấp tiến
so với thời của mình,

00:04:28.217 --> 00:04:30.676
và những hiểu biết về bộ não

00:04:30.700 --> 00:04:32.971
dần phát triển trong
những thập kỷ tiếp theo.

00:04:33.455 --> 00:04:36.308
Nhưng chúng ta vốn biết nơron
sử dụng điện để hoạt động,

00:04:36.332 --> 00:04:39.268
và cho đến Thế chiến II, công nghệ
mới đủ tiên tiến

00:04:39.292 --> 00:04:42.098
để tiến hành các thí nghiệm điện
thật sự trên nơron thật

00:04:42.122 --> 00:04:44.228
để hiểu rõ hơn cách chúng vận hành.

00:04:44.631 --> 00:04:48.987
Đây cũng là thời điểm máy vi tính
được phát minh,

00:04:49.011 --> 00:04:52.111
chủ yếu dựa trên ý tưởng
mô phỏng lại bộ não

00:04:52.135 --> 00:04:55.004
nó là một "cái máy thông minh",
như cách mà Alan Turing gọi,

00:04:55.004 --> 00:04:57.765
một trong những người tiên phong 
cho khoa học máy tính.

NOTE Paragraph

00:04:57.923 --> 00:05:02.555
Warren McCulloch và Walter Pitts 
quan sát bản vẽ của Ramón y Cajal

00:05:02.579 --> 00:05:03.896
mô tả vỏ não thị giác,

00:05:03.920 --> 00:05:05.482
như bạn đang thấy.

00:05:05.506 --> 00:05:09.948
Đây là phần vỏ não phụ trách xử lý
hình ảnh được mắt ghi nhận.

00:05:10.424 --> 00:05:13.932
Với McCulloch và Pitts, trông nó như
một sơ đồ mạch điện.

00:05:14.353 --> 00:05:18.188
Nên có rất nhiều chi tiết trong 
bản vẽ của hai người

00:05:18.212 --> 00:05:19.564
không chính xác cho lắm.

00:05:19.588 --> 00:05:20.757
Nhưng về ý tưởng cốt lõi

00:05:20.757 --> 00:05:24.909
xem vỏ não thị giác như vi mạch điện tử


00:05:24.909 --> 00:05:27.609
truyền thông tin từ mạch này
qua mạch khác theo tầng,

00:05:27.633 --> 00:05:29.235
lại hoàn toàn chính xác.

NOTE Paragraph

00:05:29.259 --> 00:05:31.609
Chúng ta hãy bàn một chút

00:05:31.633 --> 00:05:35.665
sẽ cần những gì để quá trình 
xử lý thông tin hình ảnh diễn ra.

00:05:36.228 --> 00:05:38.969
Bước căn bản chính trong 
quá trình tri nhận

00:05:38.993 --> 00:05:43.187
là nhìn vào ảnh, như hình này, và nói:

00:05:43.211 --> 00:05:44.387
"Đó là một con chim"

00:05:44.411 --> 00:05:47.285
là chuyện vô cùng đơn giản mà não
ta thực hiện.

00:05:47.309 --> 00:05:50.730
Nhưng bạn nên hiểu rằng để
máy tính hiểu được hình ảnh,

00:05:50.754 --> 00:05:53.841
vài năm trước vẫn còn
là chuyện bất khả thi.

00:05:53.865 --> 00:05:55.781
Với hệ thống máy tính thế hệ đầu

00:05:55.805 --> 00:05:58.312
thì việc này không dễ thực hiện.

NOTE Paragraph

00:05:59.366 --> 00:06:01.918
Vậy những gì diễn ra giữa 
các điểm ảnh,

00:06:01.942 --> 00:06:05.970
giữa hình vẽ một con chim, 
và từ "con chim",

00:06:05.994 --> 00:06:08.808
về bản chất là một tập hợp nơron
với các nơron nối với nhau

00:06:08.832 --> 00:06:09.987
thành mạng lưới nơron,

00:06:10.011 --> 00:06:11.048
như sơ đồ tôi vẽ đây.

00:06:11.048 --> 00:06:14.500
Mạng lưới này có thể mang tính 
sinh học, nằm trong hai vỏ não thị giác,

00:06:14.500 --> 00:06:16.716
hay ngày nay, chúng ta có thể

00:06:16.740 --> 00:06:19.194
mô phỏng những mạng lưới
như vậy trên máy tính.

00:06:19.834 --> 00:06:22.187
Và tôi sẽ cho bạn xem
nó trông thế nào.

NOTE Paragraph

00:06:22.211 --> 00:06:25.627
Bạn có thể xem các điểm ảnh
là lớp nơron thứ nhất,

00:06:25.651 --> 00:06:27.890
và thật ra, đó là cách mà
mắt hoạt động

00:06:27.914 --> 00:06:29.577
đó là các nơron trong võng mạc.

00:06:29.601 --> 00:06:31.351
Tiếp theo chúng chạy thẳng ra trước

00:06:31.351 --> 00:06:34.528
đi lần lượt vào trong các 
lớp nơron sau, từng lớp một,

00:06:34.552 --> 00:06:37.585
tất cả nối lại bằng các sợi xi-náp 
có khối lượng khác nhau.

00:06:37.609 --> 00:06:38.944
Trạng thái của mạng lưới này

00:06:38.968 --> 00:06:42.252
đặc trưng bởi độ bền
của những sợi xi-náp.

00:06:42.276 --> 00:06:45.564
Chúng khắc hoạ đặc tính giống hệ mạch 
điện tử của mạng lưới này.

00:06:45.588 --> 00:06:47.058
Và cuối cùng,

00:06:47.082 --> 00:06:49.609
bạn có một sợi nơron hay một bó nhỏ
gồm các sợi nơron

00:06:49.609 --> 00:06:51.200
bật sáng và hô lên "con chim".

NOTE Paragraph

00:06:51.824 --> 00:06:54.956
Giờ tôi sẽ biểu diễn ba thành phần:

00:06:54.980 --> 00:06:59.676
điểm ảnh ở đầu vào, sợi tiếp hợp xi-náp
trong mạng lưới nơron,

00:06:59.700 --> 00:07:01.285
và con chim ở đầu ra

00:07:01.309 --> 00:07:04.366
là ba biến số: X, W và Y.

00:07:04.853 --> 00:07:06.664
Biến X có thể có hàng triệu giá trị.

00:07:06.688 --> 00:07:08.641
nghĩa là hàng triệu điểm ảnh trong hình.

00:07:08.665 --> 00:07:11.111
Biến W có hàng tỉ hay cả ngàn tỉ giá trị,

00:07:11.135 --> 00:07:14.556
tương ứng với khối lượng khác nhau
của toàn bộ xi-náp trong mạng nơron.

00:07:14.580 --> 00:07:16.455
Và với biến Y, chỉ có 4 giá trị,

00:07:16.479 --> 00:07:18.337
là số giá trị mà mạng nơron xuất ra.

00:07:18.361 --> 00:07:20.110
"B-i-r-d" có 4 kí tự đúng không?

00:07:21.088 --> 00:07:24.514
Giờ thì hãy giả sử ta có biểu thức
đơn giản này:

00:07:24.538 --> 00:07:26.701
X "x" W =Y.

00:07:26.725 --> 00:07:28.761
Tôi đặt dấu nhân trong ngoặc kép

00:07:28.785 --> 00:07:31.065
vì đó mới là những gì 
đang thực sự diễn ra,

00:07:31.089 --> 00:07:34.135
tất nhiên rất phức tạp, gồm hàng loạt
các bài toán được giải.

NOTE Paragraph

00:07:35.172 --> 00:07:36.393
Đây là một biểu thức.

00:07:36.417 --> 00:07:38.089
Gồm có 3 biến số.

00:07:38.113 --> 00:07:40.839
Và ta đều biết nếu như ta 
có 1 đẳng thức,

00:07:40.863 --> 00:07:44.505
bạn sẽ tìm được 1 biến khi biết
2 biến còn lại.

00:07:45.158 --> 00:07:48.538
Nên vấn đề mắc phải

00:07:48.562 --> 00:07:51.435
để nhận ra đó là hình vẽ một con chim

00:07:51.459 --> 00:07:52.733
chính là đây:

00:07:52.757 --> 00:07:56.216
đây là nơi Y là biến chưa biết,
và W, X là 2 biến đã biết.

00:07:56.240 --> 00:07:58.699
Bạn biết được mạng nơron,
bạn biết số điểm ảnh.

00:07:58.723 --> 00:08:02.050
Như bạn thấy, chuyện này
khá dễ giải quyết.

00:08:02.074 --> 00:08:04.260
Chỉ cần lấy tích của 2 x 3
là xong.

00:08:04.862 --> 00:08:07.105
Tôi sẽ cho bạn xem một mạng lưới
neuron nhân tạo

00:08:07.105 --> 00:08:09.305
mà nhóm tôi dựng mới đây,
dựng lại hệt như vậy.

NOTE Paragraph

00:08:09.634 --> 00:08:12.494
Mạng lưới này đang chạy trên
một chiếc điện thoại di động,

00:08:12.518 --> 00:08:15.831
và tất nhiên, khả năng tuyệt vời
vốn có của chiếc điện thoại

00:08:15.855 --> 00:08:19.323
chính là nó có thể thực hiện hàng tỉ,
hàng ngàn tỉ thao tác

00:08:19.347 --> 00:08:20.595
mỗi giây.

00:08:20.619 --> 00:08:22.514
Bạn đang nhìn thấy 
một chiếc điện thoại

00:08:22.514 --> 00:08:25.805
đang nhìn lần lượt những bức ảnh
có hình chim,

00:08:25.829 --> 00:08:28.544
và nó không hô lên
"Đúng rồi, đây là chim,"

00:08:28.568 --> 00:08:31.979
mà lại xác định mỗi loài chim với một
mạng lưới tương tự như bộ não.

00:08:32.890 --> 00:08:34.716
Nên trong bức tranh đó,

00:08:34.740 --> 00:08:38.542
X và W là hai đại lượng đã có,
và Y là ẩn.

00:08:38.566 --> 00:08:41.344
Tôi đang chú thích cho một phần
rất hóc búa, dĩ nhiên rồi,

00:08:41.344 --> 00:08:44.843
để hiểu làm cách nào
mà ta tìm được biến W.

00:08:44.843 --> 00:08:47.054
não chúng ta thật sự 
làm được chuyện này sao?

00:08:47.054 --> 00:08:49.978
Nhưng chúng ta chưa học về 
những mô hình thế này bao giờ mà?

NOTE Paragraph

00:08:49.978 --> 00:08:52.651
Nên bước này chúng ta học
cách giải ra W,

00:08:52.675 --> 00:08:55.322
nếu ta làm giả bài này 
với cách giải của đơn thức

00:08:55.346 --> 00:08:57.346
bằng cách xem chúng là các con số,

00:08:57.370 --> 00:08:59.847
chúng ta biết cách giải đúng: 6 = 2 x W,

00:08:59.917 --> 00:09:03.393
thì lấy 6 chia 2 là tiêu đời.

00:09:04.001 --> 00:09:06.221
Vấn đề chính là phép chia này đây.

00:09:06.823 --> 00:09:07.974
Vậy, phép chia này...

00:09:07.998 --> 00:09:11.119
Chúng ta sử dụng phép chia vì nó
nó nghịch đảo với phép nhân,

00:09:11.143 --> 00:09:12.583
nhưng tôi đã nói vừa nãy,

00:09:12.607 --> 00:09:15.176
Phép nhân này thật ra không chỉ
là một phép nhân.

00:09:15.176 --> 00:09:18.406
Đây là một phép tính cực kỳ phức tạp,
vô cùng lắt léo;

00:09:18.430 --> 00:09:20.134
và không có phép tính nghịch đảo.

00:09:20.158 --> 00:09:23.308
Nên chúng ta phải tìm cách khác 
để giải biểu thức này

00:09:23.332 --> 00:09:25.356
mà không được dùng phép chia.

00:09:25.380 --> 00:09:28.603
Trong khi cách giải lại không rối rắm.


00:09:28.603 --> 00:09:30.908
Đừng sợ, hãy dùng một mẹo nhỏ trong
môn đại số,

00:09:30.908 --> 00:09:33.348
hãy chuyển 6 qua vế bên phải.

00:09:33.372 --> 00:09:35.368
Giờ thì chúng ta vẫn 
đang dùng phép nhân.

00:09:35.675 --> 00:09:39.255
Và số 0 đó, hãy coi nó là lỗi đi.

00:09:39.279 --> 00:09:41.794
Có nghĩa là, nếu ta giải đúng được W,

00:09:41.818 --> 00:09:43.474
thì lỗi sẽ bằng 0.

00:09:43.498 --> 00:09:45.436
Và nếu ta chưa giải đúng được,

00:09:45.460 --> 00:09:47.209
thì lỗi đó sẽ lớn hơn 0 nhiều.

NOTE Paragraph

00:09:47.233 --> 00:09:50.599
Nên giờ ta chỉ có thể đoán sao để
lỗi có giá trị nhỏ nhất,

00:09:50.623 --> 00:09:53.310
và đó là chuyện mà máy vi tính
rất thành thạo.

00:09:53.334 --> 00:09:54.927
Vậy bạn vừa mới đoán:

00:09:54.951 --> 00:09:56.107
giả sử W = 0 ?

00:09:56.131 --> 00:09:57.371
Vậy thì số lỗi = 6.

00:09:57.395 --> 00:09:58.825
W = 4 thì sao? Vậy lỗi = 4.

00:09:58.825 --> 00:10:01.282
Rồi sau đó máy tính sẽ như 
chơi trò bịt mắt bắt dê,

00:10:01.282 --> 00:10:03.623
và đuổi theo lỗi cho đến khi nó
gần chạm tới 0.

00:10:03.647 --> 00:10:06.151
Nó sẽ tiến dần về giá trị đúng của W.


00:10:06.151 --> 00:10:10.701
Thật ra sẽ không có giá trị hoàn toàn
chính xác, nhưng sau mười mấy lần,

00:10:10.725 --> 00:10:15.349
chúng ta có được W = 2.999,
là giá trị gần đúng nhất.

00:10:16.302 --> 00:10:18.116
Và đây chính là quá trình học tập.

NOTE Paragraph

00:10:18.140 --> 00:10:20.870
Hãy nhớ điều đang diễn ra 
từ nãy đến giờ

00:10:20.894 --> 00:10:25.272
là cách thức chúng ta sử dụng rất nhiều
giá trị đã biết của X và Y

00:10:25.296 --> 00:10:28.750
để tìm ra mối quan tâm của ta là W,
thông qua quá trình lặp đi lặp lại.

00:10:28.774 --> 00:10:32.330
Đó cũng chính là phương pháp
học tập của chúng ta.

00:10:32.354 --> 00:10:35.504
Khi còn nhỏ người lớn cho ta
xem rất nhiều hình ảnh và nói

00:10:35.504 --> 00:10:37.991
"đây là con chim", "còn đây không phải".


00:10:37.991 --> 00:10:40.162
Qua thời gian, và qua việc học đi học lại,

00:10:40.162 --> 00:10:43.214
chúng ta giải được W, là
giải được các kết nối nơron.

NOTE Paragraph

00:10:43.460 --> 00:10:47.546
Nên giờ đây chúng ta đem X và W đã
cố định để tìm Y;

00:10:47.570 --> 00:10:49.417
đó là sự tri nhận nhanh hằng ngày.

00:10:49.441 --> 00:10:51.334
Chúng ta hiểu rằng mình có thể giải W,

00:10:51.334 --> 00:10:53.131
đó là học tập, khó hơn nhiều,

00:10:53.155 --> 00:10:55.140
vì chúng ta phải giảm thiểu lỗi sai,

00:10:55.164 --> 00:10:57.281
bằng cách sử dụng 
phương pháp luyện tập.

NOTE Paragraph

00:10:57.281 --> 00:11:00.162
Khoảng 1 năm trước,thành viên 
Alex Mordvinstev của nhóm tôi,

00:11:00.162 --> 00:11:03.636
quyết định làm thí nghiệm xem
chuyện gì xảy ra nếu ta cố tìm X,

00:11:03.660 --> 00:11:05.697
khi đã biết 1 giá trị W và 1 giá trị Y.

00:11:06.124 --> 00:11:07.275
Nói cách khác,

00:11:07.299 --> 00:11:08.651
bạn biết đó là con chim,

00:11:08.675 --> 00:11:11.978
và bạn cũng biết là hệ thần kinh
của mình được dạy, đó là chim

00:11:12.002 --> 00:11:14.346
vậy thì bức hình một con chim là gì?

00:11:15.034 --> 00:11:20.058
Hoá ra khi sử dụng 1 quá trình giống 
như quá trình giảm thiểu lỗi,

00:11:20.082 --> 00:11:23.092
có thể giảm thiểu sai sót của mạng lưới 


00:11:23.092 --> 00:11:26.104
được dạy để nhận ra chim, và kết quả...

00:11:30.400 --> 00:11:32.495
là một bức hình gồm nhiều loài chim.

00:11:32.814 --> 00:11:36.551
Đây là bức hình có nhiều loài chim
được tạo ra hoàn toàn từ 1 hệ thần kinh

00:11:36.575 --> 00:11:38.401
đã được dạy để nhận ra các loài chim,

00:11:38.425 --> 00:11:41.963
chỉ bằng việc tìm X thay vì tìm Y,

00:11:41.987 --> 00:11:43.655
và làm đi làm lại quá trình đó.

NOTE Paragraph

00:11:43.732 --> 00:11:45.579
Đây là một ví dụ khác.

00:11:45.603 --> 00:11:49.040
Đây là tác phẩm của thành viên
Mike Tyka của nhóm tôi,

00:11:49.064 --> 00:11:51.372
cậu ấy gọi nó là "Đoàn thú tuần hành".

00:11:51.396 --> 00:11:54.272
Nó làm tôi nhớ tới các tác phẩm
của William Kentridge,

00:11:54.296 --> 00:11:56.785
khi ông cứ phác ra các hình vẽ, rồi bôi,

00:11:56.809 --> 00:11:58.269
rồi vẽ phác lại, rồi lại bôi,

00:11:58.293 --> 00:12:00.111
và tạo ra một kiểu phim theo cách này.

00:12:00.141 --> 00:12:01.186
Trong tranh này,

00:12:01.196 --> 00:12:04.011
Mike đã đa dạng hoá biến Y
thành nhiều loài thú khác nhau,

00:12:04.011 --> 00:12:06.953
trong một mạng lưới được thiết kế
để nhận biết và phân biệt

00:12:06.953 --> 00:12:08.537
mỗi loài có nhiều loài khác nữa.

00:12:08.537 --> 00:12:12.182
Và giờ bạn có được một bức như tranh
biến hình động vật của hoạ sĩ Escher.

NOTE Paragraph

00:12:14.221 --> 00:12:18.835
Ở đây cậu ấy và Alex cùng thử

00:12:18.859 --> 00:12:21.618
giảm không gian của biến Y còn 2 chiều,

00:12:21.642 --> 00:12:25.080
để tạo ra một bản đồ có mặt 
mọi thứ khác nhau

00:12:25.104 --> 00:12:26.823
mà mạng lưới này nhận ra.

00:12:26.847 --> 00:12:28.870
Khi thực hiện tổng hợp như vậy

00:12:28.894 --> 00:12:31.276
hay tạo ra hình ảnh trên toàn bộ bề mặt,

00:12:31.300 --> 00:12:34.246
đa dạng giá trị Y trên mặt phẳng,
bạn có thể tạo ra

00:12:34.246 --> 00:12:37.311
một loại bản đồ có tất cả những thứ
mà mạng lưới nhận biết được.

00:12:37.335 --> 00:12:40.660
Tất cả các loài thú đều ở ngay đây;
"armadillo" ngay vị trí trung tâm.

NOTE Paragraph

00:12:40.919 --> 00:12:43.398
Bạn có thể tạo bản đồ cho những mạng
lưới khác nữa.

00:12:43.422 --> 00:12:46.296
Đây là mạng lưới được thiết kế
để nhận diện các khuôn mặt,

00:12:46.320 --> 00:12:48.320
để phân biệt mặt người này, người kia.

00:12:48.344 --> 00:12:51.593
Còn đây, chúng ta đang chọn Y
có giá trị là "tôi",

00:12:51.617 --> 00:12:53.592
là thông số giúp nhận ra gương mặt tôi.

00:12:53.592 --> 00:12:54.922
Và khi dùng Y để tìm X,

00:12:54.946 --> 00:12:57.564
nó cho ra một thứ rất điên,

00:12:57.588 --> 00:13:02.016
đại loại như tranh lập thể, siêu thực 
vẽ tôi đang phê thuốc

00:13:02.040 --> 00:13:03.846
từ nhiều góc nhìn khác nhau cùng lúc.

00:13:03.870 --> 00:13:06.604
Sở dĩ nó như nhiều góc nhìn khác nhau
cùng một lúc là vì

00:13:06.628 --> 00:13:10.049
mạng lưới được thiết kế 
để tránh sự mơ hồ khi nhận diện

00:13:10.049 --> 00:13:13.125
một gương mặt khi nhìn ở góc này 
so với khi nhìn ở góc khác,

00:13:13.125 --> 00:13:16.215
hay trong điều kiện chiếu sáng
khác nhau.

00:13:16.239 --> 00:13:18.324
Nên khi bạn thực hiện việc tái cấu tạo,

00:13:18.348 --> 00:13:20.652
nếu không sử dụng kiểu hình ảnh hướng dẫn

00:13:20.676 --> 00:13:22.307
hay thông số hướng dẫn để làm mẫu,

00:13:22.307 --> 00:13:25.676
thì bạn sản phẩm nhận được
là một bức hình rối mắt ở mọi góc nhìn,

00:13:25.700 --> 00:13:27.068
vì mọi thứ trông rất mờ ảo.

00:13:27.786 --> 00:13:32.009
Đây là kết quả khi Ales sử dụng
mặt mình làm hình ảnh mẫu

00:13:32.033 --> 00:13:35.354
trong quá trình tối ưu hoá mạng lưới
để tái hiện gương mặt tôi.

00:13:36.284 --> 00:13:38.612
Nên có thể bạn thấy nó không hoàn hảo.

00:13:38.636 --> 00:13:40.510
Vẫn còn khá nhiều chuyện để làm

00:13:40.534 --> 00:13:43.007
để cải thiện tối đa
quá trình tái cấu trúc.

00:13:43.007 --> 00:13:45.838
Nhưng giờ thì có được
bức tranh một gương mặt liền mạch

00:13:45.862 --> 00:13:47.876
sử dụng mặt tôi làm hình hướng dẫn.

NOTE Paragraph

00:13:48.892 --> 00:13:51.393
Bạn không cần phải bắt đầu
vẽ với tờ giấy trắng

00:13:51.417 --> 00:13:52.573
hay tiếng ồn trắng.

00:13:52.597 --> 00:13:53.901
Khi tìm X,

00:13:53.925 --> 00:13:57.814
bạn có thể bắt đầu với X,
bản thân nó đã là một hình.

00:13:57.838 --> 00:14:00.394
Đó là điều mà tôi minh hoạ hôm nay.

00:14:00.418 --> 00:14:04.540
Hệ thần kinh nhân tạo này được
thiết kế để phân loại

00:14:04.564 --> 00:14:07.683
tất cả vật thể khác nhau,
như công trình nhân tạo, động vật...

00:14:07.707 --> 00:14:10.300
Ở đây, đầu tiên ta có bức tranh với
những đám mây,

00:14:10.324 --> 00:14:11.995
và khi ta tối ưu hoá hình này,

00:14:12.019 --> 00:14:16.505
về căn bản, hệ thần kinh nhân tạo
đang xác định mấy đám mây có hình gì.

00:14:16.931 --> 00:14:19.251
Và khi nhìn bức hình này càng lâu,

00:14:19.275 --> 00:14:22.028
bạn càng thấy được nhiều thứ 
tạo ra từ những đám mây đó.

00:14:23.004 --> 00:14:26.379
Bạn cũng có thể dùng hệ nhận diện
khuôn mặt để tạo ảo giác cho nền này,

00:14:26.403 --> 00:14:28.215
và sẽ có được một sản phẩm điên khùng.

NOTE Paragraph

00:14:28.239 --> 00:14:29.389
(Cười)

NOTE Paragraph

00:14:30.401 --> 00:14:33.145
Hay như vầy, Mike 
có vài thí nghiệm nữa

00:14:33.169 --> 00:14:37.074
cậu ấy lấy hình đám mây,

00:14:37.098 --> 00:14:40.605
tạo hiệu ứng ảo, phóng đại, rồi chỉnh ảo,
phóng, rồi chỉnh, rồi lại phóng.

00:14:40.629 --> 00:14:41.780
Và bằng cách này,

00:14:41.804 --> 00:14:45.479
tôi nghĩ bạn sẽ nhận được một
hệ thần kinh đang thấy lâng lâng,

00:14:45.503 --> 00:14:49.183
hay là sự kết hợp tự do,

00:14:49.207 --> 00:14:52.094
trong đó bạn sẽ thấy mạng lưới ấy
đang ăn cái đuôi của mình.

00:14:52.094 --> 00:14:54.879
Nên mỗi hình đều là ảnh nền cho

00:14:54.903 --> 00:14:56.324
hình "tôi sẽ thấy gì kế tiếp?

00:14:56.348 --> 00:14:59.151
tôi sẽ nhìn thấy gì kế tiếp?
tôi sẽ nhìn thấy gì kế tiếp?"

NOTE Paragraph

00:14:59.487 --> 00:15:02.423
Tôi đã đem trưng bày bức tranh

00:15:02.447 --> 00:15:07.884
cho nhóm dự thính bài giảng 
"Giáo dục Cấp cao" ở Seattle xem

00:15:07.908 --> 00:15:10.855
ngay sau khi ma tuý 
được hợp thức hoá.

NOTE Paragraph

00:15:10.855 --> 00:15:12.784
(Cười)

NOTE Paragraph

00:15:14.627 --> 00:15:16.731
Tôi sẽ kết thúc nhanh thôi

00:15:16.755 --> 00:15:21.010
bằng việc nhấn mạnh rằng công nghệ
không có giới hạn.

00:15:21.034 --> 00:15:24.699
Tôi chỉ mới cho bạn xem những ví dụ
thị giác vì chúng nhìn vui mắt.

00:15:24.723 --> 00:15:27.048
Chứ công nghệ 
không chỉ thuần về thị giác.

00:15:27.048 --> 00:15:29.451
Cộng tác viên của chúng tôi, hoạ sĩ 
Ross Goodwin,

00:15:29.451 --> 00:15:32.886
đã có nhiều thí nghiệm có cả
một camera chụp hình,

00:15:32.910 --> 00:15:37.144
và sau đó 1 cái máy tính trong balô của
cậu ấy viết 1 bài thơ bằng mạng nơron,

00:15:37.168 --> 00:15:39.112
dựa vào nội dung của
hình ảnh ghi nhận.

00:15:39.136 --> 00:15:42.093
Hệ thần kinh nhân tạo viết ra bài thơ đó
đã được học

00:15:42.093 --> 00:15:44.341
một kho ngữ liệu lớn 
về thơ ca thế kỷ 20.

00:15:44.365 --> 00:15:45.864
Và bài thơ đó, bạn biết không,

00:15:45.888 --> 00:15:47.802
thật ra cũng không dở lắm đâu.

NOTE Paragraph

00:15:47.826 --> 00:15:49.210
(Cười)

NOTE Paragraph

00:15:49.234 --> 00:15:50.393
Tóm lại,

00:15:50.417 --> 00:15:52.549
Tôi nghĩ người tên Michelangelo đó,

00:15:52.573 --> 00:15:53.807
Ông ấy đã đúng;

00:15:53.831 --> 00:15:57.267
Sự tri nhận và sáng tạo
có liên quan mật thiết với nhau.

00:15:57.611 --> 00:16:00.245
Những hệ thần kinh nhân tạo
mà ta vừa thấy

00:16:00.269 --> 00:16:02.486
vốn chỉ được thiết kế 
để tiếp nhận, phân biệt,

00:16:02.486 --> 00:16:05.518
để nhận biết những sự vật
khác nhau của thế giới,

00:16:05.518 --> 00:16:08.023
giờ có thể làm ngược lại, tạo ra cái mới.

00:16:08.047 --> 00:16:09.904
Một trong những điều tôi cảm giác được

00:16:09.924 --> 00:16:12.252
không chỉ là Michelangelo 
thật sự nhìn ra

00:16:12.276 --> 00:16:14.728
bức điêu khắc bên trong tảng đá,

00:16:14.752 --> 00:16:18.390
mà ông thấy bất kì sinh vật nào,
thực thể nào, trong hay ngoài hành tinh

00:16:18.414 --> 00:16:22.071
chỉ cần biết tri nhận,

00:16:22.095 --> 00:16:23.470
sẽ có thể sáng tạo

00:16:23.494 --> 00:16:26.718
vì có cơ chế chung dùng cho cả
hai quá trình ấy.

NOTE Paragraph

00:16:26.742 --> 00:16:31.274
Tôi cũng nghĩ rằng sự tri nhận
và sáng tạo không thể nào

00:16:31.298 --> 00:16:32.508
chỉ con người mới có.

00:16:32.532 --> 00:16:36.240
Chúng ta bắt đầu có những 
mẫu máy tính làm được những thứ này.

00:16:36.264 --> 00:16:39.592
Và điều đó không có gì lạ;
bộ não chính là bộ máy.

NOTE Paragraph

00:16:39.616 --> 00:16:41.273
Và sau cùng,

00:16:41.297 --> 00:16:45.965
máy tính bắt đầu trở thành công cụ
thiết kế trí tuệ nhân tạo.

00:16:45.989 --> 00:16:48.451
Điện tử đã trở thành bằng chứng

00:16:48.475 --> 00:16:51.488
chứng minh rằng ta 
có thể làm ra trì tuệ nhân tạo.

00:16:51.512 --> 00:16:53.674
Và cuối cùng chúng ta 
đã có thể hoàn thành

00:16:53.698 --> 00:16:56.104
những hoài bão mà các tiền nhân để lại,

00:16:56.128 --> 00:16:57.841
chính là Turing, Von Neumann

00:16:57.865 --> 00:17:00.130
McCulloch và Pitts.

00:17:00.154 --> 00:17:04.252
Và tôi nghĩ điện toán không chỉ 
tập trung cho việc tính toán,

00:17:04.276 --> 00:17:06.423
để chơi Candy Crush 
hoặc những trò khác.

00:17:06.447 --> 00:17:09.265
Từ đầu, máy tính được tạo ra
theo hình mẫu là não người.

00:17:09.265 --> 00:17:12.318
Và nhờ máy tính, chúng ta hiểu 
về bộ não mình rõ hơn

00:17:12.342 --> 00:17:13.871
để có thể cải tiến chúng.

NOTE Paragraph

00:17:14.627 --> 00:17:15.794
Cám ơn rất nhiều.

NOTE Paragraph

00:17:15.818 --> 00:17:21.757
(Vỗ tay)