Ứng dụng tuyệt vời hay đáng sợ của máy tính biết học

0:01 - 0:05

Ngày xưa nếu bạn muốn máy tính
thực hiện thao tác mới,
0:05 - 0:06

thì bạn phải lập trình nó trước.
0:06 - 0:10

Đối với những bạn ở đây
chưa từng lập trình,
0:10 - 0:13

việc này đòi hỏi phải lập sơ đồ chi tiết
0:13 - 0:17

từng bước một cho điều
bạn muốn máy tính thực hiện
0:17 - 0:19

để đạt được mục tiêu của bạn.
0:19 - 0:23

Nếu bạn muốn làm một việc mà chính bạn
cũng không biết cách làm,
0:23 - 0:25

thì đây sẽ là một thử thách khá lớn.
0:25 - 0:28

Đây là thử thách mà người đàn ông này,
Arthur Samuel, gặp phải.
0:28 - 0:32

Vào năm 1956, ông muốn chiếc máy tính này
0:32 - 0:35

có thể đánh bại ông trong môn cờ tướng.
0:35 - 0:37

Làm sao mà bạn có thể viết ra chương trình
0:37 - 0:40

tỉ mỉ, chi tiết về cách chơi
cờ tướng giỏi hơn chính bạn ?
0:40 - 0:42

Vậy là ông nảy ra một ý tưởng:
0:42 - 0:46

ông để máy tính tự chơi lại hàng ngàn lần
0:46 - 0:48

và tự học cách chơi cờ.
0:48 - 0:52

Và quả nhiên cách này hiệu quả,
và thật sự, đến năm 1962,
0:52 - 0:56

chiếc máy này đã đánh bại
quán quân bang Connecticut.
0:56 - 0:59

Arthur Samuel là cha đẻ của
lĩnh vực machine learning,
0:59 - 1:00

và tôi rất biết ơn ông,
1:00 - 1:03

bởi tôi là một người làm trong
ngành "máy biết học".
1:03 - 1:04

Tôi từng là Chủ tịch ở Kaggle
1:04 - 1:08

một cộng đồng gồm hơn 200,000
chuyên gia về "máy biết học".
1:08 - 1:10

Kaggle tổ chức các cuộc thi
1:10 - 1:14

với thử thách là
những vấn đề chưa có lời giải,
1:14 - 1:17

và họ đã thành công hàng trăm lần.
1:17 - 1:20

Với vị thế thuận lợi đó,
tôi đã khám phá ra
1:20 - 1:24

rất nhiều thứ mà "máy biết học" có thể
làm được trước đây, làm được bây giờ,
1:24 - 1:26

và những gì nó có thể làm trong tương lai.
1:26 - 1:31

Có lẽ sự thành công vang dội đầu tiên
của "máy biết học" là Google
1:31 - 1:34

Google cho ta thấy nó có thể
tìm kiếm thông tin
1:34 - 1:36

bằng cách sử dụng thuật toán,
1:36 - 1:38

và thuật toán này dựa trên
"máy biết học",
1:38 - 1:42

Kể từ đó, đã có rất nhiều thành công
về mặt thương mại của "máy biết học".
1:42 - 1:44

Công ty như Amazon và Netflix
1:44 - 1:48

sử dụng "máy biết học"để gợi ý
những sản phẩm bạn có thể muốn mua,
1:48 - 1:50

các bộ phim bạn có thể muốn xem.
1:50 - 1:52

Đôi khi nó làm ta
rùng mình.
1:52 - 1:54

Các công ty như LinkedIn và Facebook
1:54 - 1:56

đôi khi sẽ nói cho bạn biết ai có thể
là bạn bè của bạn
1:56 - 1:58

và bạn không hiểu nổi làm sao họ tìm ra,
1:58 - 2:01

và đó là vì họ dùng đến sức mạnh của
"máy biết học".
2:01 - 2:04

Đây là thuật toán tự học cách xử lý
từ cơ sở dữ liệu,
2:04 - 2:07

thay vì được lập trình sẵn trước đó.
2:07 - 2:10

Đây cũng là cách IBM thành công
2:10 - 2:14

trong việc khiến cho Watson đánh bại
hai nhà vô địch chương trình "Jeopardy",
2:14 - 2:17

bằng cách trả lời những câu hỏi hóc
búa và phức tạp như :
2:17 - 2:20

[Sư tử Nimrud bị mất tại bảo tàng
quốc gia thành phố ...
2:20 - 2:23

Đây cũng là cơ sở cho
những xe hơi tự lái đầu tiên.
2:23 - 2:26

Nếu chúng phân biệt
được sự khác nhau giữa
2:26 - 2:28

cây xanh và người đi bộ,
thì đó là việc rất quan trọng.
2:28 - 2:31

Chúng ta không biết cách viết
những chương trình này,
2:31 - 2:34

nhưng với "máy biết học", điều đó
trở thành có thể.
2:34 - 2:37

Và thực tế, loại xe này đã đi được
cả triệu dặm
2:37 - 2:40

trên những con đường bình thường
mà không gây tai nạn nào.
2:40 - 2:44

Bây giờ chúng ta biết máy tính
có thể học được,
2:44 - 2:46

và chúng có thể học
cách làm những việc
2:46 - 2:49

mà đôi khi chính chúng ta
không biết cách làm,
2:49 - 2:52

hoặc có thể chúng làm tốt hơn ta.
2:52 - 2:56

Một trong những ví dụ ngoạn mục nhất
về "máy biết học" tôi từng thấy
2:56 - 2:58

là dự án tôi tham gia ở Kaggle
2:58 - 3:02

nơi đó có một anh chàng điều khiển
một nhóm, anh ta tên là Geofrey Hinton
3:02 - 3:03

đến từ Đại học Toronto
3:03 - 3:06

nhóm này thắng cuộc thi về
chế tạo máy phát hiện ma túy.
3:06 - 3:09

Bây giờ, điều phi thường ở đây
không phải là họ đánh bại
3:09 - 3:13

tất cả các giải thuật phát triển bới Merk
hay các cộng đồng học thuật quốc tế khác
3:13 - 3:18

mà chính là họ không có thành viên nào
chuyên về hóa, sinh hay khoa học đời sống,
3:18 - 3:20

và họ đã tạo ra chiếc máy
chỉ trong 2 tuần.
3:20 - 3:22

Làm thế nào mà họ làm được?
3:22 - 3:25

Họ dùng 1 siêu giải thuật
gọi là deep learning: "học sâu".
3:25 - 3:28

Thành công này quan trọng
đến mức đã được lên
3:28 - 3:31

trang bìa tờ New York Times
vài tuần sau đó.
3:31 - 3:34

Đây là Geoffrey Hinton ở đây bên bìa trái.
3:34 - 3:38

"Học sâu" là một giải thuật lấy
cảm hứng từ cách làm việc của não người,
3:38 - 3:40

và kết quả là giải thuật này
3:40 - 3:44

về lý thuyết, không có giới hạn cho
những gì nó có thể làm.
3:44 - 3:47

Bạn đưa vào càng nhiều dữ liệu và
cho càng nhiều thời gian,
3:47 - 3:48

thì nó càng làm tốt.
3:48 - 3:51

Trong bài báo này, Tờ New York Times
cũng nói về
3:51 - 3:53

một kết quả tuyệt vời khác
của "học sâu"
3:53 - 3:56

mà tôi sẽ cho các bạn xem bây giờ.
3:56 - 4:01

Đó là máy tính có thể nghe và hiểu.
4:01 - 4:03

(Video) Richard Rashid:
Bây giờ là bước cuối cùng
4:03 - 4:06

mà tôi muốn làm trong quá trình này
4:06 - 4:11

là nói chuyện với các bạn bằng
tiếng Trung.
4:11 - 4:14

Điểm mấu chốt đó là,
4:14 - 4:19

chúng tôi có thể lấy lượng lớn
thông tin từ những người nói tiếng Trung
4:19 - 4:21

và tạo ra hệ thống chuyển văn bản
thành giọng nói
4:21 - 4:26

nó giúp lấy văn bản tiếng Trung chuyển
thành tiếng Trung,
4:26 - 4:30

và sau đó chúng tôi đã thực hiện khoảng
1 giờ để lấy giọng của chính tôi
4:30 - 4:32

từ đó chúng tôi đã điều chỉnh
4:32 - 4:36

hệ thống chuyển 'văn bản-lời nói'
để cho ra được giọng nói giống tôi.
4:36 - 4:39

Lần nữa, kết quả không hoàn hảo.
4:39 - 4:42

Thực tế vẫn còn một vài lỗi.
4:42 - 4:44

( tiếng Trung).
4:44 - 4:47

(vỗ tay)
4:49 - 4:53

Còn nhiều việc để làm trong lĩnh vực này.
4:53 - 4:57

( tiếng Trung)
4:57 - 5:00

( vỗ tay)
5:01 - 5:05

Jeremy Howard: đó là trong một hội thảo
về "máy biết học" ở Trung Quốc.
5:05 - 5:07

Thực ra ở hội thảo học thuật, các bạn
5:07 - 5:09

thường ít nghe tiếng vỗ tay tự phát,
5:09 - 5:13

ngay cả ở các hội thảo của TEDx,
hay vỗ tay thoải mái đi.
5:13 - 5:15

Những điều bạn thấy đó
đang diễn ra với "học sâu".
5:15 - 5:17

( vỗ tay) Cảm ơn.
5:17 - 5:19

Viết lại lời tiếng tiếng Anh
bằng "học sâu".
5:19 - 5:23

Dịch sang tiếng Trung có văn bản
ở trên bên phải, do "học sâu",
5:23 - 5:26

và xây dựng giọng nói cũng nhờ
"học sâu".
5:26 - 5:29

"Học sâu" thật sự phi thường.
5:29 - 5:32

Nó là một giải thuật đơn giản mà có vẻ
làm được hầu hết mọi thứ,
5:32 - 5:35

và tôi phát hiện trước đó một năm,
nó còn học nhìn thấy.
5:35 - 5:38

Trong cuộc thi ở Đức,
5:38 - 5:40

cuộc thi 'Nhận biết Tín hiệu
Giao thông Benchmark',
5:40 - 5:44

"học sâu" nhận biết các
tín hiệu giao thông,như cái này.
5:44 - 5:46

Nó không chỉ nhận biết tín hiệu giao thông
5:46 - 5:47

tốt hơn bất kỳ giải thuật nào khác,
5:47 - 5:50

mà còn làm tốt hơn cả con người,
5:50 - 5:52

tốt hơn gấp đôi.
5:52 - 5:54

Năm 2011, chúng tôi có thử nghiệm đầu tiên
5:54 - 5:57

cho thấy máy tính có thể nhìn
tốt hơn con người.
5:57 - 5:59

Từ đó, rất nhiều điều đã xảy ra.
5:59 - 6:03

Năm 2012, Google thông báo họ đã có một
giải thuật "học sâu"
6:03 - 6:04

xem được video trên YouTube
6:04 - 6:08

và lấy dữ liệu từ 16,000 máy tính trong
một tháng,
6:08 - 6:12

và máy tính đã học một cách độc lập
các khái niệm "người" và "mèo"
6:12 - 6:14

chỉ bằng việc xem các videos.
6:14 - 6:16

Cách này rất giống
cách học của con người.
6:16 - 6:19

Không cần khái niệm có sẵn,
ta học từ cái ta nhìn thấy,
6:19 - 6:22

ta có thể hiểu trực tiếp
bản chất của sự vật đó.
6:22 - 6:26

Cũng trong năm 2012, Geoffrey Hinton,
6:26 - 6:29

chiến thắng cuộc thi
ImageNet rất nổi tiếng,
6:29 - 6:33

vì đã tìm ra cách để xác định
một trong số nửa triệu tấm ảnh
6:33 - 6:34

được giao trước.
6:34 - 6:38

Từ 2014, chúng tôi đã giảm
còn 6% tỉ lệ lỗi
6:38 - 6:39

trong việc nhận diện hình ảnh.
6:39 - 6:41

Với dạng việc này,
máy cũng hơn con người.
6:41 - 6:45

Thật vậy, máy rất siêu trong lĩnh vực này,
6:45 - 6:47

và đang được ứng dụng trong công nghiệp.
6:47 - 6:50

Ví dụ, năm ngoái Google thông báo
6:50 - 6:55

họ đã lập bản đồ mọi địa điểm ở Pháp
trong 2 giờ,
6:55 - 6:58

và cách họ làm là nạp những hình ảnh
đường phố
6:58 - 7:03

vào giải thuật "học sâu" để nhận diện
và đọc số nhà.
7:03 - 7:05

Hãy tưởng tượng trước đây
mất bao lâu:
7:05 - 7:08

vài chục người làm việc trong nhiều năm.
7:08 - 7:10

Điều này cũng diễn ra ở Trung Quốc.
7:10 - 7:14

Tôi thấy Baidu cũng là một dạng
Google ở Trung Quốc,
7:14 - 7:17

và những gì bạn thấy ở trên bên góc trái
7:17 - 7:20

là một ví dụ về một bức ảnh tôi tải lên
hệ thống "học sâu" của Baidu
7:20 - 7:24

và ở dưới bạn có thể thấy kết quả
hệ thống xử lý bức ảnh
7:24 - 7:26

và nó đã tìm ra những bức hình tương tự.
7:26 - 7:29

Những bức hình tương tự thực ra có
nền tương tự,
7:29 - 7:31

hướng của khuôn mặt tương tự,
7:31 - 7:33

và cả một số hình có lưỡi thè ra.
7:33 - 7:36

Đây không phải là đối chiếu văn bản
của trang web.
7:36 - 7:37

Tôi chỉ upload một tấm ảnh.
7:37 - 7:41

Vậy chúng ta đang có những chiếc máy tính
thực sự hiểu được những gì chúng nhìn thấy
7:41 - 7:43

và có thể nhờ đó tìm dữ liệu
7:43 - 7:46

của hàng trăm triệu tấm ảnh.
7:46 - 7:50

Điều đó có nghĩa là gì khi máy tính
có thể nhìn thấy?
7:50 - 7:52

À, máy tính không chỉ có thể
nhìn thấy.
7:52 - 7:54

Thật ra, "học sâu"
còn làm được nhiều hơn.
7:54 - 7:57

Những câu phức tạp và đầy
nét khác biệt tinh tế như câu này
7:57 - 7:59

giờ đã được hiểu bởi giải thuật "học sâu".
7:59 - 8:01

Như các bạn thấy ở đây,
8:01 - 8:03

hệ thống nền Stanford này đang chiếu điểm
đỏ ở trên
8:03 - 8:07

đã tìm ra rằng câu này thể hiện tình cảm
tiêu cực.
8:07 - 8:11

"học sâu" thực sự đang gần giống như
con người
8:11 - 8:16

trong việc hiểu chủ đề các câu
và nội dung diễn đạt.
8:16 - 8:19

"học sâu" có thể đọc tiếng Trung,
8:19 - 8:22

giống như người nói tiếng Trung bản xứ.
8:22 - 8:24

Giải thuật này phát triển ở Thụy Sĩ
8:24 - 8:27

bởi những người không
biết tí gì tiếng Trung.
8:27 - 8:29

Như tôi đã nói, "học sâu"
8:29 - 8:32

là phương tiện tốt nhất
trong lĩnh vực này,
8:32 - 8:37

vì nó có thể hiểu
thậm chí như người bản địa.
8:37 - 8:40

Đây là hệ thống chúng tôi trang bị
ở công ty tôi,
8:40 - 8:42

công ty tôi muốn sử dụng
và kết hợp tất cả.
8:42 - 8:44

Đây là những tấm hình không kèm theo
dòng chữ nào,
8:44 - 8:47

vì tôi viết những câu vào chỗ này,
8:47 - 8:50

nhờ đó nó hiểu những tấm hình này
8:50 - 8:51

và tìm ra chúng nói về cái gì
8:51 - 8:54

và tìm những tấm hình có ý
tương tự với dòng chữ tôi đang viết.
8:54 - 8:57

Vậy các bạn thấy đó, nó thực sự hiểu
được câu tôi viết
8:57 - 8:59

và thực sự hiểu những tấm hình này.
8:59 - 9:02

Tôi biết các bạn từng thấy điều tương tự
trên Google,
9:02 - 9:05

khi bạn viết điều gì đó và chúng hiện
lên các tấm ảnh,
9:05 - 9:08

nhưng thực sự những gì nó đang làm là
tìm những trang web theo dòng chữ.
9:08 - 9:11

Điều này rất khác với việc thực việc hiểu
những tấm ảnh.
9:11 - 9:14

Đây là điều mà máy tính chỉ có thể làm
9:14 - 9:17

lần đầu tiên cách đây vài tháng.
9:17 - 9:21

Chúng ta thấy máy tính không chỉ
nhìn thấy được mà chúng còn đọc được,
9:21 - 9:25

và dĩ nhiên chúng tôi cho thấy chúng còn
hiểu được những gì chúng nghe.
9:25 - 9:28

Có lẽ không còn ngạc nhiên khi tôi nói
với các bạn chúng có thể viết.
9:28 - 9:33

Ở đây là những dòng văn bản tôi tạo ra
bằng giải thuật "học sâu" hôm qua.
9:33 - 9:37

Và đây là những văn bản giải thuật ở
Stanford tạo ra.
9:37 - 9:39

Mỗi câu được tạo ra
9:39 - 9:43

bằng giải thuật "học sâu" nhằm mô tả
những bức ảnh này.
9:43 - 9:48

Trước đây giải thuật này chưa bao giờ
thấy một người đàn ông áo đen chơi ghita
9:48 - 9:50

Nhưng nó đã thấy đàn ông,
và đã thấy màu đen,
9:50 - 9:51

và nó cũng đã thấy đàn ghita,
9:51 - 9:56

rồi nó đã tự tạo ra
chú thích của tấm ảnh này.
9:56 - 9:59

Máy vẫn chưa đạt đến mức như
con người, nhưng cũng khá gần rồi.
9:59 - 10:03

Trong các thí nghiệm máy viết phụ đề
cho hình, số phụ đề được người ta chọn
10:03 - 10:05

chỉ ở tỉ lệ 1/4.
10:05 - 10:07

Nhưng hệ thống này giờ
chỉ mới 2 tuần tuổi,
10:07 - 10:09

nên có thể trong năm tới,
10:09 - 10:12

giải thuật máy tính sẽ còn
hơn cả con người
10:12 - 10:13

và tỉ lệ được chọn sẽ cao hơn.
10:13 - 10:16

Máy tính cũng có thể viết.
10:16 - 10:20

Chúng tôi kết hợp tất cả lại và nó
dẫn đến những cơ hội rất thú vị.
10:20 - 10:21

Ví dụ, trong ngành y,
10:21 - 10:24

một nhóm ở Boston thông báo họ đã tìm ra
10:24 - 10:27

hàng chục tính năng lâm sàng mới
10:27 - 10:31

của các khối u để giúp các
bác sĩ tiên đoán bệnh ung thư.
10:32 - 10:35

Tương tự, ở Stanford,
10:35 - 10:38

một nhóm thông báo rằng, dựa vào
các hình phóng đại của mô,
10:38 - 10:41

họ phát triển hệ thống "máy biết học"
10:41 - 10:43

còn tốt hơn cả các nhà nghiên cứu bệnh học
10:43 - 10:48

nhờ thế làm tăng khả năng sống sót
của các bệnh nhân ung thư.
10:48 - 10:51

Trong cả hai trường hợp, không chỉ việc
tiên đoán chính xác hơn,
10:51 - 10:53

mà còn tạo ra ngành
khoa học mới rất triển vọng.
10:53 - 10:55

Trong lĩnh vực X-quang,
10:55 - 10:58

chúng là những chỉ số lâm sàng
mới mà con người có thể hiểu.
10:58 - 11:00

Trong lĩnh vực bệnh học,
11:00 - 11:04

hệ thống máy tính đã cho thấy rằng
những tế bào xung quanh khối u
11:04 - 11:08

cũng quan trọng như chính tế bào ung thư
11:08 - 11:09

trong việc chẩn đoán bệnh.
11:09 - 11:15

Điều này ngược với những gì các nhà
bệnh học được dạy trong nhiều thập kỷ qua.
11:15 - 11:18

Trong mỗi trường hợp trên,
chúng là các hệ thống được phát triển
11:18 - 11:22

bởi sự hợp tác của các chuyên gia y tế
và các chuyên gia "máy biết học",
11:22 - 11:24

nhưng từ năm trước,
chúng tôi đã tiến khá xa.
11:24 - 11:28

Đây là một ví dụ về xác định khu vực
ung thư
11:28 - 11:30

của mô người dưới kính hiển vi.
11:30 - 11:35

Hệ thống có thể xác định những
khu vực chính xác hơn
11:35 - 11:38

hoặc tương đương các nhà bệnh học,
11:38 - 11:41

nhưng vì nó được xây dựng với
"học sâu" không có chuyên gia ngành y
11:41 - 11:44

nên những người không chuyên
cũng có thể dùng.
11:45 - 11:47

Ví dụ như việc phân đoạn nơ ron này.
11:47 - 11:51

Máy giúp chúng tôi phân đoạn nơ ron
chính xác như các chuyên gia,
11:51 - 11:54

nhưng hệ thống này lại được thiết kế với
"học sâu"
11:54 - 11:57

bởi những người không có
chuyên môn y khoa.
11:57 - 12:00

Còn tôi, cũng không có nền tảng về y khoa,
12:00 - 12:04

thế mà tôi dường như có đầy đủ năng lực
để mở một công ty về ngành y,
12:04 - 12:06

và tôi đã làm.
12:06 - 12:08

Tôi đã từng sợ trước khi bắt đầu,
12:08 - 12:11

nhưng lý thuyết cho thấy mọi người có thể
12:11 - 12:16

dùng những kỹ thuật phân tích dữ liệu
để có được một nền y học hiệu quả.
12:16 - 12:19

Và may mắn là tôi nhận được
những phản hồi rất tốt,
12:19 - 12:21

không chỉ từ truyền thông
mà còn từ giới y khoa,
12:21 - 12:23

họ luôn ủng hộ.
12:23 - 12:27

Về lý thuyết, chúng tôi có thể lấy phần
giữa của quy trình
12:27 - 12:30

và làm phân tích dữ liệu
càng nhiều càng tốt,
12:30 - 12:33

phần còn lại dành cho bác sĩ.
12:33 - 12:35

Tôi muốn đưa ra một ví dụ.
12:35 - 12:40

Thông thường ta cần 15 phút
để làm một xét nghiệm chẩn đoán
12:40 - 12:42

và tôi sẽ làm cho bạn xem
12:42 - 12:45

tôi nén nó thành 3 phút
bằng cách cắt bớt bỏ một số phần.
12:45 - 12:48

Thay vì cho bạn xem quá trình
một xét nghiệm chẩn đoán y học,
12:48 - 12:52

tôi sẽ cho các bạn xem một xét nghiệm
chẩn đoán hình ảnh xe hơi,
12:52 - 12:54

vì như thế sẽ dễ hiểu cho mọi người.
12:54 - 12:57

Chúng tôi bắt đầu với khoảng 1,5 triệu
hình ảnh xe hơi,
12:57 - 13:00

tôi muốn tạo tiêu chuẩn để
gom chúng lại vào góc
13:00 - 13:03

của bức hình đang được chụp.
13:03 - 13:07

Những bức hình này không gắn nhãn trước,
nên tôi phải bắt đầu từ số không.
13:07 - 13:08

Giải thuật "học sâu"
13:08 - 13:12

có thể tự xác định
vùng cấu trúc trong những bức ảnh này.
13:12 - 13:16

Rất thuận lợi, bây giờ con người
và máy tính có thể làm việc cùng nhau.
13:16 - 13:18

Như các bạn đang thấy đây, con người
13:18 - 13:21

đang nói cho máy tính biết
lĩnh vực cần quan tâm
13:21 - 13:25

mà họ muốn máy tính sử dụng để
cải thiện giải thuật của nó.
13:25 - 13:30

Những hệ thống "học sâu" này thực ra là
không gian 16,000 chiều,
13:30 - 13:33

bạn có thể thấy ở đây máy tính quay
quanh không gian đó,
13:33 - 13:35

cố gắng tìm vùng mới của cấu trúc.
13:35 - 13:37

Và khi nó làm thành công,
13:37 - 13:41

người sử dụng máy có thể tìm thấy
khu vực đáng quan tâm.
13:41 - 13:43

Ở đây, máy tính đã tìm ra những vùng đó,
13:43 - 13:46

ví dụ, các góc.
13:46 - 13:47

Khi chúng tôi thực hiện,
13:47 - 13:50

chúng tôi lần lượt nói cho máy tính
13:50 - 13:52

các loại mảng cấu trúc
mà chúng tôi tìm kiếm.
13:52 - 13:54

Hãy liên tưởng xét nghiệm chuẩn đoán,
13:54 - 13:57

ví dụ, một chuyên gia bệnh học
xác định những vùng của bệnh ,
13:57 - 14:02

hoặc một bác sĩ X-quang cho thấy nốt sần
có thể gây phiền phức,
14:02 - 14:05

và đôi khi nó gây khó cho giải thuật.
14:05 - 14:07

Trong trường hợp này, giải thuật hơi rối.
14:07 - 14:09

Phần trước và sau của xe rất
giống nhau nên dễ nhầm.
14:09 - 14:11

Chúng tôi phải cẩn thận hơn,
14:11 - 14:15

chọn bằng tay phần trước để thấy
sự khác biệt với phần sau,
14:15 - 14:20

sau đó bảo với máy tính rằng đây là
tiêu chuẩn nhận dạng nhóm
14:20 - 14:22

mà chúng tôi quan tâm.
14:22 - 14:24

Chúng tôi làm điều đó,
thỉnh thoảng bỏ qua,
14:24 - 14:26

sau đó luyện tập giải thuật
cho "máy biết học"
14:26 - 14:28

dựa trên hàng trăm lần như thế này,
14:28 - 14:30

chúng tôi hy vọng nó hoàn thiện hơn.
14:30 - 14:34

Các bạn thấy đó, nó đang bắt đầu làm mờ
vài bức ảnh,
14:34 - 14:38

cho thấy rằng nó đã nhận ra cách
để hiểu những hình đó.
14:38 - 14:41

Chúng tôi có thể dùng khái niệm này cho
các bức ảnh tương tự,
14:41 - 14:43

và dùng các bức ảnh tương tự, bạn thấy đó,
14:43 - 14:47

máy tính có thể tìm thấy
phần trước của chiếc xe.
14:47 - 14:50

Lúc này, con người có thể nói cho máy tính
14:50 - 14:52

ok, đúng rồi, bạn đã làm rất tốt.
14:54 - 14:56

Nhưng đôi khi, đối với máy
14:56 - 15:00

việc tách các nhóm hình vẫn còn khó.
15:00 - 15:03

Ngay cả khi chúng tôi để nhiều thời gian
cho máy tính xoay xở,
15:03 - 15:07

nhưng chúng tôi vẫn thấy phía trái
và phía phải bức ảnh
15:07 - 15:08

bị chọn nhầm lẫn.
15:08 - 15:10

Để cho máy tính thêm vài gợi ý,
15:10 - 15:13

chúng tôi nói: ok, hãy thử và tìm
một chi tiết
15:13 - 15:16

khác biệt rõ ràng nhất
giữa bên trái và bên phải
15:16 - 15:18

bằng giải thuật "học sâu" này.
15:18 - 15:21

Và với gợi ý đó, à, nó đã thành công.
15:21 - 15:24

Nó được giao nhiệm vụ tìm ra cách
nhận ra các đối tượng này
15:24 - 15:26

rồi tách rời chúng ra.
15:26 - 15:29

Các bạn đã nắm được cách làm này.
15:29 - 15:37

Trong trường hợp này máy tính
không thể thay con người,
15:37 - 15:40

nhưng cả hai làm việc chung với nhau.
15:40 - 15:43

Điều chúng tôi đang làm là thay thế
những thứ mà trước đây cần một đội
15:43 - 15:45

5 hoặc 6 người làm trong 7 năm
15:45 - 15:48

bằng một công việc trong 15 phút
15:48 - 15:50

của một người.
15:50 - 15:54

Quá trình nhận ra và tách hình
được lặp lại 4 hoặc 5 lần.
15:54 - 15:56

Các bạn thấy chúng tôi có 62%
15:56 - 15:59

trong số 1.5 triệu bức ảnh
được phân loại chính xác.
15:59 - 16:01

Và ở mức độ này, chúng tôi có thể
bắt đầu với
16:01 - 16:03

những nhóm lớn,
16:03 - 16:06

kiểm tra chúng để bảo đảm không còn lỗi.
16:06 - 16:10

Nơi nào có lỗi, chúng tôi sẽ cho
máy tính biết.
16:10 - 16:13

Và dùng dạng quá trình này cho từng nhóm
khác nhau,
16:13 - 16:15

bây giờ, chúng tôi đạt đến 80% tỉ lệ
thành công
16:15 - 16:18

trong việc phân loại 1.5 triệu tấm ảnh.
16:18 - 16:20

Lúc này, với trường hợp
16:20 - 16:23

tìm thấy những tấm
không được phân loại đúng,
16:23 - 16:26

chúng tôi cố gắng tìm hiểu lý do.
16:26 - 16:28

Và sử dụng cách tiếp cận trên,
16:28 - 16:32

với 15 phút chúng tôi đạt tỉ lệ phân loại
97%.
16:32 - 16:37

Vậy kỹ thuật này có thể cho chúng ta
chỉnh sửa một vấn đề lớn,
16:37 - 16:40

mà toàn bộ chuyên gia trên
thế giới cũng không đủ số để làm.
16:40 - 16:43

Diễn đàn Kinh tế Thế giới nói rằng
vào giữa thập kỷ 2010 và 2020
16:43 - 16:46

số lượng bác sĩ bị thiếu
so với nhu cầu của thế giới,
16:46 - 16:48

và phải mất khoảng 300 năm
16:48 - 16:51

để đào tạo đủ số nhân sự cho vấn đề này.
16:51 - 16:54

Hãy tưởng tượng, liệu chúng ta có thể
nâng hiệu năng của họ
16:54 - 16:56

qua cách tiếp cận "học sâu"?
16:56 - 16:59

Tôi rất thích việc tạo ra những cơ hội.
16:59 - 17:01

Tôi cũng quan tâm đến
các vấn đề khó cần giải quyết.
17:01 - 17:04

Vấn đề ở đây là ở mỗi khu vực
màu xanh da trời trên bản đồ,
17:04 - 17:08

ngành dịch vụ chiếm 80% nhân lực.
17:08 - 17:10

Ngành dịch vụ gì vậy?
17:10 - 17:11

Các dịch vụ trong bảng này.
17:11 - 17:16

Máy tính cũng vừa mới học
được cách làm các dịch vụ này.
17:16 - 17:19

Vậy công việc của 80% nhân lực
trong các nước phát triển
17:19 - 17:22

sẽ được máy tính học để làm thay.
17:22 - 17:23

Điều đó có nghĩa là gì?
17:23 - 17:26

À, sẽ ổn thôi.
Họ sẽ làm các công việc khác.
17:26 - 17:29

Ví dụ, sẽ có nhiều việc hơn cho
các nhà khoa học dữ liệu.
17:29 - 17:30

À cũng không hẳn.
17:30 - 17:33

Vì các nhà khoa học dữ liệu
không cần nhiều thời gian nữa.
17:33 - 17:36

Ví dụ, bốn giải thuật này được xây dựng
bởi cùng một người.
17:36 - 17:38

Các bạn nghĩ chuyện này
đã xảy ra trước đây rồi,
17:38 - 17:42

trong quá khứ nhiều máy móc
được làm ra và tiếp theo là
17:42 - 17:44

và nhiều người đã phải
chuyển sang việc mới,
17:44 - 17:46

nhưng việc mới của thời nay này sẽ là gì?
17:46 - 17:48

Thật khó để dự đoán được điều này,
17:48 - 17:51

vì khả năng của con người
thì chỉ tăng từng bước,
17:51 - 17:54

nhưng với một hệ thống "học sâu",
17:54 - 17:57

chúng ta có khả năng phát triển rất nhanh.
17:57 - 17:58

Và chúng ta ở đây.
17:58 - 18:01

Chúng ta thấy những thứ xung quanh
18:01 - 18:03

và chúng ta nói: "Ôi, máy tính
vẫn ngốc lắm", lo gì ?
18:03 - 18:07

Nhưng trong 5 năm nữa, máy tính
sẽ không còn như vậy.
18:07 - 18:11

Chúng ta cần suy nghĩ tới
khả năng này ngay từ bây giờ.
18:11 - 18:13

Chúng ta thấy một lần
như vậy trước đây rồi.
18:13 - 18:14

Trong cách mạng công nghiệp,
18:14 - 18:17

chúng ta đã thấy những thay đổi
nhờ các động cơ.
18:18 - 18:21

Mặc dù vậy, sau đó mọi thứ
trở nên bình thường.
18:21 - 18:23

Đã có vài đảo lộn trong xã hội,
18:23 - 18:26

nhưng một khi động cơ được dùng
để tạo ra những thuận lợi cho cuộc sống,
18:26 - 18:28

thì mọi thứ đi vào ổn định.
18:28 - 18:30

Cuộc cách mạng "máy biết học"
18:30 - 18:33

sẽ rất khác với
Cuộc cách mạng công nghiệp,
18:33 - 18:36

vì Cách mạng "máy biết học sẽ
không bao giờ dừng lại.
18:36 - 18:39

Máy tính càng giỏi
trong các hoạt động trí tuệ,
18:39 - 18:43

thì chúng tạo nên những
máy tính càng thông minh hơn,
18:43 - 18:45

và đây chính là kiểu thay đổi
18:45 - 18:47

mà thế giới chưa bao giờ trải qua,
18:47 - 18:51

những phán đoán trước đây của bạn
có thể sẽ không chính xác.
18:51 - 18:53

Điều này tác động lên chính chúng ta.
18:53 - 18:56

Trong 25 năm trước, khi năng suất
thiết bị tăng,
18:56 - 19:01

thì năng suất lao động không tăng,
mà thậm chí còn hơi giảm.
19:01 - 19:04

Tôi nghĩ chúng ta cần
thảo luận về vấn đề này từ bây giờ.
19:04 - 19:07

Khi tôi nói với mọi người
về tình hình này,
19:07 - 19:09

họ thường tỏ vẻ coi thường.
19:09 - 19:10

Đúng, máy tính không thể suy nghĩ,
19:10 - 19:13

chúng không có cảm xúc, không hiểu thơ ca,
19:13 - 19:16

nhưng ta không lường
trước được cách chúng làm việc.
19:16 - 19:17

Vậy chuyện gì đây?
19:17 - 19:19

Bây giờ, máy tính có thể làm
19:19 - 19:22

những việc mà con người
cần cả đời để thực hiện,
19:22 - 19:24

đây là thời điểm để
chúng ta nghĩ tới
19:24 - 19:28

cách điều chỉnh cấu trúc xã hội
và cấu trúc kinh tế
19:28 - 19:30

để thận trọng với hiện thực mới này.
19:30 - 19:31

Xin cảm ơn.
19:31 - 19:32

(Tiếng vỗ tay)

Title:: Ứng dụng tuyệt vời hay đáng sợ của máy tính biết học
Speaker:: Jeremy Howard
Description:: Điều gì sẽ xảy ra khi chúng ta dạy cho máy tính cách học? Chuyên gia công nghệ Jeremy Howard trình bày những phát triển đáng kinh ngạc về sự thay đổi chóng mặt của deep learning ("học sâu"), một kỹ thuật có thể cho máy tính khả năng học tiếng Trung, học cách nhận ra những đối tượng trong bức hình, học cách trợ giúp chuẩn đoán y khoa. (một công cụ "học sâu", sau vài giờ xem Youtube, đã tự học được khái niệm "mèo.") Hãy bắt kịp đà tiến bộ của máy tính, nó sẽ thay đổi cách ảnh hưởng trên chính hành vi của bạn ... đừng để mình bị bất ngờ và bị động trước những điều mà máy tính sẽ làm được.

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 19:45

	Dimitra Papageorgiou approved Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê accepted Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn
	Hồng Khánh Lê edited Vietnamese subtitles for The wonderful and terrifying implications of computers that can learn

Show all

Vietnamese subtitles

Revisions

Revision 32 Edited

Hồng Khánh Lê

Ứng dụng tuyệt vời hay đáng sợ của máy tính biết học

Revisions

Our website uses cookies

Operating cookies (Required)