Return to Video

Ứng dụng tuyệt vời hay đáng sợ của máy tính biết học

  • 0:01 - 0:05
    Ngày xưa nếu bạn muốn máy tính
    thực hiện thao tác mới,
  • 0:05 - 0:06
    thì bạn phải lập trình nó trước.
  • 0:06 - 0:10
    Đối với những bạn ở đây
    chưa từng lập trình,
  • 0:10 - 0:13
    việc này đòi hỏi phải lập sơ đồ chi tiết
  • 0:13 - 0:17
    từng bước một cho điều
    bạn muốn máy tính thực hiện
  • 0:17 - 0:19
    để đạt được mục tiêu của bạn.
  • 0:19 - 0:23
    Nếu bạn muốn làm một việc mà chính bạn
    cũng không biết cách làm,
  • 0:23 - 0:25
    thì đây sẽ là một thử thách khá lớn.
  • 0:25 - 0:28
    Đây là thử thách mà người đàn ông này,
    Arthur Samuel, gặp phải.
  • 0:28 - 0:32
    Vào năm 1956, ông muốn chiếc máy tính này
  • 0:32 - 0:35
    có thể đánh bại ông trong môn cờ tướng.
  • 0:35 - 0:37
    Làm sao mà bạn có thể viết ra chương trình
  • 0:37 - 0:40
    tỉ mỉ, chi tiết về cách chơi
    cờ tướng giỏi hơn chính bạn ?
  • 0:40 - 0:42
    Vậy là ông nảy ra một ý tưởng:
  • 0:42 - 0:46
    ông để máy tính tự chơi lại hàng ngàn lần
  • 0:46 - 0:48
    và tự học cách chơi cờ.
  • 0:48 - 0:52
    Và quả nhiên cách này hiệu quả,
    và thật sự, đến năm 1962,
  • 0:52 - 0:56
    chiếc máy này đã đánh bại
    quán quân bang Connecticut.
  • 0:56 - 0:59
    Arthur Samuel là cha đẻ của
    lĩnh vực machine learning,
  • 0:59 - 1:00
    và tôi rất biết ơn ông,
  • 1:00 - 1:03
    bởi tôi là một người làm trong
    ngành "máy biết học".
  • 1:03 - 1:04
    Tôi từng là Chủ tịch ở Kaggle
  • 1:04 - 1:08
    một cộng đồng gồm hơn 200,000
    chuyên gia về "máy biết học".
  • 1:08 - 1:10
    Kaggle tổ chức các cuộc thi
  • 1:10 - 1:14
    với thử thách là
    những vấn đề chưa có lời giải,
  • 1:14 - 1:17
    và họ đã thành công hàng trăm lần.
  • 1:17 - 1:20
    Với vị thế thuận lợi đó,
    tôi đã khám phá ra
  • 1:20 - 1:24
    rất nhiều thứ mà "máy biết học" có thể
    làm được trước đây, làm được bây giờ,
  • 1:24 - 1:26
    và những gì nó có thể làm trong tương lai.
  • 1:26 - 1:31
    Có lẽ sự thành công vang dội đầu tiên
    của "máy biết học" là Google
  • 1:31 - 1:34
    Google cho ta thấy nó có thể
    tìm kiếm thông tin
  • 1:34 - 1:36
    bằng cách sử dụng thuật toán,
  • 1:36 - 1:38
    và thuật toán này dựa trên
    "máy biết học",
  • 1:38 - 1:42
    Kể từ đó, đã có rất nhiều thành công
    về mặt thương mại của "máy biết học".
  • 1:42 - 1:44
    Công ty như Amazon và Netflix
  • 1:44 - 1:48
    sử dụng "máy biết học"để gợi ý
    những sản phẩm bạn có thể muốn mua,
  • 1:48 - 1:50
    các bộ phim bạn có thể muốn xem.
  • 1:50 - 1:52
    Đôi khi nó làm ta
    rùng mình.
  • 1:52 - 1:54
    Các công ty như LinkedIn và Facebook
  • 1:54 - 1:56
    đôi khi sẽ nói cho bạn biết ai có thể
    là bạn bè của bạn
  • 1:56 - 1:58
    và bạn không hiểu nổi làm sao họ tìm ra,
  • 1:58 - 2:01
    và đó là vì họ dùng đến sức mạnh của
    "máy biết học".
  • 2:01 - 2:04
    Đây là thuật toán tự học cách xử lý
    từ cơ sở dữ liệu,
  • 2:04 - 2:07
    thay vì được lập trình sẵn trước đó.
  • 2:07 - 2:10
    Đây cũng là cách IBM thành công
  • 2:10 - 2:14
    trong việc khiến cho Watson đánh bại
    hai nhà vô địch chương trình "Jeopardy",
  • 2:14 - 2:17
    bằng cách trả lời những câu hỏi hóc
    búa và phức tạp như :
  • 2:17 - 2:20
    [Sư tử Nimrud bị mất tại bảo tàng
    quốc gia thành phố ...
  • 2:20 - 2:23
    Đây cũng là cơ sở cho
    những xe hơi tự lái đầu tiên.
  • 2:23 - 2:26
    Nếu chúng phân biệt
    được sự khác nhau giữa
  • 2:26 - 2:28
    cây xanh và người đi bộ,
    thì đó là việc rất quan trọng.
  • 2:28 - 2:31
    Chúng ta không biết cách viết
    những chương trình này,
  • 2:31 - 2:34
    nhưng với "máy biết học", điều đó
    trở thành có thể.
  • 2:34 - 2:37
    Và thực tế, loại xe này đã đi được
    cả triệu dặm
  • 2:37 - 2:40
    trên những con đường bình thường
    mà không gây tai nạn nào.
  • 2:40 - 2:44
    Bây giờ chúng ta biết máy tính
    có thể học được,
  • 2:44 - 2:46
    và chúng có thể học
    cách làm những việc
  • 2:46 - 2:49
    mà đôi khi chính chúng ta
    không biết cách làm,
  • 2:49 - 2:52
    hoặc có thể chúng làm tốt hơn ta.
  • 2:52 - 2:56
    Một trong những ví dụ ngoạn mục nhất
    về "máy biết học" tôi từng thấy
  • 2:56 - 2:58
    là dự án tôi tham gia ở Kaggle
  • 2:58 - 3:02
    nơi đó có một anh chàng điều khiển
    một nhóm, anh ta tên là Geofrey Hinton
  • 3:02 - 3:03
    đến từ Đại học Toronto
  • 3:03 - 3:06
    nhóm này thắng cuộc thi về
    chế tạo máy phát hiện ma túy.
  • 3:06 - 3:09
    Bây giờ, điều phi thường ở đây
    không phải là họ đánh bại
  • 3:09 - 3:13
    tất cả các giải thuật phát triển bới Merk
    hay các cộng đồng học thuật quốc tế khác
  • 3:13 - 3:18
    mà chính là họ không có thành viên nào
    chuyên về hóa, sinh hay khoa học đời sống,
  • 3:18 - 3:20
    và họ đã tạo ra chiếc máy
    chỉ trong 2 tuần.
  • 3:20 - 3:22
    Làm thế nào mà họ làm được?
  • 3:22 - 3:25
    Họ dùng 1 siêu giải thuật
    gọi là deep learning: "học sâu".
  • 3:25 - 3:28
    Thành công này quan trọng
    đến mức đã được lên
  • 3:28 - 3:31
    trang bìa tờ New York Times
    vài tuần sau đó.
  • 3:31 - 3:34
    Đây là Geoffrey Hinton ở đây bên bìa trái.
  • 3:34 - 3:38
    "Học sâu" là một giải thuật lấy
    cảm hứng từ cách làm việc của não người,
  • 3:38 - 3:40
    và kết quả là giải thuật này
  • 3:40 - 3:44
    về lý thuyết, không có giới hạn cho
    những gì nó có thể làm.
  • 3:44 - 3:47
    Bạn đưa vào càng nhiều dữ liệu và
    cho càng nhiều thời gian,
  • 3:47 - 3:48
    thì nó càng làm tốt.
  • 3:48 - 3:51
    Trong bài báo này, Tờ New York Times
    cũng nói về
  • 3:51 - 3:53
    một kết quả tuyệt vời khác
    của "học sâu"
  • 3:53 - 3:56
    mà tôi sẽ cho các bạn xem bây giờ.
  • 3:56 - 4:01
    Đó là máy tính có thể nghe và hiểu.
  • 4:01 - 4:03
    (Video) Richard Rashid:
    Bây giờ là bước cuối cùng
  • 4:03 - 4:06
    mà tôi muốn làm trong quá trình này
  • 4:06 - 4:11
    là nói chuyện với các bạn bằng
    tiếng Trung.
  • 4:11 - 4:14
    Điểm mấu chốt đó là,
  • 4:14 - 4:19
    chúng tôi có thể lấy lượng lớn
    thông tin từ những người nói tiếng Trung
  • 4:19 - 4:21
    và tạo ra hệ thống chuyển văn bản
    thành giọng nói
  • 4:21 - 4:26
    nó giúp lấy văn bản tiếng Trung chuyển
    thành tiếng Trung,
  • 4:26 - 4:30
    và sau đó chúng tôi đã thực hiện khoảng
    1 giờ để lấy giọng của chính tôi
  • 4:30 - 4:32
    từ đó chúng tôi đã điều chỉnh
  • 4:32 - 4:36
    hệ thống chuyển 'văn bản-lời nói'
    để cho ra được giọng nói giống tôi.
  • 4:36 - 4:39
    Lần nữa, kết quả không hoàn hảo.
  • 4:39 - 4:42
    Thực tế vẫn còn một vài lỗi.
  • 4:42 - 4:44
    ( tiếng Trung).
  • 4:44 - 4:47
    (vỗ tay)
  • 4:49 - 4:53
    Còn nhiều việc để làm trong lĩnh vực này.
  • 4:53 - 4:57
    ( tiếng Trung)
  • 4:57 - 5:00
    ( vỗ tay)
  • 5:01 - 5:05
    Jeremy Howard: đó là trong một hội thảo
    về "máy biết học" ở Trung Quốc.
  • 5:05 - 5:07
    Thực ra ở hội thảo học thuật, các bạn
  • 5:07 - 5:09
    thường ít nghe tiếng vỗ tay tự phát,
  • 5:09 - 5:13
    ngay cả ở các hội thảo của TEDx,
    hay vỗ tay thoải mái đi.
  • 5:13 - 5:15
    Những điều bạn thấy đó
    đang diễn ra với "học sâu".
  • 5:15 - 5:17
    ( vỗ tay) Cảm ơn.
  • 5:17 - 5:19
    Viết lại lời tiếng tiếng Anh
    bằng "học sâu".
  • 5:19 - 5:23
    Dịch sang tiếng Trung có văn bản
    ở trên bên phải, do "học sâu",
  • 5:23 - 5:26
    và xây dựng giọng nói cũng nhờ
    "học sâu".
  • 5:26 - 5:29
    "Học sâu" thật sự phi thường.
  • 5:29 - 5:32
    Nó là một giải thuật đơn giản mà có vẻ
    làm được hầu hết mọi thứ,
  • 5:32 - 5:35
    và tôi phát hiện trước đó một năm,
    nó còn học nhìn thấy.
  • 5:35 - 5:38
    Trong cuộc thi ở Đức,
  • 5:38 - 5:40
    cuộc thi 'Nhận biết Tín hiệu
    Giao thông Benchmark',
  • 5:40 - 5:44
    "học sâu" nhận biết các
    tín hiệu giao thông,như cái này.
  • 5:44 - 5:46
    Nó không chỉ nhận biết tín hiệu giao thông
  • 5:46 - 5:47
    tốt hơn bất kỳ giải thuật nào khác,
  • 5:47 - 5:50
    mà còn làm tốt hơn cả con người,
  • 5:50 - 5:52
    tốt hơn gấp đôi.
  • 5:52 - 5:54
    Năm 2011, chúng tôi có thử nghiệm đầu tiên
  • 5:54 - 5:57
    cho thấy máy tính có thể nhìn
    tốt hơn con người.
  • 5:57 - 5:59
    Từ đó, rất nhiều điều đã xảy ra.
  • 5:59 - 6:03
    Năm 2012, Google thông báo họ đã có một
    giải thuật "học sâu"
  • 6:03 - 6:04
    xem được video trên YouTube
  • 6:04 - 6:08
    và lấy dữ liệu từ 16,000 máy tính trong
    một tháng,
  • 6:08 - 6:12
    và máy tính đã học một cách độc lập
    các khái niệm "người" và "mèo"
  • 6:12 - 6:14
    chỉ bằng việc xem các videos.
  • 6:14 - 6:16
    Cách này rất giống
    cách học của con người.
  • 6:16 - 6:19
    Không cần khái niệm có sẵn,
    ta học từ cái ta nhìn thấy,
  • 6:19 - 6:22
    ta có thể hiểu trực tiếp
    bản chất của sự vật đó.
  • 6:22 - 6:26
    Cũng trong năm 2012, Geoffrey Hinton,
  • 6:26 - 6:29
    chiến thắng cuộc thi
    ImageNet rất nổi tiếng,
  • 6:29 - 6:33
    vì đã tìm ra cách để xác định
    một trong số nửa triệu tấm ảnh
  • 6:33 - 6:34
    được giao trước.
  • 6:34 - 6:38
    Từ 2014, chúng tôi đã giảm
    còn 6% tỉ lệ lỗi
  • 6:38 - 6:39
    trong việc nhận diện hình ảnh.
  • 6:39 - 6:41
    Với dạng việc này,
    máy cũng hơn con người.
  • 6:41 - 6:45
    Thật vậy, máy rất siêu trong lĩnh vực này,
  • 6:45 - 6:47
    và đang được ứng dụng trong công nghiệp.
  • 6:47 - 6:50
    Ví dụ, năm ngoái Google thông báo
  • 6:50 - 6:55
    họ đã lập bản đồ mọi địa điểm ở Pháp
    trong 2 giờ,
  • 6:55 - 6:58
    và cách họ làm là nạp những hình ảnh
    đường phố
  • 6:58 - 7:03
    vào giải thuật "học sâu" để nhận diện
    và đọc số nhà.
  • 7:03 - 7:05
    Hãy tưởng tượng trước đây
    mất bao lâu:
  • 7:05 - 7:08
    vài chục người làm việc trong nhiều năm.
  • 7:08 - 7:10
    Điều này cũng diễn ra ở Trung Quốc.
  • 7:10 - 7:14
    Tôi thấy Baidu cũng là một dạng
    Google ở Trung Quốc,
  • 7:14 - 7:17
    và những gì bạn thấy ở trên bên góc trái
  • 7:17 - 7:20
    là một ví dụ về một bức ảnh tôi tải lên
    hệ thống "học sâu" của Baidu
  • 7:20 - 7:24
    và ở dưới bạn có thể thấy kết quả
    hệ thống xử lý bức ảnh
  • 7:24 - 7:26
    và nó đã tìm ra những bức hình tương tự.
  • 7:26 - 7:29
    Những bức hình tương tự thực ra có
    nền tương tự,
  • 7:29 - 7:31
    hướng của khuôn mặt tương tự,
  • 7:31 - 7:33
    và cả một số hình có lưỡi thè ra.
  • 7:33 - 7:36
    Đây không phải là đối chiếu văn bản
    của trang web.
  • 7:36 - 7:37
    Tôi chỉ upload một tấm ảnh.
  • 7:37 - 7:41
    Vậy chúng ta đang có những chiếc máy tính
    thực sự hiểu được những gì chúng nhìn thấy
  • 7:41 - 7:43
    và có thể nhờ đó tìm dữ liệu
  • 7:43 - 7:46
    của hàng trăm triệu tấm ảnh.
  • 7:46 - 7:50
    Điều đó có nghĩa là gì khi máy tính
    có thể nhìn thấy?
  • 7:50 - 7:52
    À, máy tính không chỉ có thể
    nhìn thấy.
  • 7:52 - 7:54
    Thật ra, "học sâu"
    còn làm được nhiều hơn.
  • 7:54 - 7:57
    Những câu phức tạp và đầy
    nét khác biệt tinh tế như câu này
  • 7:57 - 7:59
    giờ đã được hiểu bởi giải thuật "học sâu".
  • 7:59 - 8:01
    Như các bạn thấy ở đây,
  • 8:01 - 8:03
    hệ thống nền Stanford này đang chiếu điểm
    đỏ ở trên
  • 8:03 - 8:07
    đã tìm ra rằng câu này thể hiện tình cảm
    tiêu cực.
  • 8:07 - 8:11
    "học sâu" thực sự đang gần giống như
    con người
  • 8:11 - 8:16
    trong việc hiểu chủ đề các câu
    và nội dung diễn đạt.
  • 8:16 - 8:19
    "học sâu" có thể đọc tiếng Trung,
  • 8:19 - 8:22
    giống như người nói tiếng Trung bản xứ.
  • 8:22 - 8:24
    Giải thuật này phát triển ở Thụy Sĩ
  • 8:24 - 8:27
    bởi những người không
    biết tí gì tiếng Trung.
  • 8:27 - 8:29
    Như tôi đã nói, "học sâu"
  • 8:29 - 8:32
    là phương tiện tốt nhất
    trong lĩnh vực này,
  • 8:32 - 8:37
    vì nó có thể hiểu
    thậm chí như người bản địa.
  • 8:37 - 8:40
    Đây là hệ thống chúng tôi trang bị
    ở công ty tôi,
  • 8:40 - 8:42
    công ty tôi muốn sử dụng
    và kết hợp tất cả.
  • 8:42 - 8:44
    Đây là những tấm hình không kèm theo
    dòng chữ nào,
  • 8:44 - 8:47
    vì tôi viết những câu vào chỗ này,
  • 8:47 - 8:50
    nhờ đó nó hiểu những tấm hình này
  • 8:50 - 8:51
    và tìm ra chúng nói về cái gì
  • 8:51 - 8:54
    và tìm những tấm hình có ý
    tương tự với dòng chữ tôi đang viết.
  • 8:54 - 8:57
    Vậy các bạn thấy đó, nó thực sự hiểu
    được câu tôi viết
  • 8:57 - 8:59
    và thực sự hiểu những tấm hình này.
  • 8:59 - 9:02
    Tôi biết các bạn từng thấy điều tương tự
    trên Google,
  • 9:02 - 9:05
    khi bạn viết điều gì đó và chúng hiện
    lên các tấm ảnh,
  • 9:05 - 9:08
    nhưng thực sự những gì nó đang làm là
    tìm những trang web theo dòng chữ.
  • 9:08 - 9:11
    Điều này rất khác với việc thực việc hiểu
    những tấm ảnh.
  • 9:11 - 9:14
    Đây là điều mà máy tính chỉ có thể làm
  • 9:14 - 9:17
    lần đầu tiên cách đây vài tháng.
  • 9:17 - 9:21
    Chúng ta thấy máy tính không chỉ
    nhìn thấy được mà chúng còn đọc được,
  • 9:21 - 9:25
    và dĩ nhiên chúng tôi cho thấy chúng còn
    hiểu được những gì chúng nghe.
  • 9:25 - 9:28
    Có lẽ không còn ngạc nhiên khi tôi nói
    với các bạn chúng có thể viết.
  • 9:28 - 9:33
    Ở đây là những dòng văn bản tôi tạo ra
    bằng giải thuật "học sâu" hôm qua.
  • 9:33 - 9:37
    Và đây là những văn bản giải thuật ở
    Stanford tạo ra.
  • 9:37 - 9:39
    Mỗi câu được tạo ra
  • 9:39 - 9:43
    bằng giải thuật "học sâu" nhằm mô tả
    những bức ảnh này.
  • 9:43 - 9:48
    Trước đây giải thuật này chưa bao giờ
    thấy một người đàn ông áo đen chơi ghita
  • 9:48 - 9:50
    Nhưng nó đã thấy đàn ông,
    và đã thấy màu đen,
  • 9:50 - 9:51
    và nó cũng đã thấy đàn ghita,
  • 9:51 - 9:56
    rồi nó đã tự tạo ra
    chú thích của tấm ảnh này.
  • 9:56 - 9:59
    Máy vẫn chưa đạt đến mức như
    con người, nhưng cũng khá gần rồi.
  • 9:59 - 10:03
    Trong các thí nghiệm máy viết phụ đề
    cho hình, số phụ đề được người ta chọn
  • 10:03 - 10:05
    chỉ ở tỉ lệ 1/4.
  • 10:05 - 10:07
    Nhưng hệ thống này giờ
    chỉ mới 2 tuần tuổi,
  • 10:07 - 10:09
    nên có thể trong năm tới,
  • 10:09 - 10:12
    giải thuật máy tính sẽ còn
    hơn cả con người
  • 10:12 - 10:13
    và tỉ lệ được chọn sẽ cao hơn.
  • 10:13 - 10:16
    Máy tính cũng có thể viết.
  • 10:16 - 10:20
    Chúng tôi kết hợp tất cả lại và nó
    dẫn đến những cơ hội rất thú vị.
  • 10:20 - 10:21
    Ví dụ, trong ngành y,
  • 10:21 - 10:24
    một nhóm ở Boston thông báo họ đã tìm ra
  • 10:24 - 10:27
    hàng chục tính năng lâm sàng mới
  • 10:27 - 10:31
    của các khối u để giúp các
    bác sĩ tiên đoán bệnh ung thư.
  • 10:32 - 10:35
    Tương tự, ở Stanford,
  • 10:35 - 10:38
    một nhóm thông báo rằng, dựa vào
    các hình phóng đại của mô,
  • 10:38 - 10:41
    họ phát triển hệ thống "máy biết học"
  • 10:41 - 10:43
    còn tốt hơn cả các nhà nghiên cứu bệnh học
  • 10:43 - 10:48
    nhờ thế làm tăng khả năng sống sót
    của các bệnh nhân ung thư.
  • 10:48 - 10:51
    Trong cả hai trường hợp, không chỉ việc
    tiên đoán chính xác hơn,
  • 10:51 - 10:53
    mà còn tạo ra ngành
    khoa học mới rất triển vọng.
  • 10:53 - 10:55
    Trong lĩnh vực X-quang,
  • 10:55 - 10:58
    chúng là những chỉ số lâm sàng
    mới mà con người có thể hiểu.
  • 10:58 - 11:00
    Trong lĩnh vực bệnh học,
  • 11:00 - 11:04
    hệ thống máy tính đã cho thấy rằng
    những tế bào xung quanh khối u
  • 11:04 - 11:08
    cũng quan trọng như chính tế bào ung thư
  • 11:08 - 11:09
    trong việc chẩn đoán bệnh.
  • 11:09 - 11:15
    Điều này ngược với những gì các nhà
    bệnh học được dạy trong nhiều thập kỷ qua.
  • 11:15 - 11:18
    Trong mỗi trường hợp trên,
    chúng là các hệ thống được phát triển
  • 11:18 - 11:22
    bởi sự hợp tác của các chuyên gia y tế
    và các chuyên gia "máy biết học",
  • 11:22 - 11:24
    nhưng từ năm trước,
    chúng tôi đã tiến khá xa.
  • 11:24 - 11:28
    Đây là một ví dụ về xác định khu vực
    ung thư
  • 11:28 - 11:30
    của mô người dưới kính hiển vi.
  • 11:30 - 11:35
    Hệ thống có thể xác định những
    khu vực chính xác hơn
  • 11:35 - 11:38
    hoặc tương đương các nhà bệnh học,
  • 11:38 - 11:41
    nhưng vì nó được xây dựng với
    "học sâu" không có chuyên gia ngành y
  • 11:41 - 11:44
    nên những người không chuyên
    cũng có thể dùng.
  • 11:45 - 11:47
    Ví dụ như việc phân đoạn nơ ron này.
  • 11:47 - 11:51
    Máy giúp chúng tôi phân đoạn nơ ron
    chính xác như các chuyên gia,
  • 11:51 - 11:54
    nhưng hệ thống này lại được thiết kế với
    "học sâu"
  • 11:54 - 11:57
    bởi những người không có
    chuyên môn y khoa.
  • 11:57 - 12:00
    Còn tôi, cũng không có nền tảng về y khoa,
  • 12:00 - 12:04
    thế mà tôi dường như có đầy đủ năng lực
    để mở một công ty về ngành y,
  • 12:04 - 12:06
    và tôi đã làm.
  • 12:06 - 12:08
    Tôi đã từng sợ trước khi bắt đầu,
  • 12:08 - 12:11
    nhưng lý thuyết cho thấy mọi người có thể
  • 12:11 - 12:16
    dùng những kỹ thuật phân tích dữ liệu
    để có được một nền y học hiệu quả.
  • 12:16 - 12:19
    Và may mắn là tôi nhận được
    những phản hồi rất tốt,
  • 12:19 - 12:21
    không chỉ từ truyền thông
    mà còn từ giới y khoa,
  • 12:21 - 12:23
    họ luôn ủng hộ.
  • 12:23 - 12:27
    Về lý thuyết, chúng tôi có thể lấy phần
    giữa của quy trình
  • 12:27 - 12:30
    và làm phân tích dữ liệu
    càng nhiều càng tốt,
  • 12:30 - 12:33
    phần còn lại dành cho bác sĩ.
  • 12:33 - 12:35
    Tôi muốn đưa ra một ví dụ.
  • 12:35 - 12:40
    Thông thường ta cần 15 phút
    để làm một xét nghiệm chẩn đoán
  • 12:40 - 12:42
    và tôi sẽ làm cho bạn xem
  • 12:42 - 12:45
    tôi nén nó thành 3 phút
    bằng cách cắt bớt bỏ một số phần.
  • 12:45 - 12:48
    Thay vì cho bạn xem quá trình
    một xét nghiệm chẩn đoán y học,
  • 12:48 - 12:52
    tôi sẽ cho các bạn xem một xét nghiệm
    chẩn đoán hình ảnh xe hơi,
  • 12:52 - 12:54
    vì như thế sẽ dễ hiểu cho mọi người.
  • 12:54 - 12:57
    Chúng tôi bắt đầu với khoảng 1,5 triệu
    hình ảnh xe hơi,
  • 12:57 - 13:00
    tôi muốn tạo tiêu chuẩn để
    gom chúng lại vào góc
  • 13:00 - 13:03
    của bức hình đang được chụp.
  • 13:03 - 13:07
    Những bức hình này không gắn nhãn trước,
    nên tôi phải bắt đầu từ số không.
  • 13:07 - 13:08
    Giải thuật "học sâu"
  • 13:08 - 13:12
    có thể tự xác định
    vùng cấu trúc trong những bức ảnh này.
  • 13:12 - 13:16
    Rất thuận lợi, bây giờ con người
    và máy tính có thể làm việc cùng nhau.
  • 13:16 - 13:18
    Như các bạn đang thấy đây, con người
  • 13:18 - 13:21
    đang nói cho máy tính biết
    lĩnh vực cần quan tâm
  • 13:21 - 13:25
    mà họ muốn máy tính sử dụng để
    cải thiện giải thuật của nó.
  • 13:25 - 13:30
    Những hệ thống "học sâu" này thực ra là
    không gian 16,000 chiều,
  • 13:30 - 13:33
    bạn có thể thấy ở đây máy tính quay
    quanh không gian đó,
  • 13:33 - 13:35
    cố gắng tìm vùng mới của cấu trúc.
  • 13:35 - 13:37
    Và khi nó làm thành công,
  • 13:37 - 13:41
    người sử dụng máy có thể tìm thấy
    khu vực đáng quan tâm.
  • 13:41 - 13:43
    Ở đây, máy tính đã tìm ra những vùng đó,
  • 13:43 - 13:46
    ví dụ, các góc.
  • 13:46 - 13:47
    Khi chúng tôi thực hiện,
  • 13:47 - 13:50
    chúng tôi lần lượt nói cho máy tính
  • 13:50 - 13:52
    các loại mảng cấu trúc
    mà chúng tôi tìm kiếm.
  • 13:52 - 13:54
    Hãy liên tưởng xét nghiệm chuẩn đoán,
  • 13:54 - 13:57
    ví dụ, một chuyên gia bệnh học
    xác định những vùng của bệnh ,
  • 13:57 - 14:02
    hoặc một bác sĩ X-quang cho thấy nốt sần
    có thể gây phiền phức,
  • 14:02 - 14:05
    và đôi khi nó gây khó cho giải thuật.
  • 14:05 - 14:07
    Trong trường hợp này, giải thuật hơi rối.
  • 14:07 - 14:09
    Phần trước và sau của xe rất
    giống nhau nên dễ nhầm.
  • 14:09 - 14:11
    Chúng tôi phải cẩn thận hơn,
  • 14:11 - 14:15
    chọn bằng tay phần trước để thấy
    sự khác biệt với phần sau,
  • 14:15 - 14:20
    sau đó bảo với máy tính rằng đây là
    tiêu chuẩn nhận dạng nhóm
  • 14:20 - 14:22
    mà chúng tôi quan tâm.
  • 14:22 - 14:24
    Chúng tôi làm điều đó,
    thỉnh thoảng bỏ qua,
  • 14:24 - 14:26
    sau đó luyện tập giải thuật
    cho "máy biết học"
  • 14:26 - 14:28
    dựa trên hàng trăm lần như thế này,
  • 14:28 - 14:30
    chúng tôi hy vọng nó hoàn thiện hơn.
  • 14:30 - 14:34
    Các bạn thấy đó, nó đang bắt đầu làm mờ
    vài bức ảnh,
  • 14:34 - 14:38
    cho thấy rằng nó đã nhận ra cách
    để hiểu những hình đó.
  • 14:38 - 14:41
    Chúng tôi có thể dùng khái niệm này cho
    các bức ảnh tương tự,
  • 14:41 - 14:43
    và dùng các bức ảnh tương tự, bạn thấy đó,
  • 14:43 - 14:47
    máy tính có thể tìm thấy
    phần trước của chiếc xe.
  • 14:47 - 14:50
    Lúc này, con người có thể nói cho máy tính
  • 14:50 - 14:52
    ok, đúng rồi, bạn đã làm rất tốt.
  • 14:54 - 14:56
    Nhưng đôi khi, đối với máy
  • 14:56 - 15:00
    việc tách các nhóm hình vẫn còn khó.
  • 15:00 - 15:03
    Ngay cả khi chúng tôi để nhiều thời gian
    cho máy tính xoay xở,
  • 15:03 - 15:07
    nhưng chúng tôi vẫn thấy phía trái
    và phía phải bức ảnh
  • 15:07 - 15:08
    bị chọn nhầm lẫn.
  • 15:08 - 15:10
    Để cho máy tính thêm vài gợi ý,
  • 15:10 - 15:13
    chúng tôi nói: ok, hãy thử và tìm
    một chi tiết
  • 15:13 - 15:16
    khác biệt rõ ràng nhất
    giữa bên trái và bên phải
  • 15:16 - 15:18
    bằng giải thuật "học sâu" này.
  • 15:18 - 15:21
    Và với gợi ý đó, à, nó đã thành công.
  • 15:21 - 15:24
    Nó được giao nhiệm vụ tìm ra cách
    nhận ra các đối tượng này
  • 15:24 - 15:26
    rồi tách rời chúng ra.
  • 15:26 - 15:29
    Các bạn đã nắm được cách làm này.
  • 15:29 - 15:37
    Trong trường hợp này máy tính
    không thể thay con người,
  • 15:37 - 15:40
    nhưng cả hai làm việc chung với nhau.
  • 15:40 - 15:43
    Điều chúng tôi đang làm là thay thế
    những thứ mà trước đây cần một đội
  • 15:43 - 15:45
    5 hoặc 6 người làm trong 7 năm
  • 15:45 - 15:48
    bằng một công việc trong 15 phút
  • 15:48 - 15:50
    của một người.
  • 15:50 - 15:54
    Quá trình nhận ra và tách hình
    được lặp lại 4 hoặc 5 lần.
  • 15:54 - 15:56
    Các bạn thấy chúng tôi có 62%
  • 15:56 - 15:59
    trong số 1.5 triệu bức ảnh
    được phân loại chính xác.
  • 15:59 - 16:01
    Và ở mức độ này, chúng tôi có thể
    bắt đầu với
  • 16:01 - 16:03
    những nhóm lớn,
  • 16:03 - 16:06
    kiểm tra chúng để bảo đảm không còn lỗi.
  • 16:06 - 16:10
    Nơi nào có lỗi, chúng tôi sẽ cho
    máy tính biết.
  • 16:10 - 16:13
    Và dùng dạng quá trình này cho từng nhóm
    khác nhau,
  • 16:13 - 16:15
    bây giờ, chúng tôi đạt đến 80% tỉ lệ
    thành công
  • 16:15 - 16:18
    trong việc phân loại 1.5 triệu tấm ảnh.
  • 16:18 - 16:20
    Lúc này, với trường hợp
  • 16:20 - 16:23
    tìm thấy những tấm
    không được phân loại đúng,
  • 16:23 - 16:26
    chúng tôi cố gắng tìm hiểu lý do.
  • 16:26 - 16:28
    Và sử dụng cách tiếp cận trên,
  • 16:28 - 16:32
    với 15 phút chúng tôi đạt tỉ lệ phân loại
    97%.
  • 16:32 - 16:37
    Vậy kỹ thuật này có thể cho chúng ta
    chỉnh sửa một vấn đề lớn,
  • 16:37 - 16:40
    mà toàn bộ chuyên gia trên
    thế giới cũng không đủ số để làm.
  • 16:40 - 16:43
    Diễn đàn Kinh tế Thế giới nói rằng
    vào giữa thập kỷ 2010 và 2020
  • 16:43 - 16:46
    số lượng bác sĩ bị thiếu
    so với nhu cầu của thế giới,
  • 16:46 - 16:48
    và phải mất khoảng 300 năm
  • 16:48 - 16:51
    để đào tạo đủ số nhân sự cho vấn đề này.
  • 16:51 - 16:54
    Hãy tưởng tượng, liệu chúng ta có thể
    nâng hiệu năng của họ
  • 16:54 - 16:56
    qua cách tiếp cận "học sâu"?
  • 16:56 - 16:59
    Tôi rất thích việc tạo ra những cơ hội.
  • 16:59 - 17:01
    Tôi cũng quan tâm đến
    các vấn đề khó cần giải quyết.
  • 17:01 - 17:04
    Vấn đề ở đây là ở mỗi khu vực
    màu xanh da trời trên bản đồ,
  • 17:04 - 17:08
    ngành dịch vụ chiếm 80% nhân lực.
  • 17:08 - 17:10
    Ngành dịch vụ gì vậy?
  • 17:10 - 17:11
    Các dịch vụ trong bảng này.
  • 17:11 - 17:16
    Máy tính cũng vừa mới học
    được cách làm các dịch vụ này.
  • 17:16 - 17:19
    Vậy công việc của 80% nhân lực
    trong các nước phát triển
  • 17:19 - 17:22
    sẽ được máy tính học để làm thay.
  • 17:22 - 17:23
    Điều đó có nghĩa là gì?
  • 17:23 - 17:26
    À, sẽ ổn thôi.
    Họ sẽ làm các công việc khác.
  • 17:26 - 17:29
    Ví dụ, sẽ có nhiều việc hơn cho
    các nhà khoa học dữ liệu.
  • 17:29 - 17:30
    À cũng không hẳn.
  • 17:30 - 17:33
    Vì các nhà khoa học dữ liệu
    không cần nhiều thời gian nữa.
  • 17:33 - 17:36
    Ví dụ, bốn giải thuật này được xây dựng
    bởi cùng một người.
  • 17:36 - 17:38
    Các bạn nghĩ chuyện này
    đã xảy ra trước đây rồi,
  • 17:38 - 17:42
    trong quá khứ nhiều máy móc
    được làm ra và tiếp theo là
  • 17:42 - 17:44
    và nhiều người đã phải
    chuyển sang việc mới,
  • 17:44 - 17:46
    nhưng việc mới của thời nay này sẽ là gì?
  • 17:46 - 17:48
    Thật khó để dự đoán được điều này,
  • 17:48 - 17:51
    vì khả năng của con người
    thì chỉ tăng từng bước,
  • 17:51 - 17:54
    nhưng với một hệ thống "học sâu",
  • 17:54 - 17:57
    chúng ta có khả năng phát triển rất nhanh.
  • 17:57 - 17:58
    Và chúng ta ở đây.
  • 17:58 - 18:01
    Chúng ta thấy những thứ xung quanh
  • 18:01 - 18:03
    và chúng ta nói: "Ôi, máy tính
    vẫn ngốc lắm", lo gì ?
  • 18:03 - 18:07
    Nhưng trong 5 năm nữa, máy tính
    sẽ không còn như vậy.
  • 18:07 - 18:11
    Chúng ta cần suy nghĩ tới
    khả năng này ngay từ bây giờ.
  • 18:11 - 18:13
    Chúng ta thấy một lần
    như vậy trước đây rồi.
  • 18:13 - 18:14
    Trong cách mạng công nghiệp,
  • 18:14 - 18:17
    chúng ta đã thấy những thay đổi
    nhờ các động cơ.
  • 18:18 - 18:21
    Mặc dù vậy, sau đó mọi thứ
    trở nên bình thường.
  • 18:21 - 18:23
    Đã có vài đảo lộn trong xã hội,
  • 18:23 - 18:26
    nhưng một khi động cơ được dùng
    để tạo ra những thuận lợi cho cuộc sống,
  • 18:26 - 18:28
    thì mọi thứ đi vào ổn định.
  • 18:28 - 18:30
    Cuộc cách mạng "máy biết học"
  • 18:30 - 18:33
    sẽ rất khác với
    Cuộc cách mạng công nghiệp,
  • 18:33 - 18:36
    vì Cách mạng "máy biết học sẽ
    không bao giờ dừng lại.
  • 18:36 - 18:39
    Máy tính càng giỏi
    trong các hoạt động trí tuệ,
  • 18:39 - 18:43
    thì chúng tạo nên những
    máy tính càng thông minh hơn,
  • 18:43 - 18:45
    và đây chính là kiểu thay đổi
  • 18:45 - 18:47
    mà thế giới chưa bao giờ trải qua,
  • 18:47 - 18:51
    những phán đoán trước đây của bạn
    có thể sẽ không chính xác.
  • 18:51 - 18:53
    Điều này tác động lên chính chúng ta.
  • 18:53 - 18:56
    Trong 25 năm trước, khi năng suất
    thiết bị tăng,
  • 18:56 - 19:01
    thì năng suất lao động không tăng,
    mà thậm chí còn hơi giảm.
  • 19:01 - 19:04
    Tôi nghĩ chúng ta cần
    thảo luận về vấn đề này từ bây giờ.
  • 19:04 - 19:07
    Khi tôi nói với mọi người
    về tình hình này,
  • 19:07 - 19:09
    họ thường tỏ vẻ coi thường.
  • 19:09 - 19:10
    Đúng, máy tính không thể suy nghĩ,
  • 19:10 - 19:13
    chúng không có cảm xúc, không hiểu thơ ca,
  • 19:13 - 19:16
    nhưng ta không lường
    trước được cách chúng làm việc.
  • 19:16 - 19:17
    Vậy chuyện gì đây?
  • 19:17 - 19:19
    Bây giờ, máy tính có thể làm
  • 19:19 - 19:22
    những việc mà con người
    cần cả đời để thực hiện,
  • 19:22 - 19:24
    đây là thời điểm để
    chúng ta nghĩ tới
  • 19:24 - 19:28
    cách điều chỉnh cấu trúc xã hội
    và cấu trúc kinh tế
  • 19:28 - 19:30
    để thận trọng với hiện thực mới này.
  • 19:30 - 19:31
    Xin cảm ơn.
  • 19:31 - 19:32
    (Tiếng vỗ tay)
Title:
Ứng dụng tuyệt vời hay đáng sợ của máy tính biết học
Speaker:
Jeremy Howard
Description:

Điều gì sẽ xảy ra khi chúng ta dạy cho máy tính cách học? Chuyên gia công nghệ Jeremy Howard trình bày những phát triển đáng kinh ngạc về sự thay đổi chóng mặt của deep learning ("học sâu"), một kỹ thuật có thể cho máy tính khả năng học tiếng Trung, học cách nhận ra những đối tượng trong bức hình, học cách trợ giúp chuẩn đoán y khoa. (một công cụ "học sâu", sau vài giờ xem Youtube, đã tự học được khái niệm "mèo.") Hãy bắt kịp đà tiến bộ của máy tính, nó sẽ thay đổi cách ảnh hưởng trên chính hành vi của bạn ... đừng để mình bị bất ngờ và bị động trước những điều mà máy tính sẽ làm được.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
19:45

Vietnamese subtitles

Revisions