WEBVTT 00:00:07.052 --> 00:00:07.862 Qua mỗi năm 00:00:07.862 --> 00:00:11.482 Máy móc càng vượt qua con người trong nhiều hoạt động 00:00:11.482 --> 00:00:14.178 mà chúng ta từng nghĩ chỉ mình có thể làm 00:00:14.848 --> 00:00:18.423 Ngày nay, máy tính có thể thắng chúng ta trong những trò trơi cờ bàn, 00:00:18.423 --> 00:00:20.984 Chuyển thể hàng chục ngôn ngữ 00:00:21.294 --> 00:00:23.944 và có thể lập tức nhận diện hầu hết mọi thứ. 00:00:24.504 --> 00:00:27.176 Nhưng tương lai Robot có thể đi xa hơn thế 00:00:27.176 --> 00:00:29.732 bằng cách cố gắng tìm hiểu cảm giác của con người. 00:00:30.482 --> 00:00:32.253 Vậy tại sao việc đó lại quan trọng? 00:00:32.253 --> 00:00:34.551 Bởi nếu máy móc và những ai điều khiển chúng 00:00:34.551 --> 00:00:36.713 có thể đọc được cảm xúc của con người 00:00:37.173 --> 00:00:39.903 nó có thể giúp ta mà cũng có thể điều khiển ta 00:00:40.113 --> 00:00:41.803 với quy mô chưa từng có. 00:00:42.303 --> 00:00:44.072 Nhưng trước khi bàn đến việc đó, 00:00:44.082 --> 00:00:48.724 sao thứ phức tạp như cảm xúc có thể mã hóa thành những con số, 00:00:49.184 --> 00:00:51.823 loại ngôn ngữ duy nhất máy móc hiểu được? 00:00:52.863 --> 00:00:56.333 Về cơ bản, như cách bộ bão chúng ta giải nghĩa những cảm xúc, 00:00:56.353 --> 00:00:58.433 bằng việc học cách phát hiện ra chúng. 00:00:58.433 --> 00:01:03.654 Nhà tâm lý học Mỹ Paul Ekman đã phát hiện ra những cảm xúc phổ biến 00:01:03.654 --> 00:01:08.400 mà biểu hiện của chúng được hiểu giống nhau ở mọi nền văn hóa 00:01:09.630 --> 00:01:13.964 Ví dụ, hình mặt cười thể hiện sự vui vẻ đối với cư dân đôi thị hiện đại. 00:01:13.964 --> 00:01:16.413 và với cả những thổ dân. 00:01:16.943 --> 00:01:18.145 Theo Ekman, 00:01:18.145 --> 00:01:18.884 tức giận, 00:01:18.884 --> 00:01:19.593 căm ghét, 00:01:19.593 --> 00:01:20.293 sợ hãi 00:01:20.293 --> 00:01:20.995 vui vẻ, 00:01:20.995 --> 00:01:21.752 buồn bã 00:01:21.752 --> 00:01:24.518 và ngạc nhiên đều có thể nhận biết được như nhau 00:01:25.228 --> 00:01:29.603 Như ta thấy, máy tính đang phát triển nhanh chóng về nhận diện hình ảnh 00:01:29.603 --> 00:01:32.836 nhờ vào các thuật toán máy như những mạng lưới thần kinh. 00:01:33.876 --> 00:01:38.005 Chúng có những nút nhân tạo bắt chước như nơ-ron của con người 00:01:38.205 --> 00:01:40.915 bằng cách tạo hình các liên kết và trao đổi thông tin. 00:01:41.565 --> 00:01:46.304 Để huấn luyện mạng lưới, đầu vào mẫu được chia trước vào các mục, 00:01:46.304 --> 00:01:49.125 như hình ảnh thể hiện vui hay buồn 00:01:49.125 --> 00:01:51.305 được đưa vào hệ thống. 00:01:51.305 --> 00:01:53.815 Sau đó, hệ thống sẽ phân loại những mẫu đó 00:01:53.815 --> 00:01:57.505 qua điều chỉnh các trọng số tương đối thành đặc tính đặc biệt. 00:01:57.935 --> 00:01:59.945 Càng nhiều dữ liệu được huấn luyện, 00:01:59.945 --> 00:02:04.345 thuật toán càng nhận diện hình ảnh mới tốt hơn 00:02:04.435 --> 00:02:06.535 Điều này cũng giống như bộ não chúng ta, 00:02:06.535 --> 00:02:10.837 tích lũy kinh nghiệm để định hình xử lý các kích thích mới. 00:02:11.527 --> 00:02:15.265 Thuật toán nhận diện không chỉ giới hạn trong việc nhận diện cảm xúc trên mặt. 00:02:15.265 --> 00:02:17.766 Có nhiều cách bộc lộ cảm xúc. 00:02:17.766 --> 00:02:19.726 Qua ngôn ngữ cơ thể và thanh âm, 00:02:19.726 --> 00:02:23.386 thay đổi nhịp tim, màu da và nhiệt độ, 00:02:23.386 --> 00:02:27.347 hay thậm chí tần số từ và cấu trúc câu trong bài viết của chúng ta 00:02:27.347 --> 00:02:31.236 Bạn có thể cho rằng huấn luyện nơron thần kinh để nhận biết những thứ này 00:02:31.236 --> 00:02:33.845 là một việc rất lâu và phức tạp 00:02:33.845 --> 00:02:36.927 đến khi bạn biết dữ liệu nhiều thế nào 00:02:36.927 --> 00:02:39.796 và máy tính xử lý chúng nhanh thế nào. 00:02:40.256 --> 00:02:41.775 Từ các bài viết, 00:02:41.775 --> 00:02:43.437 hình ảnh, video được đăng tải 00:02:43.437 --> 00:02:45.146 và các đoạn ghi âm điện thoại, 00:02:45.146 --> 00:02:47.187 tới camera cảm biến nhiệt 00:02:47.187 --> 00:02:49.917 và đồ mặc kiểm soát tín hiệu sinh lý, 00:02:49.917 --> 00:02:53.037 vấn đề không phải là làm sao để thu thập đủ dữ liệu 00:02:53.037 --> 00:02:55.057 mà chúng ta sẽ làm gì với nó. 00:02:55.397 --> 00:02:59.215 Máy hóa nhận biết cảm xúc có rất nhiều lợi ích. 00:02:59.315 --> 00:03:02.656 Robot dùng thuật toán nhận dạng nét mặt 00:03:02.656 --> 00:03:04.027 có thể giúp trẻ em học tập 00:03:04.027 --> 00:03:07.276 hay làm cho con người bớt cô đơn. 00:03:07.926 --> 00:03:10.856 Các công ty truyền thông đang xem xét dùng thuật toán 00:03:10.856 --> 00:03:16.657 để ngăn chặn tự tử bằng cách đánh dâú những bài có nội dung nhạy cảm. 00:03:17.447 --> 00:03:20.837 Phần mềm nhận biết cảm xúc có thể giúp chữa trị chứng rối loạn tâm lý 00:03:21.007 --> 00:03:25.117 hay thậm chí đưa ra thiết bị trị liệu tự động giá rẻ. 00:03:25.417 --> 00:03:27.158 Bên cạnh những lợi ích trên, 00:03:27.158 --> 00:03:30.888 một mạng lưới to lớn tự động quét mọi hình ảnh, 00:03:30.888 --> 00:03:32.069 giao thiệp, 00:03:32.069 --> 00:03:36.258 và tín hiệu sinh lý, cũng khá phiền. 00:03:36.748 --> 00:03:40.577 Vậy sự riêng tư của ta ở đâu khi có một mạng lưới như vậy 00:03:40.577 --> 00:03:44.716 đang khai phá cảm xúc của chúng ta thông qua những biển quảng cáo. 00:03:45.186 --> 00:03:46.748 Và đâu là quyền của chúng ta 00:03:46.748 --> 00:03:50.708 nếu chính quyền cho là có thể xác định những người có khả năng phạm tội 00:03:50.708 --> 00:03:53.947 ngay trước cả khi họ có ý định hành động? 00:03:54.647 --> 00:03:57.377 Robot hiện tại vẫn còn cần phải phát triển hơn 00:03:57.377 --> 00:04:00.340 để phân biệt các sắc thái cảm xúc, như mỉa mai 00:04:00.340 --> 00:04:04.358 và mức độ xúc cảm, một người đang vui hay buồn thế nào 00:04:04.358 --> 00:04:08.998 Tuy nhiên, cuối cùng chúng có thể đọc được cảm xúc của ta 00:04:08.998 --> 00:04:10.528 và phản hồi lại. 00:04:11.038 --> 00:04:15.348 Nhưng việc chúng có thể hiểu được nỗi sợ của ta vì xâm nhập ngoài ý muốn hay không 00:04:15.348 --> 00:04:17.019 thì lại là một câu chuyện khác.