WEBVTT 00:00:17.602 --> 00:00:19.239 Xin chào các bạn, tên tôi là Christian Rudder, 00:00:19.239 --> 00:00:21.875 tôi là một trong những người sáng lập trang web OK Cupid. 00:00:21.875 --> 00:00:24.502 Hiện tại, nó đang là một trong những trang web lớn nhất về hẹn hò online ở Mỹ. 00:00:24.502 --> 00:00:25.749 Cũng giống như các thành viên sáng lập khác 00:00:25.749 --> 00:00:27.296 tôi đã từng học chuyên về toán, và, cũng như dự đoán của bạn 00:00:27.296 --> 00:00:28.644 chúng tôi được biết đến với cách tiếp cận theo hướng phân tích 00:00:28.644 --> 00:00:29.887 mà chúng tôi áp dụng vào tình yêu. 00:00:29.887 --> 00:00:31.717 Chúng tôi gọi đó là thuật toán mai mối 00:00:31.717 --> 00:00:33.428 Về cơ bản thì OK Cupid sử dụng thuật toán mai mốt 00:00:33.428 --> 00:00:36.481 để giúp chúng tôi ra kết luận liệu một cặp nam nữ nhất định có thích hợp để hẹn hò với nhau hay không. 00:00:36.481 --> 00:00:38.765 Chúng tôi xây dựng công việc kinh doanh của mình xung quanh thuật toán này. 00:00:38.765 --> 00:00:40.572 "Thuật toán" nghe như một từ mang tính chuyên môn cao 00:00:40.572 --> 00:00:43.047 và khiến chúng ta nghĩ đó là một cái gì đó rất phức tạp 00:00:43.047 --> 00:00:45.148 nhưng thực ra, nó chỉ là một cách giải quyết vấn đề 00:00:45.148 --> 00:00:47.817 mang tính hệ thống theo kiểu từng bước từng bước một. 00:00:47.817 --> 00:00:49.949 Và thực sự nó khá đơn giản. 00:00:49.949 --> 00:00:51.802 Trong bài học này, tôi sẽ giải thích cho các bạn 00:00:51.802 --> 00:00:53.657 điều gì đã dẫn chúng tôi đến với thuật toán này 00:00:53.657 --> 00:00:55.660 và nó hoạt động như thế nào. 00:00:55.660 --> 00:00:57.576 Đầu tiên, hãy nghĩ xem tại sao các thuật toán lại được coi là quan trọng ? 00:00:57.576 --> 00:00:59.045 và tại sao chúng tôi lại tạo ra bài học này? 00:00:59.045 --> 00:01:02.457 Đầu tiên, bạn có thể nhận ra một cụm từ rất quan trọng mà tôi sử dụng ở phía trên: 00:01:02.457 --> 00:01:05.029 "một cách giải quyết vấn đề theo kiểu từng bước từng bước một", 00:01:05.029 --> 00:01:05.841 và có thể bạn cũng đã biết rằng 00:01:05.841 --> 00:01:08.470 máy tính là chuyên gia trong việc giải quyết vấn đề theo từng bước. 00:01:08.470 --> 00:01:09.588 Một máy tính mà không có các thuật toán 00:01:09.588 --> 00:01:12.933 thì về cơ bản cũng chỉ như một cái chặn giấy đắt tiền mà thôi. 00:01:12.933 --> 00:01:15.430 Và cũng bởi vì máy tính là một phần vô cùng phổ biến trong cuộc sống hàng ngày, 00:01:15.430 --> 00:01:17.223 nên những thuật toán có thể được tìm thấy ở khắp mọi nơi. 00:01:18.515 --> 00:01:20.267 Phép toán đằng sau thuật toán của OK Cupid 00:01:20.267 --> 00:01:21.811 đáng ngạc nhiên là lại vô cùng đơn giản. 00:01:21.811 --> 00:01:22.629 Đó chỉ là một vài phép cộng, 00:01:22.629 --> 00:01:23.687 phép nhân, 00:01:23.687 --> 00:01:25.340 và một chút khai căn. 00:01:25.340 --> 00:01:27.611 Tuy nhiên, phần khó nhất trong việc tạo ra thuật toán này 00:01:27.611 --> 00:01:30.235 lại là ở việc làm thế nào để có thể phân tích một yếu tố khó đo lường. 00:01:30.235 --> 00:01:31.212 như sự hấp dẫn của con người, 00:01:31.212 --> 00:01:33.810 thành những phần nhỏ mà máy tính có thể tính toán được. 00:01:33.810 --> 00:01:36.360 Nói về việc này, điều đầu tiên chúng tôi cần để tìm ra những cặp đôi phù hợp là những số liệu. 00:01:36.360 --> 00:01:38.382 để có thể áp dụng vào thuật toán. 00:01:38.382 --> 00:01:40.412 Và cách tốt nhất để có được chúng 00:01:40.412 --> 00:01:41.747 là thu thập từ mọi người. 00:01:41.747 --> 00:01:44.166 Vì thế, chúng tôi quyết định đưa ra các câu hỏi cho các thành viên, 00:01:44.166 --> 00:01:46.834 kiểu như "Trong tương lai bạn có muốn có con không?"; 00:01:46.834 --> 00:01:48.754 "Bạn có thường xuyên đánh răng không?"; 00:01:48.754 --> 00:01:50.227 "Bạn có thích xem phim kinh dị không?" 00:01:50.227 --> 00:01:53.514 hay những điều vĩ mô hơn như "Bạn có tin vào Chúa không?" 00:01:53.514 --> 00:01:55.308 Có thể thấy rằng nhiều câu hỏi thì rất tốt 00:01:55.308 --> 00:01:56.381 nếu chúng ta nhận được 00:01:56.381 --> 00:01:59.052 câu trả lời giống nhau từ cả hai phía. 00:01:59.052 --> 00:02:01.471 Ví dụ như hai người cùng thích xem phim kinh dị 00:02:01.471 --> 00:02:02.684 thì có thể sẽ phù hợp với nhau hơn 00:02:02.684 --> 00:02:03.843 là nếu một người thích 00:02:03.843 --> 00:02:05.115 và người còn lại thì không thích. 00:02:05.115 --> 00:02:06.480 Nhưng đối với những câu hỏi kiểu như 00:02:06.480 --> 00:02:08.189 "Bạn có muốn làm trung tâm của sự chú ý?" 00:02:08.189 --> 00:02:10.729 Nếu cả hai người đều trả lời là có, 00:02:10.729 --> 00:02:13.068 thì mối quan hệ của họ sẽ gặp phải một vấn đề lớn. 00:02:13.068 --> 00:02:14.447 Chúng tôi nhận ra điều này từ đầu 00:02:14.447 --> 00:02:15.614 và vì thế quyết định là chúng tôi cần 00:02:15.614 --> 00:02:17.581 thêm một số dữ liệu từ các câu hỏi. 00:02:17.581 --> 00:02:20.332 Chúng tôi yêu cầu mọi người không những trả lời câu hỏi của mình, 00:02:20.332 --> 00:02:23.038 mà còn cả những câu trả lời mà họ mong muốn nhận được từ người khác. 00:02:23.038 --> 00:02:24.207 Cách này khá hiệu quả, 00:02:24.207 --> 00:02:26.291 tuy nhiên chúng tôi còn cần nhìn vào một khía cạnh khác. 00:02:26.291 --> 00:02:28.835 Đó là một số câu hỏi thì nói cho bạn biết về một người nhiều hơn là những câu khác. 00:02:28.835 --> 00:02:31.795 Lấy ví dụ như một câu hỏi về chính trị 00:02:31.795 --> 00:02:34.589 " Đốt sách và đốt cờ quốc gia - việc nào tồi tệ hơn?" 00:02:34.589 --> 00:02:37.207 câu hỏi kiểu này sẽ bộc lộ nhiều thông tin hơn là câu hỏi về sở thích phim ảnh của bạn. 00:02:37.207 --> 00:02:39.387 Và vì không thể coi các câu hỏi có trọng lượng như nhau 00:02:39.387 --> 00:02:41.605 chúng tôi đã thêm một điểm sau vào thuật toán: 00:02:41.605 --> 00:02:43.440 Đối với tất cả mọi câu hỏi bạn trả lời trên OK Cupid, 00:02:43.440 --> 00:02:44.642 bạn có cơ hội để cho chúng tôi biết 00:02:44.642 --> 00:02:46.223 tầm quan trọng của câu hỏi đó đối với bạn, 00:02:46.223 --> 00:02:49.089 từ không quan trọng một chút nào cho đến vô cùng quan trọng. 00:02:49.089 --> 00:02:50.564 Vậy là đối với bất kì câu hỏi nào 00:02:50.564 --> 00:02:52.692 chúng tôi cũng có ba dữ liệu cho thuật toán của mình: 00:02:52.692 --> 00:02:54.068 Thứ nhất là câu trả lời của bạn; 00:02:54.068 --> 00:02:56.362 Thứ hai là câu trả lời mà bạn mong muốn có được từ một người khác; 00:02:56.362 --> 00:02:57.196 có thể là nửa kia của bạn 00:02:57.196 --> 00:02:58.781 trong tương lai 00:02:58.781 --> 00:03:02.327 và thứ ba là tầm quan trọng của câu hỏi đối với bạn. 00:03:02.327 --> 00:03:03.702 Với tất cả những thông tin đó, 00:03:03.702 --> 00:03:07.128 OK Cupid có thể tính ra được liệu hai người có phù hợp với nhau không. 00:03:07.128 --> 00:03:09.458 Thuật toán sẽ bắt đầu xử lý những con số và cuối cùng đưa ra một kết quả. 00:03:09.458 --> 00:03:11.262 Lấy một ví dụ cụ thể như sau, 00:03:11.262 --> 00:03:13.712 chúng tôi đang xem xét sự phù hợp của bạn với một người người con trai 00:03:13.712 --> 00:03:15.581 giả sử tên anh ta là B 00:03:15.581 --> 00:03:17.479 Phần trăm phù hợp giữa bạn và B sẽ được dựa trên 00:03:17.479 --> 00:03:19.424 những câu hỏi mà cả hai người cùng trả lời. 00:03:19.424 --> 00:03:21.978 Gọi tập hợp những câu hỏi đó là "s" 00:03:21.978 --> 00:03:24.932 và để làm cho ví dụ này đơn giản hơn 00:03:24.932 --> 00:03:26.434 thì "s" chỉ bao gồm hai câu hỏi chung 00:03:26.434 --> 00:03:28.310 rồi chúng ta sẽ tính toán từ đó. 00:03:28.310 --> 00:03:30.144 Lấy ví dụ, 00:03:30.144 --> 00:03:32.349 câu hỏi đầu tiên là "Bạn luộm thuộm đến mức nào?" 00:03:32.349 --> 00:03:34.669 câu trả lời có thể là 00:03:34.669 --> 00:03:35.618 rất luộm thuộm, 00:03:35.618 --> 00:03:36.398 khá luộm thuộm, 00:03:36.398 --> 00:03:38.172 hoặc rất gọn gàng. 00:03:38.172 --> 00:03:39.755 Giả sử câu trả lời của bạn là "rất gọn gàng" 00:03:39.755 --> 00:03:42.581 bạn cũng muốn người kia trả lời như vậy, 00:03:42.581 --> 00:03:45.202 và câu hỏi này rất quan trọng đối với bạn. 00:03:45.202 --> 00:03:46.498 Có thể nói về cơ bản bạn là một người gọn gàng thái quá. 00:03:46.498 --> 00:03:47.212 Bạn rất thích gọn gàng, 00:03:47.212 --> 00:03:48.296 và cũng muốn người yêu của mình 00:03:48.296 --> 00:03:49.248 giống như vậy 00:03:49.248 --> 00:03:51.015 Nhưng giả sử B hơi khác bạn một chút. 00:03:51.015 --> 00:03:53.539 Anh ta trả lời rằng mình rất gọn gàng, 00:03:53.539 --> 00:03:55.171 nhưng lại chỉ cần người yêu của mình 00:03:55.171 --> 00:03:56.740 "khá gọn gàng" thôi 00:03:56.740 --> 00:03:58.748 và câu hỏi này thì cũng không quan trọng mấy đối với B. 00:03:58.748 --> 00:04:00.308 Giờ hãy nhìn vào câu hỏi thứ hai, 00:04:00.308 --> 00:04:01.896 Đây là câu mà lúc trước tôi đã sử dụng: 00:04:01.896 --> 00:04:03.653 " Bạn có muốn là trung tâm của sự chú ý không?" 00:04:03.653 --> 00:04:05.231 Câu trả lời chỉ có thể là có hoặc không. 00:04:05.231 --> 00:04:06.407 Bạn trả lời là "không" 00:04:06.407 --> 00:04:08.235 Bạn cũng mong người yêu tương lai của mình trả lời "không" 00:04:08.235 --> 00:04:10.862 và câu hỏi này theo bạn cũng không mấy quan trọng. 00:04:10.862 --> 00:04:12.419 Với B, anh ấy trả lời là "có" 00:04:12.419 --> 00:04:14.087 nhưng lại tìm kiếm một người trả lời "không" 00:04:14.087 --> 00:04:16.332 vì anh ấy chỉ muốn mình là trung tâm của sự chú ý thôi 00:04:16.332 --> 00:04:19.334 và câu hỏi khá quan trọng với anh ấy. 00:04:19.334 --> 00:04:21.716 Bây giờ hãy thử tính toán tất cả những gì mà chúng ta thu được. 00:04:21.716 --> 00:04:22.855 Bước đầu tiên, 00:04:22.855 --> 00:04:24.376 vì chúng ta sẽ dùng đến máy tính để tinh toán, 00:04:24.376 --> 00:04:26.162 nên chúng ta cần phải gắn những giá trị số 00:04:26.162 --> 00:04:29.041 cho những câu trả lời kiểu như "khá quan trọng" hay "rất quan trọng" 00:04:29.041 --> 00:04:31.335 bởi vì máy tính chỉ có thể làm việc với những con số cụ thể mà thôi. 00:04:31.335 --> 00:04:33.523 Cũng vì thế, OK Cupid quyết định gắn cho 00:04:33.523 --> 00:04:35.858 "không quan trọng chút nào" giá trị bằng 0, 00:04:35.858 --> 00:04:38.307 "quan trọng một chút" giá trị bằng 1, 00:04:38.307 --> 00:04:40.302 "khá quan trọng" giá trị bằng 10, 00:04:40.302 --> 00:04:42.426 "rất quan trọng" giá trị bằng 50, 00:04:42.426 --> 00:04:46.353 và "vô cùng quan trọng" giá trị bằng 250. 00:04:46.353 --> 00:04:48.852 Tiếp theo, thuật toán sẽ thực hiện hai phép tính đơn giản. 00:04:48.852 --> 00:04:51.941 Một là mức độ hài lòng của bạn với những câu trả lời của B 00:04:51.941 --> 00:04:55.568 hay nói cách khác là số điểm mà B có thể đạt được trên thang điểm của bạn. 00:04:55.568 --> 00:04:58.138 Bạn đã nói rằng câu trả lời của B 00:04:58.138 --> 00:04:59.947 cho câu hỏi đâu tiên về mức độ luộm thuộm 00:04:59.947 --> 00:05:01.448 là rất quan trọng với bạn. 00:05:01.448 --> 00:05:04.041 B đã trả lời đúng như bạn muốn vì thế anh ấy có 50 điểm. 00:05:04.041 --> 00:05:05.947 Câu hỏi thứ hai chỉ đáng giá 1điểm 00:05:05.947 --> 00:05:07.558 vì bạn nói nó chỉ quan trọng một chút, 00:05:07.558 --> 00:05:09.036 và B đã trả lời không như bạn muốn. 00:05:09.036 --> 00:05:12.392 Vì thế B đạt 50 trên tổng số 51 điểm mà anh ấy có thể dành được. 00:05:12.392 --> 00:05:14.023 vậy mức độ hài lòng sẽ là 98%. 00:05:14.023 --> 00:05:15.220 Khá cao. 00:05:15.220 --> 00:05:16.832 Điều thứ hai mà thuật toán cần 00:05:16.832 --> 00:05:18.918 là mức độ hài lòng của B với các câu trả lời của bạn. 00:05:18.918 --> 00:05:20.768 B chỉ đặt giá trị cho câu trả lời của bạn 00:05:20.768 --> 00:05:22.353 về sự luộm thuộm là 1 00:05:22.353 --> 00:05:24.745 và 10 điểm cho câu thứ hai. 00:05:24.745 --> 00:05:27.156 Vì thế trên tổng số 11, 00:05:27.156 --> 00:05:28.324 bạn đã đạt được 10 điểm, 00:05:28.324 --> 00:05:30.617 cả hai người đã trả lời đúng như mong muốn của người kia ở câu thứ hai 00:05:30.617 --> 00:05:32.611 vì thế câu trả lời của bạn đạt 10 trên tổng số 11 điểm 00:05:32.611 --> 00:05:35.240 có nghĩa là mức độ hài lòng của B với những câu trả lời của bạn là 91%. 00:05:35.240 --> 00:05:36.117 Cũng khá tốt. 00:05:36.117 --> 00:05:38.286 Việc cuối cùng cần làm là ghép hai phần trăm về mức độ hài lòng này lại 00:05:38.286 --> 00:05:40.454 và tìm ra một con số chung cho cả hai người. 00:05:40.454 --> 00:05:42.747 Để làm như vậy, thuật toán sẽ nhân hai số phần trăm đó lại 00:05:42.747 --> 00:05:44.500 sau đó lấy căn bậc n, 00:05:44.500 --> 00:05:46.792 với n là tổng số câu hỏi. 00:05:46.792 --> 00:05:49.401 Bởi vì s là tổng số câu hỏi 00:05:49.401 --> 00:05:51.507 trong ví dụ này chỉ là 2 00:05:51.507 --> 00:05:54.093 nên để tính phần trăm hài lòng của cả hai bạn về người kia 00:05:54.093 --> 00:05:58.154 ta sẽ lấy căn bậc hai của tích 98% và 91% 00:05:58.154 --> 00:06:00.304 và có kết quả là 94%. 00:06:00.304 --> 00:06:03.194 Đó chính là mức độ phù hợp của bạn với B 00:06:03.194 --> 00:06:04.561 Đây là một cách diễn đạt kiểu toán học 00:06:04.561 --> 00:06:06.405 về mức độ hạnh phúc mà hai bạn có thể có nếu kết đôi với nhau 00:06:06.405 --> 00:06:07.749 dựa trên những thông tin mà bạn cung cấp cho chúng tôi. 00:06:07.749 --> 00:06:10.131 Bây giờ, câu hỏi bạn có thể đặt ra là tại sao chúng tôi lại nhân hai mức độ hài lòng với nhau và lấy căn bậc n, 00:06:10.131 --> 00:06:12.284 chứ không lấy trung bình cộng 00:06:12.284 --> 00:06:14.530 rồi lấy căn bậc n? 00:06:14.530 --> 00:06:16.479 Nói một cách đơn giản thì công thức này gọi là cấp số nhân 00:06:16.479 --> 00:06:17.881 và nó là một cách rất tốt để ghép những giá trị 00:06:17.881 --> 00:06:19.076 mà có nhiều khác biệt 00:06:19.076 --> 00:06:20.861 và đại diện cho nhiều khía cạnh 00:06:20.861 --> 00:06:23.164 Nói cách khác, đây là một cách hoàn hảo cho việc tìm sự phù hợp trong tình yêu. 00:06:23.164 --> 00:06:24.248 Khi mà chúng ta thường có nhiều lựa chọn 00:06:24.248 --> 00:06:26.206 có vô số quan điểm khác nhau, 00:06:26.206 --> 00:06:27.156 như tôi đã lấy ví dụ ở trên về phim ảnh 00:06:27.156 --> 00:06:28.006 về chính trị 00:06:28.006 --> 00:06:29.201 tôn giáo, 00:06:29.201 --> 00:06:30.395 hay tất cả những thứ khác. 00:06:30.395 --> 00:06:32.256 Ngoài ra, nếu chỉ bằng trực giác thì chúng ta cũng có thể thấy 00:06:32.256 --> 00:06:34.918 một cặp đôi mà mức độ hài lòng của người này về người kia đều là 50% 00:06:34.918 --> 00:06:36.052 thì sẽ tốt hơn 00:06:36.052 --> 00:06:39.180 là một cặp đôi mà tỉ lệ này là 0 và 100 00:06:39.180 --> 00:06:40.847 vì sự hấp dẫn thì phải đến từ cả hai phía 00:06:40.847 --> 00:06:43.147 Sau khi thêm vào môt vài sửa chữa nhỏ cho sai số, 00:06:43.147 --> 00:06:45.770 cho trường hợp chúng ta chỉ có rất ít câu hỏi 00:06:45.770 --> 00:06:47.234 như ở ví dụ trên 00:06:47.234 --> 00:06:48.811 thì chúng tôi thấy thuật toán hoàn toàn có thể được sử dụng. 00:06:48.811 --> 00:06:50.191 Bất cứ khi nào OK Cupid ghép đôi hai người lại với nhau, 00:06:50.191 --> 00:06:52.234 chúng tôi lại tiến hành làm theo những bước như trên. 00:06:52.234 --> 00:06:54.484 Đầu tiên là thu thập dữ liệu từ câu trả lời của bạn 00:06:54.484 --> 00:06:56.619 sau đó so sánh những câu trả lời và những mong muốn của bạn 00:06:56.619 --> 00:06:59.740 với câu trả lời và mong muốn của một người khác, bằng những phép toán đơn giản. 00:06:59.740 --> 00:07:02.453 Khả năng chuyển đổi một hiên tượng mang tính thực tế 00:07:02.453 --> 00:07:05.167 thành những số liệu mà một vi mạch có thể xử lý được 00:07:05.167 --> 00:07:05.742 theo tôi 00:07:05.742 --> 00:07:08.565 là kĩ năng quan trọng nhất mà một người có thể có trong thời đại ngày nay. 00:07:08.565 --> 00:07:10.919 Cũng giống như việc bạn sử dụng các câu để kể một câu chuyện cho người khác nghe, 00:07:10.919 --> 00:07:13.665 thì ở đây bạn sử dụng những thuật toán để kể câu chuyện ấy cho một máy tính. 00:07:13.665 --> 00:07:14.921 Nếu bạn học được ngôn ngữ thích hợp 00:07:14.921 --> 00:07:16.381 bạn có thể bắt đầu kể những câu chuyện của minh. 00:07:16.381 --> 00:07:18.768 và tôi mong clip này sẽ giúp bạn làm được điều ấy.