Return to Video

Thuật toán đằng sau trang web hẹn hò trên mạng OKCupid - Christian Rudder

  • 0:18 - 0:19
    Xin chào các bạn, tên tôi là Christian Rudder,
  • 0:19 - 0:22
    tôi là một trong những người sáng lập trang web OK Cupid.
  • 0:22 - 0:25
    Hiện tại, nó đang là một trong những trang web lớn nhất về hẹn hò online ở Mỹ.
  • 0:25 - 0:26
    Cũng giống như các thành viên sáng lập khác
  • 0:26 - 0:27
    tôi đã từng học chuyên về toán, và, cũng như dự đoán của bạn
  • 0:27 - 0:29
    chúng tôi được biết đến với cách tiếp cận theo hướng phân tích
  • 0:29 - 0:30
    mà chúng tôi áp dụng vào tình yêu.
  • 0:30 - 0:32
    Chúng tôi gọi đó là thuật toán mai mối
  • 0:32 - 0:33
    Về cơ bản thì OK Cupid sử dụng thuật toán mai mốt
  • 0:33 - 0:36
    để giúp chúng tôi ra kết luận liệu một cặp nam nữ nhất định có thích hợp để hẹn hò với nhau hay không.
  • 0:36 - 0:39
    Chúng tôi xây dựng công việc kinh doanh của mình xung quanh thuật toán này.
  • 0:39 - 0:41
    "Thuật toán" nghe như một từ mang tính chuyên môn cao
  • 0:41 - 0:43
    và khiến chúng ta nghĩ đó là một cái gì đó rất phức tạp
  • 0:43 - 0:45
    nhưng thực ra, nó chỉ là một cách giải quyết vấn đề
  • 0:45 - 0:48
    mang tính hệ thống theo kiểu từng bước từng bước một.
  • 0:48 - 0:50
    Và thực sự nó khá đơn giản.
  • 0:50 - 0:52
    Trong bài học này, tôi sẽ giải thích cho các bạn
  • 0:52 - 0:54
    điều gì đã dẫn chúng tôi đến với thuật toán này
  • 0:54 - 0:56
    và nó hoạt động như thế nào.
  • 0:56 - 0:58
    Đầu tiên, hãy nghĩ xem tại sao các thuật toán lại được coi là quan trọng ?
  • 0:58 - 0:59
    và tại sao chúng tôi lại tạo ra bài học này?
  • 0:59 - 1:02
    Đầu tiên, bạn có thể nhận ra một cụm từ rất quan trọng mà tôi sử dụng ở phía trên:
  • 1:02 - 1:05
    "một cách giải quyết vấn đề theo kiểu từng bước từng bước một",
  • 1:05 - 1:06
    và có thể bạn cũng đã biết rằng
  • 1:06 - 1:08
    máy tính là chuyên gia trong việc giải quyết vấn đề theo từng bước.
  • 1:08 - 1:10
    Một máy tính mà không có các thuật toán
  • 1:10 - 1:13
    thì về cơ bản cũng chỉ như một cái chặn giấy đắt tiền mà thôi.
  • 1:13 - 1:15
    Và cũng bởi vì máy tính là một phần vô cùng phổ biến trong cuộc sống hàng ngày,
  • 1:15 - 1:17
    nên những thuật toán có thể được tìm thấy ở khắp mọi nơi.
  • 1:19 - 1:20
    Phép toán đằng sau thuật toán của OK Cupid
  • 1:20 - 1:22
    đáng ngạc nhiên là lại vô cùng đơn giản.
  • 1:22 - 1:23
    Đó chỉ là một vài phép cộng,
  • 1:23 - 1:24
    phép nhân,
  • 1:24 - 1:25
    và một chút khai căn.
  • 1:25 - 1:28
    Tuy nhiên, phần khó nhất trong việc tạo ra thuật toán này
  • 1:28 - 1:30
    lại là ở việc làm thế nào để có thể phân tích một yếu tố khó đo lường.
  • 1:30 - 1:31
    như sự hấp dẫn của con người,
  • 1:31 - 1:34
    thành những phần nhỏ mà máy tính có thể tính toán được.
  • 1:34 - 1:36
    Nói về việc này, điều đầu tiên chúng tôi cần để tìm ra những cặp đôi phù hợp là những số liệu.
  • 1:36 - 1:38
    để có thể áp dụng vào thuật toán.
  • 1:38 - 1:40
    Và cách tốt nhất để có được chúng
  • 1:40 - 1:42
    là thu thập từ mọi người.
  • 1:42 - 1:44
    Vì thế, chúng tôi quyết định đưa ra các câu hỏi cho các thành viên,
  • 1:44 - 1:47
    kiểu như "Trong tương lai bạn có muốn có con không?";
  • 1:47 - 1:49
    "Bạn có thường xuyên đánh răng không?";
  • 1:49 - 1:50
    "Bạn có thích xem phim kinh dị không?"
  • 1:50 - 1:54
    hay những điều vĩ mô hơn như "Bạn có tin vào Chúa không?"
  • 1:54 - 1:55
    Có thể thấy rằng nhiều câu hỏi thì rất tốt
  • 1:55 - 1:56
    nếu chúng ta nhận được
  • 1:56 - 1:59
    câu trả lời giống nhau từ cả hai phía.
  • 1:59 - 2:01
    Ví dụ như hai người cùng thích xem phim kinh dị
  • 2:01 - 2:03
    thì có thể sẽ phù hợp với nhau hơn
  • 2:03 - 2:04
    là nếu một người thích
  • 2:04 - 2:05
    và người còn lại thì không thích.
  • 2:05 - 2:06
    Nhưng đối với những câu hỏi kiểu như
  • 2:06 - 2:08
    "Bạn có muốn làm trung tâm của sự chú ý?"
  • 2:08 - 2:11
    Nếu cả hai người đều trả lời là có,
  • 2:11 - 2:13
    thì mối quan hệ của họ sẽ gặp phải một vấn đề lớn.
  • 2:13 - 2:14
    Chúng tôi nhận ra điều này từ đầu
  • 2:14 - 2:16
    và vì thế quyết định là chúng tôi cần
  • 2:16 - 2:18
    thêm một số dữ liệu từ các câu hỏi.
  • 2:18 - 2:20
    Chúng tôi yêu cầu mọi người không những trả lời câu hỏi của mình,
  • 2:20 - 2:23
    mà còn cả những câu trả lời mà họ mong muốn nhận được từ người khác.
  • 2:23 - 2:24
    Cách này khá hiệu quả,
  • 2:24 - 2:26
    tuy nhiên chúng tôi còn cần nhìn vào một khía cạnh khác.
  • 2:26 - 2:29
    Đó là một số câu hỏi thì nói cho bạn biết về một người nhiều hơn là những câu khác.
  • 2:29 - 2:32
    Lấy ví dụ như một câu hỏi về chính trị
  • 2:32 - 2:35
    " Đốt sách và đốt cờ quốc gia - việc nào tồi tệ hơn?"
  • 2:35 - 2:37
    câu hỏi kiểu này sẽ bộc lộ nhiều thông tin hơn là câu hỏi về sở thích phim ảnh của bạn.
  • 2:37 - 2:39
    Và vì không thể coi các câu hỏi có trọng lượng như nhau
  • 2:39 - 2:42
    chúng tôi đã thêm một điểm sau vào thuật toán:
  • 2:42 - 2:43
    Đối với tất cả mọi câu hỏi bạn trả lời trên OK Cupid,
  • 2:43 - 2:45
    bạn có cơ hội để cho chúng tôi biết
  • 2:45 - 2:46
    tầm quan trọng của câu hỏi đó đối với bạn,
  • 2:46 - 2:49
    từ không quan trọng một chút nào cho đến vô cùng quan trọng.
  • 2:49 - 2:51
    Vậy là đối với bất kì câu hỏi nào
  • 2:51 - 2:53
    chúng tôi cũng có ba dữ liệu cho thuật toán của mình:
  • 2:53 - 2:54
    Thứ nhất là câu trả lời của bạn;
  • 2:54 - 2:56
    Thứ hai là câu trả lời mà bạn mong muốn có được từ
    một người khác;
  • 2:56 - 2:57
    có thể là nửa kia của bạn
  • 2:57 - 2:59
    trong tương lai
  • 2:59 - 3:02
    và thứ ba là tầm quan trọng của câu hỏi đối với bạn.
  • 3:02 - 3:04
    Với tất cả những thông tin đó,
  • 3:04 - 3:07
    OK Cupid có thể tính ra được liệu hai người có phù hợp với nhau không.
  • 3:07 - 3:09
    Thuật toán sẽ bắt đầu xử lý những con số và cuối cùng đưa ra một kết quả.
  • 3:09 - 3:11
    Lấy một ví dụ cụ thể như sau,
  • 3:11 - 3:14
    chúng tôi đang xem xét sự phù hợp của bạn với một người người con trai
  • 3:14 - 3:16
    giả sử tên anh ta là B
  • 3:16 - 3:17
    Phần trăm phù hợp giữa bạn và B sẽ được dựa trên
  • 3:17 - 3:19
    những câu hỏi mà cả hai người cùng trả lời.
  • 3:19 - 3:22
    Gọi tập hợp những câu hỏi đó là "s"
  • 3:22 - 3:25
    và để làm cho ví dụ này đơn giản hơn
  • 3:25 - 3:26
    thì "s" chỉ bao gồm hai câu hỏi chung
  • 3:26 - 3:28
    rồi chúng ta sẽ tính toán từ đó.
  • 3:28 - 3:30
    Lấy ví dụ,
  • 3:30 - 3:32
    câu hỏi đầu tiên là "Bạn luộm thuộm đến mức nào?"
  • 3:32 - 3:35
    câu trả lời có thể là
  • 3:35 - 3:36
    rất luộm thuộm,
  • 3:36 - 3:36
    khá luộm thuộm,
  • 3:36 - 3:38
    hoặc rất gọn gàng.
  • 3:38 - 3:40
    Giả sử câu trả lời của bạn là "rất gọn gàng"
  • 3:40 - 3:43
    bạn cũng muốn người kia trả lời như vậy,
  • 3:43 - 3:45
    và câu hỏi này rất quan trọng đối với bạn.
  • 3:45 - 3:46
    Có thể nói về cơ bản bạn là một người gọn gàng thái quá.
  • 3:46 - 3:47
    Bạn rất thích gọn gàng,
  • 3:47 - 3:48
    và cũng muốn người yêu của mình
  • 3:48 - 3:49
    giống như vậy
  • 3:49 - 3:51
    Nhưng giả sử B hơi khác bạn một chút.
  • 3:51 - 3:54
    Anh ta trả lời rằng mình rất gọn gàng,
  • 3:54 - 3:55
    nhưng lại chỉ cần người yêu của mình
  • 3:55 - 3:57
    "khá gọn gàng" thôi
  • 3:57 - 3:59
    và câu hỏi này thì cũng không quan trọng mấy đối với B.
  • 3:59 - 4:00
    Giờ hãy nhìn vào câu hỏi thứ hai,
  • 4:00 - 4:02
    Đây là câu mà lúc trước tôi đã sử dụng:
  • 4:02 - 4:04
    " Bạn có muốn là trung tâm của sự chú ý không?"
  • 4:04 - 4:05
    Câu trả lời chỉ có thể là có hoặc không.
  • 4:05 - 4:06
    Bạn trả lời là "không"
  • 4:06 - 4:08
    Bạn cũng mong người yêu tương lai của mình trả lời "không"
  • 4:08 - 4:11
    và câu hỏi này theo bạn cũng không mấy quan trọng.
  • 4:11 - 4:12
    Với B, anh ấy trả lời là "có"
  • 4:12 - 4:14
    nhưng lại tìm kiếm một người trả lời "không"
  • 4:14 - 4:16
    vì anh ấy chỉ muốn mình là trung tâm của sự chú ý thôi
  • 4:16 - 4:19
    và câu hỏi khá quan trọng với anh ấy.
  • 4:19 - 4:22
    Bây giờ hãy thử tính toán tất cả những gì mà chúng ta thu được.
  • 4:22 - 4:23
    Bước đầu tiên,
  • 4:23 - 4:24
    vì chúng ta sẽ dùng đến máy tính để tinh toán,
  • 4:24 - 4:26
    nên chúng ta cần phải gắn những giá trị số
  • 4:26 - 4:29
    cho những câu trả lời kiểu như "khá quan trọng" hay "rất quan trọng"
  • 4:29 - 4:31
    bởi vì máy tính chỉ có thể làm việc với những con số cụ thể mà thôi.
  • 4:31 - 4:34
    Cũng vì thế, OK Cupid quyết định gắn cho
  • 4:34 - 4:36
    "không quan trọng chút nào" giá trị bằng 0,
  • 4:36 - 4:38
    "quan trọng một chút" giá trị bằng 1,
  • 4:38 - 4:40
    "khá quan trọng" giá trị bằng 10,
  • 4:40 - 4:42
    "rất quan trọng" giá trị bằng 50,
  • 4:42 - 4:46
    và "vô cùng quan trọng" giá trị bằng 250.
  • 4:46 - 4:49
    Tiếp theo, thuật toán sẽ thực hiện hai phép tính đơn giản.
  • 4:49 - 4:52
    Một là mức độ hài lòng của bạn với những câu trả lời của B
  • 4:52 - 4:56
    hay nói cách khác là số điểm mà B có thể đạt được trên thang điểm của bạn.
  • 4:56 - 4:58
    Bạn đã nói rằng câu trả lời của B
  • 4:58 - 5:00
    cho câu hỏi đâu tiên về mức độ luộm thuộm
  • 5:00 - 5:01
    là rất quan trọng với bạn.
  • 5:01 - 5:04
    B đã trả lời đúng như bạn muốn vì thế anh ấy có 50 điểm.
  • 5:04 - 5:06
    Câu hỏi thứ hai chỉ đáng giá 1điểm
  • 5:06 - 5:08
    vì bạn nói nó chỉ quan trọng một chút,
  • 5:08 - 5:09
    và B đã trả lời không như bạn muốn.
  • 5:09 - 5:12
    Vì thế B đạt 50 trên tổng số 51 điểm mà anh ấy có thể dành được.
  • 5:12 - 5:14
    vậy mức độ hài lòng sẽ là 98%.
  • 5:14 - 5:15
    Khá cao.
  • 5:15 - 5:17
    Điều thứ hai mà thuật toán cần
  • 5:17 - 5:19
    là mức độ hài lòng của B với các câu trả lời của bạn.
  • 5:19 - 5:21
    B chỉ đặt giá trị cho câu trả lời của bạn
  • 5:21 - 5:22
    về sự luộm thuộm là 1
  • 5:22 - 5:25
    và 10 điểm cho câu thứ hai.
  • 5:25 - 5:27
    Vì thế trên tổng số 11,
  • 5:27 - 5:28
    bạn đã đạt được 10 điểm,
  • 5:28 - 5:31
    cả hai người đã trả lời đúng như mong muốn của người kia ở câu thứ hai
  • 5:31 - 5:33
    vì thế câu trả lời của bạn đạt 10 trên tổng số 11 điểm
  • 5:33 - 5:35
    có nghĩa là mức độ hài lòng của B với những câu trả lời của bạn là 91%.
  • 5:35 - 5:36
    Cũng khá tốt.
  • 5:36 - 5:38
    Việc cuối cùng cần làm là ghép hai phần trăm về mức độ hài lòng này lại
  • 5:38 - 5:40
    và tìm ra một con số chung cho cả hai người.
  • 5:40 - 5:43
    Để làm như vậy, thuật toán sẽ nhân hai số phần trăm đó lại
  • 5:43 - 5:44
    sau đó lấy căn bậc n,
  • 5:44 - 5:47
    với n là tổng số câu hỏi.
  • 5:47 - 5:49
    Bởi vì s là tổng số câu hỏi
  • 5:49 - 5:52
    trong ví dụ này chỉ là 2
  • 5:52 - 5:54
    nên để tính phần trăm hài lòng của cả hai bạn về người kia
  • 5:54 - 5:58
    ta sẽ lấy căn bậc hai của tích 98% và 91%
  • 5:58 - 6:00
    và có kết quả là 94%.
  • 6:00 - 6:03
    Đó chính là mức độ phù hợp của bạn với B
  • 6:03 - 6:05
    Đây là một cách diễn đạt kiểu toán học
  • 6:05 - 6:06
    về mức độ hạnh phúc mà hai bạn có thể có nếu kết đôi với nhau
  • 6:06 - 6:08
    dựa trên những thông tin mà bạn cung cấp cho chúng tôi.
  • 6:08 - 6:10
    Bây giờ, câu hỏi bạn có thể đặt ra là tại sao chúng tôi lại nhân hai mức độ hài lòng với nhau và lấy căn bậc n,
  • 6:10 - 6:12
    chứ không lấy trung bình cộng
  • 6:12 - 6:15
    rồi lấy căn bậc n?
  • 6:15 - 6:16
    Nói một cách đơn giản thì công thức này gọi là cấp số nhân
  • 6:16 - 6:18
    và nó là một cách rất tốt để ghép những giá trị
  • 6:18 - 6:19
    mà có nhiều khác biệt
  • 6:19 - 6:21
    và đại diện cho nhiều khía cạnh
  • 6:21 - 6:23
    Nói cách khác, đây là một cách hoàn hảo cho việc tìm sự phù hợp trong tình yêu.
  • 6:23 - 6:24
    Khi mà chúng ta thường có nhiều lựa chọn
  • 6:24 - 6:26
    có vô số quan điểm khác nhau,
  • 6:26 - 6:27
    như tôi đã lấy ví dụ ở trên về phim ảnh
  • 6:27 - 6:28
    về chính trị
  • 6:28 - 6:29
    tôn giáo,
  • 6:29 - 6:30
    hay tất cả những thứ khác.
  • 6:30 - 6:32
    Ngoài ra, nếu chỉ bằng trực giác thì chúng ta cũng có thể thấy
  • 6:32 - 6:35
    một cặp đôi mà mức độ hài lòng của người này về người kia đều là 50%
  • 6:35 - 6:36
    thì sẽ tốt hơn
  • 6:36 - 6:39
    là một cặp đôi mà tỉ lệ này là 0 và 100
  • 6:39 - 6:41
    vì sự hấp dẫn thì phải đến từ cả hai phía
  • 6:41 - 6:43
    Sau khi thêm vào môt vài sửa chữa nhỏ cho sai số,
  • 6:43 - 6:46
    cho trường hợp chúng ta chỉ có rất ít câu hỏi
  • 6:46 - 6:47
    như ở ví dụ trên
  • 6:47 - 6:49
    thì chúng tôi thấy thuật toán hoàn toàn có thể được sử dụng.
  • 6:49 - 6:50
    Bất cứ khi nào OK Cupid ghép đôi hai người lại với nhau,
  • 6:50 - 6:52
    chúng tôi lại tiến hành làm theo những bước như trên.
  • 6:52 - 6:54
    Đầu tiên là thu thập dữ liệu từ câu trả lời của bạn
  • 6:54 - 6:57
    sau đó so sánh những câu trả lời và những mong muốn của bạn
  • 6:57 - 7:00
    với câu trả lời và mong muốn của một người khác, bằng những phép toán đơn giản.
  • 7:00 - 7:02
    Khả năng chuyển đổi một hiên tượng mang tính thực tế
  • 7:02 - 7:05
    thành những số liệu mà một vi mạch có thể xử lý được
  • 7:05 - 7:06
    theo tôi
  • 7:06 - 7:09
    là kĩ năng quan trọng nhất mà một người có thể có trong thời đại ngày nay.
  • 7:09 - 7:11
    Cũng giống như việc bạn sử dụng các câu để kể một câu chuyện cho người khác nghe,
  • 7:11 - 7:14
    thì ở đây bạn sử dụng những thuật toán để kể câu chuyện ấy cho một máy tính.
  • 7:14 - 7:15
    Nếu bạn học được ngôn ngữ thích hợp
  • 7:15 - 7:16
    bạn có thể bắt đầu kể những câu chuyện của minh.
  • 7:16 - 7:19
    và tôi mong clip này sẽ giúp bạn làm được điều ấy.
Title:
Thuật toán đằng sau trang web hẹn hò trên mạng OKCupid - Christian Rudder
Speaker:
Christian Rudder
Description:

Bạn có thể xem bài học đầy đủ tại: http://ed.ted.com/lessons/inside-okcupid-the-math-of-online-dating-christian-rudder

Khi hai người khác giới tham gia vào một trang web hẹn hò trên mạng, họ sẽ được ghép với nhau dựa vào những sở thích chung và cách họ trả lời một số câu hỏi mang tính cá nhân. Nhưng làm thế nào mà một trang web có thể tính toán được tỉ lệ thành công của một mối quan hệ? Christian Rudder, một trong những nhà sáng lập của trang web hẹn hò online rất phổ biến OKCupid sẽ giới thiệu với các bạn về thuật toán mà họ đã sử dụng để giúp bạn trả lời câu hỏi trên.

Tác giả Christian Rudder, minh họa bởi TED-Ed.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
07:31

Vietnamese subtitles

Revisions Compare revisions