Portuguese subtitles

← Dentro do OKCupid: A matemática dos encontros online — Christian Rudder

Get Embed Code
23 Languages

Showing Revision 6 created 07/05/2015 by Margarida Ferreira.

  1. Olá, chamo-me Christian Rudder
  2. e fui um dos fundadores do OKCupid.
  3. É um dos maiores sites
    de encontros nos EUA.
  4. Como quase toda a gente no site,
  5. eu sou formado em matemática
  6. e somos conhecidos
    pela abordagem analítica ao amor.
  7. Chamamos-lhe
    o nosso algoritmo casamenteiro.
  8. O algoritmo casamenteiro do OKCupid
  9. ajuda-nos a decidir se duas pessoas
    se deveriam encontrar.
  10. Construímos todo um negócio à volta disso.
  11. Algoritmo é uma palavra cara,
  12. e as pessoas gostam de a usar
    como se fosse uma coisa muito especial,
  13. mas não passa de uma maneira sistemática,
  14. de resolver um problema passo-a-passo.
  15. Não tem que ser nada de especial.
  16. Nesta lição, vou explicar
  17. como chegamos
    ao nosso algoritmo em particular
  18. para verem como se faz.
  19. Porque é que os algoritmos
    são importantes?
  20. Porque é que esta lição existe?
  21. Reparem na frase muito
    significativa que eu usei:
  22. são uma maneira de, passo-a-passo,
    resolver um problema.
  23. Como sabem, os computadores são excelentes
  24. em processos passo-a-passo.
  25. Um computador sem algoritmo
  26. não é passa de um pisa-papéis caro.
  27. Como os computadores
    são uma parte dominante do dia-a-dia,
  28. os algoritmos estão por todo o lado.
  29. A matemática do algoritmo do OKCupid
  30. é surpreendentemente simples.
  31. É só somar, multiplicar
  32. e algumas raízes quadradas.
  33. A parte complicada de o desenhar,
  34. foi entender como transformar
    algo misterioso,
  35. a atração humana,
  36. e decompô-la em componentes
    com que um computador pudesse trabalhar.
  37. Precisávamos de informação
    para "casar" as pessoas,
  38. para que o algoritmo pudesse trabalhar.
  39. A melhor forma de conseguir
    informações das pessoas é pedir-lhas.
  40. Portanto, o OKCupid devia
    fazer perguntas aos utilizadores, como:
  41. "Quer vir a ter filhos?"
  42. "Com que frequência lava os dentes?",
  43. "Gosta de filmes de terror?"
  44. e coisas importante
    como "Acredita em Deus?"
  45. Convém haver muitas perguntas
  46. para se encontrarem pontos em comum,
  47. ou seja, duas pessoas
    darem a mesma resposta.
  48. Por exemplo, duas pessoas
    que gostam de filmes de terror
  49. devem dar-se melhor do que
    uma que gosta e outra que não.
  50. Mas se for uma pergunta como:
  51. "Gosta de ser o centro das atenções?"
  52. Se as duas pessoas numa relação
    dizem que sim,
  53. então vão ter grandes problemas.
  54. Depressa percebemos isto,
  55. por isso precisávamos de mais informações
    em cada pergunta.
  56. Pedimos às pessoas para
    serem específicas na sua resposta
  57. e também sobre a resposta
    que queriam da outra pessoa.
  58. Isso resultou muito bem,
  59. mas precisávamos de mais uma dimensão.
  60. Algumas perguntas dizem mais
    sobre uma pessoa que outras.
  61. Por exemplo, uma pergunta
    sobre política, tipo:
  62. "O que é pior: queimar livros
    ou queimar a bandeira?"
  63. pode ser mais reveladora
    do que a sua preferência em filmes.
  64. Não faz sentido dar o mesmo peso a tudo,
  65. portanto adicionámos
    um novo ponto de informação.
  66. Em todas as perguntas que o OKCupid faz,
  67. podem dizer-nos o papel
    que desempenha na vossa vida,
  68. Isto varia de "irrelevante"
    a "obrigatório".
  69. Portanto, para cada pergunta,
  70. temos três pontos no nosso algoritmo:
  71. primeiro, a vossa resposta;
  72. segundo, a resposta que querem
  73. que o vosso parceiro potencial, dê;
  74. e terceiro, a importância
    que dão à pergunta..
  75. Com todas estas informações,
  76. o OKCupid pode perceber
    se duas pessoas se darão bem.
  77. O algoritmo trabalha
    os números e dá um resultado.
  78. Como exemplo prático,
  79. vamos ver como vos sugeriríamos
    outra pessoa,
  80. vamos chamar-lhe "B".
  81. A percentagem de compatibilidade com B
  82. baseia-se nas perguntas
    a que ambos responderam.
  83. Vamos chamar "s"
    a este conjunto de perguntas comuns.
  84. Como exemplo simples,
    usamos um conjunto "s" pequeno
  85. apenas com duas perguntas comuns
  86. e calculamos a compatibilidade
    a partir daí.
  87. As duas perguntas são estas:
  88. A primeira é:
    "É desarrumado?"
  89. As possibilidades de resposta são:
  90. muito desarrumado,
  91. normal,
  92. e muito organizado.
  93. Se responderem
    "muito organizada",
  94. querem que a outra pessoa responda
    "muito organizado",
  95. e a pergunta for muito importante,
  96. é porque têm a mania da arrumação.
  97. É arrumada e quer
    que o outro seja arrumado,
  98. Suponhamos que B é um pouco diferente.
  99. Respondeu que é muito organizado,
  100. mas que a outra pessoa pode
    ser apenas normal,
  101. e que a pergunta
    não é importante para ele.
  102. Vamos ver a segunda pergunta,
  103. que é a do exemplo anterior:
  104. "Gosta de ser o centro das atenções?"
  105. As resposta são apenas sim e não.
  106. Vocês respondem que "não",
    querem que o outro responda "não",
  107. e a pergunta não é muito importante.
  108. B respondeu "sim",
    quer que o outro responda "não",
  109. porque quer que as atenções
    se concentrem nele,
  110. e a pergunta é mais ou menos importante.
  111. Vamos tentar calcular tudo isto.
  112. Como usamos computadores
    para fazer isso,
  113. o primeiro passo é atribuir
    valores numéricos
  114. a ideias como "relativamente importante"
    e "muito importante"
  115. porque os computadores
    precisam de tudo em algarismos.
  116. No OKCupid optamos pela seguinte escala:
  117. irrelevante vale 0,
  118. pouca importância vale 1,
  119. alguma importância vale 10,
  120. muito importante vale 50,
  121. e completamente obrigatório vale 250.
  122. A seguir, o algoritmo
    faz dois simples cálculos.
  123. O primeiro é: quanto é que
    as respostas de B lhe agradam,
  124. isto é, quantos pontos
    obteve B na sua escala?
  125. Como indicaram que a resposta de B
  126. à primeira pergunta sobre arrumação
  127. era muito importante,
  128. isso vale 50 pontos
    e B acertou na resposta.
  129. A segunda pergunta só vale 1
  130. porque disseram
    que era pouco importante,
  131. e B não acertou.
  132. Portanto as respostas de B
    valem 50 em 51 pontos possíveis.
  133. Isso é uma satisfação de 98%,
    É bastante bom.
  134. O segundo cálculo do algoritmo
  135. avalia se as vossas respostas
    satisfazem B.
  136. B atribui 1 ponto à vossa resposta
    à pergunta da arrumação
  137. e 10 à vossa resposta à segunda.
  138. Desses 11, ou seja 1 mais 10,
    ganharam 10,
  139. acertaram na segunda resposta um do outro.
  140. Portanto as respostas deram 10 em 11
  141. o que é 91% satisfatório para B.
  142. Não é nada mau.
  143. O passo final é pegar
    nas duas percentagens de compatibilidade
  144. e obter um número para os dois.
  145. Para isso, o algoritmo
    multiplica as pontuações,
  146. depois calcula a raiz de n,
  147. em que n é o número de perguntas.
  148. Como s, que é o número de perguntas,
  149. neste exemplo, é apenas 2,
  150. temos uma percentagem de compatibilidade
  151. igual à raiz quadrada de 98% vezes 91%.
  152. Isto dá 94%.
  153. Estes 94% são a vossa percentagem
    de compatibilidade com B.
  154. É uma expressão matemática
    de como se darão bem
  155. com base no que sabemos.
  156. Porque é que o algoritmo multiplica,
  157. em vez de fazer a média
    das duas percentagens
  158. e depois fazer a raiz quadrada?
  159. Esta fórmula chama-se média geométrica,
  160. uma excelente forma
    de combinar valores
  161. que apresentam grandes variações
  162. e representam propriedades
    muito diferentes.
  163. É perfeita para compatibilidade romântica.
  164. Temos grandes variações
    e milhares de diferentes dados,
  165. sobre filmes, sobre política,
  166. sobre religião, sobre tudo.
  167. De uma forma intuitiva, isto faz sentido.
  168. Duas pessoas que correspondam a 50%
  169. devem ser mais compatíveis
  170. que outras que têm
    compatibilidade a 0 e 100,
  171. porque o afeto tem que ser mútuo.
  172. Depois de pequenas correções
    para permitir uma margem de erro,
  173. se o número de perguntas
    for muito reduzido, como neste exemplo,
  174. estamos prontos.
  175. Sempre que o OKCupid compara duas pessoas,
  176. segue os passos que acabámos de explicar.
  177. Primeiro recolhe os dados
    das respostas,
  178. depois compara as escolhas e preferências
    com outras pessoas
  179. de forma simples e matemática.
  180. Acho que esta capacidade de pegar
    em fenómenos do mundo real
  181. e transformá-los em algo que
    um microchip consegue compreender,
  182. é a capacidade mais importante que
    uma pessoa pode ter atualmente.
  183. Tal como usamos frases
    para contar histórias às pessoas,
  184. usamos algoritmos para
    contar histórias a um computador.
  185. Se aprendermos a linguagem,
  186. podemos sair e contar histórias.
  187. Espero que isto vos ajude a fazer isso.