Return to Video

OKCupid por dentro: Las matemáticas de las citas en línea - Christian Rudder

  • 0:18 - 0:19
    Hola, soy Christian Rudder
  • 0:19 - 0:22
    y fui uno de los fundadores
    de OK Cupid.
  • 0:22 - 0:25
    Hoy es uno de los sitios de citas
    más grande de Estados Unidos.
  • 0:25 - 0:26
    Como casi todos en el sitio,
  • 0:26 - 0:27
    tenía un título en matemáticas
    y, como era de esperar,
  • 0:27 - 0:29
    éramos conocidos por
    el enfoque analítico
  • 0:29 - 0:30
    que tenemos del amor.
  • 0:30 - 0:32
    Le llamamos el algoritmo
    de compatibilidad.
  • 0:32 - 0:33
    En esencia el algoritmo
    de compatibilidad de OK Cupid
  • 0:33 - 0:36
    nos ayuda a decidir si dos personas
    debieran tener una cita.
  • 0:36 - 0:39
    Sobre esa base construimos
    todo nuestro negocio.
  • 0:39 - 0:41
    Ahora, algoritmo es
    una palabra pomposa
  • 0:41 - 0:43
    y la gente tiende a ignorarla
    por ampulosa,
  • 0:43 - 0:45
    pero en realidad, un algoritmo
    es solo una forma sistemática
  • 0:45 - 0:48
    de resolver problemas paso a paso.
  • 0:48 - 0:50
    No tiene que ser nada pomposo.
  • 0:50 - 0:52
    Aquí en esta lección, explicaré
  • 0:52 - 0:54
    cómo concebimos
    nuestro algoritmo,
  • 0:54 - 0:56
    así lo podrás entender.
  • 0:56 - 0:58
    Ahora, ¿por qué son importantes
    los algoritmos?
  • 0:58 - 0:59
    ¿Para qué existe esta lección?
  • 0:59 - 1:02
    Bueno, nota una frase
    muy significativa que usé arriba:
  • 1:02 - 1:05
    una forma de resolver
    problemas paso a paso,
  • 1:05 - 1:06
    y como probablemente sepas,
  • 1:06 - 1:08
    las computadoras se lucen en
    los procesos paso a paso.
  • 1:08 - 1:10
    Una computadora sin un algoritmo
  • 1:10 - 1:13
    es en esencia un pisapapeles caro.
  • 1:13 - 1:15
    Y dado que las computadoras son una parte
    tan dominante de la vida cotidiana,
  • 1:15 - 1:17
    los algoritmos están dondequiera.
  • 1:19 - 1:20
    La matemática subyacente al algoritmo
    de compatibilidad de OK Cupid
  • 1:20 - 1:22
    es sorprendentemente sencilla.
  • 1:22 - 1:23
    Son solo unas sumas,
  • 1:23 - 1:24
    multiplicaciones,
  • 1:24 - 1:25
    y unas cuantas raíces cuadradas.
  • 1:25 - 1:28
    Aunque el truco de diseño estaba
  • 1:28 - 1:30
    en averiguar cómo tomar
    algo tan misterioso,
  • 1:30 - 1:31
    como la atracción humana,
  • 1:31 - 1:34
    y separarlo en sus componentes para que
    una computadora pueda trabajar con ellos.
  • 1:34 - 1:36
    Bueno, lo primero que necesitamos
    para aparejar personas son datos,
  • 1:36 - 1:38
    algo que el algoritmo necesita.
  • 1:38 - 1:40
    El mejor modo de
    conseguir datos de la gente
  • 1:40 - 1:42
    es simplemente preguntando.
  • 1:42 - 1:44
    Así, decidimos que OK Cupid
    debería preguntar a los usuarios
  • 1:44 - 1:47
    cosas como, "¿quieres
    tener hijos algún día?"
  • 1:47 - 1:49
    y "¿con qué frecuencia
    te cepillas los dientes?",
  • 1:49 - 1:50
    "¿te gustan las películas de terror?",
  • 1:50 - 1:54
    y grandes temas como:
    "¿Crees en Dios?"
  • 1:54 - 1:55
    Ahora, muchas de las
    preguntas son buenas
  • 1:55 - 1:56
    para aparear entre iguales,
  • 1:56 - 1:59
    es decir cuando ambas
    personas contestan igual.
  • 1:59 - 2:01
    Por ejemplo, dos personas a las que
    les gustan las películas de terror
  • 2:01 - 2:03
    probablemente hacen mejor pareja
  • 2:03 - 2:04
    que una persona que le gusta
  • 2:04 - 2:05
    y otra que no.
  • 2:05 - 2:06
    Pero qué pasa con una pregunta como,
  • 2:06 - 2:08
    "¿te gusta ser el centro de atención?"
  • 2:08 - 2:11
    Si ambos en una relación dicen que sí,
  • 2:11 - 2:13
    entonces tendremos problemas grandes.
  • 2:13 - 2:14
    Pronto nos dimos cuenta de esto,
  • 2:14 - 2:16
    así que decidimos que necesitábamos
  • 2:16 - 2:18
    un poco más de datos
    para cada pregunta.
  • 2:18 - 2:20
    Teníamos que pedir que especificaran
    no solo su propia respuesta,
  • 2:20 - 2:23
    sino la respuesta que
    querían del otro.
  • 2:23 - 2:24
    Eso funcionó muy bien,
  • 2:24 - 2:26
    pero necesitamos
    una dimensión más.
  • 2:26 - 2:29
    Algunas preguntas dicen más
    de una persona que otras.
  • 2:29 - 2:32
    Por ejemplo, una pregunta
    de política, algo como,
  • 2:32 - 2:35
    "¿qué es peor: quemar un libro
    o una bandera?",
  • 2:35 - 2:37
    puede revelar más de alguien
    que su gusto fílmico.
  • 2:37 - 2:39
    Y no tiene sentido
    ponderar todo por igual,
  • 2:39 - 2:42
    así que sumamos
    un punto final de datos.
  • 2:42 - 2:43
    Por cada cosa que
    pregunta OK Cupid,
  • 2:43 - 2:45
    tienen una oportunidad de decirnos
  • 2:45 - 2:46
    el rol que juega en sus vidas,
  • 2:46 - 2:49
    y esto varía desde
    lo irrelevante a lo obligatorio.
  • 2:49 - 2:51
    Ahora pues, por cada pregunta,
  • 2:51 - 2:53
    tenemos tres cosas
    para nuestro algoritmo:
  • 2:53 - 2:54
    primero, tu respuesta;
  • 2:54 - 2:56
    segundo, cómo quieres que el otro,
  • 2:56 - 2:57
    tu pareja potencial,
  • 2:57 - 2:59
    responda;
  • 2:59 - 3:02
    y tercero, qué tan importante
    es la pregunta para ti.
  • 3:02 - 3:04
    Con toda esta información,
  • 3:04 - 3:07
    OO Cupid puede averiguar
    qué tan bien se llevarán dos personas.
  • 3:07 - 3:09
    El algoritmo desmenuza los números
    y les da un resultado.
  • 3:09 - 3:11
    Como un ejemplo práctico,
  • 3:11 - 3:14
    veamos cómo te apareamos
    con otra persona,
  • 3:14 - 3:16
    que llamaremos "B".
  • 3:16 - 3:17
    Tu porcentaje de compatibilidad
    con B se basa en
  • 3:17 - 3:19
    preguntas que ambos respondieron.
  • 3:19 - 3:22
    Que llamaremos el conjunto
    de preguntas comunes, "s".
  • 3:22 - 3:25
    Como un ejemplo muy sencillo,
    usaremos un conjunto pequeño "s"
  • 3:25 - 3:26
    con solo dos preguntas en común
  • 3:26 - 3:28
    y calcularemos de eso, una pareja.
  • 3:28 - 3:30
    He aquí nuestros dos preguntas ejemplo.
  • 3:30 - 3:32
    La primera, digamos,
    "¿qué tan desordenado eres?"
  • 3:32 - 3:35
    y las posibles respuestas son:
  • 3:35 - 3:36
    muy desordenado,
  • 3:36 - 3:36
    promedio
  • 3:36 - 3:38
    y muy ordenado.
  • 3:38 - 3:40
    Digamos que contestas
    "muy ordenado",
  • 3:40 - 3:43
    y quisieras a alguien que
    conteste, "muy ordenado",
  • 3:43 - 3:45
    y la preguntas es
    muy importante para ti.
  • 3:45 - 3:46
    En suma tienes manía por el orden.
  • 3:46 - 3:47
    Eres ordenada,
  • 3:47 - 3:48
    quieres a alguien ordenado,
  • 3:48 - 3:49
    sin más.
  • 3:49 - 3:51
    Digamos que B es
    un poquito diferente.
  • 3:51 - 3:54
    Responde que es
    muy ordenado consigo mismo
  • 3:54 - 3:55
    pero promedio le parece bien
  • 3:55 - 3:57
    como respuesta del otro.
  • 3:57 - 3:59
    Y la pregunta le es poco relevante.
  • 3:59 - 4:00
    Miremos la segunda pregunta,
  • 4:00 - 4:02
    es la del ejemplo anterior:
  • 4:02 - 4:04
    "¿te gusta ser el centro de atención?"
  • 4:04 - 4:05
    Las respuestas son sí y no.
  • 4:05 - 4:06
    Ahora si contestas "no",
  • 4:06 - 4:08
    cómo quieres que
    sea el "no" del otro.
  • 4:08 - 4:11
    Y la pregunta tiene
    poca relevancia para ti.
  • 4:11 - 4:12
    Ahora B, contesta "sí",
  • 4:12 - 4:14
    quiere a alguien
    que conteste "no",
  • 4:14 - 4:16
    porque quiere destacarse,
  • 4:16 - 4:19
    y la pregunta le es relevante.
  • 4:19 - 4:22
    Intentemos calcular todo esto.
  • 4:22 - 4:23
    Nuestro primer paso es,
  • 4:23 - 4:24
    dado que usamos computadoras,
  • 4:24 - 4:26
    necesitamos asignar valores numéricos
  • 4:26 - 4:29
    a ideas como "algo importante"
    y "muy importante"
  • 4:29 - 4:31
    porque las computadoras
    necesitan todo en números.
  • 4:31 - 4:34
    Nosotros en OK Cupid
    elegimos la siguiente escala:
  • 4:34 - 4:36
    irrelevante equivale a 0,
  • 4:36 - 4:38
    un poco importante equivale a 1,
  • 4:38 - 4:40
    algo importante equivale a 10,
  • 4:40 - 4:42
    muy importante equivale a 50,
  • 4:42 - 4:46
    y es absolutamente obligatorio a 250.
  • 4:46 - 4:49
    Siguiente paso, el algoritmo
    hace dos simples cálculos.
  • 4:49 - 4:52
    El primero es qué tanto
    te gustaron las respuestas de B,
  • 4:52 - 4:56
    esto es, ¿cuántos puntos posibles
    obtuvo B en tu escala?
  • 4:56 - 4:58
    Bueno, tú indicaste que
    la respuesta de B
  • 4:58 - 5:00
    a la primera pregunta sobre el desorden
  • 5:00 - 5:01
    era muy importante para ti.
  • 5:01 - 5:04
    Lo que equivale a 50 puntos y B acertó.
  • 5:04 - 5:06
    La segunda pregunta equivale solo a 1
  • 5:06 - 5:08
    porque dijiste que era
    solo poco relevante,
  • 5:08 - 5:09
    y B la tiene mal.
  • 5:09 - 5:12
    Así, las respuestas de B fueron
    50 de 51 puntos posibles.
  • 5:12 - 5:14
    Esto es 98 % satisfactorio,
  • 5:14 - 5:15
    lo cual es bastante bueno.
  • 5:15 - 5:17
    Y la segunda pregunta
    del algoritmo ve
  • 5:17 - 5:19
    qué tanto le satisfaces a B.
  • 5:19 - 5:21
    Bueno, B te dio 1 punto
    en tu respuesta
  • 5:21 - 5:22
    a la pregunta del desorden
  • 5:22 - 5:25
    y 10 en la respuesta a la segunda.
  • 5:25 - 5:27
    De esos 11, es decir 1 más 10,
  • 5:27 - 5:28
    te ganaste 10,
  • 5:28 - 5:31
    de la segunda pregunta ambos
    están satisfechos entre sí.
  • 5:31 - 5:33
    Entonces sus respuestas
    fueron 10 de 11
  • 5:33 - 5:35
    que equivale al 91% de
    satisfacción para B.
  • 5:35 - 5:36
    No está mal.
  • 5:36 - 5:38
    El paso final es tomar estos
    dos porcentajes de compatibilidad
  • 5:38 - 5:40
    y obtener un número para ambos.
  • 5:40 - 5:43
    Para hacer esto, el algoritmo
    multiplica sus resultados,
  • 5:43 - 5:44
    hace la raíz de n,
  • 5:44 - 5:47
    donde n es el número de preguntas.
  • 5:47 - 5:49
    Dado que s, es el número de preguntas,
  • 5:49 - 5:52
    en este ejemplo, es solamente 2,
  • 5:52 - 5:54
    tenemos porcentajes de
    compatibilidad que equivalen
  • 5:54 - 5:58
    a la raíz cuadrada de 98 % por 91 %,
  • 5:58 - 6:00
    que equivale a 94 %.
  • 6:00 - 6:03
    Este 94 % es tu porcentaje
    de compatibilidad con B.
  • 6:03 - 6:05
    Es una expresión matemática
  • 6:05 - 6:06
    de qué tan feliz serían entre sí
  • 6:06 - 6:08
    con base a lo que sabemos.
  • 6:08 - 6:10
    Ahora bien, ¿por qué el algoritmo
    se multiplica opuesto a, digamos,
  • 6:10 - 6:12
    el promedio de los dos resultados
    de compatibilidad juntos
  • 6:12 - 6:15
    y por qué la raíz cuadrada?
  • 6:15 - 6:16
    En general, esta fórmula
    se llama media geométrica,
  • 6:16 - 6:18
    que es un gran camino
    para combinar valores
  • 6:18 - 6:19
    que tienen rangos amplios
  • 6:19 - 6:21
    y representan propiedades muy diferentes.
  • 6:21 - 6:23
    Es decir, es perfecto para
    relaciones románticas.
  • 6:23 - 6:24
    Tenemos rangos amplios
  • 6:24 - 6:26
    y tenemos toneladas
    de datos diferentes,
  • 6:26 - 6:27
    como dije, de películas,
  • 6:27 - 6:28
    de política,
  • 6:28 - 6:29
    de religión,
  • 6:29 - 6:30
    de todo.
  • 6:30 - 6:32
    Intuitivamente, a su vez, tiene sentido.
  • 6:32 - 6:35
    Dos personas que se satisfecen
    en 50 % a la otra
  • 6:35 - 6:36
    debieran ser una mejor pareja
  • 6:36 - 6:39
    que otros dos que
    se satisfacen entre 0 y 100,
  • 6:39 - 6:41
    porque el afecto necesita ser mutuo.
  • 6:41 - 6:43
    Pero sumando una pequeña
    corrección de margen de error,
  • 6:43 - 6:46
    en el caso que haya una pequeña
    cantidad de preguntas,
  • 6:46 - 6:47
    como hicimos en este ejemplo,
  • 6:47 - 6:49
    estamos listos para salir.
  • 6:49 - 6:50
    Cada vez que OK Cupid
    junta a dos personas,
  • 6:50 - 6:52
    prosigue con los pasos
    que acabamos de esbozar.
  • 6:52 - 6:54
    Primero se recolectan
    los datos de sus respuestas,
  • 6:54 - 6:57
    luego se comparan
    sus elecciones y preferencias
  • 6:57 - 7:00
    con las de otros
    en modo simple y matemático.
  • 7:00 - 7:02
    Esto, la habilidad de tomar
    fenómenos del mundo real
  • 7:02 - 7:05
    y hacer que un microchip
    los pueda entender,
  • 7:05 - 7:06
    es, creo,
  • 7:06 - 7:09
    la destreza más importante que
    uno puede tener en la actualidad.
  • 7:09 - 7:11
    Así como usas oraciones para
    contar una historia a una persona,
  • 7:11 - 7:14
    usas algoritmos para contar
    una historia a una computadora.
  • 7:14 - 7:15
    Si aprendes el lenguaje,
  • 7:15 - 7:16
    puedes salir y contar tus historias.
  • 7:16 - 7:19
    Espero que esto te sirva para hacerlo.
Title:
OKCupid por dentro: Las matemáticas de las citas en línea - Christian Rudder
Speaker:
Christian Rudder
Description:

Vea la lección completa en: http://ed.ted.com/lessons/inside-okcupid-the-math-of-online-dating-christian-rudder

Cuando dos personas ingresan a un sitio web de citas, se les agrupa según sus intereses compartidos y en función de cómo responden una serie de preguntas personales. ¿Pero cómo calculan los sitios la probabilidad de una relación exitosa? Christian Rudder, uno de los fundadores del popular sitio de citas OKCupid, detalla el algoritmo que hay detrás de "hacer migas con alguien".

Lección de Christian Rudder, animación de TED-Ed.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
07:31

Spanish subtitles

Revisions Compare revisions