WEBVTT 00:00:00.106 --> 00:00:03.887 ♪ [música] ♪ 00:00:07.683 --> 00:00:10.462 [Mary Clare] Vamos a aprender más sobre la teoría de juegos 00:00:10.462 --> 00:00:12.592 usándola para resolver un problema simple. 00:00:12.899 --> 00:00:16.169 Bob y Al son dos magos muy prestigiados 00:00:16.169 --> 00:00:19.015 que crearon un truco nuevo bastante popular. 00:00:19.015 --> 00:00:21.366 Se pusieron de acuerdo en limitar las funciones 00:00:21.366 --> 00:00:23.144 para poder cobrar más. 00:00:23.519 --> 00:00:26.395 Si ambos magos tienen una sola función a la semana 00:00:26.395 --> 00:00:29.219 cada uno ganará $10,000. 00:00:29.219 --> 00:00:33.656 Pero si uno de ellos rompe el trato y tiene funciones cinco veces a la semana 00:00:33.656 --> 00:00:36.643 mientras que el otro mago solo da una función a la semana 00:00:36.643 --> 00:00:40.289 el traidor tendrá un ingreso de $15,000 00:00:40.289 --> 00:00:43.397 mientras que el otro mago solo ganará $1,000. 00:00:43.397 --> 00:00:45.789 Y si los dos magos rompen el acuerdo 00:00:45.789 --> 00:00:49.979 y hacen cinco funciones a la semana, cada uno obtendrá $6,000. 00:00:50.312 --> 00:00:53.969 ¿Cuál es el equilibrio de Nash en las funciones que debe dar cada uno? 00:00:54.608 --> 00:00:57.966 El equilibrio de Nash significa que ninguna persona tiene un incentivo 00:00:57.966 --> 00:00:59.899 para cambiar su conducta o estrategia 00:00:59.899 --> 00:01:03.631 a menos que alguien más cambie de conducta o de estrategia. 00:01:04.405 --> 00:01:07.873 Para encontrar el equilibrio de Nash en las funciones de Bob y Al 00:01:07.873 --> 00:01:10.267 primero tenemos que analizar la conducta de Bob 00:01:10.267 --> 00:01:13.275 basados en la conducta de Al y viceversa. 00:01:13.275 --> 00:01:17.321 Sería más fácil seguir todo si hacemos una matriz 2x2. 00:01:17.765 --> 00:01:20.478 Hay dos individuos con dos opciones. 00:01:20.478 --> 00:01:24.467 En cada caja de la matriz, colocaremos el camino de cada persona 00:01:24.467 --> 00:01:26.249 dado el estado mundial. 00:01:26.256 --> 00:01:29.911 Primero, vamos a empezar con el camino de Bob y luego con el de Al. 00:01:29.916 --> 00:01:34.109 Ahora veamos la estrategia de Bob que está basada en la conducta de Al. 00:01:34.114 --> 00:01:37.965 ¿Al cumplirá su promesa de dar una función semana 00:01:37.965 --> 00:01:41.116 o la romperá y dará cinco funciones? 00:01:41.695 --> 00:01:45.680 Si coopera y solo da una función, ¿cuál será la estrategia de Bob? 00:01:46.288 --> 00:01:48.866 Nuevamente, si solo vemos lo que Al puede ganar 00:01:48.866 --> 00:01:51.266 entonces, su mejor opción sería hacer trampa 00:01:51.266 --> 00:01:54.115 dar cinco funciones semanales y ganar $15,000 00:01:54.115 --> 00:01:58.217 en vez de tener una sola función semanal y ganar $10,000. 00:01:58.217 --> 00:02:03.645 ¿Qué tal si Al traiciona a Bob y da cinco funciones? 00:02:04.037 --> 00:02:07.456 La segunda mejor estrategia de Bob sería dar cinco funciones semanales 00:02:07.456 --> 00:02:10.623 y ganar $6,000 en vez de tener una función a la semana 00:02:10.623 --> 00:02:12.869 y ganar solamente $1,000. 00:02:13.463 --> 00:02:17.687 Dado que la estrategia de Bob es hacer trampa y dar las cinco funciones 00:02:17.687 --> 00:02:22.892 sin importar lo que Al haga, hacer trampa es su estrategia dominante. 00:02:23.413 --> 00:02:26.034 Ahora veamos todo desde la perspectiva de Al. 00:02:26.034 --> 00:02:28.561 Apuesto a que ya puede ver hacia dónde va todo esto. 00:02:28.561 --> 00:02:31.948 Si Bob mantiene la promesa y da una función semanal 00:02:31.948 --> 00:02:35.883 entonces, la mejor opción para Al es dar cinco funciones. 00:02:35.883 --> 00:02:39.248 Ganará $15,000 en vez de $10,000. 00:02:39.248 --> 00:02:43.138 Y si Bob decide romper su promesa y dar las cinco funciones 00:02:43.138 --> 00:02:46.936 la mejor opción de Al será también hacer trampa y dar las cinco funciones 00:02:46.936 --> 00:02:50.628 porque así ganará $6,000 en vez de $1,000. 00:02:50.628 --> 00:02:54.346 Dado que la mejor estrategia de Al es dar cinco funciones semanales 00:02:54.346 --> 00:02:57.488 nuevamente, sin importar lo que haga Bob 00:02:57.488 --> 00:03:00.485 a esto se le considera como la estrategia dominante de Al. 00:03:00.485 --> 00:03:03.607 Si la estrategia dominante de Al es hacer trampa también 00:03:03.607 --> 00:03:08.503 el equilibrio de Nash en este juego es que ambos rompan sus promesas. 00:03:08.503 --> 00:03:12.438 Así cada uno dará cinco funciones y ganará $6,000. 00:03:12.438 --> 00:03:15.487 Hay que enfatizar que este no es el resultado óptimo. 00:03:15.487 --> 00:03:19.502 Sería mucho más fácil para ellos que cada uno diera una función semanal. 00:03:19.502 --> 00:03:23.619 Ganarían mucho más dinero y también tendrían más tiempo libre. 00:03:23.619 --> 00:03:26.489 Pero si solo evaluamos qué hacer 00:03:26.489 --> 00:03:28.839 en base a las ganancias listadas en nuestra matriz 00:03:28.839 --> 00:03:33.390 es mejor para Bob y Al que ambos hagan trampa. 00:03:33.390 --> 00:03:35.210 Ese es el equilibrio de Nash. 00:03:35.210 --> 00:03:38.516 Claro, existe un mundo real fuera de la matriz. 00:03:38.516 --> 00:03:40.913 El mundo es mucho más complicado que esto. 00:03:40.913 --> 00:03:44.508 A la gente le importa cumplir sus promesas y considera a largo plazo 00:03:44.508 --> 00:03:46.330 y no solo períodos semanales. 00:03:46.330 --> 00:03:49.120 Por lo tanto, este ejemplo aunque es simple 00:03:49.120 --> 00:03:50.710 es un punto inicial muy poderoso 00:03:50.710 --> 00:03:53.398 para entender el proceso humano de la toma de decisiones. 00:03:53.398 --> 00:03:55.623 Como siempre, dígannos qué opinan. 00:03:55.623 --> 00:03:58.988 Y si les interesa practicar más, haga clic en las preguntas de práctica 00:03:58.988 --> 00:04:00.430 que están al final del video. 00:04:00.430 --> 00:04:03.407 ♪ [música] ♪