0:00:00.106,0:00:03.887 ♪ [música] ♪ 0:00:07.683,0:00:10.462 [Mary Clare] Vamos a aprender[br]más sobre la teoría de juegos 0:00:10.462,0:00:12.592 usándola para resolver[br]un problema simple. 0:00:12.899,0:00:16.169 Bob y Al son dos magos muy prestigiados 0:00:16.169,0:00:19.015 que crearon un truco nuevo[br]bastante popular. 0:00:19.015,0:00:21.366 Se pusieron de acuerdo[br]en limitar las funciones 0:00:21.366,0:00:23.144 para poder cobrar más. 0:00:23.519,0:00:26.395 Si ambos magos tienen [br]una sola función a la semana 0:00:26.395,0:00:29.219 cada uno ganará $10,000. 0:00:29.219,0:00:33.656 Pero si uno de ellos rompe el trato[br]y tiene funciones cinco veces a la semana 0:00:33.656,0:00:36.643 mientras que el otro mago[br]solo da una función a la semana 0:00:36.643,0:00:40.289 el traidor tendrá un ingreso de $15,000 0:00:40.289,0:00:43.397 mientras que el otro mago[br]solo ganará $1,000. 0:00:43.397,0:00:45.789 Y si los dos magos rompen el acuerdo 0:00:45.789,0:00:49.979 y hacen cinco funciones a la semana,[br]cada uno obtendrá $6,000. 0:00:50.312,0:00:53.969 ¿Cuál es el equilibrio de Nash[br]en las funciones que debe dar cada uno? 0:00:54.608,0:00:57.966 El equilibrio de Nash significa[br]que ninguna persona tiene un incentivo 0:00:57.966,0:00:59.899 para cambiar su conducta o estrategia 0:00:59.899,0:01:03.631 a menos que alguien más cambie[br]de conducta o de estrategia. 0:01:04.405,0:01:07.873 Para encontrar el equilibrio de Nash[br]en las funciones de Bob y Al 0:01:07.873,0:01:10.267 primero tenemos que analizar[br]la conducta de Bob 0:01:10.267,0:01:13.275 basados en la conducta de Al y viceversa. 0:01:13.275,0:01:17.321 Sería más fácil seguir todo[br]si hacemos una matriz 2x2. 0:01:17.765,0:01:20.478 Hay dos individuos con dos opciones. 0:01:20.478,0:01:24.467 En cada caja de la matriz,[br]colocaremos el camino de cada persona 0:01:24.467,0:01:26.249 dado el estado mundial. 0:01:26.256,0:01:29.911 Primero, vamos a empezar [br]con el camino de Bob y luego con el de Al. 0:01:29.916,0:01:34.109 Ahora veamos la estrategia de Bob[br]que está basada en la conducta de Al. 0:01:34.114,0:01:37.965 ¿Al cumplirá su promesa [br]de dar una función semana 0:01:37.965,0:01:41.116 o la romperá y dará cinco funciones? 0:01:41.695,0:01:45.680 Si coopera y solo da una función,[br]¿cuál será la estrategia de Bob? 0:01:46.288,0:01:48.866 Nuevamente, si solo vemos[br]lo que Al puede ganar 0:01:48.866,0:01:51.266 entonces, su mejor opción[br]sería hacer trampa 0:01:51.266,0:01:54.115 dar cinco funciones semanales[br]y ganar $15,000 0:01:54.115,0:01:58.217 en vez de tener una sola función semanal[br]y ganar $10,000. 0:01:58.217,0:02:03.645 ¿Qué tal si Al traiciona a Bob[br]y da cinco funciones? 0:02:04.037,0:02:07.456 La segunda mejor estrategia de Bob[br]sería dar cinco funciones semanales 0:02:07.456,0:02:10.623 y ganar $6,000 [br]en vez de tener una función a la semana 0:02:10.623,0:02:12.869 y ganar solamente $1,000. 0:02:13.463,0:02:17.687 Dado que la estrategia de Bob[br]es hacer trampa y dar las cinco funciones 0:02:17.687,0:02:22.892 sin importar lo que Al haga,[br]hacer trampa es su estrategia dominante. 0:02:23.413,0:02:26.034 Ahora veamos todo[br]desde la perspectiva de Al. 0:02:26.034,0:02:28.561 Apuesto a que ya puede ver[br]hacia dónde va todo esto. 0:02:28.561,0:02:31.948 Si Bob mantiene la promesa[br]y da una función semanal 0:02:31.948,0:02:35.883 entonces, la mejor opción para Al[br]es dar cinco funciones. 0:02:35.883,0:02:39.248 Ganará $15,000 en vez de $10,000. 0:02:39.248,0:02:43.138 Y si Bob decide romper su promesa[br]y dar las cinco funciones 0:02:43.138,0:02:46.936 la mejor opción de Al será también[br]hacer trampa y dar las cinco funciones 0:02:46.936,0:02:50.628 porque así ganará $6,000[br]en vez de $1,000. 0:02:50.628,0:02:54.346 Dado que la mejor estrategia de Al[br]es dar cinco funciones semanales 0:02:54.346,0:02:57.488 nuevamente, sin importar lo que haga Bob 0:02:57.488,0:03:00.485 a esto se le considera[br]como la estrategia dominante de Al. 0:03:00.485,0:03:03.607 Si la estrategia dominante de Al[br]es hacer trampa también 0:03:03.607,0:03:08.503 el equilibrio de Nash en este juego[br]es que ambos rompan sus promesas. 0:03:08.503,0:03:12.438 Así cada uno dará cinco funciones[br]y ganará $6,000. 0:03:12.438,0:03:15.487 Hay que enfatizar que este [br]no es el resultado óptimo. 0:03:15.487,0:03:19.502 Sería mucho más fácil para ellos[br]que cada uno diera una función semanal. 0:03:19.502,0:03:23.619 Ganarían mucho más dinero[br]y también tendrían más tiempo libre. 0:03:23.619,0:03:26.489 Pero si solo evaluamos qué hacer[br] 0:03:26.489,0:03:28.839 en base a las ganancias[br]listadas en nuestra matriz 0:03:28.839,0:03:33.390 es mejor para Bob y Al[br]que ambos hagan trampa. 0:03:33.390,0:03:35.210 Ese es el equilibrio de Nash. 0:03:35.210,0:03:38.516 Claro, existe un mundo real[br]fuera de la matriz. 0:03:38.516,0:03:40.913 El mundo es mucho más complicado que esto. 0:03:40.913,0:03:44.508 A la gente le importa cumplir sus promesas[br]y considera a largo plazo 0:03:44.508,0:03:46.330 y no solo períodos semanales. 0:03:46.330,0:03:49.120 Por lo tanto,[br]este ejemplo aunque es simple 0:03:49.120,0:03:50.710 es un punto inicial muy poderoso 0:03:50.710,0:03:53.398 para entender el proceso humano[br]de la toma de decisiones. 0:03:53.398,0:03:55.623 Como siempre, dígannos qué opinan. 0:03:55.623,0:03:58.988 Y si les interesa practicar más,[br]haga clic en las preguntas de práctica 0:03:58.988,0:04:00.430 que están al final del video. 0:04:00.430,0:04:03.407 ♪ [música] ♪