1 00:00:00,106 --> 00:00:03,887 ♪ [música] ♪ 2 00:00:07,683 --> 00:00:10,462 [Mary Clare] Vamos a aprender más sobre la teoría de juegos 3 00:00:10,462 --> 00:00:12,592 usándola para resolver un problema simple. 4 00:00:12,899 --> 00:00:16,169 Bob y Al son dos magos muy prestigiados 5 00:00:16,169 --> 00:00:19,015 que crearon un truco nuevo bastante popular. 6 00:00:19,015 --> 00:00:21,366 Se pusieron de acuerdo en limitar las funciones 7 00:00:21,366 --> 00:00:23,144 para poder cobrar más. 8 00:00:23,519 --> 00:00:26,395 Si ambos magos tienen una sola función a la semana 9 00:00:26,395 --> 00:00:29,219 cada uno ganará $10,000. 10 00:00:29,219 --> 00:00:33,656 Pero si uno de ellos rompe el trato y tiene funciones cinco veces a la semana 11 00:00:33,656 --> 00:00:36,643 mientras que el otro mago solo da una función a la semana 12 00:00:36,643 --> 00:00:40,289 el traidor tendrá un ingreso de $15,000 13 00:00:40,289 --> 00:00:43,397 mientras que el otro mago solo ganará $1,000. 14 00:00:43,397 --> 00:00:45,789 Y si los dos magos rompen el acuerdo 15 00:00:45,789 --> 00:00:49,979 y hacen cinco funciones a la semana, cada uno obtendrá $6,000. 16 00:00:50,312 --> 00:00:53,969 ¿Cuál es el equilibrio de Nash en las funciones que debe dar cada uno? 17 00:00:54,608 --> 00:00:57,966 El equilibrio de Nash significa que ninguna persona tiene un incentivo 18 00:00:57,966 --> 00:00:59,899 para cambiar su conducta o estrategia 19 00:00:59,899 --> 00:01:03,631 a menos que alguien más cambie de conducta o de estrategia. 20 00:01:04,405 --> 00:01:07,873 Para encontrar el equilibrio de Nash en las funciones de Bob y Al 21 00:01:07,873 --> 00:01:10,267 primero tenemos que analizar la conducta de Bob 22 00:01:10,267 --> 00:01:13,275 basados en la conducta de Al y viceversa. 23 00:01:13,275 --> 00:01:17,321 Sería más fácil seguir todo si hacemos una matriz 2x2. 24 00:01:17,765 --> 00:01:20,478 Hay dos individuos con dos opciones. 25 00:01:20,478 --> 00:01:24,467 En cada caja de la matriz, colocaremos el camino de cada persona 26 00:01:24,467 --> 00:01:26,249 dado el estado mundial. 27 00:01:26,256 --> 00:01:29,911 Primero, vamos a empezar con el camino de Bob y luego con el de Al. 28 00:01:29,916 --> 00:01:34,109 Ahora veamos la estrategia de Bob que está basada en la conducta de Al. 29 00:01:34,114 --> 00:01:37,965 ¿Al cumplirá su promesa de dar una función semana 30 00:01:37,965 --> 00:01:41,116 o la romperá y dará cinco funciones? 31 00:01:41,695 --> 00:01:45,680 Si coopera y solo da una función, ¿cuál será la estrategia de Bob? 32 00:01:46,288 --> 00:01:48,866 Nuevamente, si solo vemos lo que Al puede ganar 33 00:01:48,866 --> 00:01:51,266 entonces, su mejor opción sería hacer trampa 34 00:01:51,266 --> 00:01:54,115 dar cinco funciones semanales y ganar $15,000 35 00:01:54,115 --> 00:01:58,217 en vez de tener una sola función semanal y ganar $10,000. 36 00:01:58,217 --> 00:02:03,645 ¿Qué tal si Al traiciona a Bob y da cinco funciones? 37 00:02:04,037 --> 00:02:07,456 La segunda mejor estrategia de Bob sería dar cinco funciones semanales 38 00:02:07,456 --> 00:02:10,623 y ganar $6,000 en vez de tener una función a la semana 39 00:02:10,623 --> 00:02:12,869 y ganar solamente $1,000. 40 00:02:13,463 --> 00:02:17,687 Dado que la estrategia de Bob es hacer trampa y dar las cinco funciones 41 00:02:17,687 --> 00:02:22,892 sin importar lo que Al haga, hacer trampa es su estrategia dominante. 42 00:02:23,413 --> 00:02:26,034 Ahora veamos todo desde la perspectiva de Al. 43 00:02:26,034 --> 00:02:28,561 Apuesto a que ya puede ver hacia dónde va todo esto. 44 00:02:28,561 --> 00:02:31,948 Si Bob mantiene la promesa y da una función semanal 45 00:02:31,948 --> 00:02:35,883 entonces, la mejor opción para Al es dar cinco funciones. 46 00:02:35,883 --> 00:02:39,248 Ganará $15,000 en vez de $10,000. 47 00:02:39,248 --> 00:02:43,138 Y si Bob decide romper su promesa y dar las cinco funciones 48 00:02:43,138 --> 00:02:46,936 la mejor opción de Al será también hacer trampa y dar las cinco funciones 49 00:02:46,936 --> 00:02:50,628 porque así ganará $6,000 en vez de $1,000. 50 00:02:50,628 --> 00:02:54,346 Dado que la mejor estrategia de Al es dar cinco funciones semanales 51 00:02:54,346 --> 00:02:57,488 nuevamente, sin importar lo que haga Bob 52 00:02:57,488 --> 00:03:00,485 a esto se le considera como la estrategia dominante de Al. 53 00:03:00,485 --> 00:03:03,607 Si la estrategia dominante de Al es hacer trampa también 54 00:03:03,607 --> 00:03:08,503 el equilibrio de Nash en este juego es que ambos rompan sus promesas. 55 00:03:08,503 --> 00:03:12,438 Así cada uno dará cinco funciones y ganará $6,000. 56 00:03:12,438 --> 00:03:15,487 Hay que enfatizar que este no es el resultado óptimo. 57 00:03:15,487 --> 00:03:19,502 Sería mucho más fácil para ellos que cada uno diera una función semanal. 58 00:03:19,502 --> 00:03:23,619 Ganarían mucho más dinero y también tendrían más tiempo libre. 59 00:03:23,619 --> 00:03:26,489 Pero si solo evaluamos qué hacer 60 00:03:26,489 --> 00:03:28,839 en base a las ganancias listadas en nuestra matriz 61 00:03:28,839 --> 00:03:33,390 es mejor para Bob y Al que ambos hagan trampa. 62 00:03:33,390 --> 00:03:35,210 Ese es el equilibrio de Nash. 63 00:03:35,210 --> 00:03:38,516 Claro, existe un mundo real fuera de la matriz. 64 00:03:38,516 --> 00:03:40,913 El mundo es mucho más complicado que esto. 65 00:03:40,913 --> 00:03:44,508 A la gente le importa cumplir sus promesas y considera a largo plazo 66 00:03:44,508 --> 00:03:46,330 y no solo períodos semanales. 67 00:03:46,330 --> 00:03:49,120 Por lo tanto, este ejemplo aunque es simple 68 00:03:49,120 --> 00:03:50,710 es un punto inicial muy poderoso 69 00:03:50,710 --> 00:03:53,398 para entender el proceso humano de la toma de decisiones. 70 00:03:53,398 --> 00:03:55,623 Como siempre, dígannos qué opinan. 71 00:03:55,623 --> 00:03:58,988 Y si les interesa practicar más, haga clic en las preguntas de práctica 72 00:03:58,988 --> 00:04:00,430 que están al final del video. 73 00:04:00,430 --> 00:04:03,407 ♪ [música] ♪