WEBVTT

00:00:00.106 --> 00:00:03.887
♪ [música] ♪

00:00:07.683 --> 00:00:10.462
[Mary Clare] Vamos a aprender
más sobre la teoría de juegos

00:00:10.462 --> 00:00:12.592
usándola para resolver
un problema simple.

00:00:12.899 --> 00:00:16.169
Bob y Al son dos magos muy prestigiados

00:00:16.169 --> 00:00:19.015
que crearon un truco nuevo
bastante popular.

00:00:19.015 --> 00:00:21.366
Se pusieron de acuerdo
en limitar las funciones

00:00:21.366 --> 00:00:23.144
para poder cobrar más.

00:00:23.519 --> 00:00:26.395
Si ambos magos tienen 
una sola función a la semana

00:00:26.395 --> 00:00:29.219
cada uno ganará $10,000.

00:00:29.219 --> 00:00:33.656
Pero si uno de ellos rompe el trato
y tiene funciones cinco veces a la semana

00:00:33.656 --> 00:00:36.643
mientras que el otro mago
solo da una función a la semana

00:00:36.643 --> 00:00:40.289
el traidor tendrá un ingreso de $15,000

00:00:40.289 --> 00:00:43.397
mientras que el otro mago
solo ganará $1,000.

00:00:43.397 --> 00:00:45.789
Y si los dos magos rompen el acuerdo

00:00:45.789 --> 00:00:49.979
y hacen cinco funciones a la semana,
cada uno obtendrá $6,000.

00:00:50.312 --> 00:00:53.969
¿Cuál es el equilibrio de Nash
en las funciones que debe dar cada uno?

00:00:54.608 --> 00:00:57.966
El equilibrio de Nash significa
que ninguna persona tiene un incentivo

00:00:57.966 --> 00:00:59.899
para cambiar su conducta o estrategia

00:00:59.899 --> 00:01:03.631
a menos que alguien más cambie
de conducta o de estrategia.

00:01:04.405 --> 00:01:07.873
Para encontrar el equilibrio de Nash
en las funciones de Bob y Al

00:01:07.873 --> 00:01:10.267
primero tenemos que analizar
la conducta de Bob

00:01:10.267 --> 00:01:13.275
basados en la conducta de Al y viceversa.

00:01:13.275 --> 00:01:17.321
Sería más fácil seguir todo
si hacemos una matriz 2x2.

00:01:17.765 --> 00:01:20.478
Hay dos individuos con dos opciones.

00:01:20.478 --> 00:01:24.467
En cada caja de la matriz,
colocaremos el camino de cada persona

00:01:24.467 --> 00:01:26.249
dado el estado mundial.

00:01:26.256 --> 00:01:29.911
Primero, vamos a empezar 
con el camino de Bob y luego con el de Al.

00:01:29.916 --> 00:01:34.109
Ahora veamos la estrategia de Bob
que está basada en la conducta de Al.

00:01:34.114 --> 00:01:37.965
¿Al cumplirá su promesa 
de dar una función semana

00:01:37.965 --> 00:01:41.116
o la romperá y dará cinco funciones?

00:01:41.695 --> 00:01:45.680
Si coopera y solo da una función,
¿cuál será la estrategia de Bob?

00:01:46.288 --> 00:01:48.866
Nuevamente, si solo vemos
lo que Al puede ganar

00:01:48.866 --> 00:01:51.266
entonces, su mejor opción
sería hacer trampa

00:01:51.266 --> 00:01:54.115
dar cinco funciones semanales
y ganar $15,000

00:01:54.115 --> 00:01:58.217
en vez de tener una sola función semanal
y ganar $10,000.

00:01:58.217 --> 00:02:03.645
¿Qué tal si Al traiciona a Bob
y da cinco funciones?

00:02:04.037 --> 00:02:07.456
La segunda mejor estrategia de Bob
sería dar cinco funciones semanales

00:02:07.456 --> 00:02:10.623
y ganar $6,000 
en vez de tener una función a la semana

00:02:10.623 --> 00:02:12.869
y ganar solamente $1,000.

00:02:13.463 --> 00:02:17.687
Dado que la estrategia de Bob
es hacer trampa y dar las cinco funciones

00:02:17.687 --> 00:02:22.892
sin importar lo que Al haga,
hacer trampa es su estrategia dominante.

00:02:23.413 --> 00:02:26.034
Ahora veamos todo
desde la perspectiva de Al.

00:02:26.034 --> 00:02:28.561
Apuesto a que ya puede ver
hacia dónde va todo esto.

00:02:28.561 --> 00:02:31.948
Si Bob mantiene la promesa
y da una función semanal

00:02:31.948 --> 00:02:35.883
entonces, la mejor opción para Al
es dar cinco funciones.

00:02:35.883 --> 00:02:39.248
Ganará $15,000 en vez de $10,000.

00:02:39.248 --> 00:02:43.138
Y si Bob decide romper su promesa
y dar las cinco funciones

00:02:43.138 --> 00:02:46.936
la mejor opción de Al será también
hacer trampa y dar las cinco funciones

00:02:46.936 --> 00:02:50.628
porque así ganará $6,000
en vez de $1,000.

00:02:50.628 --> 00:02:54.346
Dado que la mejor estrategia de Al
es dar cinco funciones semanales

00:02:54.346 --> 00:02:57.488
nuevamente, sin importar lo que haga Bob

00:02:57.488 --> 00:03:00.485
a esto se le considera
como la estrategia dominante de Al.

00:03:00.485 --> 00:03:03.607
Si la estrategia dominante de Al
es hacer trampa también

00:03:03.607 --> 00:03:08.503
el equilibrio de Nash en este juego
es que ambos rompan sus promesas.

00:03:08.503 --> 00:03:12.438
Así cada uno dará cinco funciones
y ganará $6,000.

00:03:12.438 --> 00:03:15.487
Hay que enfatizar que este 
no es el resultado óptimo.

00:03:15.487 --> 00:03:19.502
Sería mucho más fácil para ellos
que cada uno diera una función semanal.

00:03:19.502 --> 00:03:23.619
Ganarían mucho más dinero
y también tendrían más tiempo libre.

00:03:23.619 --> 00:03:26.489
Pero si solo evaluamos qué hacer


00:03:26.489 --> 00:03:28.839
en base a las ganancias
listadas en nuestra matriz

00:03:28.839 --> 00:03:33.390
es mejor para Bob y Al
que ambos hagan trampa.

00:03:33.390 --> 00:03:35.210
Ese es el equilibrio de Nash.

00:03:35.210 --> 00:03:38.516
Claro, existe un mundo real
fuera de la matriz.

00:03:38.516 --> 00:03:40.913
El mundo es mucho más complicado que esto.

00:03:40.913 --> 00:03:44.508
A la gente le importa cumplir sus promesas
y considera a largo plazo

00:03:44.508 --> 00:03:46.330
y no solo períodos semanales.

00:03:46.330 --> 00:03:49.120
Por lo tanto,
este ejemplo aunque es simple

00:03:49.120 --> 00:03:50.710
es un punto inicial muy poderoso

00:03:50.710 --> 00:03:53.398
para entender el proceso humano
de la toma de decisiones.

00:03:53.398 --> 00:03:55.623
Como siempre, dígannos qué opinan.

00:03:55.623 --> 00:03:58.988
Y si les interesa practicar más,
haga clic en las preguntas de práctica

00:03:58.988 --> 00:04:00.430
que están al final del video.

00:04:00.430 --> 00:04:03.407
♪ [música] ♪