Juegos dinámicos

Los juegos dinámicos son aquellos en los que los jugadores no realizan la elección de sus estrategias de forma simultánea, sino que toman sus decisiones de manera secuencial; primero actúa uno y después otro. En este caso las estrategias se van a complicar un poco respecto a las utilizadas hasta ahora. En efecto, dado que se tratan de un plan de acción completo, cada estrategia tendrá que tener prevista para el jugador que actúe en segundo lugar una acción como respuesta para cada posible acción por la que opte el jugador que actúa en primer lugar. Por su parte, quien actúa en primer lugar ha de considerar las posibles respuestas que vaya a recibir por parte del otro o de los otros jugadores que puedan intervenir, pues de ello va a depender el pago que finalmente él vaya a recibir. En el contexto de los juegos dinámicos será muy importante conocer si estamos en un entorno de información perfecta o imperfecta, y especialmente en este caso habrá que tener en cuenta el razonamiento de los demás jugadores para definir cuál va a ser nuestro propio comportamiento

Los tres sombreros rojos 

Imaginemos tres chicas sentadas en círculo, cada una de las cuales porta un sombrero rojo o un sombrero blanco. Supongamos que todos los sombreros son rojos. Cuando el profesor pregunta si alguna estudiante puede identificar el color de su propio sombrero, la respuesta es siempre negativa puesto que ninguna puede ver su propio sombrero. Pero si el profesor señala que hay al menos un sombrero rojo en la sala, algo que es conocido por todas las niñas –que pueden ver dos sombreros rojos en la habitación-, entonces las respuestas cambian. La primera estudiante a quien le preguntan no puede decir cuál es el color de su sombrero; la segunda tampoco. Pero la tercera debería ser capaz de responder sin dudar que ella lleva un sombrero rojo. ¿Cómo? Siguiendo una cadena lógica de pensamiento. Así, si los sombreros que llevan las niñas dos y tres fueran blancos, entonces el comentario del profesor habría permitido a la primera niña responder con certeza que su sombrero era rojo. Como ella no lo hizo, tenemos que concluir que al menos una de las niñas dos y tres lleva un sombrero rojo. La tercera niña observa que la segunda niña también admite que no puede decir cuál es el color de su sombrero, por lo que razona de la siguiente manera: “si mi sombrero hubiera sido blanco, entonces la segunda niña habría podido responder que ella llevaba un sombrero rojo, dado que ambas sabemos que al menos una de las dos porta un sombrero rojo. Pero como la segunda niña fue incapaz de responder, necesariamente yo he de llevar un sombrero rojo”. La historia puede parecer sorprendente debido a que de un comentario aparentemente trivial del profesor las estudiantes parecen aprender de nada, salvo de su propia ignorancia. Efectivamente, este es el caso.
En el análisis de los juegos dinámicos puede ocurrir que surjan Equilibrios de Nash que incluyan acciones que no sean óptimas para el jugador que debería realizarlas si le correspondiese jugar en ese momento. Esto se evita exigiendo que los Equilibrios de Nash sean Perfectos en Subjuegos (E.N.P.S.). 

Para ello se ha de proceder resolviendo los juegos por “inducción hacia atrás”. Esto consiste en analizar cuál es la acción óptima para el individuo que actuará en último lugar. Quien deba realizar una elección en penúltimo lugar, deberá contar con que el último va a actuar de esa manera en el momento en el que a él le vaya a tocar actuar; quien actúe en antepenúltimo lugar sabrá que quien actúe en penúltimo lugar tendrá en cuenta lo que va a hacer quien actúe en último lugar, por lo que su decisión vendrá condicionada por el previsible transcurso posterior del juego, y así sucesivamente.
Lo veremos fácilmente con un ejemplo en la figura 39. En él, suponemos que primero ha de elegir el jugador nº 1 entre A y B. A continuación, el jugador nº 2, conociendo la decisión adoptada por el jugador nº 1, ha de elegir entre X e Y. Los pagos que obtendrían uno y otro jugador como consecuencia de sus respectivas elecciones están en los extremos del gráfico.
Las estrategias entre las que tiene que elegir el jugador nº 2 en este ejemplo no son dos como ocurriría en un juego estático (X e Y), sino cuatro. En efecto, dado que una estrategia es un plan de acción completo, que indica lo que el jugador haría en cada punto en el que pueda tener que elegir, las estrategias del jugador nº 2 serían las siguientes: (X, X), (X, Y), (Y, X), (Y, Y). La acción que figura antes de la coma en cada una de ellas es la respuesta prevista ante la posibilidad de que el jugador nº 1 opte por su estrategia A; la que figura tras la coma es la respuesta prevista por el jugador nº 2 al hecho de que el jugador nº 1 elija su estrategia B. 
Para resolver el juego procederemos inicialmente hallando el equilibrio de cada subjuego, para encontrar el equilibrio del juego en su conjunto a continuación. En el subjuego de la parte superior el que empieza una vez que el jugador nº 1 ha optado por la acción A, el jugador nº 2 ha de elegir entre X e Y. Como sus pagos son los que figuran detrás de la coma, está claro que optará por Y para maximizar su utilidad (12 > 7). 
En el segundo subjuego el que comenzaría una vez que el jugador nº 1 hubiera optado por la acción B, el jugador nº 2 optaría por X, pues su pago será mayor que si opta por Y (10 > 3). 

Hemos señalado en la figura 40 con sendas flechas las dos opciones que nos indican cuál es la estrategia óptima del jugador nº 2: Y si el jugador nº 1 elige A, y X si el jugador nº 1 opta por B; la estrategia óptima del jugador nº 2 será, por tanto, (Y, X). 
Cuando el juego empieza, el jugador nº 1 sabe que si el jugador nº 2 es racional optará por seguir esa estrategia. En ese caso, por tanto, si él también es racional optará por B, pues de esa manera, ya que sabe que el jugador nº 2 va a elegir X, tendrá un pago de 9, que es mayor que el que obtendría si eligiese A, dado que sabe que en ese caso el jugador nº 2 optará por Y, y su pago sería tan solo de 6. El Equilibrio de Nash Perfecto en Subjuegos, por tanto, sería (B; Y, X), que nos indica que el jugador nº 1 hará B; y que el jugador nº 2 haría X si el jugador nº 1 optara por A, y elegiría Y si el jugador nº 1 hiciese B. El ENPS nos informa, por tanto, no solamente de cuál será la evolución del juego, sino también del equilibrio de cada uno de los subjuegos aun cuando la evolución del juego no nos encamine hacia alguno o algunos de ellos. Podemos apreciar todo esto en la representación extensiva de la figura 41. Los pagos que recibirán uno y otro individuo en el Equilibrio serán 9 y 10, respectivamente. 
Es importante no confundir el resultado (9, 10) que ambos jugadores van a obtener, que surge de la previsible evolución del juego (B, X), con el ENPS: (B; Y, X).

                     
La representación matricial de un juego dinámico difiere de la de los juegos estáticos, pues en este caso no coinciden acciones y estrategias (una estrategia puede estar compuesta por varias acciones). En los juegos dinámicos se representan en filas y columnas las distintas estrategias con las que cuentan los jugadores. Siguiendo con el ejemplo propuesto, vamos a representarlo en forma matricial en la figura 42.

Podemos encontrar los Equilibrios de Nash de este juego, subrayando en la figura 43 el pago de cada jugador en la estrategia que le es óptima, dada la estrategia del otro:

Como se puede apreciar, surgen dos Equilibrios de Nash: (B; X, X), y (B; Y, X).
Anteriormente, cuando resolvimos el juego por inducción hacia atrás en la figura 41, vimos que el Equilibrio de Nash Perfecto en Subjuegos era (B; Y, X), frente al otro Equilibrio de Nash, que acabamos de calcular, que no lo es. 
Esto es así porque la perfección en subjuegos elimina los Equilibrios de Nash que están basados en amenazas o promesas que no son creíbles (Gibbons, 1992). 
En este ejemplo concreto, en el Equilibrio de Nash que no es Perfecto en Subjuegos, (B; X, X), se podría interpretar que el jugador nº 2 está realizando una promesa no creíble al jugador nº 1 como la siguiente: si sigues la estrategia A, yo optaré por la estrategia X. Esto, sin embargo, no es creíble, pues llegado el caso de que el jugador nº 1 hubiese elegid
o la estrategia A, el jugador nº 2, actuando racionalmente, debería optar por Y, dado que 12 > 7. En definitiva, ese Equilibrio de Nash no nos dice la verdad sobre lo que ocurrirá en uno de los subjuegos (el de la parte superior, que comienza cuando tiene que decidir el jugador nº 2). La perfección en subjuegos elimina este tipo de Equilibrios de Nash. 

En ocasiones cabe la posibilidad de que exista una respuesta posterior de la empresa que actuó en primer lugar, ante la acción tomada por la empresa que decidió su acción en segundo lugar. Las respuestas se podrían suceder, en realidad, en tantas ocasiones como consideremos oportuno. Sin embargo, la forma de encontrar la solución del juego, así como el ENPS del mismo siempre será similar: utilizando la inducción hacia atrás. 
Supongamos el siguiente ejemplo: una empresa (E1) puede ampliar (A) o no ampliar (NA) su negocio. A continuación, si decide ampliar su negocio, una empresa de la competencia (E2) puede reaccionar realizando una campaña de publicidad (P) o no (NP). Si lleva a cabo la campaña de publicidad, la primera empresa (E1) puede a su vez reaccionar aplicando una política agresiva de precios, con unas rebajas (R) que hicieran perder cuota de mercado a su competidor, o no reaccionando (NR). Los resultados que una y otra empresa obtendrían ante cada una de esas posibilidades están expuestos en la representación en forma de árbol de la figura 44, donde los pagos representados antes de la coma son los beneficios en millones de euros de la empresa E1, y los de detrás de la coma son los de la empresa E2. 

Resolvemos el juego de la figura 43 por inducción hacia atrás, indicando cuál sería la acción que tomaría la empresa nº 1 (E1) en el subjuego que comienza cuando la empresa nº 2 (E2) opta por hacer la campaña publicitaria (P). En ese punto, la empresa nº 1 ha de optar por hacer rebajas (R) o no (NR). En el primer caso, su beneficio sería 4 y en el segundo sólo 3, luego haría rebajas, lo que señalamos a continuación con una flecha en la figura 45. 

Después, damos un paso hacia atrás y analizamos la decisión anterior, que habría de tomar la empresa nº 2 (E2) si la empresa nº 1 (E1) decide ampliar su negocio. En ese punto, ha de decidir si realiza la publicidad (P) o no (NP). En el primer caso, dado que como se ve en el gráfico anterior la empresa nº 1 va a reaccionar con las rebajas, el beneficio de la empresa nº 2 sólo sería de 1. Si, por el contrario, la empresa nº 2 opta por no hacer la publicidad, su beneficio sería de 2. Por tanto, esta será su decisión, que señalamos en la figura 46.  

Siguiendo con la inducción hacia atrás, hemos llegado al primer nudo de decisión; la que compete a la empresa nº 1 respecto de ampliar o no su negocio. Si decide ampliar, dado que la empresa nº 2 no va a realizar la campaña publicitaria, su beneficio sería de 6. Si, por el contrario, no amplía el negocio, el beneficio que obtendría sería solamente de 5. Por consiguiente, deberá ampliar, como se aprecia en la figura 47.

El desarrollo del juego, por tanto, será el siguiente: la empresa nº 1 ampliará sus instalaciones (A) y la empresa nº 2 no reaccionará llevando a cabo la campaña publicitaria (NP). El resultado que una y otra empresa obtendrá será de 6 y 2 millones, respectivamente. 
El ENPS será: (A, R; NP). En efecto, la empresa nº 1 puede tener que elegir en dos puntos; en el nudo inicial y en el final. Por tanto, su estrategia deberá contener una acción para cada uno de ellos. La empresa nº 2 sólo tiene que elegir en una ocasión: P ó NP. 
Sabemos, por el desarrollo previsible del juego, que la empresa nº 1 no va a tener que optar entre hacer rebajas o no, dado que la empresa nº 2, una vez que la empresa nº 1 amplíe su negocio, no realizará la publicidad, y ahí acabará el juego. Sin embargo, saber qué ocurriría en el hipotético caso de que la empresa nº 1 se encontrara en el nudo final aunque sabemos que no se va a llegar allí no es una cuestión baladí. En efecto, la decisión que tomará la empresa nº 2 (NP) está determinada por el hecho de que la empresa nº 1 estaría dispuesta a llevar a cabo las rebajas en ese nudo final. En caso contrario, la empresa nº 2 sí que realizaría la publicidad. 
Por consiguiente, no es en absoluto superfluo definir las estrategias de un jugador conteniendo acciones que por el desarrollo del juego nunca se van a llevar a cabo. 
Además, la alteración del valor de un pago de un jugador, situado fuera del desarrollo previsible del juego, puede alterar dicho desarrollo por completo. Obsérvese que, por ejemplo, si el pago de la empresa nº 2 en el nudo final del juego fuera de 3 millones, la empresa nº 1 decidiría no ampliar. Véase al respecto la figura 48. 

Olvidándonos de esta alteración y volviendo al juego original, para calcular la totalidad de los Equilibrios de Nash del juego, optaremos por comodidad por representar el juego en forma matricial en la figura 49.

Como se puede apreciar, las cuatro últimas celdas contienen los mismos pagos para ambas empresas: 5 y 3. Obsérvese que en todas ellas la acción de la primera empresa para el primer nudo es la de no ampliar. Así, independientemente de lo que tuviese previsto hacer la empresa nº 2 (P ó NP), y de lo que la propia empresa nº 1 pensase hacer en el último nudo (R ó NR), si no amplía sus instalaciones el juego finaliza en ese momento y los pagos son, respectivamente, 5 y 3.
Otros pagos que se repiten en dos celdas son 6 y 2. En efecto, son los correspondientes a que la primera empresa amplíe sus instalaciones y la empresa nº 2 no haga publicidad. Independientemente de que la empresa nº 1 pensase hacer rebajas (R) o no (NR), el juego finaliza en ese momento en el que la empresa nº 2 decide no hacer publicidad, con los pagos respectivos de 6 y 2. 
Para calcular los Equilibrios de Nash, subrayamos en la figura 50 los pagos correspondientes a la mejor estrategia para cada jugador en función de la estrategia seguida por el otro, como siempre hemos hecho. 

En esta ocasión, como se puede apreciar en la figura 50, hay un Equilibrio de Nash, que es el Equilibrio de Nash Perfecto en Subjuegos que habíamos calculado anteriormente ayudándonos de la representación en forma extensiva o de árbol del juego: (A, R; NP).
Pero junto a él figuran otros dos Equilibrios de Nash que no son Perfectos en Subjuegos: (NA, R; P) y (NA, NR; P).
En ambos observamos una especie de amenaza de la empresa nº 2, que es la de llevar a cabo la publicidad si la empresa nº 1 amplía obsérvese que lo que desearía la empresa nº 2 es que la empresa nº 1 no amplíe, pues su pago crecería hasta los 3 millones. La empresa nº 1 reaccionaría ante esa amenaza no ampliando sus instalaciones (de esa forma se aseguraría un pago de 5 frente a un pago de 4 ó de 3, en función de que posteriormente hiciera rebajas o no). Pero esa amenaza de la empresa nº 2 no es creíble. La empresa nº 2, si la empresa nº 1 amplía sus instalaciones, actuando racionalmente, no va a realizar la publicidad. De esta forma obtendrá un pago de 2, mientras que con la publicidad, dado que la empresa nº 1 haría rebajas, sólo obtendría un pago de 1. La perfección en subjuegos elimina estos Equilibrios de Nash que están basados en amenazas o promesas que no son creíbles. 

Bibliografía




Comentarios

Publicar un comentario