Juegos Dinámicos
INSTITUTO TECNOLÓGICO AUTÓNOMO DE MÉXICO Andrés Ponce de León Rosas1 La teoría de juegos se ha aplicado en diversas áreas del conocimiento humano, en el afán de re‡exionar más profundamente sobre el problema económico, la Economía se ha servido de ella. La aparición de los juegos estratégicos en la ciencia económica obedece a esos esfuerzos, es el intento por explicar sistemáticamente el comportamiento estratégico, y en particular, aquéllos que son dinámicos, intentan modelar la estructura secuencial de la interacción entre individuos.
1
Motiv otivac ació ión n
El inicio de la teoría de juegos es confuso. Se puede leer en el prefacio al volumen primero de Contributions to the Theory of Games que la publicación en 1944 de Theory of Games and Economic Behavior de John von Neumann y Oskar Morgenstern representa el clímax del desarrollo pionero en teoría de juegos. Aunque existe cierto consenso sobre la presencia de vestigios de los juegos de estrategia en los trabajos de Cournot, Bertrand y Edgeworth, Fudenberg y Tirole [1991] consideran, que en el libro de von Neumann y Morgenstern, se presentan por primera primera vez los juegos estratégic estratégicos os como un cuerpo cuerpo teórico teórico general. general. La gran valía de este libro no está sólo en el hecho de ser la primera sistematización de los juegos de estrategia, sino en la calidad misma del libro, la profundidad del tema que aborda y el alcance de las herramientas que desarrolla, incluso se ha dicho que la posteridad lo reclamará como uno de los logros más importantes de la ciencia en la primera mitad del siglo XX. 2 3
2
Desar sarroll rollo o
El análisis de la teoría de juegos se funda en dos supuestos básicos: primero, en la racionalidad de los agentes que participan en el juego; y segundo, asume que los individuos intentan anticipar las acciones que tomarán los otros jugadores. 2.1
Brevia Breviario rio de de conce concept ptos os bási básicos cos
Para lograr una exposición clara de los juegos dinámicos, tema central de esta nota, es necesario presentar algunas de…niciones y conceptos básicos. 1
[email protected],
[email protected],
[email protected] [email protected] 2 “posterity may regard this book as one of the major scienti…c achievements of the …rst
half of the twentieth century.” Copeland, A., Bulletin of the American Mathematical Society
51, 1945. Tomado de Kuhn y Tucker [1953]. 3 Si lo anterior parece una exageración se puede considerar la opinión de Rasmusen [1996] y decir que al menos presentó la posibilidad de analizar matemáticamente el con‡icto.
1
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Tanto von Neumann y Morgenstern [1944] como Kuhn y Tucker [1950] coinciden en que un juego es simplemente, el conjunto de reglas que lo describen, sin embargo, esa de…nición parece ser recursiva, porque aparenta contener al propio objeto de la de…nición, así que conviene explorar alguna otra. est ratégico o es la representación formal de la inDe…nición De…nición 1 Un juego estratégic
teracción estratégica entre un número dado de individuos.
Si cada agente, al tomar cualquier decisión, conoce perfectamente los eventos eventos perfecta . Si que previamente ocurrieron, se dice que el juego tiene información perfecta lo anterior no ocurre, el juego es de información imperfecta . En este documento se supone información perfecta. En casi toda la literatura sobre los juegos estratégicos, se encuentra que los componentes de un juego son: los jugadores, las acciones que éstos pueden elegir, la información que los individuos poseen, las estrategias que siguen, los pagos que obtienen y los resultados y equilibrios 4 . De…namos estos conceptos. De…nición 2 Los jugadores son agentes que toman decisiones, y como en muchos modelos, su principal objetivo es maximizar su utilidad.
LaCasse y Ross [1994] enriquecen la de…nición anterior postulando que un individuo debe ser considerado jugador si sus decisiones pueden in‡uir sobre las asignaciones …nales del juego. La gran diferencia entre el análisis de la teoría de juegos y otras teorías de la formación formación de decisiones decisiones es que los individuo individuoss actúan actúan estratégi estratégicame camente nte.. La interpretación de Fudenberg y Tirole [1991] al comportamiento estratégico es bastante clara; es aquél en el que la decisión óptima de un individuo depende tanto tanto de sus acciones acciones como de su capacidad capacidad de anticipar anticipar las de otros. Se observa inmediatamente que en el contexto de la interdependencia estratégica, el bienestar de un individuo depende de las acciones de los otros agentes. La idea del comportamiento estratégico se sirve de un concepto más primario, mario, el de estrat estrategi egia. a. Se puede puede decir decir que las estrate estrategia giass de los jugador jugadores es 5 son los principios rectores de sus decisiones , o una regla general de decisión que especi…ca cómo actuará el jugador, frente a cualquier posible circunstancia. Para de…nir el concepto de estrategia con mayor formalidad, se necesitan otras de…niciones. De…nición De…nición 3 Una acción o movimiento ai del jugador i es una elección
que éste puede hacer.
Denotemos, Ai al conjunto de todas las acciones posibles del individuo i, y a algún per…l de acciones como a fa1 ; a2 ;:::;a n g, donde 1; 2; 3;:::;n son los n jugadores. Una vez de…nidos los jugadores y las acciones conviene distinguir entre dos tipos de juegos: en los que las acciones individuales son la base del juego y en los que las acciones de grupos de individuos los son. Al primer tipo de modelos se re…eren como juegos juegos no cooper cooperativos ativos , mientras que al segundo tipo suelen 4 No
siempre es posible caracterizar a los juegos con todos sus componentes, en ese caso, Rasmusen [1996] exige al menos tres: los jugadores, las estrategias y los pagos.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
llamarlos juegos cooperativos . Debe mencionars mencionarsee que todos los juegos en esta 6 nota serán no cooperativos. De…nición 4 Una estrategia si es una regla que le dicta al jugador i qué acción tomar en cada momento del juego .
Esa regla de decisión está íntimamente relacionada con la información que el individuo posee, entonces, una estrategia es una función de la forma: si : =i ! Ai , en donde =i es el conjunto de información del individuo i. Denotemos con S i al conjunto de todas las estrategias posibles para el jugador i, si este conjunto es …nito, se dice que el juego es …nito, en otro caso, se dice que es in…nito. De…nición 5 Un per…l de estrategias estrategias es un conjunto de estrategias, una para cada uno de los n jugadores; s = fs1 ; s2 ; : : : ; s n g.
Elegir una estrategia tiene consecuencias, tanto para el agente que tomó la decisión, como para con quien éste interactúa. El análisis de la teoría de juegos considera este hecho a través de los pagos. De…nición 6 El pago para el jugador i, si elige la estrategia si , y dadas las estrategias de los otros jugadores s i , es pi (si p s i ).7 Es común suponer que los pagos se relacionan de alguna manera con la utilidad que recibe el jugador de seguir una determinada estrategia, tomando en cuenta las estrategias de los otros jugadores. Una pregunta lógica en este punto es qué motiva a los agentes a decidirse por una u otra otra estrat estrategi egia. a. En la teoría teoría de juegos juegos se ha acuñad acuñadoo el concepto concepto de estrategi estrategiaa dominan dominante. te. Las estrategias estrategias dominan dominantes tes siempre son elegidas elegidas por los agentes racionales, porque los pagos que reciben son mayores (o en el caso extremo, iguales) con respecto a otras estrategias, sin importar las acciones que decidan los otros jugadores. Es posible de…nir lo anterior con mayor claridad y formalidad.
De…nición De…nición 7 Una estrategia estrategia dominante para el individuo i es una estrategia si que satisface la siguiente propiedad:
ui (si ; s
i)
ui (si ; s i ) 8 si 2 S i 0
0
Donde ui ()representa la utilidad del individuo i. La de…nición de…nición anterior anterior se puede hacer hacer más especí…ca. especí…ca. Si la desiguald desigualdad ad se estrictamente dominante; si para cumple estrictamente, la estrategia si es estrictamente alguna estrategia si los pagos son iguales en relación a si , se dice que si es débilmente dominante. Cualquie Cualquierr estrategia estrategia que no cumpla cumpla con alguna de las propiedades anteriores se dice que es dominada. Los juegos, tal y como se de…nieron, son susceptibles de diversas representaciones, las más usadas son la representación normal o estratégica y la extensiva. 0
De…nición 8 La forma normal de un juego consiste en: 6 En
este punto quedó claramente expuesto el alcance de esta nota; los juegos no cooperativos con información perfecta. 7 Es común representar al conjunto de los individuos que no son i con el subíndice i, sin
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
i) El conjunto de jugadores, N = f1; 2;:::;n g ii) El conjunto de todas las estrategias posibles, S i , para cada jugador i 2 N , denotado como S = fS 1 ; S 2 ;:::;S n g. iii) Las funciones de pago i que por cada per…l de estrategias posible le asigna un pago a cada jugador, pi (si p s i ) 8 i 2 N .
Es común asociar a la representación normal de un juego una matriz, que involucre las estrategias, los pagos y a los jugadores. Ejemplo 1
Considere el siguiente juego en forma normal. Imagine que hay dos jugadores, 1 y 2. Cada uno de ellos tiene dos estrategias: estrategias: fs1 ; s1 g para el jugador 1 y fs2 ; s2 g para el individuo 2. Los pagos son los siguientes: 0
0
p1 (s1 p1 (s1 p1 (s1 p1 (s1
s2 ) = p s2 ) = p s2 ) = p s2 ) = p
0
0 0
0
1; p2 (s2 2; p2 (s2 4; p2 (s2 3; p2 (s2 0 0
s1 ) = p s1 ) = p s1 ) = p s1 ) = p
0
0
3 4 2 1
Entonces, se puede de…nir la matriz de pagos como sigue: s1 s1 0
s2 1; 3 4; 4
0
s2 2; 2 3; 1
Matriz 1
Un equilibrio de Nash es un per…l de estrategias (strategy pro…le) tal que la estrategia de cada jugador es una respuesta óptima para las estrategias de los otros jugadores, expresémoslo matemáticamente: De…nición 9 Un per…l de estrategias s = fs1 ; s2 ;:::;s n g es un Equilibrio de Nash, si para todo jugador en N = f1; 2; 3; : : : ; n g ocurre que:
U i (si ; s
i)
U i (si ; s i ) 8 si 2 S i 0
0
Si como se dijo anteriormente, los pagos del juego representan de alguna manera a la utilidad de los jugadores, y casi siempre es así, la de…nición anterior hubiera dicho: Equilibrio de Nash, Nash, si Un per…l de estrategias s = fs1 ; s2 ;:::;s n g es un Equilibrio para todo jugador en N = f1; 2; 3; : : : ; n g ocurre que:
pi (si p s
i)
0
0
pi (si p s i ) 8 si 2 S i
La de…nición anterior, en cualquiera de sus versiones, establece que un per…l de estrategias que sea Equilibrio de Nash, debe satisfacer la propiedad de que cada estrategia en el per…l debe ser una respuesta óptima para las otras estrategias en él. Ejemplo 2
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
s = fs1 ; s2 g s = fs1 ; s2 g s = fs1 ; s2 g s = fs1 ; s2 g 0
0
00
0
000
0
0
Para que cualquiera de ellos sea Equilibrio de Nash cada uno de los dos elementos del per…l debería dar la mayor utilidad (o pago) dado el otro componente. nente. Es decir, si por ejemplo ejemplo s es Equilibrio de Nash, tiene que ocurrir que u1 (s1 p s2 ) u1 (s1 p s2 ) y al mismo tiempo, u2 (s2 p s1 ) u1 (s2 p s1 ), o en términos de los pagos p1 (s1 p s2 ) p1 (s1 p s2 ) y p2 (s2 p s1 ) p1 (s2 p s1 ). 0
0
0
2.2 2.2
0
Jueg Ju egos os diná dinámi mico cos s
La idea de juego dinámico se sigue directamente del concepto de juego anteriormente expuesto, sólo es necesario agregar que la evolución del juego se da en el tiempo. De…nición 9 Un juego dinámico dinámico es aquél en el que las decisiones de los jugadores son tomadas en el tiempo.
Los juegos que presentan una marcada estructura dinámica suelen ser representados en su forma extensiva, esta descripción detalla la estructura secuencial de los problemas de decisión a los que se enfrentan los agentes, además hace explícito el orden en el que el juego se lleva a cabo y la información que poseen los agentes cuando toman cada una de sus decisiones. De…nición 10 La forma forma extensiva extensiva de un juego contiene la siguiente in-
formación: i) Un conjunto de jugadores, N = f1; 2;:::;n g. ii) El orden de los movimientos, esto es, quién mueve y cuándo. iii) Los pagos de los jugadores, como función de los movimientos que siguieron los individuos, pi (si p s i ) 8 i 2 N . iv) Cuáles son las acciones que toman los jugadores cuando mueven, Ai 8 i 2 N . v) Cuál es la información que poseen los individuos cuando toman sus decisiones, =i 8 i 2 N .
Así como a la forma normal de un juego era posible asociarle una matriz, la forma extensiva puede ser representada por un diagrama de árbol, que es una colección …nita de nodos ordenados. Sobre este tipo de diagramas se pueden de…nir dos funciones especiales. Imagine que X es el conjunto de todos los nodos de los que se compone el árbol, entonces la función : X ! X + ? asigna a cada nodo del juego (excepto al inicial al que le asigna el conjunto vacío ?) uno y sólo un nodo predecesor, así (x) = x se lee x está antes de x. Para el mismo conjunto X , se puede de…nir : X ! X + ?, que asigna a todos los nodos en X (excepto a los terminales que les asigna el conjunto vacío ?) nodos sucesores. Por lo anterior, (x) = x se lee x es un sucesor de x. 0
0
0
0
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
En la Figura 1 se presenta un juego en el que el conjunto de nodos es X = fx0; x1;:::;x 8g
Figura 1
La función () toma los siguientes valores: (x0) = ? (x1) = (x2) = (x3) = (x4) = (x5) = (x6) = (x7) = (x8) =
x0 x1 x2 x4
y la función () los siguientes: (x3) = (x3) = (x3) = (x3) = (x3) = (x0) = (x1; x2) (x1) = (x3; x4) (x2) = (x5; x6) (x4) = (x7; x8)
?
La relación () no es precisamente una función, pero lo que se intenta decir presentándola como tal, es que los diagramas de árbol permiten ver, para todo nodo no terminal, los nodos que lo suceden. Existe una relación entre la forma normal y la extensiva de los juegos, en particular, es posible cambiar un juego que está en su forma extensiva a su forma normal. Este hecho quedará más claro con un ejemplo. Ejemplo 4
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
1 mueve primero y elige entre dos acciones posibles a y b, después de que el jugador 1 eligió, el jugador 2 es llamado a jugar, éste puede elegir entre dos opciones posibles, si el jugador 2 observa que 1 eligió a, 2 puede escoger A o B, si el jugador 2 elige B el individuo 1 vuelve a jugar, y elige entre las acciones a’ y b’. Si el jugador 1 escogió b, el 2 puede elegir C o D. Esta situación puede ser entendida como un juego, y por lo tanto, representada con el diagrama de la Figura 2, en el que se especi…can los pagos:
Figura 2
El juego anterior puede ser representado en su forma normal, para lograrlo, es necesario considerar que las estrategias son un plan completo para cualquier acción posible del otro jugador, así que simplemente A no es una estrategia del individuo 2 porque si el individuo 1 eligiera b, A no especi…ca qué hacer. Una vez considerado eso, la matriz de pagos y estrategias es:
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
jugar. También se puede decir que es una función que utiliza la información que el individuo tiene y que asigna a cada nodo del juego (excepto a los terminales) una acción. En los juegos dinámicos surge el concepto de estrategias no creíbles, en [6] se asegura que el Equilibrio Equilibrio de Nash no es capaz de capturar enteramen enteramente te este hecho, por lo que se introdujo el concepto de Equilibrio de Nash Perfecto en Subjuegos, para de…nirlo, es necesario establecer qué es un subjuego. De…nición 11 Un subjuego de algún juego , es un subconjunto de que
consiste en un nodo, que no es el inicial para , en todos los nodos que le siguen a ese nodo y en los pagos asociados a esos nodos. Ejemplo 5
Si suponemos que es el juego expuesto en el ejemplo anterior, un subjuego posible es el que se presenta en la Figura 3:
Figura 3
De…nición 12 Un per…l de estrategias es un Equilibrio de Nash Perfecto en Subjuegos (SGNE) si satisface dos condiciones:
i) Es Equilibrio de Nash para todo el juego. ii) Es Equilibrio de Nash para cada subjuego.
La condición condición i) puede ser considerada considerada de necesidad necesidad,, porque para ser SGNE es necesario ser primero Equilibrio de Nash, y la ii) como de su…ciencia, porque no basta ser Equilibrio de Nash para ser un SGNE. Ejemplo 6
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
correcta pues sin importar lo que elija el jugador 1 terminará mejor o igual con
respecto a si hubiera decidido A. Por último, en el SJ 3 el jugador 2 elige la acción D que efectivamente signi…ca un pago mayor para 2. Queda demostrado que es un SGNE.
3
Aplic plicac acio ione nes s
En este punto conviene exponer una aplicación económica común de la teoría de los juegos dinámicos; el modelo de Stackelberg. 3.1 3.1
Desc Descri ripci pción ón de de la eco econo nomí mía a
Existen dos empresas, 1 y 2. Estas empresas empresas compite compitenn en cantidades cantidades en un mercado con las siguientes características: La empresa 1 toma sus decisiones de producción primero, y la empresa 2 sólo se ajusta a lo que haya decidido la empresa 1. Por simplici simplicidad dad se puede suponer que la demanda de mercado es lineal, en particular, p = 12 q , en donde q = q 1 + q 2 . Otro intento por simpli…car puede ser suponer los costos marginales constantes e iguales al costo medio, por ejemplo, CT 1 = q 1 y CT 2 = 2 q 2 , donde CT i es el costo total de la empresa i, i = 1 ; 2. 3.2 3.2
Equi Equilib libri rio o
Del modelo duopólico de Cournot se sabe que la curva de reacción de la empresa 2, bajo estas condiciones, es q 2 = 10 2 q , que surge de resolver el problema de maximización de bene…cios de la empresa 2 tomando en cuenta que la demanda es p = 12 q 1 q 2, esto es: 1
max2 = p q 2 2 q 2 s:a p = 12 q 1 q 2
La empresa 1, que sabe que la empresa 2 es un agente racional (más aún, la empresa 2 sabe que la empresa 1 la considera racional, la empresa 1 sabe que la 8
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
max1 = 12 q 1
10q1 2
q 1 1 q 1 = (7
q1 2
) q 1 q 1
El problema de la empresa 1 es ahora uno de optimización libre y de una variable. La condición de primer orden es: @ 1 @q 1
= 0 () 7 q 1 1 = 0
Que implica que q 1 = 6, una vez que la empresa 2 observa esto decide producir q 2 = 102 6 = 2 Dado lo anterior el precio es p = 12 6 3 = 3.
3.3
El modelo modelo de de Stack Stackelbe elberg rg como como un un juego juego
En este punto es importante establecer claramente el vinculo que existe entre este modelo de competencia monopolista y la teoría de juegos, para lograrlo con mayor claridad se va a preservar la notación de la sección anterior. Primeramente hay que notar que el comportamiento de las dos empresas se da en un ambien ambiente te de interdepe interdependenc ndencia ia estratégica, estratégica, porque lo que haga una empresa afectará a la otra y porque el propio comportamiento de las empresas involucra la anticipación del comportamiento de la otra. Sea A1 el conjunto de cantidades (acciones) que la empresa 1 puede elegir, y A2 el conjunto de cantidades posibles para la empresa 2. Por lo anterior tiene que ocurrir que q 1 2 A1 y q 2 2 A2 : Queda por demostrar que el el per…l s = fs1 ; s2 g, donde
s1 argmax1 = p q 1 1 q 1 s:a p = 12 q 1 q 2 q 2 = 10 2 q 1
y s2 argmax2 = p q 2 2 q 2 s:a p = 12 q 1 q 2
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
3.4
Estát Estática ica compar comparati ativ va
Ahora cabe preguntarse qué ocurre con el equilibrio si cambiamos la estructura de costos, en particular, si se introduce un costo …jo o de entrada. Imagine que para entrar al mercado se exige a la empresa 2 un costo …jo de F , ahora, los costos de la empresa 2 serán CT 2 = 2 q 2 + F , y el problema que resuelve es: max2 = p q 2 (2 q 2 + F ) s:a p = 12 q 1 q 2
No parece difícil ver que la curva de mejor respuesta para esta empresa no cambia, y sigue siendo: q 2 =
10q1 2
Dado lo anterior, la decisión óptima de la empresa 1 tampoco cambia, q 1 = 6 , y de nuevo, una vez que la empresa 2 observa esto, decide producir q 2 = 102 6 = 2, y el precio sigue siendo p = 3 . Lo que cambia es el pago de la empresa 2, 1 = 3(6) 6 = 12, mientras que 2 = 3(2) 2(2) F = 2 F . De lo que se concluye que si F 2 (0; 2) la empresa 2 estará dispuesta a entrar, porque 2 > 0, si F = 2, entonces 2 = 0, por lo que es indiferente, pues 2 = 0 es lo que obtendría si no entrara, y si F > 2 no entra, pues 2 < 0.
References [1] Aumann, R., 1976. Agreein Agreein to Disagree Disagree . The Annals of Statistics. Vol. 4, Num. 6. [2] Fudenberg, D., y J. Tirole 1991. Game Theory . MIT Press. [3] Kuhn, H. W., y A. W. Tucker, editores, 1950. Contributions to the Theory of Games . Vol. I. Princeton University Press. [4] Kuhn, H. W., y A. W. Tucker, editores, 1953. Contributions to the Theory