Equilibrio de Nash
Contenido |
Definición
El equilibrio de Nash fue formulado en 1951 por el matemático John Forbes Nash cuando éste realizó su tesis doctoral, por la cual obtendría el Premio Nobel de Economía en el año 1994. Nash fue capaz de demostrar que si permitimos estrategias mixtas (en las que los jugadores pueden escoger estrategias al azar con una probabilidad predefinida), entonces todos los juegos de “n” jugadores en los que cada jugador puede escoger entre un número finito de estrategias tienen al menos un equilibrio de Nash con estrategias mixtas.
En Teoría de juegos, se define el equilibrio de Nash como un modo de obtener una estrategia óptima para juegos que involucren a dos o más jugadores. Es decir, si hay un conjunto de estrategias tal que ningún jugador se beneficia cambiando su estrategia mientras los otros no cambien la suya, entonces ese conjunto de estrategias y las ganancias correspondientes constituyen un equilibrio de Nash.
Es importante resaltar que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Cada jugador hace lo mejor para él en función de lo que hacen sus adversarios, suponiendo que el individuo y los demás jugadores son racionales. Es decir, no se busca el máximo beneficio colectivo o interés común, pero se actúa en consecuencia de las elecciones racionales que los demás jugadores han elegido o supuestamente pueden elegir siempre y cuando sean racionales.
Así pues, se dice que existe un equilibrio de Nash cuando se presenta un par de estrategias (a*, b*) en un juego de dos jugadores (A y B), en las que a* es una estrategia óptima para el jugador A frente a la estrategia b*; y b* es una estrategia óptima para el jugador B frente a la estrategia a*. El equilibrio de Nash se diferencia del equilibrio de las estrategias dominantes en que, en el equilibrio de las estrategias dominantes, se exige que la estrategia de A sea óptima en el caso de todas las elecciones óptimas de B, y viceversa. El equilibrio de Nash es menos restrictivo: el equilibrio se da si a* representa la mejor estrategia del jugador A cuando el jugador B juega b*, y b* representa la mejor estrategia de B cuando A juega a*.
- Estrategias dominantes:
- “Elijo mi mejor estrategia posible, independientemente de lo que tú hagas”.
- “Eliges tu mejor estrategia posible, independientemente de lo que yo haga”.
- Equilibrio de Nash:
- “Elijo mi mejor estrategia posible, a la vista de lo que tú haces”.
- “Eliges tu mejor estrategia posible, teniendo en cuenta lo que yo he elegido”.
En el contexto económico, el equilibrio de Nash es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Hipótesis principales
Se parte de los siguientes supuestos para comprender y alcanzar el equilibrio de Nash:
- Cada jugador ha adoptado (y es consciente de que lo ha hecho) su mejor estrategia. Se dice que el jugador adopta la mejor estrategia porque es la que maximiza sus ganancias dadas las estrategias de los demás.
- Todos y cada uno de los jugadores buscan maximizar su pago / ganancia esperada de acuerdo a los pagos y las condiciones que describen el juego.
- Los jugadores llevan a cabo las estrategias deseadas y premeditadas de acuerdo a sus preferencias, estrategias que se entiende que son ejecutadas sin errores.
- Todos los jugadores conocen las estrategias de los demás.
- Los jugadores poseen la habilidad suficiente para la determinación de sus equilibrios privados y la de estimar la de los demás jugadores que interactúan en el juego.
- Se supone que el hecho de que un individuo modifique su estrategia, no afecta a la decisión original que otro individuo planea desplegar. Cada jugador también determina su camino en base a lo que piensa que otros harán y, si piensa que lo cambie, lo tendrá en cuenta en su determinación
- Todos los agentes económicos que interactúan asumen el cumplimiento de las normas y suponen al mismo tiempo la racionalidad como característica general de todos y cada uno de ellos
- Si un juego tiene un único equilibrio de Nash y los jugadores son completamente racionales, los jugadores escogerán las estrategias que forman el equilibrio.
Ejemplos
El dilema del prisionero
Imaginemos a dos presos preocupados porque no quieren ir al a cárcel. Han cometido un delito, pero no hay pruebas suficientes para condenarlos, por lo que se propone lo siguiente:
- Si delatas a tu compañero, y tu compañero no lo hace, él cumplirá una pena de 10 años, y tú sales libre.
- Si tu compañero te delata, y tú no, serás tú el que cumpla los 10 años, y él saldrá libre.
- Si ambos os delatáis, seréis condenados a 6 años cada uno.
- Si ambos calláis, vuestra condena será de 6 meses para cada uno.
Tú no dices nada | Tú delatas | |
Él no dice nada | 6 meses de condena para ambos | 10 años de condena para él, tú libre |
Él te delata | Él libre, 10 años de condena para ti | 6 años de condena para ambos |
Como podemos ver, el resultado final depende de ambas elecciones, pero ninguno sabe qué decidirá el otro. Es entonces cuando entran conceptos como la confianza o la traición.
Si miramos a favor del grupo, la mejor opción es la de callar, y que el otro piense de la misma forma. Pero el problema es que no conocemos lo que el otro desea. Por ese motivo, lo más posible es que no confiemos en el otro, ya que seguro que no quiere estar ni un mes en la cárcel. Y no queremos estar 10 años ni de broma. Así que confesaremos que fue él.
No obstante, él seguramente ha pensado lo mismo, con lo que nos vamos a la opción de cumplir ambos 6 años. Este es el equilibrio de Nash, ya que acabaremos en este punto siempre, cuando ambos confiesan.
Como podemos ver, observamos que si "ambos cooperan", es decir, permanecen en silencio, el tiempo de condena es menor para los dos, por lo que esta opción resulta más beneficiosa. Sin embargo, la estrategia "ambos cooperan" es inestable, puesto que una vez conocida la elección de uno de los presos por parte del otro, siempre es posible mejorar el resultado personal si se confiesa, puesto que el otro ha permanecido en silencio. Por tanto, si ambos cooperan, la decisión sí sería un óptimo de Pareto, aunque no un Equilibrio de Nash.
En el mundo del cine podemos ver un claro ejemplo del dilema del prisionero. Aparece en la película “El caballero oscuro” dirigida por Christopher Nolan.
En un tramo de la película el Joker propone la siguiente idea: dos ferrys están llenos de explosivos, en uno viajan personas normales de la ciudad de Gotham huyendo del desorden que ha creado el Joker, y en el otro criminales y presos trasladados de la prisión en la que estaban para evitar una posible fuga.
El juego que les propone El Joker, para demostrar que en cada ser humano hay un ser malvado, es que dentro de cada uno de los barcos deja el detonador que hace explotar el otro barco, dando la opción a la gente que está dentro de cada ferry de salvarse si aprietan el detonador y hacen explotar el barco donde no están ellos. Para complicar más el juego, les da un límite de tiempo de 30 minutos, pasado el cual, él mismo explotaría ambos ferrys si los pasajeros no aprietan ningún detonador.
El Juego competitivo
Es un juego en el que su versión más simple participan dos agentes económicos, aunque pueden participar más, y en el que ambos deben escoger simultáneamente un número entero entre cero y diez. Los dos jugadores ganan el valor menor en unidades monetarias propuesto, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar dos unidades monetarias al otro.
Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). Cualquier otra estrategia puede desfavorecer a un jugador si otro escoge un número menor.
Si introducimos una ligera modificación del juego consistente en que si ambos individuos pueden alcanzar la ganancia elegida en caso de que ambos coincidan, este juego tendría once equilibrios de Nash.
Juego de coordinación
Este juego es un juego de coordinación al conducir. Las opciones son: o conducir por la derecha o conducir por la izquierda: 100 significa que no se produce un choque y 0 significa que sí. El primer número en cada celda indica la ganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundo jugador (cuyas opciones se muestran encima).
Conducir por la izquierda | Conducir por la derecha | |
Conducir por la izquierda | 100;100 | 0;0 |
Conducir por la derecha | 0;0 | 100;100 |
En este caso hay dos equilibrios de Nash con estrategias puras, cuando ambos conducen por la derecha o ambos conducen por la izquierda. Esto ayuda a explicar por qué en casi todo el mundo se conduce por el mismo lado (a la derecha) y como en Inglaterra, al ser una isla y no empeorar su pago por no coordinarse con los demás países, se mantuvo la estrategia de conducir por la izquierda.