la economia

Equilibrio de Nash. Teoría de juegos para economistas (John Nash)

Tabla de contenido:

Equilibrio de Nash. Teoría de juegos para economistas (John Nash)
Equilibrio de Nash. Teoría de juegos para economistas (John Nash)

Vídeo: Equilibrio de Nash, teoría de juegos | Cap. 33 - Microeconomía 2024, Julio

Vídeo: Equilibrio de Nash, teoría de juegos | Cap. 33 - Microeconomía 2024, Julio
Anonim

En la década de 1930, John von Neumann y Oscar Morgenstern se convirtieron en los fundadores de una nueva área interesante de las matemáticas, que se llamaba "teoría de juegos". En la década de 1950, el joven matemático John Nash se interesó en esta área. La teoría del equilibrio se convirtió en el tema de su disertación, que escribió cuando tenía 21 años. Así nació una nueva estrategia para juegos llamada Nash Equilibrium, que ganó el Premio Nobel muchos años después, en 1994.

Image

La larga brecha entre escribir una tesis y la aceptación universal fue una prueba para el matemático. El genio sin reconocimiento resultó en graves violaciones mentales, pero John Nash pudo resolver este problema gracias a su excelente mente lógica. Su teoría del "equilibrio de Nash" fue galardonada con el Premio Nobel, y su adaptación cinematográfica en la película "Beautiful mind" ("Juegos mentales").

Teoría del juego brevemente

Dado que la teoría del equilibrio de Nash explica el comportamiento de las personas en términos de interacción, vale la pena considerar los conceptos básicos de la teoría de juegos.

La teoría de juegos estudia el comportamiento de los participantes (agentes) en condiciones de interacción entre ellos según el tipo de juego, cuando el resultado depende de la decisión y el comportamiento de varias personas. El participante toma decisiones, guiado por sus pronósticos sobre el comportamiento de los demás, lo que se llama la estrategia del juego.

También hay una estrategia dominante en la que el participante obtiene el resultado óptimo para cualquier comportamiento de otros participantes. Esta es la mejor estrategia de ganar-ganar del jugador.

Dilema del prisionero y avance científico

El dilema del prisionero es un caso con un juego cuando los participantes se ven obligados a tomar decisiones racionales, alcanzando un objetivo común en el contexto de un conflicto de alternativas. La pregunta es cuál de estas opciones elegirá, reconociendo su interés personal y común, así como la incapacidad de obtener ambas. Los jugadores parecen estar encerrados en duras condiciones de juego, lo que a veces los hace pensar de manera muy productiva.

Image

Este dilema fue explorado por el matemático estadounidense John Nash. El equilibrio que sacó se convirtió en revolucionario de este tipo. Particularmente vívido, este nuevo pensamiento influyó en la opinión de los economistas sobre cómo los jugadores del mercado toman decisiones, teniendo en cuenta los intereses de los demás, con una estrecha interacción e intersección de intereses.

Es mejor estudiar la teoría de juegos con ejemplos específicos, ya que esta disciplina matemática en sí no es una teoría teórica seca.

Ejemplo de dilema del prisionero

Ejemplo, dos personas robadas, cayeron en manos de la policía y están siendo interrogadas en celdas separadas. Al mismo tiempo, los oficiales de policía ofrecen a cada participante condiciones favorables bajo las cuales será liberado si testifica contra su compañero. Cada uno de los delincuentes tiene el siguiente conjunto de estrategias que considerará:

  1. Ambos testifican simultáneamente y reciben 2.5 años de prisión.

  2. Ambos guardan silencio al mismo tiempo y reciben 1 año cada uno, ya que en este caso la base de evidencia de su culpa será pequeña.

  3. Uno da evidencia y obtiene libertad, mientras que el otro calla y recibe 5 años de prisión.

Obviamente, el resultado del caso depende de la decisión de ambos participantes, pero no pueden llegar a un acuerdo porque están sentados en diferentes celdas. El conflicto de sus intereses personales en la lucha por un interés común también es claramente visible. Cada preso tiene dos opciones de acción y 4 opciones de resultados.

Cadena de inferencia

Entonces, el criminal A está considerando las siguientes opciones:

  1. Estoy en silencio y mi compañero está en silencio: ambos recibiremos 1 año de prisión.

  2. Le doy a mi compañero y él me da a mí: ambos tenemos 2.5 años de prisión.

  3. Estoy en silencio, y mi compañero me está entregando: recibiré 5 años de prisión y él será libre.

  4. Alquilo a mi compañero, y él está en silencio: tengo libertad, y él está 5 años en prisión.

Damos una matriz de posibles soluciones y resultados para mayor claridad.

La tabla de resultados probables del dilema del prisionero.

Image

La pregunta es ¿qué elegirá cada participante?

"Silencio, no puedes hablar" o "Silencio, no puedes hablar"

Para comprender la elección del participante, debe pasar por la cadena de pensamientos. Siguiendo el razonamiento del criminal A: si guardo silencio y callo a mi pareja, obtendremos un plazo mínimo (1 año), pero no puedo averiguar cómo se comportará. Si él testifica en mi contra, entonces también es mejor para mí testificar, de lo contrario me puedo sentar durante 5 años. Prefiero sentarme 2.5 años que 5 años. Si él no dice nada, entonces más necesito testificar, porque así tendré libertad. El miembro B también argumenta de la misma manera.

Image

Es fácil entender que la estrategia dominante para cada uno de los criminales es testificar. El punto óptimo de este juego ocurre cuando ambos criminales dan evidencia y reciben su "premio": 2.5 años en prisión. La teoría de juegos de Nash lo llama equilibrio.

Solución óptima óptima de Nash

La revolución de la visión de Nashev es que ese equilibrio no es óptimo si consideramos al participante individual y su interés personal. Después de todo, la mejor opción es permanecer en silencio y liberarse.

El equilibrio de Nash es un punto de convergencia de intereses, donde cada participante elige una opción que es óptima para él solo si los otros participantes eligen una estrategia específica.

Teniendo en cuenta la opción cuando ambos delincuentes están en silencio y reciben solo 1 año cada uno, podemos llamarlo la opción óptima de Pareto. Sin embargo, solo es posible si los delincuentes podrían haber acordado de antemano. Pero incluso esto no garantizaría este resultado, ya que la tentación de retroceder de la persuasión y evitar el castigo es grande. La falta de plena confianza mutua y el peligro de tener 5 años obliga a elegir la opción con reconocimiento. Reflexionar sobre el hecho de que los participantes se adherirán a la opción con silencio, actuando en concierto, es simplemente irracional. Tal conclusión puede hacerse si estudiamos el equilibrio de Nash. Los ejemplos solo prueban eso.

Egoísta o racional

La teoría del equilibrio de Nash ha arrojado conclusiones sorprendentes, refutando los principios que existían antes. Por ejemplo, Adam Smith consideró que el comportamiento de cada uno de los participantes era absolutamente egoísta, lo que llevó al sistema al equilibrio. Esta teoría fue llamada la "mano invisible del mercado".

Image

John Nash vio que si todos los participantes actúan en pos de sus propios intereses, esto nunca conducirá a un resultado de grupo óptimo. Teniendo en cuenta que el pensamiento racional es inherente a cada participante, la opción que ofrece la estrategia de equilibrio de Nash es más probable.

Experimento puramente masculino

Un ejemplo vívido es el juego de la "paradoja rubia", que, aunque parece inapropiado, es una ilustración vívida que muestra cómo funciona la teoría del juego de Nash.

En este juego debes imaginar que la compañía de hombres libres vino al bar. Lo siguiente es una compañía de chicas, una de las cuales es preferible a las demás, dice una rubia. ¿Cómo se comportan los chicos para conseguir la mejor novia para ellos?

Image

Entonces, el razonamiento de los chicos: si todos comienzan a familiarizarse con la rubia, lo más probable es que no llegue a nadie, entonces sus amigos no querrán conocerse. Nadie quiere ser el segundo recurso. Pero si los chicos eligen evitar a la rubia, entonces la probabilidad de que cada uno de ellos encuentre una buena novia entre las chicas es alta.

La situación del equilibrio de Nash no es óptima para los hombres, porque, persiguiendo solo sus intereses egoístas, todos elegirían una rubia. Es evidente que la búsqueda de intereses egoístas equivaldrá al colapso de los intereses del grupo. El equilibrio de Nash significará que cada individuo actúa en sus propios intereses personales, que están en contacto con los intereses de todo el grupo. Esta no es una opción óptima para todos personalmente, pero es óptima para todos, según la estrategia general de éxito.

Toda nuestra vida es un juego

Tomar decisiones en condiciones reales es muy similar a un juego cuando esperas un cierto comportamiento racional de otros participantes. En los negocios, en el trabajo, en un equipo, en una empresa e incluso en las relaciones con el sexo opuesto. Desde grandes transacciones hasta situaciones de la vida cotidiana, todo obedece a una ley u otra.

Image

Por supuesto, las situaciones de juego consideradas con criminales y el bar son solo excelentes ilustraciones que demuestran el equilibrio de Nash. A menudo surgen ejemplos de tales dilemas en el mercado real, y esto funciona especialmente en casos con dos monopolistas que controlan el mercado.

Estrategias mixtas

A menudo estamos involucrados no en uno sino en varios juegos a la vez. Eligiendo una de las opciones para un juego, guiado por una estrategia racional, pero entras en otro juego. Después de varias decisiones racionales, puede encontrar que su resultado no le conviene. Que hacer

Considere dos tipos de estrategia:

  • Una estrategia pura es el comportamiento de un participante que proviene de pensar en el posible comportamiento de otros participantes.

  • Una estrategia mixta o una estrategia aleatoria es la alternancia de estrategias puras al azar o la elección de una estrategia pura con una cierta probabilidad. Esta estrategia también se llama aleatorizada.

Image

Considerando este comportamiento, obtenemos una nueva mirada al equilibrio de Nash. Si antes se decía que el jugador elige una estrategia una vez, se puede imaginar otro comportamiento. Podemos admitir la opción de que los jugadores elijan una estrategia al azar con una cierta probabilidad. Los juegos en los que no se pueden encontrar equilibrios de Nash en estrategias puras siempre los tienen en estrategias mixtas.

El equilibrio de Nash en estrategias mixtas se llama equilibrio mixto. Este es un equilibrio, donde cada participante elige la frecuencia óptima para elegir sus estrategias, siempre que otros participantes elijan sus estrategias con una frecuencia dada.