Equilíbrio de Nash. Teoria dos Jogos para Economistas (John Nash)

Na década de 1930, John von Neumann e Oscar Morgenstern tornaram-se os fundadores de uma nova área interessante da matemática, chamada "teoria dos jogos". Na década de 1950, o jovem matemático John Nash ficou interessado nessa área. A teoria do equilíbrio tornou-se objeto de sua dissertação, que ele escreveu aos 21 anos de idade. Assim nasceu uma nova estratégia para jogos chamada Nash Equilibrium, que ganhou o Prêmio Nobel muitos anos depois, em 1994.

A longa diferença entre escrever uma tese e aceitação universal foi um teste para o matemático. O gênio sem reconhecimento resultou em graves violações mentais, mas John Nash conseguiu resolver esse problema graças à sua excelente mente lógica. Sua teoria do "equilíbrio de Nash" foi agraciada com o Prêmio Nobel, e sua adaptação cinematográfica no filme "Beautiful mind" ("Jogos mentais").

Teoria dos Jogos Brevemente

Como a teoria do equilíbrio de Nash explica o comportamento das pessoas em termos de interação, vale a pena considerar os conceitos básicos da teoria dos jogos.

A teoria dos jogos estuda o comportamento dos participantes (agentes) sob condições de interação entre si de acordo com o tipo de jogo, quando o resultado depende da decisão e do comportamento de várias pessoas. O participante toma decisões, guiadas por suas previsões sobre o comportamento dos outros, que é chamado de estratégia de jogo.

Há também uma estratégia dominante na qual o participante obtém o resultado ideal para qualquer comportamento de outros participantes. Esta é a melhor estratégia ganha-ganha do jogador.

Dilema do prisioneiro e avanço científico

O dilema do prisioneiro é o caso de um jogo em que os participantes são forçados a tomar decisões racionais, alcançando um objetivo comum no contexto de um conflito de alternativas. A questão é qual dessas opções ele escolherá, reconhecendo seu interesse pessoal e comum, bem como a incapacidade de obter as duas. Os jogadores parecem estar envolvidos em condições adversas de jogo, o que às vezes os faz pensar de maneira muito produtiva.

Esse dilema foi explorado pelo matemático americano John Nash. O equilíbrio que ele trouxe se tornou revolucionário de seu tipo. Particularmente vívido, esse novo pensamento influenciou a opinião dos economistas sobre como os participantes do mercado fazem escolhas, levando em consideração os interesses dos outros, com estreita interação e interseção de interesses.

É melhor estudar a teoria dos jogos com exemplos específicos, já que essa disciplina matemática em si não é uma teoria teórica seca.

Exemplo de dilema do prisioneiro

Por exemplo, duas pessoas assaltadas, caíram nas mãos da polícia e estão sendo interrogadas em celas separadas. Ao mesmo tempo, os policiais oferecem a cada participante condições favoráveis sob as quais ele será libertado se testemunhar contra seu parceiro. Cada um dos criminosos tem o seguinte conjunto de estratégias que ele considerará:

Ambos testemunham e recebem simultaneamente 2, 5 anos de prisão.
Ambos ficam em silêncio ao mesmo tempo e recebem 1 ano cada, pois nesse caso a base de evidências de sua culpa será pequena.
Um dá provas e obtém liberdade, enquanto o outro fica em silêncio e recebe 5 anos de prisão.

Obviamente, o resultado do caso depende da decisão de ambos os participantes, mas eles não podem chegar a um acordo porque estão sentados em células diferentes. O conflito de seus interesses pessoais na luta por um interesse comum também é claramente visível. Cada prisioneiro tem duas opções de ação e 4 opções de resultados.

Cadeia de Inferência

Portanto, o criminoso A está considerando as seguintes opções:

Fico calado e meu parceiro fica calado - nós dois receberemos 1 ano de prisão.
Dou meu parceiro e ele me dá - nós dois temos 2, 5 anos de prisão.
Fico em silêncio e meu parceiro está me entregando - receberei 5 anos de prisão e ele estará livre.
Alugo meu parceiro e ele fica calado - eu tenho liberdade e ele está 5 anos na prisão.

Fornecemos uma matriz de possíveis soluções e resultados para maior clareza.

A tabela de resultados prováveis do dilema do prisioneiro.

A questão é: o que cada participante escolherá?

"Silêncio, você não pode falar" ou "Silêncio, você não pode falar"

Para entender a escolha do participante, você precisa passar pela cadeia de pensamentos dele. Seguindo o raciocínio do criminoso R: se eu ficar calado e calado meu parceiro, teremos um mandato mínimo (1 ano), mas não consigo descobrir como ele se comportará. Se ele testemunhar contra mim, também é melhor para mim testemunhar, caso contrário eu posso sentar por 5 anos. Prefiro sentar 2, 5 anos do que 5 anos. Se ele não diz nada, ainda mais eu preciso testemunhar, porque assim eu terei liberdade. O membro B também argumenta da mesma maneira.

É fácil entender que a estratégia dominante para cada um dos criminosos é testemunhar. O ponto ideal deste jogo ocorre quando os dois criminosos dão provas e recebem seu "prêmio" - 2, 5 anos de prisão. A teoria dos jogos de Nash chama isso de equilíbrio.

Nash Optimal Optimal Solution

A revolução da visão de Nashev é que esse equilíbrio não é ótimo se considerarmos o participante individual e seu interesse pessoal. Afinal, a melhor opção é manter o silêncio e sair em liberdade.

O equilíbrio de Nash é um ponto de contato, onde cada participante escolhe uma opção ideal para ele apenas se os outros participantes escolherem uma estratégia específica.

Considerando a opção em que ambos os criminosos estão calados e recebem apenas 1 ano cada, podemos chamá-la de opção ideal de Pareto. No entanto, só é possível se os criminosos pudessem ter concordado com antecedência. Mas mesmo isso não garantiria esse resultado, já que a tentação de recuar da persuasão e evitar punições é grande. A falta de total confiança um no outro e o perigo de ter 5 anos obriga a escolher a opção com reconhecimento. Refletir sobre o fato de os participantes aderirem à opção com silêncio, agindo em conjunto, é simplesmente irracional. Essa conclusão pode ser feita se estudarmos o equilíbrio de Nash. Exemplos apenas provam isso.

Egoísta ou racional

A teoria do equilíbrio de Nash produziu conclusões impressionantes, refutando os princípios que existiam antes. Por exemplo, Adam Smith considerou o comportamento de cada um dos participantes absolutamente egoísta, o que colocou o sistema em equilíbrio. Essa teoria foi chamada de "mão invisível do mercado".

John Nash viu que, se todos os participantes agirem em busca de seus próprios interesses, isso nunca conduzirá a um resultado ideal para o grupo. Considerando que o pensamento racional é inerente a cada participante, a escolha que a estratégia de equilíbrio de Nash oferece é mais provável.

Experiência puramente masculina

Um exemplo vívido é o jogo do “paradoxo loiro”, que, embora pareça inapropriado, é uma ilustração vívida que mostra como a teoria dos jogos de Nash funciona.

Neste jogo você precisa imaginar que a companhia de caras livres veio ao bar. Em seguida é uma companhia de meninas, uma das quais é preferível às outras, diz uma loira. Como os caras se comportam para conseguir a melhor namorada para si?

Então, o raciocínio dos caras: se todo mundo começar a se familiarizar com a loira, provavelmente ela não encontrará ninguém, então seus amigos não vão querer se encontrar. Ninguém quer ser o segundo substituto. Mas se os caras optarem por evitar a loira, então a probabilidade de cada um deles encontrar uma boa namorada entre as meninas é alta.

A situação do equilíbrio de Nash não é ideal para os homens, porque, perseguindo apenas seus interesses egoístas, todos escolheriam uma loira. É evidente que a busca apenas de interesses egoístas será equivalente ao colapso dos interesses do grupo. O equilíbrio de Nash significa que cada indivíduo age em seus próprios interesses pessoais, que estão em contato com os interesses de todo o grupo. Esta não é uma opção ideal para todos pessoalmente, mas ideal para todos, com base na estratégia geral de sucesso.

Toda a nossa vida é um jogo

Tomar decisões em condições reais é muito semelhante a um jogo quando você espera um certo comportamento racional de outros participantes. Nos negócios, no trabalho, em equipe, em uma empresa e até em relacionamentos com o sexo oposto. De grandes transações a situações da vida cotidiana, tudo obedece a uma lei ou a outra.

Obviamente, as situações consideradas de jogo com criminosos e o bar são apenas excelentes ilustrações que demonstram o equilíbrio de Nash. Exemplos de tais dilemas surgem com muita frequência no mercado real, e isso funciona especialmente em casos com dois monopolistas que controlam o mercado.

Estratégias mistas

Muitas vezes, não estamos envolvidos em um, mas em vários jogos ao mesmo tempo. Escolhendo uma das opções para um jogo, guiada por uma estratégia racional, mas você entra em outro jogo. Após várias decisões racionais, você pode achar que seu resultado não combina com você. O que fazer?

Considere dois tipos de estratégia:

Uma estratégia pura é o comportamento de um participante que vem do pensamento sobre o possível comportamento de outros participantes.
Uma estratégia mista ou uma estratégia aleatória é a alternância de estratégias puras aleatoriamente ou a escolha de uma estratégia pura com uma certa probabilidade. Essa estratégia também é chamada de randomizada.

Considerando esse comportamento, temos uma nova visão do equilíbrio de Nash. Se anteriormente foi dito que o jogador escolhe uma estratégia uma vez, então outro comportamento pode ser imaginado. Podemos admitir a opção de os jogadores escolherem uma estratégia aleatoriamente com uma certa probabilidade. Jogos em que os equilíbrios de Nash não podem ser encontrados em estratégias puras sempre os apresentam em misturas.

O equilíbrio de Nash em estratégias mistas é chamado de equilíbrio misto. Esse é o equilíbrio, em que cada participante escolhe a frequência ideal para escolher suas estratégias, desde que outros participantes escolham suas estratégias com uma determinada frequência.