
O Dilema do Prisioneiro é um cenário de teoria dos jogos[1] desenvolvido na década de 1950 por Merrill Flood, Melvin Dresher e Albert W. Tucker. Demonstra o conflito entre interesses individuais e coletivos quando dois suspeitos são separadamente oferecidos um acordo pela polícia. Cada um pode cooperar (permanecer em silêncio) ou desertar (testemunhar contra o outro). Se ambos permanecerem em silêncio, cada um cumpre 6 meses; se um confessar, o suspeito em silêncio cumpre 10 anos. Matematicamente, confessar é a estratégia dominante, levando a um resultado subótimo em que ambos os suspeitos confessam. O cenário foi expandido para a versão iterada, onde interações repetidas podem fomentar a cooperação através de estratégias como Tit for Tat. Possui aplicações abrangentes na compreensão de interações estratégicas em economia, política[2] e ciências sociais, ilustrando como o interesse próprio racional pode levar a resultados coletivamente piores.
Este artigo ou secção contém uma lista de referências no fim do texto, mas as suas fontes não são claras porque não são citadas no corpo do artigo, o que compromete a confiabilidade das informações. (Janeiro de 2022) |
O dilema do prisioneiro faz referência a um problema da teoria dos jogos, sendo um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em muitos outros, supõe-se que cada jogador, de forma independente, quer aumentar ao máximo a sua própria vantagem sem lhe importar o resultado do outro jogador.
As técnicas de análise da teoria de jogos padrão, como por exemplo determinar o equilíbrio de Nash, podem levar a que cada jogador escolha trair o outro, embora ambos os jogadores obtenham um resultado mais favorável se colaborarem. Infelizmente para os prisioneiros, cada jogador é incentivado individualmente a defraudar o próximo, mesmo após a promessa recíproca de colaboração. Este é o ponto-chave do dilema, ou seja, deverá ou não deverá o prisioneiro egoísta colaborar com o próximo sem o trair, para que a vantagem do grupo, equitativamente distribuída, possa ser maximizada?
No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui joga-se repetidamente, e quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar o outro jogador pela não cooperação em jogos anteriores. Assim, num processo iterativo, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, ou seja, mais cooperativo.