Dilema do Prisioneiro

Na Galipedia, a wikipedia en galego.

O Dilema do Prisioneiro e un exemplo claro pero atípico dun problema de suma non nula. Nste problema da Teoría de Xogos, como en otros moitos, suponse que cada xogador, de forma independente, trata de maximizar a súa propia vantaxe sen importar os resultados para o outro xogador. As técnicas de análise da teoría de xogo estándar, por exemplo determinar o Equilibrio de Nash poden levar a cada xogador a escoller traicionar o outro, pero curiosamente cada xogador obtendrá un mellor resultado se colaborasen. Desgraciadamente para os xogadores, cada prisioneiro está incentivado individualmente para defraudar o outro, incluso tras prometer colaborar. Iste é o punto clave do dilema.

No dilema do prisioneiro iterado a cooperación pode obterse como un resultado de equilibrio. Aquí xógase repetidamente polo que, cando repítese o xogo, ofrécese a cada xogador a oportunidade de castigar o outro pola no cooperación nos xogos anteriores. Asi, o incentivo para defraudar pode verse superado pola ameaza de castigo, que conduce un resultado mellor, cooperativo.

Índice

[editar] O dilema do prisioneiro clásico

A enunciación do dilema do prisioneiro clásico é:

A policía detén a dous sopechosos. Non teñen probas suficientes e dependen dos testimonios dos detidos para impoñer un castigo. Séparan os prisioneiros, polo que non teñen testimonio conxunto e descoñecen que fará o compañeiro. Si o prisioneiro A delata o prisioneiro B, o xogador A será condeado a 2 anos e o B a 10 anos. Se o compañeiro B delata o compañeiro A, o último será condeado a 10 anos mentres que o delator a 2 anos de cárcere. Si os prisioneiros calan, serán condeados a 5 anos de prisión. Se ambos falan, os dous serán condeados a pena máxima, 10 anos.

Supongamos que cada prisioneiro actúa de forma egoísta é a única meta e minimizar a súa estancia na cárcere. Cada prisioneiro ten dúas opcións: cooperar co cómplice ou traicionalo. O resultado de cada elección depende da elección do outro xogador. Desgraciadamente, están aislados un do outro e non saben como actuará. E incluso tendo contacto con él, non poden estar seguro de que pode confiar en él.

Se esperas que o teu compañeiro colabore contigo, a elección óptima para ti sería delatar, condenandoo a él a 10 anos mentres que a tua pena sería soamente de 2 anos. Sen embargo, o outro xogador co meso razoamento tenderá a confesar, polo que ambolos dous serían condeados a pena máxima, 10 anos.

Confesar é a estratexía dominante para os dous actores individuales, xa que supón a pena mínima. Sin embargo isto conduce a un resultado distinto o esperado, pois se ambos confesan son condeados a 10 anos. Aquí encontrase o punto clave do dilema. o resultado das interaccións individuais produce un resultado que non é óptimo no sentido de Pareto; existe unha situación tal que a utilidade duns dos detidos podría mellorar (incluso dos dous) sin que isto implique un empeoramiento para o resto. Noutras pañabras, o resultado no cal ambos detidos no confesan domina paretianamente o resultado no cal os dous excollen confesar.

Dende a perspectiva do interese óptimo do grupo, o reusltado correcto sería que ambolos dous cooperasen e calase xa quereduciría o tempo total de condena que si se delatasen. Calquera outra decisión sería peor para os prisioneiros si se evalúa en conxunto. A pesar de isto, se seguen os seus intereses egoístas, cada un dos prisioneiros recibirá unha sentencia peor que si non colaborasen.

No dilema do prisioneiro iterado, onde pódese castigar o compañeiro por confesar, entón o reusltado cooperativo pode manterse. neste xogo, si o teu compañeito traicionate e confesa unha vez, podes castigalo traicionando ti a próxima vez. Asi, a opción iterada ofrece a opción de castigo ausente na teoría clásica do xogo.

[editar] Unha variante sinxela

O científico cognitivo Douglas Hofstadter expuso que o dilema do prisioneiro atópase moitas veces na vida corrente, máis doados de entender se están presentados coma un xogo ou intercambio. Un exemplo ilustrativo disto é candos dous persoas intercambian dous bolsas cerradas co acordo de que unha conten os cartos mentre ca outra a mercancía comprada. Cada xogador pode escoller ser fiel o acordo e poñer na bolsa o estipulado no acordo ou, pola contra,enganar e ofrecer a bolsa vacía. Nesta variante, o contrario que no dilema do prisioneiro clásico, enganar sempre é a mellor opción.

[editar] Matriz de pagos do dilema

No mesmo artigo, Hofstadter observou ca matriz de pagos do dilema do prisioneiro pode, de feito, enunciarse de moitas formas sempre que manteña iste axioma:

T > R > C > P

Onde T é a tentación para traizoar[é dicir, o que obtes cando desertas e o outro xogador coopera); R é aa recompensa da cooperación mutua; C é o castigo pola traizón mútua; e P é a paga do primo (é dicir, o que obtés se cooperas e o outro xogador deserta).

(É frecuente tamén (T + C)/2 < R, e esto requierese no caso iterado.)

Segindo este principio, e simplicando o dilema do prisioneiro o escenario do cambio de bolsas do xogo anterior, obteremos a seguinte matriz de pagos canónica para o dilema do prisioneiro, isto é, a que sóese mostrar na literatura sobre iste tema:

  Cooperar Desertar
Cooperar 3, 3 -5, 5
Desertar 5, -5 -1, -1

En terminoloxía "ganancia-ganancia" a tabla sería similar a esta:

  Cooperar Desertar
Cooperar ganancia - ganancia pérdida sustancial - ganancia sustancial
Desertar ganancia sustancial - pérdida sustancial pérdida - pérdida


[editar] Referencias

Hofstadter, Douglas R. (1985) The Prisoner's Dilemma Computer Tournaments and the Evolution of Cooperation Ch.29 en Metamagical Themas: questing for the essence of mind and pattern (ISBN 0465045669).