Teoria de juegos dilema del prisionero

dilema del prisionero beispiel

Las simulaciones por ordenador se utilizan habitualmente para estudiar la evolución de las estrategias en juegos repetidos. Estas simulaciones rara vez prestan atención a los resultados de la teoría de juegos que pueden iluminar el análisis de los datos o las preguntas que se plantean. Los resultados de la teoría evolutiva de los juegos implican que para cada equilibrio de Nash existen secuencias de mutantes que los desestabilizan. Si las estrategias no se limitan a un conjunto finito, las poblaciones se mueven entre una variedad de equilibrios de Nash con diferentes niveles de cooperación. Esta inestabilidad es ineludible, independientemente de cómo se representen las estrategias. Presentamos algoritmos que muestran que las simulaciones coinciden con la teoría. Esto implica que la cognición en sí misma puede tener un impacto limitado en la dinámica del ciclo. Argumentamos que el papel de las mutaciones o la exploración es más importante para determinar los niveles de cooperación.

La cooperación costosa -en la que los individuos reducen su propia aptitud para aumentar la de otros- es omnipresente en el mundo natural. Sin embargo, no está claro por qué la cooperación costosa habría sobrevivido a un proceso de mutación y selección. Un problema paralelo surge en la ingeniería, cuando los agentes autónomos necesitan aprender a cooperar entre sí. Si los agentes responden a recompensas individuales, hay pocos incentivos para que los grupos de agentes se comporten de forma cooperativa (Shoham y Leyton-Brown, 2008). Reconocido por el propio Darwin (Darwin, 1859), el problema de la cooperación sigue considerándose uno de los mayores problemas abiertos en la ciencia (Pennisi, 2005).

dilema del prisionero infinito

El equilibrio de Nash es un concepto de la teoría de los juegos en el que el resultado óptimo de un juego es aquel en el que no hay incentivos para desviarse de la estrategia inicial. Más concretamente, el equilibrio de Nash es un concepto de la teoría de los juegos en el que el resultado óptimo de un juego es aquel en el que ningún jugador tiene incentivos para desviarse de su estrategia elegida tras considerar la elección del oponente.

El equilibrio de Nash lleva el nombre de su inventor, John Nash, un matemático estadounidense. Se considera uno de los conceptos más importantes de la teoría de los juegos, que trata de determinar matemática y lógicamente las acciones que los participantes de un juego deben realizar para asegurarse los mejores resultados.

La razón por la que el equilibrio de Nash se considera un concepto tan importante de la teoría de juegos está relacionada con su aplicabilidad. El equilibrio de Nash puede incorporarse a una amplia gama de disciplinas, desde la economía hasta las ciencias sociales.

El equilibrio de Nash suele compararse con la estrategia dominante, ya que ambas son estrategias de la teoría de juegos. El equilibrio de Nash establece que la estrategia óptima para un actor es mantener su estrategia inicial conociendo la estrategia del adversario y que todos los jugadores mantienen la misma estrategia, siempre que los demás jugadores no cambien su estrategia.

el dilema del prisionero deutsch

El dilema del prisionero, una de las teorías de juegos más famosas, fue conceptualizado por Merrill Flood y Melvin Dresher en la Rand Corporation en 1950. Posteriormente fue formalizado y bautizado por el matemático canadiense Albert William Tucker.

El escenario del dilema del prisionero funciona como sigue: Dos sospechosos han sido detenidos por un delito y se encuentran en habitaciones separadas en una comisaría de policía, sin medios para comunicarse entre sí. El fiscal les ha dicho por separado lo siguiente:

Empecemos por construir una matriz de pagos como la que se muestra en la tabla siguiente. La “recompensa” se muestra aquí en términos de la duración de la pena de prisión (simbolizada por el signo negativo; cuanto más alto sea el número, mejor). Los términos “cooperar” y “desertar” se refieren a que los sospechosos cooperan entre sí (por ejemplo, si ninguno de ellos confiesa) o desertan (es decir, no cooperan con el otro jugador, que es el caso en el que un sospechoso confiesa, pero el otro no). El primer número de las casillas (a) a (d) muestra la recompensa para el sospechoso A, mientras que el segundo número la muestra para el sospechoso B.

equilibrio de nash

Inicialmente, un jugador que utilice el gatillo sombrío cooperará, pero tan pronto como el oponente deserte (satisfaciendo así la condición de gatillo), el jugador que utilice el gatillo sombrío desertará durante el resto de la partida iterada. Dado que un solo defecto del oponente desencadena la deserción para siempre, el desencadenamiento sombrío es la estrategia más estrictamente implacable en un juego iterado.

Si un jugador deserta, será castigado durante el resto de la partida. De hecho, a ambos jugadores les conviene más permanecer en silencio (cooperar) que traicionar al otro, por lo que jugar (C, C) es el perfil cooperativo mientras que jugar (D, D), también el único equilibrio de Nash en este juego, es el perfil de castigo.

En la estrategia de activación sombría, un jugador coopera en la primera ronda y en las siguientes siempre que su oponente no deserte del acuerdo. Una vez que el jugador descubre que el oponente ha traicionado en la partida anterior, entonces desertará para siempre.

En las competiciones de estrategia de dilema del prisionero iterado, el gatillo lúgubre funciona mal incluso sin ruido, y si se le añaden errores de señal, empeora aún más. Su capacidad de amenazar con la deserción permanente le da una forma teóricamente efectiva de mantener la confianza, pero debido a su naturaleza implacable y a la incapacidad de comunicar esta amenaza por adelantado, su rendimiento es pobre[5].