Prisoner's dilemma (original) (raw)

dbo:abstract

معضلة السجينَين هي النواة الأساسية لمشكلة التعاون ضمن نظرية الألعاب. تتضمن اللعبة متهمين، لا يملك المحقق أدلةً كافية على أي منهما لإثبات الجرم. الخيارات المتاحة أمام كل متهم أثناء التحقيق هي: إما أن يشهد على المتهم الآخر أمام القاضي، أو أن يلتزم الصمت. في حال آثر المتهمان الصمت، لا تستطيع المحكمة إثبات التهمة على أي منهما، ويحكم على كل منهما بالسجن ستة أشهر فقط. أما لو شهد أحد المتهمين على صاحبه، يخرج الشاهد دون حكم ويحكم على الآخر بالسجن عشر سنوات. إذا اختار كلا المتهمين أن يشهد على الآخر، يحكم على الاثنين بخمس سنوات من السجن. كلا المتهمين لا يعلم بقرار الآخر أثناء التحقيق معه. (ar)
En teoria de jocs, el dilema del presoner o del pres és un tipus de joc de suma no nul·la en el qual dos jugadors poden «cooperar» o «trair-se». En aquest joc, igual que en totes les situacions de teoria de jocs, l'única preocupació de cada jugador individual és maximitzar els seus beneficis, independentment del benefici de l'altre jugador. En la formulació clàssica d'aquest problema l'estratègia és la traïció, de manera que l'únic equilibri possible del joc és que tots els jugadors traeixin. És a dir, independentment de què faci l'altre jugador, sempre s'obtindrà un major benefici traint. Les tècniques d'anàlisi de la teoria de jocs estàndard, per exemple la determinació de l'equilibri de Nash, poden dur a cada jugador a escollir trair a l'altre, però curiosament ambdós jugadors obtindrien un resultat global millor si col·laboressin. Es tracta d'un tipus de solució anomenada «solució de Pareto subòptima», en què l'elecció racional duu ambdós jugadors a trair-se malgrat que la recompensa individual seria major si cooperessin. Aquest és el punt clau del dilema. En el dilema del presoner iterat, la cooperació pot obtenir-se com un resultat d'equilibri. Aquí es juga repetidament, per la qual cosa, quan es repeteix el joc, s'ofereix a cada jugador l'oportunitat de castigar l'altre jugador per la no cooperació en jocs anteriors. Així, l'incentiu per trair pot ser superat per l'amenaça del càstig, la qual cosa condueix a un resultat cooperatiu. Si el joc es repeteix indefinidament s'assoleix un equilibri de Nash, tot i que la traïció segueix sent una possible situació d'equilibri. (ca)
Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat spolu (tedy mluvit s "vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat).Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů. Dominantní strategií (tzv. strictly dominating – „přísně dominující“) je zde nespolupráce, tj. bez ohledu na to, jakou strategii si vybere spoluhráč, vykazuje nespolupráce pro hráče vždy lepší výsledek než spolupráce. Racionální hráč se rozhodne pro „zradu“. Takže pro hru je jediná možná rovnováha, a to když oba hráči nespolupracují. Tato rovnováha však překvapivě nemusí vést k Paretovsky optimálnímu řešení. To znamená, že pokud by oba hráči zůstali loajální, v konečném součtu by oba dva získali více, než když nespolupracují. Jiná situace nastane, pokud jde o tzv. iterované (opakované) vězňovo dilema, hra se hraje opakovaně. Hráč tu má možnost „potrestat“ druhého za předchozí nekooperativní hru. Zde se racionální strategií může stát spolupráce. Čím více se počet opakování blíží k nekonečnu, tím více Nashova rovnováha směřuje k Paretovu optimu. (cs)
Το δίλημμα του φυλακισμένου γνωστό παράδειγμα της θεωρίας των παιγνίων. Μπορεί να χρησιμοποιηθεί ως πρότυπο σε πολλές καταστάσεις του πραγματικού κόσμου που αφορούν συμπεριφορές συνεργασίας. Μπορεί να εφαρμοστεί σε καταστάσεις που δεν ταιριάζουν απόλυτα τα κριτήρια των κλασικών ή επαναληπτικών παιχνιδιών. Για παράδειγμα σε αυτά που θα μπορούσαν και οι δύο οντότητες να κερδίσουν σημαντικά οφέλη από τη συνεργασία ή να υποστούν την αποτυχία αν το πράξουν, αλλά θεωρούν αδύνατο ή δαπανηρό να συντονίσουν τις δραστηριότητες τους για την επίτευξη της συνεργασίας. Το «δίλημμα του φυλακισμένου» εξετάζει τις στρατηγικές επιλογές λογικά σκεπτόμενων παικτών που εμπλέκονται σε ανταγωνιστικές καταστάσεις. Δύο άτομα συλλαμβάνονται από την αστυνομία σαν ύποπτοι διάπραξης κάποιων εγκλημάτων. Η αστυνομία δεν έχει όλα τα απαιτούμενα στοιχεία για να τους κατηγορήσει, οπότε τους βάζει σε χωριστά δωμάτια, εμποδίζοντάς τους να έχουν οποιαδήποτε επικοινωνία. Ο εισαγγελέας επισκέπτεται και τους δύο, τον καθένα χωριστά, και κάνει στον καθένα την εξής πρόταση: * Αν καταθέσει εναντίον του άλλου (και ο άλλος δεν μιλήσει) τότε η συνεργασία αμοίβεται με άμεση απελευθέρωση, ενώ ο «άλλος» θα τιμωρηθεί με 12 χρόνια. * Αν δε μιλήσει ούτε αυτός ούτε ο άλλος θα τιμωρηθούν και οι δύο με 1 χρόνο φυλακή για ήσσονος σημασίας αδικήματα για τα οποία η αστυνομία έχει αποδείξεις. * Αν καρφώσουν και οι δύο ο ένας τον άλλον τότε θα τιμωρηθούν με 4 χρόνια ο καθένας. Ποια είναι η αναμενόμενη ορθολογικά «βέλτιστη» στάση του καθενός απ’ τους κρατούμενους; ρωτάει η θεωρία παιγνίων. Θυμίζουμε ότι «ορθολογισμός» για τους ειδικούς αυτού του μοντέλου είναι να κοιτάει ο καθένας το συμφέρον του, δηλαδή είτε το μέγιστο όφελος είτε την μικρότερη ζημιά του, λαμβάνοντας υπόψη του ότι και ο άλλος (ο «αντίπαλος»…) θα κάνει το ίδιο. Πρόκειται για υπόθεση της ανάλυσης που αποδίδεται με τον όρο "κοινή γνώση" (της ορθολογικότητας). Σύμφωνα λοιπόν με την θεωρία, ο κάθε κρατούμενους, ας πούμε ο Α και ο Β, έχει τις πιο κάτω επιλογές: Με δεδομένο ότι οι κανόνες είναι κοινοί και για τους δύο θεωρούμε ότι και οι δύο κάνουν τις ίδιες λογικές σκέψεις. Σκέψη του Α: "Εάν ο Β με καταδώσει τότε τι πρέπει να κάνω; Στην περίπτωση που δεν τον καταδώσω τότε εμπίπτω στον 1ο κανόνα από αυτούς που μας έθεσαν, όντας ο ένοχος και θα φυλακιστώ για 12 χρόνια, ενώ αν τον καταδώσω εμπίπτουμε και οι δύο στον 3ο κανόνα και θα φυλακιστώ για 4. Με συμφέρει λοιπόν να τον καταδώσω." ... " Εάν ο Β δεν με καταδώσει τότε τι πρέπει να κάνω;Στην περίπτωση που τον καταδώσω τότε εμπίπτω στον 1ο κανόνα και θα απελευθερωθώ όντας ο αθώος που συνεργάστηκε, ενώ αν δεν τον καταδώσω εμπίπτουμε και οι δύο στον δεύτερο κανόνα και θα φυλακιστούμε και οι δυο 1 χρόνο. Πάλι με συμφέρει να τον καταδώσω." Με αυτές τι λογικές σκέψεις του ο Α ως που ενδιαφέρεται πάντα για το μεγαλύτερο για αυτόν όφελος (σε αντίθεση με τον που κίνητρο του αποτελεί το κοινό όφελος με το περιβάλλον του), αποφασίζει να καταδώσει τον Β διότι τον συμφέρει και στις δύο περιπτώσεις. Ωστόσο και για τον Β ισχύουν οι ίδιοι κανόνες με συνέπεια να καταδώσει και αυτός τον Α. Προβλέπουμε λοιπόν ότι από αυτή τη διαδικασία και οι δύο ορθολογικοί άνθρωποι που θέλουν το άμεσο ατομικό τους συμφέρον θα τιμωρηθούν με 4 χρόνια. Αν συνυπολόγιζαν και το όφελος του συγκατηγορούμενού τους ως δικό τους όφελος τότε θα έβγαζαν το συμπέρασμα ότι το μεγαλύτερο όφελος πρέπει να λογίζεται ώς συνολικό και είναι τα 2 χρόνια φυλάκισης (1 ο καθένας), σε σχέση με τα 12 χρόνια (12 ο ένας και 0 ο άλλος) αλλά και τα 8 χρόνια (από 4 ο καθένας). Με αυτό στο μυαλό, εάν και οι δύο ήταν homo reciprocans, τότε η στρατηγική συνεργασίας τους θα ήταν να μην καταδώσει ο ένας τον άλλο και να λάβουν ποινή απο 1 χρόνο ο καθένας. Μέρος της ευθύνης της αστοχίας ορισμένων βραβευμένων κατα τ' άλλα οικονομικών θεωριών, οφείλεται στο οτι ο άνθρωπος προσεγγίζεται ως έλλογο ον (rational individual, ως homo economicus) και οι θεωρίες αυτές μόνο σε αυτή τη βάση αναπτύσσονται. Από την παραπάνω θεώρηση αποδεικνύεται οτι η συνεργασία με τις αμοιβαία επωφελείς στρατηγικές είναι πολλές φορές πιο δόκιμη από την επιδίωξη για άμεσο ατομικό όφελος (1 χρόνος ποινή αντί 4 χρόνια). Πρέπει να πούμε ότι σε αυτό το παράδειγμα, όπως και σε κάθε κατάσταση (παίγνιο) της θεωρίας παιγνίων (Game Theory), υποθέτουμε ότι οι εμπλεκόμενοι (οι παίκτες) είναι απόλυτα λογικοί και έχουν ως αποκλειστικό γνώμονα τη μεγιστοποίηση του κέρδους ή την ελαχιστοποίηση του κόστους (όπως σε αυτή την περίπτωση). Θα περίμενε ίσως κάποιος ότι δύο λογικοί άνθρωποι θα επέλεγαν το βέλτιστο δυνατό αποτέλεσμα που θα συνέφερε και τους δύο περισσότερο από αυτό που τελικά κατάφεραν, δηλαδή, να κρατήσουν και οι δύο τη σιωπή τους και να πάνε στη φυλακή με μια ποινή μόνο ενός έτους. Πώς κατέληξαν λοιπόν εδώ τα πράγματα; Η απάντηση βρίσκεται στην εμπιστοσύνη που δείχνει ο ένας στην απόφαση του άλλου. Με άλλα λόγια, με δεδομένη κάθε επιλογή του αντίπαλου παίκτη, το αποτέλεσμα του ανταγωνισμού επικρατεί έναντι του αποτελέσματος της συνεργασίας. Το παραπάνω παράδειγμα καταδεικνύει ότι το «κοινό συμφέρον» δεν είναι πάντα η επιλογή απόλυτα λογικά σκεπτόμενων ατόμων και πολλές φορές απόλυτα λογικά επιλογές μπορούν να οδηγήσουν σε ζημία για όλους τους εμπλεκόμενους. Η κατάσταση αλλάζει αν το παιχνίδι επαναλαμβάνεται, οπότε κάθε παίκτης έχει τη δυνατότητα να «τιμωρήσει» μέσω της επιλογής του τον άλλο παίκτη για την προηγούμενη παρασπονδία του. Σε αυτή την περίπτωση, όταν οι επαναλήψεις του παιγνίου τείνουν στο άπειρο, η επιλογή της συνεργασίας (να κρατήσουν και οι δύο τη σιωπή τους) τείνει στο να επικρατήσει. Αν όμως οι δύο ύποπτοι, μπορούσαν να επικοινωνήσουν, θα έβλεπαν ότι η καλύτερη λύση είναι η μη ομολογία. Αλλά όπως αναφέρθηκε και πιο πάνω δεν αποκλείεται η πιθανότητα της προδοσίας. Όμως αν οι δύο ύποπτοι έχουν ξαναέρθει αντιμέτωποι με το συγκεκριμένο πρόβλημα , έχουν συνεννοηθεί και δεν υπάρχει περίπτωση προδοσίας, τότε δε θα μιλήσουν. Αυτή η ισορροπία λέγεται “υπό-παιγνιακή τέλεια ισορροπία Νας”. Η βέλτιστη στρατηγική για κάποιον παίχτη είναι να κρατήσει το στόμα του κλειστό στον πρώτο γύρο και στην συνέχεια να επαναλαμβάνει αυτό που έκανε ο άλλος παίχτης στον προηγούμενο γύρο. Η στρατηγική αυτή επικράτησε ώς καλύτερη, σε διαγωνισμό επινοήθηκε απο τον Ανατόλ Ράποπορτ, αποκαλείται "μία σου, μία μου" (TIT FOR TAT) και αποδεικνύεται με γενετικούς αλγόριθμους. Μεταφέροντας το παράδειγμα στην καθημερινή ζωή μπορούμε να βγάλουμε πολύ χρήσιμα συμπεράσματα για πράγματα που φαίνονται λογικό να γίνουν αλλά τελικά επιλέγεται κάτι διαφορετικό που οδηγεί σε χειρότερα αποτελέσματα. (el)
Das Gefangenendilemma ist ein mathematisches Spiel aus der Spieltheorie. Es modelliert die Situation zweier Gefangener, die beschuldigt werden, gemeinsam ein Verbrechen begangen zu haben. Die beiden Gefangenen werden einzeln vernommen und können nicht miteinander kommunizieren. Leugnen beide das Verbrechen, erhalten beide eine niedrige Strafe, da ihnen nur eine weniger streng bestrafte Tat nachgewiesen werden kann. Gestehen beide, erhalten beide dafür eine hohe Strafe, wegen ihres Geständnisses aber nicht die Höchststrafe. Gesteht jedoch nur einer der beiden Gefangenen, geht dieser als Kronzeuge straffrei aus, während der andere als überführter, aber nicht geständiger Täter die Höchststrafe bekommt. Das Dilemma besteht nun darin, dass sich jeder Gefangene entscheiden muss, entweder zu leugnen (also zu versuchen, mit dem anderen Gefangenen zu kooperieren) oder zu gestehen (also den anderen zu verraten), ohne die Entscheidung des anderen Gefangenen zu kennen. Das letztlich verhängte Strafmaß richtet sich allerdings danach, wie die beiden Gefangenen zusammengenommen ausgesagt haben und hängt damit nicht nur von der eigenen Entscheidung, sondern auch von der Entscheidung des anderen Gefangenen ab. Beim Gefangenendilemma handelt es sich um ein symmetrisches Spiel mit vollständiger Information, das sich entsprechend in Normalform darstellen lässt. Die dominante Strategie beider Gefangenen ist, zu gestehen. Diese Kombination stellt auch das einzige Nash-Gleichgewicht dar. Hingegen würde eine Kooperation der Gefangenen für beide zu einer niedrigeren Strafe und damit auch zu einer niedrigeren Gesamtstrafe führen. Das Gefangenendilemma taucht bei einer Vielzahl soziologischer und ökonomischer Fragestellungen auf. In den Wirtschaftswissenschaften wird das Gefangenendilemma als Teil der Spieltheorie auch den entscheidungsorientierten Organisationstheorien zugeordnet. Es ist nicht zu verwechseln mit dem Gefangenenparadoxon über bedingte Wahrscheinlichkeiten und dem Problem der 100 Gefangenen der Kombinatorik. (de)
La Prizonula Dilemo estas speco de matematika ludo originale farita por kaj en 1950. Pli malfrue, Albert W. Tucker formaligis ĝin kun la temo de la kondamno je tempo de prizono kaj donis al la ĝenerala problemo tiun ĉi specifan nomon. Du ludantoj elektas sekrete, ĉu silenti ĉu perfidi la alian ludanton. Se unu ludanto elektas "silenti" kaj aliaj elektas "perfidi", la perfidanto gajnas maksimume kaj la silenta prizonulo malgajnegas. Tamen, se la du prizonuloj ambaŭ elektas "silenti", la du prizonuloj ankaŭ gajnas. (eo)
El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas. Fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban en RAND en 1950. Albert W. Tucker formalizó el juego con la frase sobre las recompensas penitenciarias y le dio el nombre del "dilema del prisionero" (Poundstone, 1995). Es un ejemplo de problema de suma no nula. Las técnicas de análisis de la teoría de juegos estándar, por ejemplo determinar el equilibrio de Nash, pueden llevar a cada jugador a escoger traicionar al otro, pero ambos jugadores obtendrían un resultado mejor si colaborasen. En el dilema del prisionero iterado, la cooperación puede obtenerse como un resultado de equilibrio. Aquí se juega repetidamente, por lo que, cuando se repite el juego, se ofrece a cada jugador la oportunidad de castigar al otro jugador por la no cooperación en juegos anteriores. Así, el incentivo para defraudar puede ser superado por la amenaza del castigo, lo que conduce a un resultado cooperativo. (es)
Presoaren dilema Joko-teoriaren oinarrizko problema bat da. Dilema honek agerian uzten du bi pertsonek elkarlan egiteari uko egin ahal diotela, elkarlanean aritzeari uzteak haien interesen kontrakoa izan arren. Presoaren dilema, eta garatu zuten 1950ean, RAND enpresan lanean ari ziren bitartean. Joko estandarren teoriaren analisi teknikek, Nash orekak adibidez, jokalari bakoitza beste jokalaria traizionatzera eraman dezakete, elkarlan eginda emaitza hobeak lortuko balituzkete ere. (eu)
Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l'absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l'un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer. Le dilemme du prisonnier est souvent évoqué dans des domaines comme l'économie, la biologie, la politique internationale, les politiques commerciales (avantage et risques d'une guerre des prix), la psychologie, le traitement médiatique de la rumeur, et même l'émergence de règles morales dans des communautés. Il a donné naissance à des jeux d'économie expérimentale testant la rationalité économique des joueurs et leur capacité à identifier l'équilibre de Nash d'un jeu. (fr)
The Prisoner's Dilemma is an example of a game analyzed in game theory. It is also a thought experiment that challenges two completely rational agents to a dilemma: cooperate with their partner for mutual reward, or betray their partner ("defect") for individual reward. This dilemma was originally framed by Merrill Flood and Melvin Dresher while working at RAND in 1950. Albert W. Tucker appropriated the game and formalized it by structuring the rewards in terms of prison sentences and named it "prisoner's dilemma". William Poundstone in his 1993 book Prisoner's Dilemma writes the following version: Two members of a criminal gang are arrested and imprisoned. Each prisoner is in solitary confinement with no means of speaking to or exchanging messages with the other. The police admit they don't have enough evidence to convict the pair on the principal charge. They plan to sentence both to a year in prison on a lesser charge. Simultaneously, the police offer each prisoner a Faustian bargain. The possible outcomes are: * A: If A and B each betray the other, each of them serves 5 years in prison * B: If A betrays B but B remains silent, A will be set free and B will serve 10 years in prison * C: If A remains silent but B betrays A, A will serve 10 years in prison and B will be set free * D: If A and B both remain silent, both of them will serve 2 years in prison (on the lesser charge). As a projection of rational behaviour in terms of loyalty to one's partner in crime, the Prisoner's Dilemma suggests that criminals who are offered a greater reward will betray their partner for the reward. Accepting offers such as B shows that loyalty to one's partner is, in this game, irrational. Rationality in a system that profits from others, governs this behaviour. Alternative ideas governing behaviour have been proposed, see for example, Elinor Ostrom a Nobel Laureate in Economics. An assumption of the Prisoner's Dilemma is that all purely rational behaviour is self-interested, and as such people will betray each other for self-interest. This implies the only possible outcome for two purely rational prisoners is for them to betray each other, even though mutual cooperation would yield a greater reward. In this case, "to betray" is the dominant strategy for both players, meaning it is the player's best response in all circumstances, and it is aligned with the sure-thing principle. The prisoner's dilemma also illustrates that the decisions made under collective rationality may not necessarily be the same as those made under individual rationality, and this conflict can also be witnessed in a situation called the "Tragedy of the Commons". This case indicates the fact that public goods are always prone to over-use. In reality, such systemic bias towards cooperative behavior happens despite what is predicted by simple models of "rational" self-interested action. This bias towards cooperation has been known since the test was first conducted at RAND; the secretaries involved trusted each other and worked together for the best common outcome. The prisoner's dilemma became the focus of extensive experimental research. This experimental research usually takes one of three forms: single play, iterated play and iterated play against a programmed player, each with different purposes. And as a summary of these experiments, their results justify the categorical imperative raised by Immanuel Kant, which states that a rational agent is expected to "act in the way you wish others to act." This theory is vital for a situation when there are different players each acting for their best interest, and has to take others' actions into consideration to form their own choice. It underlines the interconnectedness of players in such a game, thus stressing the fact that a strategy has to consider others' reactions to be successful, including their responsiveness, their tendency to imitate, etc. An extended "iterated" version of the game also exists. In this version, the classic game is played repeatedly between the same prisoners, who continuously have the opportunity to penalize the other for previous decisions. If the number of times the game will be played is known to the players, then by backward induction two classically rational players will betray each other repeatedly, for the same reasons as the single-shot variant. In an infinite or unknown length game there is no fixed optimum strategy, and prisoner's dilemma tournaments have been held to compete and test algorithms for such cases. The iterated version of the prisoner's dilemma is of particular interest to researchers. Due to its iterative nature, previous researchers observed that the frequency for players to cooperate could change, based on the outcomes of each iteration. Specifically, a player may be less willing to cooperate if their counterpart did not cooperate many times, which renders disappointment. Conversely, as time goes by, cooperation could increase, mainly attributable to the fact that a "tacit agreement" between players has been set up. Another interesting aspect concerning the iterated version of experiment, however, is that this tacit agreement between players has always been established successfully even though the number of iterations is made public to both sides. The prisoner's dilemma game can be used as a model for many involving cooperative behavior. In casual usage, the label "prisoner's dilemma" may be applied to situations not strictly matching the formal criteria of the classic or iterative games: for instance, those in which two entities could gain important benefits from cooperating or suffer from the failure to do so, but find it difficult or expensive—not necessarily impossible—to coordinate their activities. (en)
Dilema tahanan (DT) adalah contoh kanonis dari sebuah permainan yang dianalisis dalam teori permainan yang memperlihatkan mengapa dua individu mungkin tidak akan bekerja sama, bahkan jika demi kebaikan mereka sendiri untuk melakukan hal tersebut.Ia diciptakan pada mulanya oleh dan yang bekerja di RAND pada tahun 1950. memformulasikan permainan tersebut dengan imbalan hukuman penjara dan menamakannya dengan "dilema tahanan" (Poundstone, 1992), seperti cerita berikut: Dua anggota geng kriminal tertangkap dan dipenjara. Setiap tahanan berada dalam ruangan tersendiri tanpa bisa saling berbicara atau menukar pesan. Polisi mengakui bahwa mereka tidak memiliki cukup bukti untuk menghukum pasangan tersebut. Mereka berencana menghukum keduanya satu tahun penjara dengan dakwaan terendah. Bersamaan dengan itu, polisi memberikan setiap tahanan sebuah . Jika salah satu dari mereka bersaksi melawan teman mereka, ia akan dibebaskan sedangkan temannya akan dihukum tiga tahun penjara. Oh, ya, ada udang di balik batu ... Jika kedua tahanan saling bersaksi, keduanya akan dihukum dua tahun penjara. Dalam versi klasik permainan ini, kolaborasi didominasi oleh pengkhianatan; jika seorang tahanan memilih untuk tetap diam, maka tahanan lain mendapatkan balasan lebih baik dengan berkhianat daripada tetap diam (tanpa dihukum bukannya satu tahun penjara), tetapi jika seorang tahanan memilih untuk berkhianat, maka tahanan lain masih tetap mendapatkan imbalan yang cukup baik dengan berkhianat juga (dua tahun bukannya tiga tahun penjara).Karena berkhianat selalu memberikan imbalan lebih daripada berkooperasi, semua tahanan yang sepenuhnya rasional egois akan mengkhianati yang lainnya, dan satu-satunya hasil dari dua tahanan rasional egois adalah saling mengkhianati.Bagian yang menarik dari hasil ini adalah mengejar imbalan individu secara logika mengarah pada kedua tahanan berkhianat, tetapi mereka akan mendapatkan imbalan yang lebih baik jika mereka saling berkooperasi.Dalam dunia nyata, manusia memperlihatkan bias sistematis terhadap perilaku kooperatif dalam permainan ini dan permainan yang mirip lainnya, lebih dari apa yang diprediksi oleh model sederhana dari aksi "rasional" egoistis. Ada juga versi "iteratif" dari permainan ini, di mana permainan klasik dimainkan terus menerus terhadap tahanan yang sama, dan akibatnya, kedua tahanan terus menerus memiliki kesempatan untuk menghukum yang lain berdasarkan pilihan mereka sebelumnya.Jika jumlah permainan yang dilakukan diketahui oleh pemain, maka (dengan induksi mundur) duah tahanan yang sepenuhnya rasional akan saling mengkhianati berulang kali, dengan alasan yang sama pada versi klasiknya.Dalam permainan yang panjang dan tak terbatas tidak ada strategi pasti yang optimal, dan pertandingan Dilema Tahanan telah dilakukan untuk mengadu dan menguji algoritme-algoritme. Dalam penggunaan sehari-hari, label "dilema tahanan" bisa diterapkan pada situasi yang tidak harus benar-benar sama dengan kriteria formal dari permainan klasik atau iteratif: misalnya, permainan dengan dua entitas yang bisa mendapatkan keuntungan dari berkooperasi atau menderita dari kegagalan berkooperasi, tetapi menemukannya sulit atau membutuhkan biaya tinggi, tidak harus sesuatu yang mustahil, untuk mengkoordinasi aktivitas mereka untuk berkooperasi. (in)
囚人のジレンマ（しゅうじんのジレンマ、英: prisoners' dilemma）とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである。各個人が合理的に選択した結果（ナッシュ均衡）が社会全体にとって望ましい結果（パレート最適）にならないので、社会的ジレンマとも呼ばれる。 1950年に数学者のアルバート・タッカーが考案した。ランド研究所のとの行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている。囚人のジレンマではゲームを無期限に繰り返すことで協力の可能性が生まれる（）。囚人のジレンマは、自己の利益を追求する個人の間でいかに協力が可能となるかという社会科学の基本問題であり、経済学、政治学、社会学、社会心理学、倫理学、哲学などの幅広い分野で研究されているほか、自然科学である生物学においても、生物の協力行動を説明するモデルとして活発に研究されている。 (ja)
Il dilemma del prigioniero è un gioco ad informazione completa proposto negli anni cinquanta del XX secolo da Albert Tucker come problema di teoria dei giochi. Oltre ad essere stato approfonditamente studiato in questo contesto, il "dilemma" è anche piuttosto noto al pubblico non tecnico come esempio di paradosso. Anche John Von Neumann, creatore della teoria dei giochi, si interessò a questo dilemma, presentatogli dai due ideatori mentre lavorava al RAND nel 1948. Il dilemma in sé, anche se usa l'esempio dei due prigionieri per spiegare il fenomeno, può descrivere altrettanto bene la corsa agli armamenti, proprio degli anni cinquanta, da parte di USA e URSS (i due prigionieri) durante la guerra fredda. Il corollario a questo dilemma, detto di Aie (dai nomi dei 3 professori universitari che lo teorizzarono nel 1988 Astegy, Inglot e Elghi) prevede sempre che uno dei due tradisca l'altro. (it)
죄수의 딜레마(罪囚, 2명이 참가하는 비제로섬 게임 (non zero-sum game)의 일종이다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人의 煩悶)이라고도 부른다. 이 사례는 협력할 경우 서로에게 가장 이익이 되는 상황일 때 개인적인 욕심으로 서로에게 불리한 상황을 선택하는 문제를 보여주고 있지만 이후 이러한 딜레마의 '반복되는 죄수의 딜레마'로 지속적으로 일어날 경우 긍정적인 협동이 가장 최선의 선택지가 된다는 사회행동의 전략적 진화를 보여준다. (ko)
Het prisoner's dilemma (in het Nederlands wel gevangenendilemma) is een gedachte-experiment uit de speltheorie dat laat zien waarom volledig rationele individuen die niet met elkaar kunnen communiceren misschien niet samenwerken, ook al lijkt het in hun belang te zijn om dat wel te doen. (nl)
Dylemat więźnia – problem w teorii gier. Jest oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać, zdradzając przeciwnika, ale obaj stracą, jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę. W odróżnieniu jednak od dylematu kurczaków w tej grze istnieje większe pole do współpracy, które może zaistnieć w strategiach wielokrotnego dylematu więźnia. Dylemat więźnia został wymyślony przez dwóch pracowników RAND Corporation: Melvina Dreshera i Merrilla Flooda w 1950 roku. sformalizował jego zasady i jako pierwszy użył nazwy dylemat więźnia (Poundstone, 1992). W klasycznej formie jest przedstawiany następująco: Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się, czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić? Jeśli założymy, że każdy z więźniów woli krótszy wyrok niż dłuższy i że żadnemu nie zależy na niskim wyroku drugiego, możemy opisać ten dylemat w terminach teorii gier. Więźniowie grają wtedy w grę, w której dopuszczalne strategie to: współpracuj (milcz) i zdradzaj (zeznawaj). Celem każdego gracza jest maksymalizacja swoich zysków, czyli uzyskanie jak najkrótszego wyroku. W tej grze zdradzaj jest strategią ściśle dominującą: niezależnie od tego, co robi przeciwnik, zawsze bardziej opłaca się zdradzać niż współpracować. Jeśli współwięzień milczy, zdradzanie skróci wyrok z sześciu miesięcy do zera. Jeśli współwięzień zeznaje, zdradzanie skróci wyrok z dziesięciu lat do pięciu. Każdy gracz racjonalny będzie zatem zdradzał i jedyną równowagą Nasha jest sytuacja, gdy obaj gracze zdradzają. W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali. Iterowany dylemat więźnia (patrz niżej) polega na rozgrywaniu tej samej gry wielokrotnie. Wtedy każdy gracz ma możliwość ukarania drugiego gracza za zdradzanie w poprzedniej rundzie. W tej sytuacji, jeśli straty wynikające z ukarania będą większe niż zyski ze zdradzania, współpraca obu graczy może utworzyć stan równowagi. Taka gra może mieć też wiele innych stanów równowagi. (pl)
O dilema do prisioneiro faz referência a um problema da teoria dos jogos, sendo um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em muitos outros, supõe-se que cada jogador, de forma independente, quer aumentar ao máximo a sua própria vantagem sem lhe importunar o resultado do outro jogador. As técnicas de análise da teoria de jogos padrão, como por exemplo determinar o equilíbrio de Nash, podem levar a que cada jogador escolha trair o outro, embora ambos os jogadores obtenham um resultado mais favorável se colaborarem. Infelizmente para os prisioneiros, cada jogador é incentivado individualmente a defraudar o próximo, mesmo após a promessa recíproca de colaboração. Este é o ponto-chave do dilema, ou seja, deverá ou não deverá o prisioneiro egoísta colaborar com o próximo sem o trair, para que a vantagem do grupo, equitativamente distribuída, possa ser maximizada? No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui joga-se repetidamente, e quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar o outro jogador pela não cooperação em jogos anteriores. Assim, num processo iterativo, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, ou seja, mais cooperativo. (pt)
Fångarnas dilemma är inom spelteori ett känt exempel på ett spel för två personer, där det tillhör kategorin icke-nollsummespel. Den matematiska versionen av spelet skapades ursprungligen av Merrill Flood och Melvin Dresher när de arbetade vid den amerikanska tankesmedjan RAND Corporation på 1950-talet. Det var dock matematikern Albert W. Tucker som gav spelet dess namn och som hittade på exemplet med fångarna när han ville formulera en mer populär och lättförståelig version av Floods och Dreshers resultat. (sv)
У теорії ігор дилема в'язня (ДВ) — гра з , в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших. У дилемі в'язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду. Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема. У дилемі в'язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму). (uk)
Диле́мма заключённого (англ. Prisoner's dilemma, реже употребляется название «дилемма банди́та») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована и в 1950 году. Название дилемме дал математик Альберт Такер. В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, каким бы ни было поведение другого игрока, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство. Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма. В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму). (ru)
囚徒困境（英語：prisoner's dilemma）、囚犯兩難是博弈论的非零和博弈中具代表性的例子，反映個人最佳選擇並非团体最佳選擇。或者说在一个群体中，个人做出理性选择却往往导致集体的非理性。雖然困境本身只屬模型性質，但現實中的價格競爭、環境保護等方面，也會頻繁出現類似情況。單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。囚徒困境的主旨為，囚徒們彼此合作，堅不吐實，可為全體帶來最佳利益（縮短刑期），但在無法溝通的情況下，因為出賣同伙可為自己帶來利益（無罪開釋），也因為同伙把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。但實際上，執法機構不可能設立如此情境來誘使所有囚徒招供，因為囚徒們必須考慮刑期以外之因素（出賣同伙會受到報復等），而無法完全以執法者所設立之利益（刑期）作考量，所以這是一個參考性的學術問題。 (zh)

dbo:wikiPageExternalLink

dbo:wikiPageWikiLink

rdfs:comment

معضلة السجينَين هي النواة الأساسية لمشكلة التعاون ضمن نظرية الألعاب. تتضمن اللعبة متهمين، لا يملك المحقق أدلةً كافية على أي منهما لإثبات الجرم. الخيارات المتاحة أمام كل متهم أثناء التحقيق هي: إما أن يشهد على المتهم الآخر أمام القاضي، أو أن يلتزم الصمت. في حال آثر المتهمان الصمت، لا تستطيع المحكمة إثبات التهمة على أي منهما، ويحكم على كل منهما بالسجن ستة أشهر فقط. أما لو شهد أحد المتهمين على صاحبه، يخرج الشاهد دون حكم ويحكم على الآخر بالسجن عشر سنوات. إذا اختار كلا المتهمين أن يشهد على الآخر، يحكم على الاثنين بخمس سنوات من السجن. كلا المتهمين لا يعلم بقرار الآخر أثناء التحقيق معه. (ar)
La Prizonula Dilemo estas speco de matematika ludo originale farita por kaj en 1950. Pli malfrue, Albert W. Tucker formaligis ĝin kun la temo de la kondamno je tempo de prizono kaj donis al la ĝenerala problemo tiun ĉi specifan nomon. Du ludantoj elektas sekrete, ĉu silenti ĉu perfidi la alian ludanton. Se unu ludanto elektas "silenti" kaj aliaj elektas "perfidi", la perfidanto gajnas maksimume kaj la silenta prizonulo malgajnegas. Tamen, se la du prizonuloj ambaŭ elektas "silenti", la du prizonuloj ankaŭ gajnas. (eo)
Presoaren dilema Joko-teoriaren oinarrizko problema bat da. Dilema honek agerian uzten du bi pertsonek elkarlan egiteari uko egin ahal diotela, elkarlanean aritzeari uzteak haien interesen kontrakoa izan arren. Presoaren dilema, eta garatu zuten 1950ean, RAND enpresan lanean ari ziren bitartean. Joko estandarren teoriaren analisi teknikek, Nash orekak adibidez, jokalari bakoitza beste jokalaria traizionatzera eraman dezakete, elkarlan eginda emaitza hobeak lortuko balituzkete ere. (eu)
囚人のジレンマ（しゅうじんのジレンマ、英: prisoners' dilemma）とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである。各個人が合理的に選択した結果（ナッシュ均衡）が社会全体にとって望ましい結果（パレート最適）にならないので、社会的ジレンマとも呼ばれる。 1950年に数学者のアルバート・タッカーが考案した。ランド研究所のとの行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている。囚人のジレンマではゲームを無期限に繰り返すことで協力の可能性が生まれる（）。囚人のジレンマは、自己の利益を追求する個人の間でいかに協力が可能となるかという社会科学の基本問題であり、経済学、政治学、社会学、社会心理学、倫理学、哲学などの幅広い分野で研究されているほか、自然科学である生物学においても、生物の協力行動を説明するモデルとして活発に研究されている。 (ja)
죄수의 딜레마(罪囚, 2명이 참가하는 비제로섬 게임 (non zero-sum game)의 일종이다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人의 煩悶)이라고도 부른다. 이 사례는 협력할 경우 서로에게 가장 이익이 되는 상황일 때 개인적인 욕심으로 서로에게 불리한 상황을 선택하는 문제를 보여주고 있지만 이후 이러한 딜레마의 '반복되는 죄수의 딜레마'로 지속적으로 일어날 경우 긍정적인 협동이 가장 최선의 선택지가 된다는 사회행동의 전략적 진화를 보여준다. (ko)
Het prisoner's dilemma (in het Nederlands wel gevangenendilemma) is een gedachte-experiment uit de speltheorie dat laat zien waarom volledig rationele individuen die niet met elkaar kunnen communiceren misschien niet samenwerken, ook al lijkt het in hun belang te zijn om dat wel te doen. (nl)
Fångarnas dilemma är inom spelteori ett känt exempel på ett spel för två personer, där det tillhör kategorin icke-nollsummespel. Den matematiska versionen av spelet skapades ursprungligen av Merrill Flood och Melvin Dresher när de arbetade vid den amerikanska tankesmedjan RAND Corporation på 1950-talet. Det var dock matematikern Albert W. Tucker som gav spelet dess namn och som hittade på exemplet med fångarna när han ville formulera en mer populär och lättförståelig version av Floods och Dreshers resultat. (sv)
囚徒困境（英語：prisoner's dilemma）、囚犯兩難是博弈论的非零和博弈中具代表性的例子，反映個人最佳選擇並非团体最佳選擇。或者说在一个群体中，个人做出理性选择却往往导致集体的非理性。雖然困境本身只屬模型性質，但現實中的價格競爭、環境保護等方面，也會頻繁出現類似情況。單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。囚徒困境的主旨為，囚徒們彼此合作，堅不吐實，可為全體帶來最佳利益（縮短刑期），但在無法溝通的情況下，因為出賣同伙可為自己帶來利益（無罪開釋），也因為同伙把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。但實際上，執法機構不可能設立如此情境來誘使所有囚徒招供，因為囚徒們必須考慮刑期以外之因素（出賣同伙會受到報復等），而無法完全以執法者所設立之利益（刑期）作考量，所以這是一個參考性的學術問題。 (zh)
En teoria de jocs, el dilema del presoner o del pres és un tipus de joc de suma no nul·la en el qual dos jugadors poden «cooperar» o «trair-se». En aquest joc, igual que en totes les situacions de teoria de jocs, l'única preocupació de cada jugador individual és maximitzar els seus beneficis, independentment del benefici de l'altre jugador. (ca)
Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat spolu (tedy mluvit s "vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat).Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů. (cs)
Das Gefangenendilemma ist ein mathematisches Spiel aus der Spieltheorie. Es modelliert die Situation zweier Gefangener, die beschuldigt werden, gemeinsam ein Verbrechen begangen zu haben. Die beiden Gefangenen werden einzeln vernommen und können nicht miteinander kommunizieren. Leugnen beide das Verbrechen, erhalten beide eine niedrige Strafe, da ihnen nur eine weniger streng bestrafte Tat nachgewiesen werden kann. Gestehen beide, erhalten beide dafür eine hohe Strafe, wegen ihres Geständnisses aber nicht die Höchststrafe. Gesteht jedoch nur einer der beiden Gefangenen, geht dieser als Kronzeuge straffrei aus, während der andere als überführter, aber nicht geständiger Täter die Höchststrafe bekommt. (de)
Το δίλημμα του φυλακισμένου γνωστό παράδειγμα της θεωρίας των παιγνίων. Μπορεί να χρησιμοποιηθεί ως πρότυπο σε πολλές καταστάσεις του πραγματικού κόσμου που αφορούν συμπεριφορές συνεργασίας. Μπορεί να εφαρμοστεί σε καταστάσεις που δεν ταιριάζουν απόλυτα τα κριτήρια των κλασικών ή επαναληπτικών παιχνιδιών. Για παράδειγμα σε αυτά που θα μπορούσαν και οι δύο οντότητες να κερδίσουν σημαντικά οφέλη από τη συνεργασία ή να υποστούν την αποτυχία αν το πράξουν, αλλά θεωρούν αδύνατο ή δαπανηρό να συντονίσουν τις δραστηριότητες τους για την επίτευξη της συνεργασίας. Σκέψη του Α: ... (el)
El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas. Fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban en RAND en 1950. Albert W. Tucker formalizó el juego con la frase sobre las recompensas penitenciarias y le dio el nombre del "dilema del prisionero" (Poundstone, 1995). (es)
Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l'absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l'un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer. (fr)
Dilema tahanan (DT) adalah contoh kanonis dari sebuah permainan yang dianalisis dalam teori permainan yang memperlihatkan mengapa dua individu mungkin tidak akan bekerja sama, bahkan jika demi kebaikan mereka sendiri untuk melakukan hal tersebut.Ia diciptakan pada mulanya oleh dan yang bekerja di RAND pada tahun 1950. memformulasikan permainan tersebut dengan imbalan hukuman penjara dan menamakannya dengan "dilema tahanan" (Poundstone, 1992), seperti cerita berikut: (in)
The Prisoner's Dilemma is an example of a game analyzed in game theory. It is also a thought experiment that challenges two completely rational agents to a dilemma: cooperate with their partner for mutual reward, or betray their partner ("defect") for individual reward. The possible outcomes are: As a projection of rational behaviour in terms of loyalty to one's partner in crime, the Prisoner's Dilemma suggests that criminals who are offered a greater reward will betray their partner for the reward. (en)
Il dilemma del prigioniero è un gioco ad informazione completa proposto negli anni cinquanta del XX secolo da Albert Tucker come problema di teoria dei giochi. Oltre ad essere stato approfonditamente studiato in questo contesto, il "dilemma" è anche piuttosto noto al pubblico non tecnico come esempio di paradosso. Anche John Von Neumann, creatore della teoria dei giochi, si interessò a questo dilemma, presentatogli dai due ideatori mentre lavorava al RAND nel 1948. (it)
Dylemat więźnia – problem w teorii gier. Jest oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać, zdradzając przeciwnika, ale obaj stracą, jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę. W odróżnieniu jednak od dylematu kurczaków w tej grze istnieje większe pole do współpracy, które może zaistnieć w strategiach wielokrotnego dylematu więźnia. (pl)
O dilema do prisioneiro faz referência a um problema da teoria dos jogos, sendo um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em muitos outros, supõe-se que cada jogador, de forma independente, quer aumentar ao máximo a sua própria vantagem sem lhe importunar o resultado do outro jogador. (pt)
Диле́мма заключённого (англ. Prisoner's dilemma, реже употребляется название «дилемма банди́та») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована и в 1950 году. Название дилемме дал математик Альберт Такер. (ru)
У теорії ігор дилема в'язня (ДВ) — гра з , в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших. У дилемі в'язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду. (uk)

is dbo:wikiPageRedirects of