Entscheidungstheorie: Ist das Gefangenendilemma lösbar?

Teilen

Immer wieder bewegt das zuerst von Paul Watzlawick in "Wie wirklich ist die Wirklichkeit? Wahn, Täuschung, Verstehen" (München, 1976) präsentierte sogenannte Gefangenendilemma die Gemüter, und die Frage nach seiner Lösbarkeit steht im Raum. Eine Lösung existiert, meint der Autor dieses Beitrages, und überläßt es dem Leser, die Validität der nachfolgend skizzierten Lösung und ihre Anwendbarkeit und Konsequenzen im wirtschaftlichen Bereich selbst zu beurteilen.

Das Problem

Paul Watzlawick beschrieb in dem oben angegeben Werk den folgenden Situationstyp, der nur auf den ersten Blick mit wirtschaftlichen Fragestellungen nichts zu tun hat, bei näherem Hinsehen für ökonomische Handlungsmuster im allgemeinen und betriebliche Probleme im besonderen sehr typisch ist. Watzlawick schreibt:

"Ein Staatsanwalt hält zwei Männer in Untersuchungshaft, die des Raubes verdächtigt sind. Die gegen die beiden vorliegenden Indizien reichen aber nicht aus, um den Fall vor Gericht zu bringen. Er läßt sich die beiden Gefangenen vorführen und teilt ihnen unverblümt mit, daß er zu ihrer Anklage ein Geständnis brauche. Ferner erklärt er ihnen, daß er sie dann, wenn beide den Raubüberfall leugnen, nur wegen illegalen Waffenbesitzes zur Anklage bringen kann und daß sie dafür schlimmstenfalls zu je sechs Monaten Gefängnis verurteilt werden könnten. Gestehen aber beide, so werde er dafür sorgen, daß sie nur das Mindestmaß für Raub, nämlich zwei Jahre Gefängnis bekommen. Wenn aber nur einer ein Geständnis ablegt, der andere aber weiterhin leugnet, so würde der Geständige damit zum Kronzeugen und ginge frei aus, während der andere das Höchststrafmaß, nämlich zwanzig Jahre, erhalten würde. Ohne ihnen die Möglichkeit zu einer gegenseitigen Aussprache zu geben, schickt er die Gefangenen in getrennte Zellen zurück und macht damit jede Kommunikation zwischen ihnen unmöglich."

Wir unterstellen beiden Gefangenen "wirtschaftliches" Verhalten. also Nutzenmaximierung. Jeder Gefangene wird also versuchen, die zu erwartende Haftstrafe zu minimieren, aber beim Versuch, das im Sinne dieses Zieles "richtige" Verhalten zu finden, in einen unlösbaren Widerspruch geraten:

  • Leugnen ist offensichtlich eine gute Strategie, denn sie verspricht nur 6 Monate Haft.
  • Gesteht dann der Andere, resultiert die Strategie "Leugnen" aber in 20 Jahren Gefängnis.
  • Gestehen bringt hingegen die Aussicht auf Freiheit als Kronzeuge, aber:
  • Gesteht der Andere, werden es zwei Jahre.
  • Leugnen also…

Der Situationstyp

Hier ist eine Lösung offensichtlich nicht möglich (oder jedenfalls ziemlich schwierig). Es handelt sich um ein Dilemma. Diese Situation ist gekennzeichnet durch

  1. die Abwesenheit von Kommunikation,
  2. einander entgegengesetzte Ziele,
  3. eine einmalige Entscheidung, die nicht reversibel ist und
  4. den Umstand, daß die getroffene Entscheidung immer für alle Beteiligten Konsequenzen hat.

Offensichtlich sind Situationen dieses Typs in der Wirtschaft häufig, wenn Wirtschaftsteilnehmer untereinander in Konkurrenz stehen. Kennzeichnendes Merkmal solcher spieltheoretischer Probleme ist immer ein Gedankengang des Typs "was denkt er daß ich von ihm denke daß er denkt…".

Zwei mögliche Lösungsansätze

Wie auch in der statistischen Entscheidungstheorie wird in der Spieltheorie versucht, Lösungen für Entscheidungsprobleme zu finden. Eine Lösung, die wiederholbar ist und bei Wiederholungen gleiche Ergebnisse erbringt, heißt dabei stabil; eine Lösung, die nur ein Mal (i.d.R. das erste Mal) funktioniert und bei Wiederholung ein anderes Ergebnis produziert, heißt instabil.
Die instabile (einmalige) Lösung: Steht der Torschütze am Elfmeterpunkt, und ist bereit, den Ball zu schießen, so liegt eine typische spieltheoretische Situation vor (auch wenn in dem Moment keiner darüber nachdenkt und Fußballer doch recht selten Philosophen sind):

  1. Torwart und Torschutze kommunizieren nicht miteinander,
  2. sie verfolgen einander entgegengesetzte Ziele (Tor schießen/Ball halten),
  3. die Entscheidung des Torschützen, in eine bestimmte Ecke des Tors zu schießen, ist ebenso eine einmalige Entscheidung wie die des Torwarts, in eine bestimmte Ecke zu springen, d.h., nach Schuß und Sprung können beide Entscheidungen nicht mehr revidiert werden und
  4. die getroffene Entscheidung hat Konsequenzen für beide Beteiligte (Mannschaften), d.h., ein Tor wird geschossen oder nicht und eine Mannschaft siegt die andere verliert.

Kann der Torwart das Verhalten des Torschützen richtig vorhersagen, so erreicht er sein Ziel; umgekehrt schießt der Torschütze das Tor, wenn er die Denkweise des Torwarts korrekt antizipiert und entsprechend entgegengesetzt handelt.
Der Torschütze kann immer sein Ziel erreichen, wenn er eine Beschränkung in der Denkweise des Torwarts findet. Geht beispielsweise der Torwart davon aus, daß der Torschütze auf jeden Fall in eine Ecke schießen werde, so kann der Torschütze genau ein Mal sicher ein Tor schießen, indem er den Ball in die Mitte des Tors, also genau auf den Torwart spielt, der aber aufgrund seiner Annahme in eine der Ecken des Tors springt, den Ball also nicht halten kann. Diese Lösung ist aber instabil, weil sie nur dieses eine Mal ein bestimmtes, vorhersagbares Ergebnis erbringt – das nächste Mal weiß der Torwart bescheid und könnte u.U. einfach in der Mitte stehenbleiben und den Ball fangen. Instabile Lösungen sind damit auf eine Art also ein "Regelbruch". Sie erweitern die möglichen Handlungsalternativen für künftige Entscheidungen.
Die stabile (endgültige) Lösung: Das Gefangenendilemma hingegen besitzt eindeutige Regeln, die nicht erweitert werden können. Eine instabile Lösung ist daher nicht möglich. Es handelt sich aber nur um ein Dilemma, solange man von individueller Nutzenoptimierung ausgeht. Eine eindeutige Lösung wird aber möglich, wenn der Kollektivnutzen (und nicht der Individualnutzen) maximiert wird. In diesem Sinne wäre beiderseitiges Leugnen mit der Gesamthaftstrafe von 1 Jahr die optimale Lösung des Gefangenenproblemes. Man spricht in diesem Fall von der Transzendierung der Regeln, d.h., die Regeln wurden nicht "gebrochen" (wie im Fußball-Beispiel), sondern verändert, insbesondere erweitert.

Watzlawick und die Moralphilosophen

Hier liegt nun der sprichwörtliche Hase im Pfeffer: eine Stabile Lösung ist kollektivistisch. Sie optimiert den Gesamtnutzen und stellt die seit "Wealth of Nations" gültige Egoismusannahme, die im Say'schen Theorem zu einer allgemeinen Grundlage der Staatstheorie wurde, gleichsam auf den Kopf: nicht mehr "Brot für die Welt, aber die Wurst bleibt hier", sondern kollektive Zusammenarbeit als siegreiche Strategie. Dies ist aber inhärent gefährlich, denn mit kollektivistischen Ideologien aller Art hat man schon so einige Erfahrungen gemacht, insbesondere aber nicht nur in Deutschland.

Die markttheoretische Bewertung

Es könnte jetzt diskutiert werden, ob Zusammenarbeit langfristig siegreich sein kann. Das ist meiner Ansicht nach der interessanteste und tiefgreifendste Punkt des Problems: Die Gefangenen können ihren Nutzen im betrachteten Modell nämlich nur dann eindeutig maximieren, wenn sie die Gesamthaftstrafe (und nicht die individuelle Haftzeit) als Optimierungskriterium definieren. Die Lösung erfordert also einen Sinneswandel, eine Veränderung der individuellen Denkmuster, und nicht nur ein neues Arbeitsverfahren. Das macht die Lösung schon in den engen theoretischen Grenzen des Modells "schwierig". Doch wie gut läßt sich das auf die reale Welt übertragen, wo die Spielregeln trotz der bekannten deutschen Überreglementierung auch des letzten Lebensbereiches viel schlechter ("unschärfer") definiert sind? Märkte funktionieren bekanntlich nur aufgrund des Egoismus, dessen unintendierter Kollektivnutzen zu den schönsten und in sich schlüssigsten Grundannahmen des marktwirtschaftlichen Modells gehört. Kann man diese Grundannahme ökonomischen Handelns ändern?

Das Oligopol als Modell

Es gibt ein Beispiel, in dem Zusammenarbeit auch nach traditionellen Entscheidungsmustern die rationale Verhaltensweise ist, und dieses ist das Oligopol. Unter den Bedingungen weniger Marktteilnehmer, d.h., nur so vieler, daß alle sich gegenseitig kennen und miteinander kommunizieren können, ist die gegenseitige Absprache nämlich die "siegreiche", d.h., nutzenmaximierende und aufwandsminimierende Verhaltensweise, also das Kartell. Im Kartell stimmen die Kartellteilnehmer ihr Verhalten so ab, daß ihr Gesamtnutzen maximiert wird, was bei Abwesenheit von Konkurrenz insgesamt optimal ist. Weicht die Nutzenpräferenzfunktion eines einzelnen Kartellteilnehmers aber zu sehr von der Gesamtnutzenfunktion ab, so kommt es zum Kartellbruch, also zum – nur ein einziges Mal wirksamen – Unterlaufen der Kartellregeln durch einen der Kartellteilnehmer, der sich damit zwar den nächsten Auftrag sichert, möglicherweise aber aus dem Kartell ausgeschlossen wirt. Das impliziert aber, daß Kartelle selbst schon nicht stabil sind, d.h., die Zusammenarbeit im Kartell keine spieltheoretisch stabile Lösung darstellt.

Weitere mögliche Anwendungsfelder

Es gibt zwei weitere Anwendungsfelder, die man vielleicht diskutieren könnte: Qualitätsmanagement und Lean Production. Das Qualitätsmanagement, jedenfalls in seiner über ISO hinausgehenden Erscheinungsform als Total Quality Management versucht, die Belohungs- und folglich auch die Bedürfnisstruktur der Mitarbeiter auf den Qualitätsbegriff eher als auf andere Karrierekriterien zu fixieren. Es ist daher im Kern ebenfalls kollektivistisch als es Gruppenarbeit und Kollektiverfolg vor individuelle Karriere und persönliche Einzelleistung stellt. Der Mißerfolg vieler TQM-Systeme, die von den Mitarbeitern eher als Belastung denn als Fortschritt empfunden werden, kann aber als Zeichen für die generelle Unmöglichkeit einer solchen "Umerziehung" verstanden werden. Ähnlich ist es im Lean Production Modell, das nicht, wie es häufig mißverstanden wird, im Kern nur "schlanke" Produktion anstrebt (dies ist eher ein Nebeneffekt), sondern eine Art Gemeinschaft zwischen Lieferanten, Produzenten und Kunden zu konstruieren sucht. Dies ermöglicht neue Formen des Outsourcing und überschreitet traditionelle Unternehmensgrenzen, weshalb das Modell, das übrigens häufig im Zusammenhang mit TQM auftgaucht, im Kern ebenso kollektivistisch strukturiert. Ich behaupte aber, daß beide Modelle gescheitert sind, das Qualitätsmanagement in seiner ganzheitlichen Form weil es in Bürokratie erstickt und den Umerziehungseffekt nicht schafft und Lean Production, weil es in der japanischen Kultur und Mentalität sowie im Buddhismus wurzelt, und beides hierher nicht ohne weiteres verpflanzt werden kann.

Was Bismarck uns zu sagen hat

"Man müsse die Menschen nehmen, wie sie seien", soll er gesagt haben, "bessere gäbe es nicht". Und genau das ist, worauf das Watzlawick'sche Gefangenendilemma hinausläuft: die Lösung erfordert, daß der Mensch sich ändert. Kann er dies, und wird er dies? Jedenfalls nicht unter Druck, denn alle, die das versucht haben, sind gescheitert: Stalin, Mao, Hitler, Pol Pot – sie alle hinterließen nur Leichen statt den neuen Menschen. Kann es aber eine grundsätzliche Änderung des Menschen (und damit eine über das enge Modell hinausweisende) Lösung des beschrieben Situationstyps geben, und wenn ja, unter welchen Bedingungen? Das ist, worüber im Forum für Betriebswirtschaft deskutiert werden könnte, und worüber ich nachdenke, und an dieser Stelle mehr schreibe, wenn mir was dazu einfällt, was bald der Fall sein könnte, oder auch nie…

Links zum Thema

Diskutieren Sie es im Forum für Betriebswirtschaft | Mein Skript zum Qualitätsmanagement (PDF-Datei, 455k)

Ähnliche Themen, die Ihnen gefallen könnten