Spieltheorie: das [0,1] Spiel lösen

Hallo alle miteinander. Es geht um folgendes Spiel:
-2Spieler, jeder bekommt eine reelle Zahl zw. 0 und 1 ausgeteilt, wobei 0 die beste und 1 die schlechteste Zahl ist
-in der Mitte liegt ein Betrag P
-Spieler A kann dann einen Betrag X setzen (wichtig: bevor er seine zahlt ausgeteilt bekommt, muss er entscheiden wie groß dieser Betrag X wäre, dh. er kann seine Setzgröße nicht ändern jenachdem was er ausgeteilt bekommt) und Spieler B entscheidet ob er ihn bezahlt oder aussteigt, dann gewinnt Spieler A den Betrag P
-wenn nicht gesetzt wird, dann gewinnt der Spieler mit der niedrigeren Zahl den Betrag P

Wir wollen dieses Spiel nun lösen, sodass wenn beide Spieler die Strategie des anderen kennen, keiner von seiner eigenen Strategie abweichen kann/will ohne mehr zu verlieren. Der Graph zur Verteilung der beiden sieht wie folgt aus:
http://i.gyazo.com/37c0d49c2548f44e8c7ccde71a4d8c90.png

Klar ist, Spieler A will mit den besten seiner Zahlen setzen, damit Spieler B mit schlechteren bezahlt, dies tut B aber nur wenn A auch einige Zahlen "bluffed". Demnach sehen die Strategien wie folgt aus:
http://i.gyazo.com/28995a14f714cc00cdcf2792ff3a7504.png
wobei
-v alle Zahlen sind die A setzt damit schlechteres bezahlt
-c alle Zahlen sind die Spieler B bezahlt
-b alle "Bluffs" von A sind

Dieses Spiel lässt sich genau lösen, indem die Spieler sich mit ihren Strategien gegenseitig "indifferent" an den einzelnen Knoten machen, sodass
-A mit der Zahl v gleichgültig ist ob er setzt oder nicht
-B bei c gleichgültig ist ob er bezahlt oder nicht
-A bei b gleichgültig ist ob er bluffed oder nicht
(dh. beide Aktionen haben den gleichen Erwartungswert)

Man bekommt dann Gleichungen, die man lösen kann wenn man den Setzbetrag X einsetzt. Sei P=1, dann
b/2(X+1) = (1-b) + (1-b)/X
damit lösen wir nach b, dann
v = b/2(1+X)
und dann
C = 2v

Ich möchte jetzt bestimmen mit welchem Betrag X der Erwartungswert von A am höchsten ist.

Dafür muss ich eine Gleichung aufstellen für den Erwartungswert (die ich später ableiten und maximieren will). Ich vermute das geht irgendwie über das Integral, bin mir aber nicht sicher....
Kann mir dabei jemand helfen?

Ich hoffe ich habe alles genau genug erklärt, sonst fragt einfach

Vielen Dank schonmal.

Bashar

Könntest du das Spiel nochmal von vorne beschreiben? In welcher Reihenfolge wird gesetzt, ausgeteilt, wer gewinnt etc.

Also in der Mitte liegt Betrag P (hier =1).

A legt Betrag X fest
A und B erhalten reelle Zahl zw. 0 und 1 ausgeteilt (0 ist beste und 1 schlechteste, dh 0 gewinnt ggn. 1)
3.1) A setzt nichts
4.1) B darf nichts mehr machen, der Spieler mit der kleineren Zahl gewinnt P=1
3.2) A setzt Betrag X
4.2) B darf bezahlen oder nicht
5.2) bezahlt B, dann gewinnt der Spieler mit der geringeren Zahl P + die beiden Einsätze B, also P+2B
6.2) bezahlt B nicht, dann bekommt Spieler A den Betrag P in der Mitte

Hoffe das war nun verständlich.

C14

Kannst du auch noch die Aussage nach dem "klar ist" erklären?
Du meinst die optimale Menge der Zahlen für A bei denen A setzt sei von der Form [0,v1] \cup [v2,1]? Wieso ist das klar?

Deine Rechnung kann ich auch nicht nachvollziehen.
Meiner Meinung nach müsstest du von unten her an jedem Knoten den Erwartungswert für den jeweiligen Spieler maximieren.
Also zunächst gegeben X, v1, v2 und die gezogene Zahl von Spieler B =: b, den Erwarutnswert von Spieler B (= $\int \text{Gewinnn}_B(a,b,X) p(a) da$ wobei p(a) Gleichverteilung auf [0,v1] \cup [v2,1]) maximieren.
Dann weisst du was Spieler B in Abhängigkeit von X,v1,v2 und b spielt und kannst damit den Erwartungswert von Spieler A in Abhängigkeit von X,v1,v2 berechnen (mit Gleichverteilung auf [0,1] für b) und maximieren.

C14 schrieb:

Kannst du auch noch die Aussage nach dem "klar ist" erklären?
Du meinst die optimale Menge der Zahlen für A bei denen A setzt sei von der Form [0,v1] \cup [v2,1]? Wieso ist das klar?

Folgendermassen:
B will verhindern dass A ihn einfach immer "rausbluffed" und muss somit einen gewissen Teil seiner Zahlen "verteidigen". Dies führt dazu, dass A die besten seiner Zahlen setzen will, weil B schlechteres bezahlt.

B kennt aber A's Strategie und wird folglich niemals mit etwas bezahlen, was schlechter als die niedrigste Zahl ist die A setzt.
Damit A also von B bezahlt wird, nimmt er bluffs hinzu, dazu will er natürlich die Zahlen nehmen die am öftesten verlieren wenn NICHT gesetzt wird, also die schlechtesten Zahlen.
B bezahlt also oft genug damit A nicht einfach immer bluffen kann und P gewinnt, dies tut er mit den besten seiner Zahlen.
A hingegen teilt seine Verteilung auf in "noch bessere" Zahlen und Bluffs.

So nun verständlich?
Danke schonmal.

C14

Ok.
Wie gesagt musst du um das zu lösen von unten nach oben die optimale Strategie der Spieler (= maximaler Erwartungswert) gegeben die Strategie des anderen Spielers berechnen (siehe http://en.wikipedia.org/wiki/Backward_induction ).

Ich benutz mal folgende Notation:
v1,v2 für die Grenzen, ab denen Spieler A setzt (wie in meinem vorigen post), a,b für die gleichverteilten gezogenen Zahlen in [0,1] für Spieler A,B und P=1.

Also zunächst für Spieler B (gegeben a in M:=[0,v1]u[v2,1]) die Zahl c ausrechnen, ab der er mitspielt falls b>c ist.
Dazu den erwarteten Gewinn wenn er nicht mitspielt mit dem erwarteten Gewinn wenn er mitspielt gleichsetzen, d.h.
$0 = 1/(v1 + 1-v2) \int_M (c>a)(1+x) - (c\leq a)x \; da$
wobei (c>a) = 1 falls c>a und 0 sonst.
Um das auszurechnen brauchst du schon Fallunterscheidungen.
(ich seh nicht, wie du auf deine einfachen Gleichungen kommst)

Nehmen wir an du hast das c(v1,v2,x), dann schaust du dir damit den erwarteten Gewinn von Spieler A an:
\int_{M^c} \int_{[0,1]} (a>b) \; da \; db + \int\_M \left[ \int\_{[0,c]} 1 \; db + \int_{[c,1]} (a>b)(1+x) - (a\leq b)x \; db \right] \; da
und optimierst dann nach v1,v2 und x.
Geht aber imho nicht ohne nervige Fallunterscheidung.

ipsec

Ein Gedanke: die Wahrscheinlichkeit, dass A eine kleinere Zahl als B bekommt, ist 1/2. Da die eigentlichen Zahlen offenbar keine Rolle spielen, kann man damit das Ganze sicherlich vereinfachen.
Das basiert natürlich auf der Annahme, dass die beiden Zahlen unabhängig voneinander und gleichverteilt über dem Interval sind.

C14

ipsec schrieb:

Ein Gedanke: die Wahrscheinlichkeit, dass A eine kleinere Zahl als B bekommt, ist 1/2. Da die eigentlichen Zahlen offenbar keine Rolle spielen, kann man damit das Ganze sicherlich vereinfachen.
Das basiert natürlich auf der Annahme, dass die beiden Zahlen unabhängig voneinander und gleichverteilt über dem Interval sind.

Die eigentlichen Zahlen spielen eine Rolle, weil A und B je nach ihrer Zahl entweder mitspielen oder aussteigen.
Man muss also bedingte Wahrscheinlichkeiten ausrechnen, z.B. dafür dass A die kleinere Zahl als B hat, gegeben 0 < a < v1 oder v2 < a < 1 und b > c.
D.h. man schaut sich Rechtecke im a,b-Raum an und muss angeben, wieviel von ihnen überhalb/unterhalb der Diagonale liegt.
Das ist nicht besonders schwer (die Integrale im vorigen Post sind nur ne Art das kompakt hinzuschreiben), aber es geht eben nicht ohne nervige Fallunterscheidung.