Spezielle Wahrscheinlichkeitsverteilungen: die geometrische Verteilung

Die geometrische Verteilung wird verwendet, um Wartezeiten zu modellieren. Die grundlegenden Eigenschaften wie Erwartungswert, Varianz, Standardabweichung, die Verteilungsfunktion und insbesondere der Zusammenhang zur Binomialverteilung und die sogenannte Ged├Ąchtnislosigkeit werden besprochen.
Noch keine Stimmen abgegeben
Noch keine Kommentare

Einordnung des Artikels

Einf├╝hrung

Die geometrische Verteilung wurde schon in mehreren Kapiteln dieses Kurses verwendet, um spezielle Konzepte zu demonstrieren. Wegen ihrer Relevanz werden ihre Eigenschaften hier im Zusammenhang dargestellt. Diese "Relevanz" kann durch zwei Argumente begr├╝ndet werden:

  1. Die geometrische Verteilung besitzt Verwandtschaft mit zahlreichen anderen Verteilungen; hier wird nur die Verwandtschaft mit der Binomialverteilung diskutiert.
  2. Sie wird eingesetzt, um Wartezeiten zu modellieren. Auch dazu wird nur ein spezielles Beispiel besprochen: F├╝hrt man ein Gl├╝cksspiel unter gleichen Bedingungen mehrfach hintereinander aus, so kann man die "Wartezeit" bis zum ersten Gewinn mit der geometrischen Verteilung modellieren.

Als Eigenschaften der geometrischen Verteilung zum Parameter p werden besprochen:

  • Berechnung von Erwartungswert, Varianz und Standardabweichung,
  • Eindeutigkeit des Zusammenhangs von Erwartungswert beziehungsweise Standardabweichung und Parameter p,
  • Berechnung der Verteilungsfunktion,
  • Ged├Ąchtnislosigkeit.

Eigenschaften der geometrischen Reihe

Die Wahrscheinlichkeiten der geometrischen Verteilung bilden eine geometrische Folge, wobei in vielen Anwendungen die zugeh├Ârige geometrische Reihe ben├Âtigt wird. Die entsprechenden Definitionen und sp├Ąter n├Âtigen Aussagen sind in Abbildung 1 zusammengestellt.

Abbildung 1: Definition der endlichen und der unendlichen geometrischen Reihe.Abbildung 1: Definition der endlichen und der unendlichen geometrischen Reihe.

Die Definition der geometrischen Verteilung

Die Definition der geometrischen Verteilung ist in Abbildung 2 zu sehen. Man sagt eine Zufallsvariable X gehorcht der geometrischen Verteilung mit Parameter, wenn sie die Werte 1, 2, ... annehmen kann und die Wahrscheinlichkeiten P(X = i) nach Gleichung (1) berechnet werden. Oft wird die Schreibweise mit q = 1 - p aus Gleichung (2) bevorzugt.

Abbildung 2: Definition der geometrischen Verteilung mit Parameter p. Das Paradebeispiel f├╝r eine geometrische Verteilung erh├Ąlt man mit Hilfe der Zufallsvariable X, die angibt, nach wie vielen W├╝rfen zum ersten Mal eine 6 beim W├╝rfeln erscheint.Abbildung 2: Definition der geometrischen Verteilung mit Parameter p. Das Paradebeispiel f├╝r eine geometrische Verteilung erh├Ąlt man mit Hilfe der Zufallsvariable X, die angibt, nach wie vielen W├╝rfen zum ersten Mal eine 6 beim W├╝rfeln erscheint.

Achten Sie beim Umgang mit Literatur und Programm-Bibliotheken genau darauf, wie die geometrische Verteilung definiert ist. Die hier vorgestellte Variante ist nicht die einzig m├Âgliche Definition: Hier gibt die Zufallsvariable X die Anzahl der W├╝rfe an bis der erste Treffer erscheint. (Diese Interpretation wird im n├Ąchsten Abschnitt n├Ąher erl├Ąutert.) Oft wird die geometrische Verteilung als die Verteilung der Zufallsvariable Y definiert, die die Anzahl der Nieten angibt bis der erste Treffer erscheint. Die Zufallsvariable Y nimmt somit die Werte 0, 1, 2, ... an und es ist Y = 0, wenn X = 1 und so weiter. Diese Definition wird hier nicht verwendet.

Beispiel f├╝r eine Zufallsvariable mit geometrischer Verteilung

Das Paradebeispiel f├╝r eine Zufallsvariable X mit geometrischer Verteilung entsteht immer bei einem Gl├╝cksspiel, das unter identischen Bedingungen beliebig oft wiederholt wird. Bezeichnet man mit p die Gewinnwahrscheinlichkeit bei einem Spiel und mit q = 1 - p die Wahrscheinlichkeit f├╝r eine Niete, so gehorcht die Zufallsvariable X, die angibt, nach wie vielen Spielen zum ersten Mal ein Treffer erscheint, der geometrischen Verteilung (siehe Gleichung (3) in Abbildung 2; dort f├╝r die erste 6 beim W├╝rfeln).

Tritt der erste Treffer nach i Spielen ein, so m├╝ssen zuvor i-1 Nieten eingetreten sein und die Wahrscheinlichkeit P(X = i) wird durch

qi-1┬Ěp

berechnet, liefert also genau die geometrische Verteilung.

Verwechseln Sie das Ereignis "der erste Treffer tritt nach i Spielen ein" nicht mit dem Ereignis "innerhalb von i Spielen gibt es genau einen Treffer". Die Wahrscheinlichkeiten f├╝r dieses Ereignis sind die kumulierten Wahrscheinlichkeiten von X.

In Abbildung 2 sind f├╝r den Spezialfall eines Laplace-W├╝rfels einige Wahrscheinlichkeiten der geometrischen Verteilung berechnet. In Abbildung 3 links sind sie als Histogramm dargestellt.

Abbildung 3: Zwei Beispiele f├╝r geometrische Verteilungen. Links mit Parameter p = 1/6, rechts mit p = 1/2. Interpretieren kann man die Wahrscheinlichkeiten etwa mit dem ersten Auftreten einer 6 beim W├╝rfeln oder von Kopf beim M├╝nzwurf.Abbildung 3: Zwei Beispiele f├╝r geometrische Verteilungen. Links mit Parameter p = 1/6, rechts mit p = 1/2. Interpretieren kann man die Wahrscheinlichkeiten etwa mit dem ersten Auftreten einer 6 beim W├╝rfeln oder von Kopf beim M├╝nzwurf.

Zum Vergleich zeigt Abbildung 3 rechts die geometrische Verteilung zu p = 1/2, wie sie etwa beim entsprechenden M├╝nzwurf entsteht (die M├╝nze wird so lange geworfen bis zum ersten Mal Kopf erscheint). In beiden F├Ąllen werden die Wahrscheinlichkeiten bis P(X = i) f├╝r i =1, 2, ..., 12 berechnet; zum besseren Vergleich sind die y-Achsen identisch skaliert.

Eigenschaften der geometrischen Verteilung

Erwartungswert und Varianz

An Abbildung 3 kann man leicht den qualitativen Zusammenhang zwischen der Gewinn-Wahrscheinlichkeit p und dem Erwartungswert E (X) der Zufallsvariable X erraten: Bei einer hohen Gewinn-Wahrscheinlichkeit wird der erste Treffer sehr fr├╝h eintreten und der Erwartungswert ist sehr klein. Ist dagegen die Gewinn-Wahrscheinlichkeit p sehr klein, ben├Âtigt man mehr Versuche bis zum ersten Treffer.

Den quantitativen Zusammenhang zwischen p und dem Erwartungswert ╬╝ = E (X) kann man entweder durch die Berechnung des Erwartungswertes aus seiner Definition erhalten, wobei man Gleichung (4) aus Abbildung 1 ben├Âtigt. Oder man kann folgende einfache ├ťberlegung anstellen:

Der Erwartungswert ╬╝ kann nicht kleiner sein als 1. Man muss genau dann mehr als einmal w├╝rfeln, wenn im ersten Wurf kein Treffer erscheint ÔÇô die Wahrscheinlichkeit daf├╝r betr├Ągt 1 - p. Und jetzt kann man sich fragen: wie viele W├╝rfe wird man im Durchschnitt ausf├╝hren m├╝ssen, bis der erste Treffer erscheint? Da sich am W├╝rfel nichts ge├Ąndert hat, ist der Erwartungswert wiederum gleich ╬╝, womit man folgende Bestimmungsgleichung f├╝r ╬╝ aufgestellt hat:

╬╝ = 1 + (1 - p) ╬╝.

L├Âst man die Gleichung nach ╬╝ auf, erh├Ąlt man:

╬╝ = 1/p.

Aufgabe: Berechnen Sie den Erwartungswert der Zufallsvariable X (Anzahl der W├╝rfe, nach denen zum ersten Mal eine 6 erscheint) mit Hilfe der Definition des Erwartungswertes und Gleichung (4) aus Abbildung 1.

ÔÖŽ ÔÖŽ ÔÖŽ

Zur Berechnung der Varianz geht man ├Ąhnlich vor wie bei der Berechnung des Erwartungswertes aus dessen Definition. Die Rechnung wurde in Eigenschaften von Zufallsvariablen: Die Varianz und die Standardabweichung gezeigt und soll hier nicht wiederholt werden. Abbildung 4 zeigt lediglich das Ergebnis und in Abbildung 5 sind die geometrischen Verteilungen aus Abbildung 3 nochmals dargestellt, wobei jetzt jeweils Erwartungswert und Standardabweichung eingetragen sind.

Abbildung 4: Erwartungswert, Varianz und Standardabweichung der geometrischen Verteilung mit Parameter p.Abbildung 4: Erwartungswert, Varianz und Standardabweichung der geometrischen Verteilung mit Parameter p.

Abbildung 5: Darstellung der geometrischen Verteilungen zu den Parametern p = 1/6 und p = 1/2 wie in Abbildung 3; zus├Ątzlich eingetragen sind der Erwartungswert ╬╝ (rot) und ╬╝ ┬▒ ¤â (gr├╝n), wodurch die Standardabweichung erkennbar ist.Abbildung 5: Darstellung der geometrischen Verteilungen zu den Parametern p = 1/6 und p = 1/2 wie in Abbildung 3; zus├Ątzlich eingetragen sind der Erwartungswert ╬╝ (rot) und ╬╝ ┬▒ ¤â (gr├╝n), wodurch die Standardabweichung erkennbar ist.

Aufgabe: Berechnen Sie den Erwartungswert von X2 einer Zufallsvariable X, die der geometrischen Verteilung mit Parameter p gehorcht.

Rekonstruktion der Verteilung aus dem Erwartungswert beziehungsweise der Standardabweichung

In Abbildung 4 Gleichung (3) und (4) wurden der Erwartungswert und die Standardabweichung einer geometrisch verteilten Zufallsvariable X mit Parameter p berechnet. Liest man die jeweils rechte Seite der Gleichungen als Funktion von p, so ist dies eine eindeutige Funktion von p.

Mit anderen Worten: Ist von einer Zufallsvariable X bekannt, dass sie geometrisch verteilt ist und kennt man entweder ihren Erwartungswert oder ihre Standardabweichung, dann kann man daraus den Parameter p eindeutig berechnen.

Dazu muss man entweder ╬╝ = 1/p oder ¤â2 = (1-p)/p2 nach p aufl├Âsen.

In Abbildung 6 werden der Erwartungswert (rot) und die Standardabweichung (gr├╝n) als Funktion von p aufgetragen. An der Monotonie der beiden Funktionen erkennt man die Eindeutigkeit von p.

Geht p gegen null, so gehen Erwartungswert und Standardabweichung gegen unendlich. Der Grenzfall p Ôćĺ 1 bedeutet ÔÇô in der bisher verwendeten Interpretation der geometrischen Verteilung ÔÇô, dass bereits im ersten Spiel ein Gewinn eintreten muss und somit P(X = i) = 0 f├╝r i = 2, 3, ... Daher ist der Erwartungswert gleich 1 und die Standardabweichung gleich null.

Abbildung 6: Erwartungswert (rot) und Standardabweichung (gr├╝n) der geometrischen Verteilung als Funktion des Parameters p.Abbildung 6: Erwartungswert (rot) und Standardabweichung (gr├╝n) der geometrischen Verteilung als Funktion des Parameters p.

Aufgabe: Geben Sie die Formel an, wie der Parameter aus einem gegebenen ¤â berechnet wird. Warum ist die L├Âsung eindeutig?

Die Verteilungsfunktion der geometrischen Verteilung

Bisher wurden zu der geometrisch verteilten Zufallsvariable X die Wahrscheinlichkeiten P(X = i) mit i = 1, 2, ... angegeben. Die Verteilungsfunktion F(x) der Zufallsvariable X berechnet die Wahrscheinlichkeiten:

F(x) = P(X ÔëĄ x), wobei x eine beliebige relle Zahl sein kann.

Dazu sollte man sich ÔÇô in der Interpretation der geometrischen Verteilung mit einem Gl├╝cksspiel mit Gewinn-Wahrscheinlichkeit p ÔÇô die Bedeutung der folgenden Gr├Â├čen klarmachen:

  • P(X = i) steht f├╝r die Wahrscheinlichkeit daf├╝r, dass genau beim i-ten Spiel der erste Treffer eintritt.
  • P(X ÔëĄ i) steht f├╝r die Wahrscheinlichkeit daf├╝r, dass innerhalb der ersten i Spiele der erste Treffer eintritt. Daher ist P(X ÔëĄ i) = P(X = 1) + P(X = 2) + ... + P(X = i).
  • P(X > i) steht f├╝r die Wahrscheinlichkeit daf├╝r, dass der erste Treffer nicht innerhalb der ersten i Spiele eintritt. Daher ist P(X > i) = 1 - P(X ÔëĄ i).

Da die Wahrscheinlichkeiten P(X = i) eine geometrische Folge bilden, lassen sich die Wahrscheinlichkeiten P(X ÔëĄ i) und P(X > i) leicht berechnen, siehe Abbildung 7.

Abbildung 7: Ausdr├╝ckliche Berechnung der Wahrscheinlichkeiten P(X = i), P(X ÔëĄ i) und P(X > i) f├╝r die geometrische Verteilung mit Parameter p.Abbildung 7: Ausdr├╝ckliche Berechnung der Wahrscheinlichkeiten P(X = i), P(X ÔëĄ i) und P(X > i) f├╝r die geometrische Verteilung mit Parameter p.

In Abbildung 8 sind die Verteilungsfunktionen der Zufallsvariable X mit den Parametern p = 1/6 (links, W├╝rfel) und p = 1/2 (rechts, M├╝nze) dargestellt. Zum besseren Vergleich mit Abbildung 5 sind wieder der Erwartungswert und die Standardabweichung eingetragen.

Abbildung 8: Darstellung der Verteilungsfunktion F(x) f├╝r die Verteilungen aus Abbildung 3 beziehungsweise 5.Abbildung 8: Darstellung der Verteilungsfunktion F(x) f├╝r die Verteilungen aus Abbildung 3 beziehungsweise 5.

Die Ged├Ąchtnislosigkeit der geometrischen Verteilung

Das Argument, das oben verwendet wurde, um den Erwartungswert der geometrischen Verteilung zu berechnen, mag aus mehreren Gr├╝nden befremden:

  • Zur Berechnung des Erwartungswertes muss eigentlich eine unendliche Summe ausgewertet werden, hier wird aber ein Ansatz mit nur zwei Summanden verwendet.
  • Beruht das Argument ├╝berhaupt darauf, dass es sich um eine geometrische Verteilung handelt?
  • Kann man ein derartiges Argument f├╝r jede Erwartungswert-Berechnung einsetzen?

Man sollte diesen Fragen ernsthaft nachgehen, denn sie f├╝hren zu einem besseren Verst├Ąndnis der Besonderheit der geometrischen Verteilung ÔÇô diese Besonderheit wird meist als die Ged├Ąchtnislosigkeit der geometrischen Verteilung bezeichnet.

Um diese Eigenschaft zu erkl├Ąren, werde mit X wieder eine Zufallsvariable bezeichnet, die angibt, wann der erste Treffer bei einem Gl├╝cksspiel eintritt; die Spiele werden wieder unabh├Ąngig voneinander durchgef├╝hrt und die Gewinn-Wahrscheinlichkeit ist jeweils p, 0 < p < 1.

Man kann jetzt folgende Fragen stellen:

  1. Es wurden bereits n Spiele durchgef├╝hrt und verloren. Wie gro├č ist die Wahrscheinlichkeit daf├╝r, dass ein weiteres Spiel verloren wird?
  2. Oder etwas allgemeiner: Es wurden bereits n Spiele durchgef├╝hrt und verloren. Wie gro├č ist die Wahrscheinlichkeit daf├╝r, dass k weitere Spiele verloren werden?

Formuliert man diese Fragen mit Hilfe der Zufallsvariable X, so ist hier nach einer bedingten Wahrscheinlichkeit gefragt, n├Ąmlich:

  1. P(X > n+1 | X > n) und
  2. P(X > n+k | X > n).

Da die Spiele unabh├Ąngig voneinander durchgef├╝hrt werden und "der Zufall kein Ged├Ąchtnis hat", liegt nach n verlorenen Spielen keine andere Situation vor als zu Beginn des Spiels und somit gilt:

  1. P(X > n+1 | X > n) = P(X > 1) und
  2. P(X > n+k | X > n) = P(X > k),

wobei man f├╝r n und k beliebige ganze Zahlen k, n = 1, 2, ... einsetzen kann.

Dass diese Eigenschaft keine Selbstverst├Ąndlichkeit ist, kann man durch das folgende Gegenbeispiel zeigen:

In einer Urne befinden sich 6 Kugeln mit der Aufschrift 1, 2, ..., 6. Es wird eine Kugel gezogen und die Kugel wird anschlie├čend nicht wieder in die Urne gelegt. Der Spieler gewinnt, wenn eine 6 gezogen wird. (Wird das Spiel mit Zur├╝cklegen ausgef├╝hrt, ist es gleichwertig zum W├╝rfeln.)

Jetzt ist schon f├╝r n = 1 obige Eigenschaft der Ged├Ąchtnislosigkeit verletzt. Denn im ersten Spiel betr├Ągt die Wahrscheinlichkeit f├╝r einen Verlust noch 5/6. Wurde das erste Spiel verloren, befinden sich noch 5 Kugeln in der Urne, von denen 4 nicht mit 6 beschriftet sind. Die Wahrscheinlichkeit f├╝r einen weiteren Verlust ist somit 4/5 und damit etwas kleiner als 5/6. Und f├╝r gr├Â├čere n werden diese Wahrscheinlichkeiten immer kleiner.

Aufgabe: Dr├╝cken Sie die oben gesuchten Wahrscheinlichkeiten P(X > n+1 | X > n) und P(X > n+k | X > n) mit Hilfe von p und q aus (q = 1-p).