Wartezeitprobleme beim Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen

Es werden die Wartezeitprobleme bei den beiden Zufallsexperimenten Ziehen mit Zurücklegen beziehungsweise Ziehen ohne Zurücklegen untersucht. Bei diesen Zufallsexperimenten befinden sich in einer Urne Treffer und Nieten. Mit Wartezeitproblem ist gemeint, dass man eine Zufallsvariable definiert, die angibt nach wie vielen Zügen der r-te Treffer aus der Urne entnommen wird. Zur Vorbereitung werden die Zusammenhänge zwischen Binomialverteilung, geometrischer Verteilung und hyper-geometrischer Verteilung gezeigt.

walter

03 Dez. 2022

geometrische Verteilung hyper-geometrische Verteilung Ziehen mit Zurücklegen Ziehen ohne Zurücklegen Wartezeit Binomialkoeffizient Baumdiagramm Wahrscheinlichkeitsverteilung

Inhaltsverzeichnis

Einordnung des Artikels

Ausgewählte Kapitel der Mathematik (für Programmierer, Informatiker, Ingenieure und Naturwissenschaftler)
- Wahrscheinlichkeitsrechnung
  - Spezielle Wahrscheinlichkeitsverteilungen
    - Spezielle Wahrscheinlichkeitsverteilungen: die geometrische Verteilung
    - Spezielle Wahrscheinlichkeitsverteilungen: Lösung von Wartezeitproblemen mit Hilfe der geometrischen Verteilung
    - Spezielle Wahrscheinlichkeitsverteilungen: die hypergeometrische Verteilung
    - Wartezeitprobleme beim Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen
    - Interpretation der Zufallsexperimente Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen durch Pfade auf einem Gitter

Die geometrische und die hyper-geometrische Verteilung werden hier verwendet, aber nicht erläutert. Zum besseren Verständnis der hier behandelten Fragestellungen ist es hilfreich, den Zusammenhang zwischen der geometrischen Verteilung und den Wartezeitproblemen zu kennen.

Weitere Diskussionen und Graphiken zu den Wartezeitproblemen finden sich in Interpretation der Zufallsexperimente Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen durch Pfade auf einem Gitter.

Einführung

Die Binomialverteilung entsteht zum Beispiel dann, wenn das Zufallsexperiment "Ziehen mit Zurücklegen" betrachtet wird und aus einer Urne Treffer (mit Wahrscheinlichkeit p) beziehungsweise Nieten (mit Wahrscheinlichkeit q = 1 - p) gezogen werden. Fragt nach der Wartezeit bis zum ersten Treffer, entsteht die geometrische Verteilung. Die Frage nach der Wartezeit kann sofort verallgemeinert werden: nach wie vielen Zügen wird der r-te Treffer gezogen? Die zugehörige Verteilung kann zum Beispiel durch r-fache Faltung der geometrischen Verteilung berechnet werden.

Die entsprechenden Fragestellungen kann man auf das "Ziehen ohne Zurücklegen" übertragen. Dabei ist zu beachten, dass mit der hyper-geometrischen Verteilung nicht das Analogon der geometrischen Verteilung gemeint ist. Diese Zusammenhänge werden geklärt und die entsprechenden Verteilungen berechnet.

Zuletzt werden die Verteilungen der Wartezeiten auf eine Form gebracht, in der man sie leichter vergleichen kann.

Die Binomialverteilung und die geometrische Verteilung

Bezeichnungen

Eine Urne enthalte M = K + L Lose, von denen K Nieten und L Treffer sind.
Es werden N Lose mit Zurücklegen gezogen.
Mit p und q werden die Treffer– und Nieten–Wahrscheinlichkeit bezeichnet: p = L/M, q = K/M.

Abbildung 1: In einer Urne befinden sich rote und blaue Kugeln, man kann sich auch einen Lostopf mit Nieten (0) und Treffern (1) vorstellen. Aus dem Lostopf werden nacheinander N Lose mit Zurücklegen gezogen. Dadurch liegt bei jedem Zug die identische Ausgangssituation vor und die Trefferwahrscheinlichkeit p ändert sich nicht. Später wird das Zufallsexperiment "Ziehen ohne Zurücklegen" betrachtet; dann hängen die Wahrscheinlichkeiten für Treffer und Niete von den Ergebnissen der vorangegangenen Ziehungen ab.

Die Binomialverteilung

Ein Zufallsexperiment wie das soeben beschriebene "Ziehen mit Zurücklegen" wird N-mal unabhängig voneinander durchgeführt, wobei die Trefferwahrscheinlichkeit gleich p ist. Die Zufallsvariable X soll die Anzahl der Treffer bei N Ziehungen angeben. Dann ist X binomialverteilt, siehe Gleichung (1) in Abbildung 2 (man sagt auch: X gehorcht der Binomialverteilung). Der Term in (1) ist leicht zu verstehen:

Werden bei N Ziehungen genau n Treffer gezogen, so beschreibt pⁿ q^{N - n} die Wahrscheinlichkeit dafür, dass die n Treffer und N-n Nieten in einer speziellen Reihenfolge gezogen werden.
Der Binomialkoeffizient "n aus N" beschreibt die Anzahl der möglichen Anordnungen der n Treffer und N-n Nieten in der gesamten Folge von N Ergebnissen.

Abbildung 2: Die Binomialverteilung, die geometrische Verteilung und die hyper-geometrische Verteilung.

Die geometrische Verteilung

Wird das "Ziehen mit Zurücklegen" mit Trefferwahrscheinlichkeit p beliebig oft durchgeführt, und beschreibt die Zufallsvariable W₁ die Wartezeit bis zum Eintreten des ersten Treffers, so ist W₁ geometrisch verteilt mit Parameter p, siehe Gleichung (2) in Abbildung 2.

Tritt der erste Treffer bereits beim ersten Zug ein, also n = 1, so ist die Wahrscheinlichkeit dafür gleich p.
Tritt der erste Treffer erst beim zweiten Zug ein, also n = 2, so muss im ersten Zug eine Niete gezogen worden sein und der Treffer im zweiten Zug; somit beträgt die Wahrscheinlichkeit pq.
Allgemein: Tritt der erste Treffer beim n–ten Zug ein, so müssen zuvor n − 1 Nieten gezogen worden sein.

Die hypergeometrische Verteilung

Die hypergeometrische Verteilung ist relevant beim "Ziehen ohne Zurücklegen", das heißt es wird die Urne (wie oben beschrieben) betrachtet, aber die Lose werden nicht in die Urne zurückgelegt.

Die Bezeichnung "hypergeometrische Verteilung" ist womöglich verwirrend, da man erwarten könnte, dass die analoge Problemstellung wie bei der geometrischen Verteilung betrachtet wird, also das Wartezeitproblem beim "Ziehen ohne Zurücklegen". Das ist aber falsch!

Stattdessen wird als die hypergeometrische Verteilung die Verteilung der Zufallsvariable Y_{K, L, N} bezeichnet, die angibt, wie viele Treffer beim Ziehen ohne Zurücklegen aus der Urne gezogen werden. Die Indizes K, L, N geben die Anzahl der Nieten beziehungsweise Treffer sowie die Anzahl der Züge an. Berechnet wird die hypergeometrische Verteilung nach Gleichung (3) in Abbildung 2.

Wenn man davon ausgeht, dass jede Realisierung einer Zugfolge mit n Treffern und N − n Nieten die gleiche Wahrscheinlichkeit besitzt, so ist Gleichung (3) leicht zu verstehen:

Die Anzahl der möglichen Zugfolgen wird durch den Binomialkoeffizienten "N aus (K+L)" berechnet (Auswahl der N Lose aus allen K + L Losen).
Die n Treffer müssen aus den L Treffern gewählt werden, die N − n Nieten aus den K Nieten.

Warum sind alle Realisierungen gleich wahrscheinlich? Das macht man sich am Einfachsten am Baumdiagramm klar: Bei jedem Zug verändern sich die Wahrscheinlichkeiten dafür, dass im nächsten Zug ein Treffer beziehungsweise eine Niete gezogen wird (da die Urne jetzt neu bestückt ist). Allerdings werden bei n Treffern in N Zügen stets gleichen Produkte von Wahrscheinlichkeiten erzeugt, da immer im Nenner (Anzahl der Lose in der Urne) die Zahl um eins verringert wird, und im Zähler die Anzahl der Treffer beziehungsweise Nieten um eins verringert wird. Somit hat jeder Pfad im Baumdiagramm bei n Treffern in N Zügen die gleiche Wahrscheinlichkeit.

Abbildung 3 zeigt das Baumdiagramm zu K = 3 Nieten (hier symbolisiert durch 0) und L = 2 Treffern (symbolisiert durch 1), das man zu gegebenem N wie soeben beschrieben auswerten kann. Die Anzahl der Züge N entspricht der Länge der Dualzahlen, die ein Ergebnis repräsentieren.

Dies soll als Andeutung genügen, um Gleichung (3) in Abbildung 2 plausibel zu machen; ausführlich diskutiert wurde die Berechnung der hypergeometrischen Verteilung in Spezielle Wahrscheinlichkeitsverteilungen: die hypergeometrische Verteilung.

Abbildung 3: Darstellung der Ergebnisse beim Ziehen ohne Zurücklegen als Baumdiagramm. In der Urne befinden sich anfangs K = 3 Nieten und L = 2 Treffer. Jede Ebene (N = 1, 2, ..., 5) zeigt alle möglichen Ergebnisse bei N Ziehungen. Da man aus den Ergebnissen ablesen kann, welche Lose sich noch in der Urne befinden, kann man das Baumdiagramm leicht auswerten und die Wahrscheinlichkeiten aller möglichen Ergebnisse berechnen. Ergebnisse mit gleicher Anzahl von Treffern sind mit gleicher Farbe gekennzeichnet.

Das Wartezeitproblem beim Ziehen mit Zurücklegen

Oben wurde als Wartezeitproblem die Frage formuliert, nach wie vielen Zügen der erste Treffer eintritt. Die Anzahl kann die Werte n = 1, 2, ... annehmen. Die entsprechende Zufallsvariable wurde mit W₁ bezeichnet. Die Wahrscheinlichkeiten P(W₁ = n) stimmen mit der geometrischen Verteilung zum Parameter p überein.

Man kann das Wartezeitproblem verallgemeinern, indem man nicht fragt:

"Nach wie vielen Zügen tritt der erste Treffer ein?"

sondern fragt:

"Nach wie vielen Zügen tritt der r-te Treffer ein, r = 1, 2, ...?"

Die Zufallsvariable, die die Anzahl der Ziehungen bis zum r–ten Treffer beschreibt, wird mit W_r bezeichnet. Da man jetzt r–mal oder öfter ziehen muss, kann W_r die Werte n = r, r+1, ... annehmen. Für die Wahrscheinlichkeiten gilt Gleichung (1) in Abbildung 4.

Dass diese Wahrscheinlichkeiten derart berechnet werden, ist leicht einzusehen: Jede Zugfolge muss aus r Treffern und n − r Nieten bestehen, wobei im letzten Zug (dem n–ten Zug) ein Treffer eintritt (andernfalls wären die r Treffer bereits früher eingetreten):

Der Term p^rq^n − r beschreibt die Wahrscheinlichkeit für eine derartige Realisierung.
Der Binomialkoeffizient gibt die Anzahl der möglichen Realisierungen an.

Abbildung 4: Verallgemeinert man das Wartezeitproblem zur Frage nach dem Eintreten des r-ten Treffers, so ergibt sich beim Ziehen mit Zurücklegen eine Zufallsvariable W_r mit der Verteilung nach Gleichung (1). Später wird die fallende Faktorielle benötigt, die in Gleichung (2) definiert wird.

Das Wartezeitproblem beim Ziehen ohne Zurücklegen

Vorgehensweise

Ganz analog kann man jetzt beim "Ziehen ohne Zurücklegen" die Zufallsvariable Y_r definieren, die angibt nach wie vielen Ziehungen der r-te Treffer eintritt. Die Zufallsvariable Y_r kann die Werte n = r, r+1, ..., K+r annehmen, denn die Urne enthält nur K Nieten und daher muss nach K+r Ziehungen der r-te Treffer eingetreten sein.

Zur Berechnung der Verteilung der Zufallsvariable Y_r dient folgende Überlegung:

Man betrachtet das Zufallsexperiment, bei dem alle Lose aus der Urne gezogen werden.
Es gibt insgesamt "L aus K+L" mögliche Ergebnisse (die L Treffer können K + L Stellen im Ergebnis belegen).
Jedes dieser Ergebnisse besitzt die gleiche Wahrscheinlichkeit. (Man kann dies leicht am Baumdiagramm Abbildung 3 nachvollziehen.)
Damit kann man berechnen, welche Wahrscheinlichkeit ein Ergebnis besitzt, bei dem nicht alle Lose aus der Urne gezogen wurden, sondern lediglich n mit n < K + L.
Ist für die ersten n Ziehungen bekannt, welche Lose gezogen wurden (Treffer beziehungsweise Nieten), so kann dieses Ergebnis einfach durch beliebige Ergebnisse ergänzt werden (beliebig heißt mit Wahrscheinlichkeit 1) bis die Länge gleich K + L ist.

Die Berechnung der Verteilung für das Wartezeitproblem beim "Ziehen ohne Zurücklegen"

Für die zuletzt definierte Zufallsvariable Y_r soll die Verteilung berechnet werden, also die Wahrscheinlichkeiten P (Y_r = n). Dies wird auf zwei Arten geschehen:

Durch Auswertung des Zufallsexperimentes "Ziehen ohne Zurücklegen" und Berechnung der Wahrscheinlichkeiten für die Züge.
Durch Abzählen der relevanten Ergebnisse.

1. Auswertung des Zufallsexperimentes "Ziehen ohne Zurücklegen":

Wenn nach n Zügen der r-te Treffer eintritt, dann muss ein Ergebnis beim Ziehen aller Lose aus der Urne folgendermaßen aussehen:

Zuerst werden r-1 Treffer gezogen.
Anschließend werden n-r Nieten gezogen.
Im n-ten Zug muss ein Treffer erscheinen.
Anschließend werden die Lose in beliebiger Reihenfolge gezogen bis die Urne leer ist.

Die Ergebnisse der ersten n-1 Züge können in beliebiger Reihenfolge stattfinden, wofür es "(r-1) aus (n-1)" Möglichkeiten gibt (die r-1 Treffer werden innerhalb der n-1 Züge beliebig angeordnet).

Die Wahrscheinlichkeit der angegebenen speziellen Realisierung kann leicht mit Hilfe der fallenden Faktoriellen ausgedrückt werden: Bei jedem Zug eines Treffers (beziehungsweise einer Niete) werden die Anzahl der Treffer (beziehungsweise der Nieten) sowie die Anzahl der insgesamt vorhandenen Lose um 1 heruntergezählt. Da im letzten Zug ein Treffer gezogen werden muss, erhält man für die Wahrscheinlichkeit dieser speziellen Realisierung Gleichung (1) in Abbildung 5.

Multipliziert man jetzt mit der Anzahl gleichwertiger Realisierungen, so erhält man Gleichung (2) in Abbildung 5.

Abbildung 5: 2 Möglichkeiten, die Wahrscheinlichkeiten zu berechnen: Oben durch Auswertung des Baumdiagramms, wobei zu beachten ist, dass sich bei jedem Zug die Anzahl der Nieten beziehungsweise Treffer in der Urne verändert. Unten durch Abzählen der möglichen Ergebnisse.

2. Berechnung durch Abzählen der Ergebnisse des Zufallsexperimentes "Ziehen ohne Zurücklegen":

Es werden alle Ergebnisse gezählt, bei denen

Die Urne vollständig geleert wird.
Die ersten n Züge genau r Treffer und n-r Nieten enthalten, wobei im letzten Zug (n-ten Zug) ein Treffer erscheinen muss.
Für die weiteren K + L - n Züge befinden sich jetzt L - r Treffer und K - (n - r) Nieten in der Urne. Hierfür werden beliebige Ergebnisse zugelassen.

Die Anzahl der Möglichkeiten für die ersten n Züge berechnet sich nach Gleichung (3) in Abbildung 5; für die weiteren K + L - n Züge beschreibt Gleichung (4) die Anzahl der Möglichkeiten.

Für die erste Gruppe gibt es (Argumentation wie oben) genau "(r-1) aus (n-1)" Möglichkeiten. Für die zweite Gruppe wird die Anzahl der Möglichkeiten analog mit Hilfe der Binomialkoeffizienten ausgedrückt, man erhält Gleichung (4) in Abbildung 5.

Um daraus eine Wahrscheinlichkeit zu berechnen, werden die beiden Anzahlen miteinander multipliziert (die Möglichkeiten können unabhängig voneinander gewählt werden) und anschließend durch die Gesamtzahl der Möglichkeiten dividiert, siehe Gleichung (5) in Abbildung 5.

Aufgabe: Eliminieren Sie in Gleichung (2) und (5) in Abbildung 5 die fallenden Faktoriellen beziehungsweise die Binomialkoeffizienten und zeigen Sie, dass die beiden Terme identisch sind.

Beispiel zur Berechnung der Verteilung der Wartezeiten

Für die Urne aus Abbildung 1 mit K = 3 Nieten und L = 2 Treffern sollen jetzt die Verteilungen der Wartezeiten (für die Zufallsexperimente "Ziehen mit Zurücklegen" und "Ziehen ohne Zurücklegen") berechnet werden.

Beim "Ziehen mit Zurücklegen" wird die Zufallsvariable W_r betrachtet, wobei r = 1, 2, ... beliebige Werte annehmen kann.

Dagegen sind beim "Ziehen ohne Zurücklegen" für die Zufallsvariable Y_r lediglich die beiden Werte r = 1 und r = 2 möglich.

Ziehen mit Zurücklegen

Die Verteilung der Zufallsvariable W_r berechnet sich mit Gleichung (1) in Abbildung 4, wobei p = 2/5 und q = 1 - p = 3/5 ist.

Für r = 1 erhält man für W₁ die geometrische Verteilung nach Gleichung (1) in Abbildung 6 (der Binomialkoeffizient aus Gleichung (1) in Abbildung 4 ist jetzt gleich null). Die Wartezeit kann somit beliebige Werte n = 1, 2, ... annehmen und die entsprechenden Wahrscheinlichkeiten nehmen exponentiell ab (siehe Abbildung 7 links oben).

Für r = 2 ist es nicht mehr klar, wie sich die Wahrscheinlichkeiten der Wartezeiten qualitativ verhalten. Der Binomialkoeffizient liefert jetzt einen Term, der mit n anwächst, die von p und q abhängigen Terme fallen wieder exponentiell mit n ab. Demnach ist zu erwarten, dass die Wahrscheinlichkeiten P(W₂ = n) ein Maximum besitzen (siehe Abbildung 7 rechts oben).

Damit kann man leicht verstehen, wie sich die Verteilungen für größere Werte von r qualitativ verhalten (siehe Abbildung 7 unten für r = 3 und r = 4).

Abbildung 6: Verteilung der Zufallsvariable W<sub>r</sub> beim "Ziehen mit Zurücklegen" für r = 1, 2, 3, 4.

Abbildung 6: Verteilung der Zufallsvariable W_r beim "Ziehen mit Zurücklegen" für r = 1, 2, 3, 4.

Abbildung 7: Graphische Darstellung der Verteilung der Zufallsvariable W<sub>r</sub> beim "Ziehen mit Zurücklegen" für r = 1, 2, 3, 4. Blau eingetragen sind Erwartungswert und Standardabweichung der Verteilung.

Abbildung 7: Graphische Darstellung der Verteilung der Zufallsvariable W_r beim "Ziehen mit Zurücklegen" für r = 1, 2, 3, 4. Blau eingetragen sind Erwartungswert und Standardabweichung der Verteilung.

Aufgaben:

1. In Spezielle Wahrscheinlichkeitsverteilungen: Lösung von Wartezeitproblemen mit Hilfe der geometrischen Verteilung wurde gezeigt, wie Erwartungswert und Standardabweichung für die Verteilung der Wartezeiten W_r (für beliebiges r) berechnet wird; sie sind in Abbildung 7 eingetragen. Berechnen Sie die Werte explizit für r = 1, 2, 3, 4.

2. In Abbildung 7 wurde als Trefferwahrscheinlichkeit p = 2/5 verwendet. Diskutieren Sie qualitativ, wie sich die Verteilungen verändern, wenn p einen kleineren Wert annimmt.

Ziehen ohne Zurücklegen

Da die Urne nur L = 2 Treffer enthält, kann r lediglich die Werte r = 1 und r = 2 annehmen. Für diese Werte soll nun die Verteilung der Wartezeiten Y_r berechnet werden. Dazu sollen beide Arten der Berechnung erläutert werden, die in Abbildung 5 gezeigt wurden. Hilfreich ist dazu auch das Baumdiagramm in Abbildung 3.

In Abbildung 5 wurde zuerst gezeigt, wie man die gesuchten Wahrscheinlichkeiten berechnet, indem man das Zufallsexperiment auswertet, also man nach jedem Zug die Wahrscheinlichkeiten neu berechnet. Diese Vorgehensweise wird in Abbildung 8 gezeigt. Die Berechnung nach der zweiten Methode (Abzählen der Ergebnisse) wird dann in Abbildung 10 gezeigt.

1. Fall: r = 1

1.1 Auswertung des Zufallsexperimentes

Es müssen entweder "keine Niete" (bei n = 1) oder "n-1 Nieten" (bei n > 1) gezogen werden; aber mehr als drei Nieten sind nicht möglich. Die entsprechenden Wahrscheinlichkeiten P(Y₁ = n) für n = 1, 2, 3, 4 erhält man nach den Gleichungen (1- 4) in Abbildung 8. Um die Berechnungen leichter nachzuvollziehen, werden die Wahrscheinlichkeiten fett gedruckt, wenn ein Treffer gezogen wird. Man kann sich diese Berechnungen leicht am Baumdiagramm Abbildung 3 veranschaulichen, wenn man beachtet, dass nach jedem Zug die Urne anders bestückt ist.

Als Histogramm wird die Verteilung von Y₁ in Abbildung 9 links dargestellt.

Abbildung 8: Berechnung der Verteilung der Wartezeit durch Berechnung der Wahrscheinlichkeiten. Dabei ist zu beachten, dass sich nach jedem Zug die Wahrscheinlichkeiten verändern, da sich eine andere Anzahl von Treffern beziehungsweise Nieten in der Urne befindet.

Abbildung 9: Graphische Darstellung der Verteilung der Zufallsvariable Y<sub>r</sub> beim "Ziehen mit Zurücklegen" für r = 1, 2.

Abbildung 9: Graphische Darstellung der Verteilung der Zufallsvariable Y_r beim "Ziehen mit Zurücklegen" für r = 1, 2.

1.2 Abzählen der Ergebnisse

In Abbildung 10 wird die in Abbildung 5 Gleichung (5) hergeleitete Formel verwendet, um die Anzahl der Ergebnisse zu berechnen (hier nochmal in Gleichung (1)). Setzt man jetzt r = 1, so erhält man die gesuchten Wahrscheinlichkeiten in Abhängigkeit von n, wobei n = 1, 2, 3, 4, siehe Gleichung (2). Setzt man dort die erlaubten Werte für n ein, erhält man die Wahrscheinlichkeiten, die in Abbildung 8 explizit berechnet wurden.

2. Fall: r = 2

2.1 Auswertung des Zufallsexperimentes

Für r = 2 kann n die Werte n = 2, 3, 4, 5 annehmen. Im Unterschied zu r = 1 gibt es jetzt (außer im Fall n = 2) mehrere Realisierungen, in welche Reihenfolge die Lose gezogen werden. Allerdings besitzen diese jeweils identische Wahrscheinlichkeiten. In Abbildung 8 werden daher alle möglichen Realisierungen angegeben, und für die jeweils erste Realisierung die Wahrscheinlichkeit berechnet. Man kann sich leicht überlegen, dass die Wahrscheinlichkeiten anderer Realisierungen durch Umsortieren der Faktoren entstehen. Dass es mehrere Möglichkeiten gibt, wird dann dadurch berücksichtigt, dass berechnete Wahrscheinlichkeit mit der Anzahl der Möglichkeiten multipliziert wird. Um die Berechnungen leichter nachzuvollziehen, sind die Faktoren fett gedruckt, bei denen ein Treffer gezogen wird.

Als Histogramm sind die Ergebnisse in Abbildung 9 rechts dargestellt.

Abbildung 10: Berechnung der Verteilung der Wartezeit durch Abzählen.

2.2 Abzählen der Ergebnisse

In Abbildung 10 unten wird dann wieder die Formel ausgewertet (Gleichung (1)), die die Anzahl der Möglichkeiten verwendet, um die gesuchte Verteilung zu berechnen. Wieder erhält man einen von n abhängigen Term (siehe Abbildung 10, Gleichung (3)); durch Einsetzen der erlaubten Werte von n ergeben sich die Wahrscheinlichkeiten aus Abbildung 8 unten, Gleichung (5-8).

Vergleich der Wartezeitprobleme beim "Ziehen mit Zurücklegen" und "Ziehen ohne Zurücklegen"

In Abbildung 5 wurden zwei Herangehensweisen besprochen, wie man die Verteilung der Zufallsvariable Y_r berechnen kann. Es ist naheliegend zu fragen, inwiefern die beiden Zufallsvariablen W_r und Y_r eine ähnliche Verteilung besitzen Denn für kleine n und r (klein im Vergleich zu K und L) sind die Wahrscheinlichkeiten dafür, eine Niete oder einen Treffer zu ziehen, auch im Zufallsexperiment "Ziehen ohne Zurücklegen" nahezu identisch mit q und p (wie sie beim "Ziehen mit Zurücklegen" definiert wurden). Allerdings ist es den Termen in Gleichung (1) in Abbildung 4 sowie Gleichung (2) und (5) in Abbildung 5 nicht sofort anzusehen, warum sie zu ähnlichen Werten der Wahrscheinlichkeiten führen.

Den Term in Gleichung (1) in Abbildung 4 kann man folgendermaßen interpretieren (siehe auch Gleichung (2) in Abbildung 11):

Wird eine spezielle Folge von n-r Nieten und r Treffern gezogen, so ist die Wahrscheinlichkeit dafür gleich q^n-r·p^r.
Der Binomialkoeffizient beschreibt die Anzahl der möglichen Zugfolgen, so dass n-r Nieten und r Treffer gezogen werden, wobei im n–ten Zug ein Treffer erscheinen muss.

Weder Gleichung (2) noch Gleichung (5) in Abbildung 5 kann man derart interpretieren. Daher wird in Abbildung 11 gezeigt, wie man die Wahrscheinlichkeiten P(Y_r = n) auf eine ähnliche Gestalt bringt wie P(W_r = n).

Ausgangspunkt ist die Darstellung von P(Y_r = n) durch die fallenden Faktoriellen (3); deren Definition ist in Gleichung (1) nochmals gezeigt.
Die fallenden Faktoriellen werden als Produkte geschrieben, wobei die r Faktoren von L bis L-r+1 fett gedruckt sind (dies entspricht wieder den Treffern).
Sowohl Zähler als auch Nenner bestehen aus einem Produkt von n Faktoren. Dieser Bruch wird jetzt als ein Produkt von n Brüchen geschrieben. (Siehe die Umformungen über Gleichung (5) zu Gleichung (6).)

Das Produkt von Brüchen in Gleichung (6) kann man jetzt als die Auswertung eines Baumdiagramms interpretieren, nämlich für die Zugfolge, bei der zuerst n-r Nieten und anschließend r Treffer gezogen werden. Denn im Zähler steht jeweils die Anzahl von Nieten (bei den ersten n-r Brüchen) beziehungsweise von Treffern (die anderen r Brüche). Im Nenner steht jeweils die Anzahl von Losen, die sich insgesamt in der Urne befinden.

Werden die Lose in einer anderen Reihenfolge gezogen, so müssen nur die Faktoren im Zähler anders angeordnet werden, das Ergebnis der Berechnung ändert sich dabei aber nicht. Und der Binomialkoeffizient beschreibt wieder die Anzahl der möglichen Zugfolgen (für r Treffer und n-r Nieten sowie ein Treffer im n-ten Zug). In diesem Sinn lassen sich jetzt Gleichung (2) und Gleichung (6) in Abbildung 11 besser miteinander vergleichen. Die Frage, in welchem Sinn eine Wahrscheinlichkeit als Approximation der anderen Wahrscheinlichkeit betrachtet werden kann, soll hier nicht diskutiert werden.

Abbildung 11: Vergleich der Verteilungen der Wartezeit beim "Ziehen mit Zurücklegen" und "Ziehen ohne Zurücklegen".