Berechnung von Erwartungswerten und Varianzen mit Hilfe von Indikatorvariablen

Die Methode, den Erwartungswert einer Zufallsvariable X mit Hilfe von Indikatorvariablen zu berechnen, ist deshalb so wichtig, weil man dazu die Verteilung von X nicht kennen muss. Die eigentliche Schwierigkeit besteht oft darin, geeignete Indikatorvariablen zu finden. An mehreren Beispielen (M├╝nzwurf, hypergeometrische Verteilung und einer Zufallsvariable mit unbekannter Verteilung) wird dieses Vorgehen demonstriert. Da man Varianzen auf Erwartungswerte zur├╝ckf├╝hren kann, lassen sich mit dieser Methode auch Varianzen und Standardabweichungen berechnen.
Noch keine Stimmen abgegeben
Noch keine Kommentare

Einordnung des Artikels

Als Beispiel f├╝r die Berechnung von Erwartungswert und Varianz wird die hypergeometrische Verteilung besprochen. Diese wird hier nur kurz definiert, ausf├╝hrlich diskutiert wurde sie in Spezielle Wahrscheinlichkeitsverteilungen: die hypergeometrische Verteilung. Das Verst├Ąndnis der hypergeometrischen Verteilung wird erleichtert durch die Kenntnis der Abz├Ąhlprobleme, die mit dem Ziehen ohne Zur├╝cklegen verbunden sind; sie wurden in Spezielle Abz├Ąhlprobleme: Ziehen ohne Zur├╝cklegen besprochen.

Einf├╝hrung

In Eigenschaften von Zufallsvariablen: Der Erwartungswert von diskreten und stetigen Zufallsvariablen wurden bereits mehrere Beispiele besprochen, bei denen unterschiedliche Methoden angewandt wurden, um einen Erwartungswert zu berechnen. Eine weitere Methode ist so wichtig, dass ihr ein eigener Artikel gewidmet wird: Eine Zufallsvariable X wird als Summe von Indikatorvariablen geschrieben:

X = I1 + I2 + ... + IN

Was genau unter einer Indikatorvariable (oder Indikatorfunktion) zu verstehen ist, wird weiter unten erkl├Ąrt; aber die Idee hinter dieser Summenbildung l├Ąsst sich leicht verstehen.

Die Gleichheit

E (X) = E (I1) + E (I2) + ... + E (IN)

gilt immer ÔÇô egal ob die Zufallsvariablen der Summanden unabh├Ąngig voneinander sind oder nicht. Wenn nun die Erwartungswerte E (Ii) sehr leicht zu berechnen sind, kann man auch den Erwartungswert E (X) berechnen ÔÇô und das ohne die Verteilung von X zu kennen. Die Schwierigkeit der Methode, einen Erwartungswert mit Hilfe von Indikatorvariablen zu berechnen, besteht dann meist darin, geeignete Indikatorvariablen aufzusp├╝ren ÔÇô oft ist es nicht offensichtlich, wie sie zu definieren sind, damit sich die einzelnen Erwartungswerte E (Ii) tats├Ąchlich ohne gro├čen Aufwand berechnen lassen.

Im Folgenden wird:

  • erkl├Ąrt, was eine Indikatorvariable ist und welche Eigenschaften diese Zufallsvariablen haben.
  • Am Beispiel des zweimaligen M├╝nzwurfs wird erkl├Ąrt, wie man bei der Berechnung des Erwartungswertes die Indikatorvariablen einsetzt. Das Beispiel ist so einfach gew├Ąhlt, dass man den Erwartungswert leicht ohne Indikatorvariablen berechnen kann ÔÇô gerade dadurch soll diese Methode transparenter werden. Die Verallgemeinerung zum N-fachen M├╝nzwurf ist dann so einfach, dass sie hier nicht vorgef├╝hrt wird.
  • Das Beispiel Kunstwettbewerb soll zwei Dinge verdeutlichen: Erstens soll es zeigen, wie man durch die Einf├╝hrung der Indikatorvariablen einen Erwartungswert einer Zufallsvariable X auch berechnen kann, ohne die Verteilung von X zu kennen. Zweitens soll es zeigen, dass es nicht immer offensichtlich ist, wie die Indikatorvariablen geeignet zu definieren sind.
  • Das Beispiel des Erwartungswertes der hypergeometrischen Verteilung soll nochmals zeigen, dass die Auswertung der Indikatorvariablen sehr viel einfacher ist als die Berechnung des Erwartungswertes mit Hilfe der Verteilung.
  • Da man eine Varianz ├╝ber Erwartungswerte definieren kann, l├Ąsst sich die Methode der Berechnung von Erwartungswerten auch auf die Berechnung von Varianzen ├╝bertragen; sie wird am N-maligen M├╝nzwurf und an der hypergeometrischen Verteilung demonstriert.

Diese Aussagen suggerieren, dass Indikatorvariablen ein universelles Hilfsmittel sind, die f├╝r viele Aufgaben eingesetzt werden k├Ânnen. Wie im folgenden Abschnitt gezeigt wird (und wie alle besprochenen Beispiele best├Ątigen werden), sind Indikatorvariablen so einfach, dass sie f├╝r sich genommen meist irrelevant sind und ihre Bedeutung erst erlangen, wenn man sie zum Berechnen von Erwartungswerten einsetzt.

Definition und Eigenschaften von Indikatorvariablen

Als Indikatorvariable IA eines Ereignisses A wird eine Zufallsvariable bezeichnet, die angibt, ob das Ereignis A eintritt oder nicht; tritt A ein, ist der Wert der Zufallsvariable gleich 1, tritt A nicht ein, ist der Wert gleich 0. Die exakte Definition ist in Abbildung 1 zu sehen.

Abbildung 1: Definition einer Indikatorvariable zu einem Ereignis A. Aufgrund der einfachen Definition ist es sehr leicht, Erwartungswert und Varianz der Indikatorvariable zu berechnen.Abbildung 1: Definition einer Indikatorvariable zu einem Ereignis A. Aufgrund der einfachen Definition ist es sehr leicht, Erwartungswert und Varianz der Indikatorvariable zu berechnen.

Bemerkungen:

  1. Anstelle der Bezeichnung Indikatorvariable verwendet man oft Indikatorfunktion; dies dr├╝ckt besser aus, dass die Zufallsvariable IA ein Elementarereignis ¤ë als Eingabewert hat und somit eine Funktion auf der Ergebnismenge ╬ę ist: IA (¤ë).
  2. Da die Zufallsvariable IA nur die beiden Werte 0 oder 1 annehmen kann, schreibt man anstelle von IA h├Ąufig 1A; diese Schreibweise dr├╝ckt besser aus, dass ÔÇô im relevanten Fall ÔÇô der Wert der Zufallsvariable gleich 1 ist.

Zur Berechnung des Erwartungswertes einer Indikatorvariable IA muss man ├╝ber alle Elementarereignisse ¤ë Ôłł ╬ę summieren; da die Zufallsvariable nur die Werte 0 und 1 annehmen kann, muss man nur ├╝ber die ¤ë Ôłł A summieren und erh├Ąlt die Wahrscheinlichkeit von A, also P(A), siehe Gleichung (2) in Abbildung 1.

Da die Indikatorvariable nur die Werte 0 und 1 annehmen kann und diese Zahlen mit ihrem Quadrat ├╝bereinstimmen, hat man mit dem Erwartungswert von IA zugleich den Erwartungswert von IA2 berechnet (siehe Gleichung (3) in Abbildung 1).

Als weitere Folgerung kann man jetzt die Varianz einer Indikatorvariable berechnen, siehe Gleichung (4) in Abbildung 1; man erh├Ąlt das Produkt aus den Wahrscheinlichkeiten von A und des Gegenereignisses.

Einfaches Beispiel zur Einf├╝hrung: zweimaliger M├╝nzwurf

Eine Laplace-M├╝nze wird zweimal nacheinander geworfen, die W├╝rfe sind unabh├Ąngig voneinander. Anstelle von Kopf und Zahl werden die Ergebnisse mit 0 und 1 bezeichnet. Gesucht ist der Erwartungswert der Zufallsvariable X, die die Anzahl der geworfenen 1 angibt.

Die Ergebnismenge ╬ę besteht hier aus vier Elementen. Das Problem ist so einfach, dass man s├Ąmtliche Wahrscheinlichkeiten der Elementarereignisse sofort angeben und den Erwartungswert E (X) m├╝helos berechnen kann (die Rechnung ist in Gleichung (1) Abbildung 2 zu sehen). Es ist hier nicht n├Âtig, eine neue Methode zur Berechnung des Erwartungswertes zu entwickeln. Um aber mit Indikatorvariablen vertraut zu werden, soll das Problem entsprechend formuliert werden.

Man definiert zwei Indikatorvariablen f├╝r die beiden Ereignisse "beim ersten Wurf tritt eine 1 ein" und "beim zweiten Wurf tritt eine 1 ein"; diese Indikatorvariablen werden mit I1 und I2 bezeichnet, siehe Gleichung (2) in Abbildung 2.

Abbildung 2: F├╝r das Beispiel des zweimaligen M├╝nzwurfs kann der Erwartungswert der Zufallsvariable X, die die Anzahl der 1 angibt, unmittelbar berechnet werden. Definiert man geeignete Indikatorvariablen, kann die Zufallsvariable X als Summe dieser Zufallsvariablen dargestellt und der Erwartungswert von X als die Summe der Erwartungswerte berechnet werden.Abbildung 2: F├╝r das Beispiel des zweimaligen M├╝nzwurfs kann der Erwartungswert der Zufallsvariable X, die die Anzahl der 1 angibt, unmittelbar berechnet werden. Definiert man geeignete Indikatorvariablen, kann die Zufallsvariable X als Summe dieser Zufallsvariablen dargestellt und der Erwartungswert von X als die Summe der Erwartungswerte berechnet werden.

Die Erwartungswerte von I1 und I2 k├Ânnen sofort angegeben werden: wie oben gezeigt wurden, stimmen sie mit den Wahrscheinlichkeiten daf├╝r ├╝berein, dass im ersten beziehungsweise zweiten Wurf eine 1 erscheint; aufgrund der Laplace-Annahme sind diese gleich 1/2 (siehe Gleichung (3) in Abbildung 2).

Der entscheidende Schritt in der Verwendung der Indikatorvariablen besteht darin, dass man die Zufallsvariable X als Summe der Indikatorvariablen schreiben kann, siehe Gleichung (4). Diese Gleichung muss tats├Ąchlich als Gleichheit zweier Funktionen zu lesen, das hei├čt sie muss f├╝r jedes ¤ë Ôłł ╬ę erf├╝llt sein ÔÇô was man hier aber schnell nachpr├╝ft. Im Allgemeinen ist es nicht naheliegend, wie die Indikatorvariablen geeignet zu definieren sind und ob gegebene Indikatorvariablen in der Summe tats├Ąchlich die zu untersuchende Zufallsvariable ergeben. Der anspruchsvolle Teil der Anwendung der hier vorgestellten Methode besteht meist darin, geeignete Indikatorvariablen zu suchen und die Summe wie Gleichung (4) nachzupr├╝fen.

Hier ist Gleichung (4) nahezu selbstverst├Ąndlich, so dass man sofort den Erwartungswert nach Gleichung (5) berechnen kann und zum selben Ergebnis wie in Gleichung (2) kommt.

Aufgabe:

Wie werden die Indikatorvariablen f├╝r den n-fachen M├╝nzwurf definiert und wie berechnet sich dann der Erwartungswert?

Beispiel: Kunstwettbewerb

Die Problemstellung

An einem Wettbewerb nehmen K K├╝nstler teil, die von J Juroren beurteilt werden. Jeder Juror kann genau einem K├╝nstler seine Stimme geben. Sieger ist, wer die meisten Stimmen erh├Ąlt. Es wird angenommen,

  • dass K, J > 1,
  • jeder Juror seine Entscheidung rein zuf├Ąllig gem├Ą├č der Laplace-Annahme macht und
  • keine Absprachen unter den Juroren m├Âglich sind.

Gesucht ist der Erwartungswert der Anzahl der K├╝nstler, f├╝r die keine Stimme abgegeben wird.

Weiter soll diskutiert werden, inwiefern die L├Âsung des Problems von folgender Fallunterscheidung abh├Ąngt:

  1. Fall: K > J,
  2. Fall: K = J,
  3. Fall: K < J.

Berechnen Sie die Erwartungswerte f├╝r K = 10 und J = 3, 4, ..., 10.

L├Âsung des Problems mit geeigneten Indikatorvariablen

Man beachte, dass durch die Fragestellung nur gefordert wird, den Erwartungswert einer Zufallsvariable X zu berechnen. Die Zufallsvariable X beschreibt hier die Anzahl der K├╝nstler, f├╝r die sich kein Juror entscheidet. Der naheliegende Ansatz zur Berechnung von E (X) besteht darin, zuerst die Wahrscheinlichkeiten P(X = n) und dann den Erwartungswert E (X) = ԳŠn ┬Ě P (X = n) zu berechnen. Die detaillierte Information der P(X = n) ist vermutlich sehr schwierig zu berechnen und l├Ąsst sich durch die Definition geeigneter Indikatorvariablen vermeiden.

Der Kern des Problems besteht somit darin, die Zufallsvariable X als Summe von Indikatorvariablen zu schreiben, so dass deren Erwartungswert leichter zu berechnen ist als die Wahrscheinlichkeiten P(X = n) und die Summe ԳŠn ┬Ě P (X = n). Man versucht dazu, die Vorgehensweise beim n-fachen M├╝nzwurf zu imitieren. Dort muss der Erwartungswert f├╝r n W├╝rfe berechnet werden; als Indikatorvariable w├Ąhlt man die Zufallsvariable, die einen einzigen M├╝nzwurf beschreibt.

Und wenn hier X die Anzahl der K├╝nstler beschreibt, die nicht ausgew├Ąhlt werden, so wird man analog Zufallsvariablen definieren, die sich auf einen K├╝nstler beziehen. Ein naheliegender Ansatz ist daher:

Die Zufallsvariable Ii ist gleich 1, wenn die i-te K├╝nstler nicht ausgew├Ąhlt wird, und gleich 0, wenn er ausgew├Ąhlt wird; dabei kann i die Werte 1, 2, ..., K annehmen.

Dann kann die Zufallsvariable als Summe der Indikatorvariablen Ii ausgedr├╝ckt werden (linker Teil von (1) in Abbildung 3) und die Summe ├╝bert├Ągt sich auf den Erwartungswert (rechter Teil von (1) in Abbildung 3).

Der Erwartungswert der Zufallsvariable Ii stimmt mit der Wahrscheinlichkeit daf├╝r ├╝berein, dass der i-te K├╝nstler von keinem Juror ausgew├Ąhlt wird, also mit der Wahrscheinlichkeit daf├╝r, dass sich alle J Juroren f├╝r einen der anderen K - 1 K├╝nstler entscheiden. Da die Entscheidungen unabh├Ąngig voneinander getroffen werden, ergibt sich Gleichung (2) in Abbildung 3. F├╝hrt man jetzt die Summation in (1) aus, erh├Ąlt man einen Ausdruck (3) f├╝r den Erwartungswert von X, der nur von den gegebenen Gr├Â├čen K und J abh├Ąngt. Und man erkennt sofort, dass die oben angegebene Fallunterscheidung (Beziehung von K und J) irrelevant ist.

Abbildung 3: Berechnung des Erwartungswertes f├╝r die Zufallsvariable X, die die Anzahl K├╝nstler beschreibt, die keine Stimme erhalten. Durch die Einf├╝hrung geeigneter Indikatorvariablen ist es nicht n├Âtig, die Verteilung der Zufallsvariable X zu berechnen, sondern man kann den Erwartungswert von X sofort aus den Erwartungswerten der Indikatorvariablen berechnen, siehe Gleichung (1). Der Erwartungswert einer Indikatorvariable wird aus der Wahrscheinlichkeit des Ereignisses berechnet, wenn kein Juror f├╝r den i-ten K├╝nstler stimmt (das hei├čt, alle Juroren stimmen f├╝r einen der anderen K├╝nstler), siehe Gleichung (2). Die Tabelle unten zeigt die Erwartungswerte f├╝r spezielle K und J.Abbildung 3: Berechnung des Erwartungswertes f├╝r die Zufallsvariable X, die die Anzahl K├╝nstler beschreibt, die keine Stimme erhalten. Durch die Einf├╝hrung geeigneter Indikatorvariablen ist es nicht n├Âtig, die Verteilung der Zufallsvariable X zu berechnen, sondern man kann den Erwartungswert von X sofort aus den Erwartungswerten der Indikatorvariablen berechnen, siehe Gleichung (1). Der Erwartungswert einer Indikatorvariable wird aus der Wahrscheinlichkeit des Ereignisses berechnet, wenn kein Juror f├╝r den i-ten K├╝nstler stimmt (das hei├čt, alle Juroren stimmen f├╝r einen der anderen K├╝nstler), siehe Gleichung (2). Die Tabelle unten zeigt die Erwartungswerte f├╝r spezielle K und J.

Die Tabelle in Abbildung 3 unten gibt die mit Gleichung (3) berechneten Erwartungswerte f├╝r K = 10 und J = 3, 4, ..., 10 an (gerundet auf zwei Nachkommastellen). Man erkennt die Monotonie: je mehr Juroren es gibt, um so kleiner wird der Erwartungswert f├╝r die Anzahl der nicht ausgew├Ąhlten K├╝nstler.

Aufgabe: Wie gro├č ist E (X) / K f├╝r K = J im Grenz├╝bergang K Ôćĺ Ôł×?

Der Erwartungswert der hypergeometrischen Verteilung

In Spezielle Wahrscheinlichkeitsverteilungen: die hypergeometrische Verteilung wurde der Erwartungswert der hypergeometrischen Verteilung zwar angegeben aber nicht hergeleitet. Dort wurde der Term gezeigt, den man eigentlich auswerten muss, um den Erwartungswert zu berechnen, siehe Abbildung 4, Gleichung (2). Mit elementaren Kenntnissen ├╝ber die Binomialkoeffizienten kann man den Erwartungswert nicht berechnen, da jeder Summand (in der Summe ├╝ber n) sowohl den Faktor n als auch zwei von n abh├Ąngige Binomialkoeffizienten enth├Ąlt. Stattdessen l├Ąsst sich der Erwartungswert mit der hier vorgestellten Methode berechnen: Man definiert geeignete Indikatorvariablen und berechnet ihre Erwartungswerte.

Das Paradebeispiel f├╝r ein Zufallsexperiment, das sich mit Hilfe der hypergeometrischen Verteilung beschreiben l├Ąsst, ist das Ziehen ohne Zur├╝cklegen, wobei sich in der Urne anfangs M = K + L Lose befinden, von denen K Nieten und L Treffer sind. Werden jetzt N Lose ohne Zur├╝cklegen gezogen, so ist es naheliegend zu fragen, wie viele Treffer gezogen wurden. Die Zufallsvariable X soll die Anzahl der Treffer bei N Ziehungen beschreiben.

Die Wahrscheinlichkeiten P(X = n) werden als die hypergeometrische Verteilung mit den Parametern K, L und N bezeichnet. Wie in Spezielle Wahrscheinlichkeitsverteilungen: die hypergeometrische Verteilung hergeleitet wurde, berechnet sich P(X = n) durch Gleichung (1) in Abbildung 4.

Abbildung 4: Die Definition (1) und die Berechnung des Erwartungswertes der hypergeometrischen Verteilung. Durch die Definition geeigneter Indikatorvariablen (3) l├Ąsst sich die Berechnung des Erwartungswertes gem├Ą├č (2) vermeiden. Der Erwartungswert l├Ąsst sich mit Hilfe einer Trefferwahrscheinlichkeit p schreiben (8).Abbildung 4: Die Definition (1) und die Berechnung des Erwartungswertes der hypergeometrischen Verteilung. Durch die Definition geeigneter Indikatorvariablen (3) l├Ąsst sich die Berechnung des Erwartungswertes gem├Ą├č (2) vermeiden. Der Erwartungswert l├Ąsst sich mit Hilfe einer Trefferwahrscheinlichkeit p schreiben (8).

Um geeignete Indikatorvariablen zu definieren, werden zuerst die Treffer mit 1, 2, ..., L durchnumeriert. Bei einer Ziehung wird dann nicht nur festgestellt, ob eine Niete oder ein Treffer gezogen wurde, sondern im Falle eines Treffers wird diese Nummer angegeben. Die Zufallsvariablen Xi nehmen dann jeweils den Wert 1 an, wenn der Treffer mit Nummer i gezogen wurde und 0, wenn der Treffer nicht gezogen wurde (siehe Gleichung (3) in Abbildung 4). Da es L Treffer gibt, l├Ąuft der Index i von 1 bis L.

Damit l├Ąsst sich die Zufallsvariable X (also die Anzahl der Treffer bei N Ziehungen) als Summe dieser Indikatorvariablen schreiben und zur Berechnung des Erwartungswertes von X verwendet man die Linearit├Ąt des Erwartungswertes (siehe Gleichung (4) in Abbildung 4).

Um jetzt E (X) zu berechnen, ben├Âtigt man die Erwartungswerte E (Xi); da kein Treffer bevorzugt ist, sind alle Erwartungswerte identisch. Der Wert stimmt mit der Wahrscheinlichkeit daf├╝r ├╝berein, dass der i-te Treffer gezogen wird. Und diese Wahrscheinlichkeit kann leicht durch Abz├Ąhlen bestimmt werden: Werden N Lose aus dem Lostopf mit M Losen gezogen, so gibt es "N aus M" gleichwahrscheinliche M├Âglichkeiten. Darunter gibt es "(N-1) aus (M-1)" M├Âglichkeiten, bei denen der i-te Treffer gezogen wird, siehe Gleichung (5) in Abbildung 4. (Der Treffer i muss gezogen werden, aus den verbleibenden M-1 Losen werden N-1 Lose gezogen.) Vereinfacht man die Binomialkoeffizienten in (5), erh├Ąlt man N/M, siehe Gleichung (6). Mit dieser Wahrscheinlichkeit, die zugleich der Erwartungswert der Indikatorvariablen ist, kann man den Erwartungswert von X berechnen, siehe Gleichung (7) und (8).

Diesen Erwartungswert (8) kann man mit einer "Trefferwahrscheinlichkeit" p = L / M schreiben. Den Begriff Trefferwahrscheinlichkeit darf man dabei nicht missverstehen, da er eigentlich nur die Ausgangssituation beschreibt, wenn sich im Lostopf noch L Treffer und insgesamt M Lose befinden. Da ohne Zur├╝cklegen gezogen wird, ├Ąndert sich die die Trefferwahrscheinlichkeit bei jedem Zug ÔÇô erstaunlich ist dann Gleichung (8), da sie eine konstante Trefferwahrscheinlichkeit w├Ąhrend aller N Ziehungen suggeriert (wie beim Ziehen mit Zur├╝cklegen).

Die Berechnung der Varianz mit Hilfe von Indikatorvariablen

Da man die Berechnung der Varianz einer Zufallsvariable X auf die Berechnung von Erwartungswerten zur├╝ckf├╝hren kann, gem├Ą├č der Formel (siehe auch Gleichung (6) in Abbildung 5)

Var(X) = E (X2) - (E (X))2,

kann man jetzt versuchen, die Indikatorvariablen zur Berechnung der Varianz einzusetzen. Vorgestellt wird die Methode f├╝r den N-fachen M├╝nzwurf und die hypergeometrische Verteilung.

Der N-malige M├╝nzwurf

Wie oben werden die Ergebnisse des M├╝nzwurfes anstelle von Kopf und Zahl durch 0 (Niete) und 1 (Treffer) dargestellt. Anders als oben wird die Trefferwahrscheinlichkeit mit p (0 < p < 1, q = 1 - p) angesetzt. Die N W├╝rfe erfolgen unabh├Ąngig voneinander.

Die Zufallsvariable X, die die Anzahl der Treffer bei N W├╝rfen beschreibt, wird als Summe von N Indikatorvariablen geschrieben; die Indikatorvariable Ii beschreibt das Ergebnis des i-ten M├╝nzwurfs, siehe Gleichung (1) links in Abbildung 5. Berechnet man jetzt die Zufallsvariable X2 und stellt sie mit Hilfe der Indikatorvariablen dar, so gibt es insgesamt N2 Summanden, siehe Gleichung (1) rechts und (2) in Abbildung 5:

  • N mal treten Quadrate auf Ii2,
  • (N2 - N) mal treten gemischte Produkte Ii Ij auf, in denen i und j verschieden sind.

Die Aufspaltung ist sinnvoll, weil es zwei unterschiedliche Erwartungswerte gibt (siehe Gleichungen (4) und (5)):

  • Da Ii2 = Ii, ist E (Ii2) = p und
  • E (Ii Ij) = p2 (dies ist gleich der Wahrscheinlichkeit daf├╝r, dass sowohl im i-ten als auch im j-ten Wurf ein Treffer erscheint).

Abbildung 5: Die Berechnung der Varianz und der Standardabweichung beim N-maligen M├╝nzwurf. Die Zufallsvariable X, die die Anzahl der Treffer bei N W├╝rfen angibt, wird als Summe von Indikatorvariablen geschrieben. Die Berechnung der Varianz von X kann auf die Berechnung von Erwartungswerten zur├╝ckgef├╝hrt werden.Abbildung 5: Die Berechnung der Varianz und der Standardabweichung beim N-maligen M├╝nzwurf. Die Zufallsvariable X, die die Anzahl der Treffer bei N W├╝rfen angibt, wird als Summe von Indikatorvariablen geschrieben. Die Berechnung der Varianz von X kann auf die Berechnung von Erwartungswerten zur├╝ckgef├╝hrt werden.

Mit all diesen Vorbereitungen kann die Varianz von X leicht berechnet werden, siehe Gleichung (6) und (7); die Varianz und die Standardabweichung sind in Gleichung (8) gezeigt.

Die hypergeometrische Verteilung

Die Rechenschritte zur Berechnung der Varianz beim N-maligen M├╝nzwurf k├Ânnen jetzt ÔÇô mit leichten Anpassungen ÔÇô auf die Berechnung der Varianz der hypergeometrischen Verteilung ├╝bertragen werden. Die Indikatorvariablen werden dazu wie in Gleichung (3) in Abbildung 4 definiert. Aus Abbildung 5 k├Ânnen die Gleichungen (1) bis (3) und der Ansatz zur Berechnung der eigentlichen Varianz in (6) ├╝bernommen und auf die entsprechenden Zufallsvariablen ├╝bertragen werden. Abzu├Ąndern sind die Erwartungswerte in Gleichung (4) und (5) in Abbildung 5.

Der Erwartungswert E (Xi) wurde bereits in Gleichung (5) und (6) in Abbildung 4 berechnet und dort erl├Ąutert. Vergleicht man den Erwartungswert mit Gleichung (4) in Abbildung 5, so wird man hier vielleicht L/M anstelle von N/M erwarten. Dazu muss man aber bedenken: Die Zufallsvariable Xi beschreibt N Ziehungen aus der Urne, in der sich anfangs L Treffer und K Nieten befinden. Wird der Treffer mit der Nummer i gezogen, ist die Zufallsvariable Xi gleich 1. Wenn also die Anzahl der Ziehungen gr├Â├čer wird, wird auch die Wahrscheinlichkeit daf├╝r gr├Â├čer, dass der Treffer i gezogen wird. Und f├╝r N = M wird diese Wahrscheinlichkeit sogar gleich 1, da ohne Zur├╝cklegen gezogen wird und bei N = M alle Lose ÔÇô also auch das Los i ÔÇô gezogen werden.

├ähnlich kann man den Erwartungswert E (Xi ┬Ě Xj) = P(Xi = 1, Xj = 1) in (4) und (5) interpretieren: F├╝r N = 1 ist diese Wahrscheinlichkeit gleich 0, da nur ein Treffer gezogen werden kann. Wird N gr├Â├čer, w├Ąchst die Wahrscheinlichkeit und wird gleich 1, wenn N = M.

Abbildung 6: Die Berechnung der Varianz und der Standardabweichung der hypergeometrischen Verteilung. Die Vorgehensweise ist identisch wie in Abbildung 5, lediglich die Erwartungswerte in (3) und (4) m├╝ssen neu bestimmt werden.Abbildung 6: Die Berechnung der Varianz und der Standardabweichung der hypergeometrischen Verteilung. Die Vorgehensweise ist identisch wie in Abbildung 5, lediglich die Erwartungswerte in (3) und (4) m├╝ssen neu bestimmt werden.

Sind die Erwartungswerte (3) und (5) bekannt, kann man wie in Abbildung 5 die gesuchte Varianz berechnen, siehe Gleichung (6) in Abbildung 6, wobei einige Zwischenschritte nicht gezeigt sind (siehe Aufgabe unten). In (7) ist dann die Varianz und die Standardabweichung gezeigt.

Aufgaben:

1. In Gleichung (6) in Abbildung 5 fehlen einige Zwischenschritte (Terme auf gemeinsamen Nenner bringen, die Variable q = 1 - p einf├╝hren, vereinfachen). F├╝hren Sie die entsprechenden Rechenschritte aus.

2. F├╝r M = N werden die Varianz und die Standardabweichung von X in (7) gleich 0. Wie kann man das auch ohne Rechnung begr├╝nden?

3. F├╝r N = 1 ist Var(X) in (7) nicht definiert. Der Term ist dann aber so zu verstehen, dass sich der Bruch (M-N)/(M-1) k├╝rzt und somit Var(X) = pq bleibt. Diskutieren Sie, ob dies ein sinnvolles Ergebnis f├╝r Var(X) ist.

4. Es ist kein Zufall, dass die Terme f├╝r die Varianz in Gleichung (8) in Abbildung 5 und Gleichung (7) in Abbildung 6 ├Ąhnliche Gestalt haben ÔÇô um sie zu verdeutlichen wurde q eingef├╝hrt. Diskutieren Sie, warum die Berechnungen in Abbildung 5 auf das Zufallsexperiment Ziehen mit Zur├╝cklegen ├╝bertragen werden k├Ânnen, wobei sich in der Urne ebenfalls zwei Arten von Losen befinden: Treffer und Nieten, die mit Wahrscheinlichkeit p beziehungsweise q = 1 - p gezogen werden.

Diskutieren Sie weiter, ob die Terme f├╝r die Varianz (beziehungsweise Standardabweichung) in dieser Interpretation plausibel sind.