Eigenschaften von Zufallsvariablen: Quantil und Median

Das p-Quantil als Umkehrfunktion der Verteilungsfunktion und der Spezialfall des Medians als p-Quantil zur Wahrscheinlichkeit p = 0.5 werden vorgestellt.
Noch keine Stimmen abgegeben
Noch keine Kommentare

Einordnung des Artikels

In Wahrscheinlichkeitsverteilungen in R werden die R-Funktionen vorgestellt, mit denen p-Quantile zu den geläufigen Wahrscheinlichkeitsverteilungen berechnet werden können.

Einf√ľhrung

Viele Fragestellungen √ľber Zufallsvariablen X k√∂nnen so formuliert werden, dass sie sich mit Hilfe der Verteilungsfunktion F(x) l√∂sen lassen. Die Verteilungsfunktion F(x) gibt die Wahrscheinlichkeit daf√ľr an, dass die Zufallsvariable X einen Wert kleiner oder gleich x annimmt:

F(x) = P(X ‚ȧ x).

Die Umkehrfunktion der Verteilungsfunktion gibt somit eine Wahrscheinlichkeit p = P(X ‚ȧ x) vor und berechnet den zugeh√∂rigen x-Wert. Diese Umkehrfunktion wird als p-Quantil (oder nur Quantil) bezeichnet.

Speziell f√ľr p = 0.5 wird das p-Quantil als Median bezeichnet und f√ľr p = 0.25 beziehungsweise p = 0.75 als Quartil. Sie sind Lageparameter einer Wahrscheinlichkeitsverteilung und werden h√§ufig in der Statistik eingesetzt, um Stichproben zu beschreiben.

Das p-Quantil

Das p-Quantil einer stetigen Zufallsvariable

Ist X eine stetige Zufallsvariable, so kann man Wahrscheinlichkeiten der Art P(X ‚ȧ x) leicht mit Hilfe der Wahrscheinlichkeitsdichte f(x) veranschaulichen, siehe Abbildung 1 links (dort ist die Wahrscheinlichkeitsdichte der Standardnormalverteilung aufgetragen): Man integriert die Wahrscheinlichkeitsdichte von -‚ąě bis x, siehe Gleichung (1) in Abbildung 2. Das Ergebnis dieser Integration ist zugleich der Wert der Verteilungsfunktion F(x).

Abbildung 1: Links: Die Wahrscheinlichkeitsdichte der Standard-Normalverteilung N(0, 1); zus√§tzlich eingetragen ist die Wahrscheinlichkeit P(X ‚ȧ 1.28) als Fl√§che, die man durch (n√§herungsweise) Integration berechnen kann. Rechts: Die Verteilungsfunktion der N(0, 1)-Verteilung; hier sind zus√§tzlich eingetragen die Geraden x = 1.28 und y = 0.9.Abbildung 1: Links: Die Wahrscheinlichkeitsdichte der Standard-Normalverteilung N(0, 1); zus√§tzlich eingetragen ist die Wahrscheinlichkeit P(X ‚ȧ 1.28) als Fl√§che, die man durch (n√§herungsweise) Integration berechnen kann. Rechts: Die Verteilungsfunktion der N(0, 1)-Verteilung; hier sind zus√§tzlich eingetragen die Geraden x = 1.28 und y = 0.9.

Abbildung 2: Definition des Erwartungswertes und seine Berechnung bei einfachen Beispielen.Abbildung 2: Definition des Erwartungswertes und seine Berechnung bei einfachen Beispielen.

In vielen Anwendungen ist man an der umgekehrten Fragestellung interessiert: Gegeben ist zu einer Zufallsvariable X eine Wahrscheinlichkeit p und gesucht ist derjenige x-Wert, f√ľr den Gleichung (1) in Abbildung 2 gilt. Da auf der rechten Seite die Verteilungsfunktion F(x) steht, kann der gesuchte x-Wert aus der Umkehrfunktion der Verteilungsfunktion berechnet werden, siehe Gleichung (2) in Abbildung 2. Abbildung 1 rechts versucht dies zu veranschaulichen: Zur gegebenen Wahrscheinlichkeit (in der Abbildung p = 0.9) sucht man den x-Wert des Schnittpunktes der Verteilungsfunktion F(x) mit der Geraden y = p.

Kann man die Umkehrfunktion nicht explizit berechnen - wie zum Beispiel bei der Normalverteilung -, so werden die Werte tabelliert oder geeignet näherungsweise berechnet (inzwischen ist dies in vielen Tabellenkalkulationsprogrammen implementiert).

Der x-Wert, der implizit durch Gleichung (1) in Abbildung 2 definiert wird, wird als p-Quantil zur Wahrscheinlichkeit p bezeichnet. Das p-Quantil ist somit derjenige x-Wert aus der Wertemenge der Zufallsvariable X, der Gleichung (1) in Abbildung 2 erf√ľllt.

Das p-Quantil einer diskreten Zufallsvariable

Bei der Definition des p-Quantils f√ľr eine diskrete Zufallsvariable ist lediglich zu beachten, dass die Verteilungsfunktion wie in Gleichung (3) in Abbildung 2 nicht mehr umkehrbar ist. Denn nimmt eine Zufallsvariable X die diskreten Werte x1, x2, ... xn mit x1 < x2 < ... < xn an, so ist auf den Intervallen

[xi; xi+1[, i = 1, 2, ..., n-1,

die Verteilungsfunktion konstant und somit die Abbildung

p ‚Üí x = F-1 (p)

nicht mehr eindeutig.

Abbildung 3 veranschaulicht dies am Beispiel des Laplace-W√ľrfels: W√§hlt man etwa p = 0.5, so kommt jeder x-Wert im Intervall [3; 4[ in Frage, um die Gleichung

P(X ‚ȧ x) = 0.5

zu erf√ľllen (dabei wird der Wert 4 ausgeschlossen).

Abbildung 3: Die Verteilungsfunktion der Zufallsvariable X: Augenzahl beim W√ľrfeln.Abbildung 3: Die Verteilungsfunktion der Zufallsvariable X: Augenzahl beim W√ľrfeln.

Die Definition des p-Quantils erfolgt daher im diskreten Fall mit einer Summe anstelle eines Integrals zur Berechnung der Verteilungsfunktion (siehe Gleichung (3) in Abbildung 2). Dabei ist zu beachten, dass der Wert nicht mehr eindeutig sein muss, sondern ein Intervall [xi; xi+1[ sein kann, dessen Grenzen von aufeinanderfolgenden Werten der Zufallsvariable X gebildet wird.

Der Median

In den beiden Beispielen oben (Standard-Normalverteilung und W√ľrfeln) stimmt der Erwartungswert der Zufallsvariable mit dem p-Quantil zu p = 0.5 √ľberein. Dies gilt nat√ľrlich nicht f√ľr jede Zufallsvariable, sondern nur in Spezialf√§llen. Da man mit dem p-Quantil zu p = 0.5 einen weiteren Lageparameter definieren kann, der Aufschluss √ľber eine Wahrscheinlichkeits-Verteilung gibt, f√ľhrt man daf√ľr einen eigenen Begriff ein: der Median.

Der Begriff Lageparameter wird hier als Gegensatz zu Streuparameter verwendet. Seine Bedeutung ist klar: jeweils links und rechts liegen 50 Prozent der Wahrscheinlichkeit. Und wie beim p-Quantil diskutiert, muss der Wert des Medians nicht eindeutig gegeben sein.

Gelegentlich wird auch f√ľr p = 0.25 und p = 0.75 eine eigene Bezeichnung f√ľr das p-Quantil verwendet: man spricht vom unteren Quartil beziehungsweise vom oberen Quartil.

Aufgaben

1. Geben Sie je ein Beispiel einer diskreten Zufallsvariable an mit:

  • der Erwartungswert stimmt mit dem Median √ľberein,
  • der Erwartungswert stimmt nicht mit dem Median √ľberein.

2. Berechnen Sie den Median sowie das untere und obere Quartil der Exponentialverteilung mit Parameter őĽ = 2.

Eine kurze Beschreibung der Eigenschaften der Exponentialverteilung findet sich in Eigenschaften von Zufallsvariablen: Der Erwartungswert von diskreten und stetigen Zufallsvariablen.

(gerundete Ergebnisse: 0.347, 0.144 0.693)

3. Berechnen Sie das untere und obere Quartil der Standard-Normalverteilung.

(gerundete Ergebnisse: -0.674, 0.674)