Biometrieübung 8
Chi-Quadrat-Test

Formeln


Inhalt
Chi-Quadrat-Anpassungstest
Tabelle der Verteilungsfunktion der standardisierten Normalverteilung
Tabelle der Signifikanzschranken der Chi-Quadrat-Verteilung

- Anpassungstest

Eine rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe aus einer normalverteilten Grundgesamtheit stammt, ist der Chi-Quadrat-Test, entwickelt von K. pearson. Dieses statistische Prüfverfahren vergleicht die beobachtete empirische Verteilung der Stichprobe, gegeben durch die absoluten oder relativen Häufigkeiten oder auch durch die relativen Summenhäufigkeiten einer in Klassen eingeteilten Meßreihe, mit einer angenommenen theoretischen Verteilung der dazugehörigen Grundgesamtheit. Dazu stellt man über das unbekannte Wahrscheinlichkeitsgesetz F(x) der Grundgesamtheit eine Hypothese auf und prüft diese an Hand einer geeigneten Testgröße, die die Abweichung zwischen empirischer und theoretischer Verteilung zum Ausdruck bringt, auf Ablehnung oder Annahme. Da die statistische Hypothese die gesamte unbekannte Verteilungsfunktion F(x) und nicht nur einzelne ihrer Parameter betrifft, spricht man von einem nichtparametrischen (oder verteilungsfreien) Prüfverfahren und im vorliegenden Fall auch von einem Anpassungstest (STORM).

Wenn der Mittelwert und die Varianz der Grundgesamtheit nicht gegeben sind, müssen sie aus der Stichprobe geschätzt werden.

fi = Beobachtete Häufigkeit
xi = Klassenmitte

Die aufgestellten Hypothesen lauten:
H0: Die Stichprobe stammt aus einer normalverteilten Population
HA: Die Stichprobe stammt nicht aus einer normalverteilten Population

Mit Hilfe der Schätzwerte und kann man die erwarteten Häufigkeiten nach dem in der folgenden Tabelle angegebenen Schema berechnen.
(Mittelwert = 70,16; Standardabweichung = 3,1281; n = 75)

Klassen-
grenzen

Klassen-
mitte
(xi)

Beobachtete Häufigkeit
fi



Erwartete Häufigkeit

<62,5

 

0

-2,45

0,00714

0,00740

0,5355

62,5...<63,5

63

1

-2,13

0,01659

0,00945

0,7088

63,5...<64,5

64

2

-1,81

0,03515

0,01856

1,3920

64,5...<65,5

65

4

-1,49

0,06811

0,03296

2,4720

65,5...<66,5

66

3

-1,17

0,12100

0,05289

3,9668

66,5...<67,5

67

6

-0,85

0,19766

0,07666

5,7495

...

...

...

...

...

...

...

...

...

...

...

...

...

...

oi = obere Klassengrenze der i-ten Klasse
zi = Standardisierung der normalverteilten oberen Klassengrenze der i-ten Klasse
= Wahrscheinlichkeit der standardisierten Normalverteilung (wird aus Tabelle der Verteilungsfunktion der standardisierten Normalverteilung entnommen)
Pi = Wahrscheinlichkeit für die i-te Klasse
= Erwartete Häufigkeit der i-ten Klasse

Pi ist die Wahrscheinlichkeit dafür, daß die betrachtete Zufallsgröße x der Grundgesamtheit in die i-te Klasse fällt, d.h. x zwischen der unteren und oberen Klassengrenze der i-ten Klasse liegt unter der Voraussetzung, daß die Hypothese H0 zutrifft, x also normalverteilt ist.
Damit die Testgröße näherungsweise eine Chi-Quadrat-Verteilung besitzt, dürfen die erwarteten Häufigkeiten nicht zu klein sein. Als Faustregel soll die Beziehung für alle Klassen gelten, d.h., keine der erwarteten Häufigkeiten darf kleiner als 5 sein. Ist für einige Klassen die Forderung verletzt, so müssen benachbarte Klassen zusammengefaßt werden (STORM).
In unserem Beispiel müßten die ersten 5 Klassen zusammengefaßt werden.

Klassen-
grenzen

Beobachtete Häufigkeit
fi

Erwartete Häufigkeit

<66,5

10

9,0751

0,0943

66,5...<67,5

6

5,7495

0,0109

...

...

...

...

...

...

...

...

     

Nach der Wahl der Irrtumswahrscheinlichkeit (Beispiel ) entnimmt man der Tabelle der Chi-Quadrat-Verteilung die Schranke .
Die Freiheitsgrade (FG oder ) ergibt sich aus der Anzahl Klassen k - 1 - r, wobei r die Anzahl der geschätzten Parameter ist (Beispiel: Mittelwert und Varianz geschätzt, damit r = 2).
Gilt für die berechnete Testgröße die Ungleichung , so wird H0 abgelehnt, für erfolgt keine Ablehnung, d.h., die Abweichung zwischen erwarteter und beobachteter Häufigkeit ist nicht signifikant, und es besteht kein Widerspruch zu der Annahme, daß die Stichprobe aus der durch H0 festgelegten Grundgesamtheit stammt.


Letzte Änderung: 20.09.1999
Kontakt:
Wolfgang Stümer