Biometrieübung 11
Kontingenztafeln

Formeln


Inhalt
Auswertung von Vierfeldertafeln (2x2 Kontigenztafeln)
Tabelle der Signifikanzschranken der Chi-Quadrat-Verteilung

Auswertung von Vierfeldertafeln (2x2 Kontigenztafeln)

Merkmalspaar II

Ereignisse

(+)

Komplementär-
ereignisse
(-)

Insgesamt

Merkmalspaar I      
Erste Stichprobe

a

b

a + b = n1

Zweite Stichprobe

c

d

c + d = n2

       
Insgesamt

a + c

b + d

n1 + n2 = n

Die beiden Stichproben von Alternativdaten werden daraufhin untersucht, ob sie als Zufallsstichproben aus einer durch die Randsummen repräsentierten Grundgesamtheit aufgefaßt werden können. Ob Abweichungen der Verhältnisse a/n1 und c/n2 von dem Verhältnis (a + c)/n (Nullhypothese der Homogenität: a/n1 = c/n2 = (a + c)/n) als Zufallsabweichung auffaßbar sind.

Verteilen sich die Felderhäufigkeiten proportinal zu den Randsummen?

Um dies zu entscheiden, bestimmen wir die unter dieser Annahme zu erwartenden Häufigkeiten, kurz Erwartungshäufigkeiten E genannt.
Wir multiplizieren die Zeilensumme mit der Spaltensumme des Feldes und dividieren das Produkt durch den Umfang n der vereinten Stichproben.

z.B.


Nullhypothese: Beide Stichproben entstammen einer gemeinsamen Grundgesamtheit mit der Erfolgswahrscheinlichkeit .
Alternativhypothese: Beide Stichproben entstammen zwei verschiedenen Grundgesamtheiten mit den Erfolgswahrscheinlichkeiten 1 und 2.

Erfolgswahrscheinlichkeit ist das Ereignis dividiert durch die Zeilensumme.
Die Nullhypothese auf Gleichheit oder Homogenität beider Parameter (oder auf stochastische Unabhängigkeit beider Merkmalsalternativen) wird anhand des - Tests nicht abgelehnt oder abgelehnt.

durch Umformungen erhält man:

Für kleines n ist n durch (n-1) zu ersetzen.

Das Vierfelder- besitzt nur einen Freiheitsgrad, da bei gegebenen Randsummen nur eine der 4 Häufigkeiten frei gewählt werden kann.
Die Nullhypothese wird abgelehnt, sobald das berechnete größer ist als der Tabellenwert
-Tests können lediglich die Existenz eines Zusammenhanges aufzeigen. Über die Stärke des Zusammenhanges sagen sie nichts aus. Ein Maßzahl für den Grad des Zusammenhanges ist der Kontingenzkoeffizient. Er ist als Maß für die Straffheit des Zusammenhanges der beiden Merkmale von Vier- und Mehrfeldertafeln aus dem - Wert nach der Formel zu berechnen:

          

Der maximale Kontigenzkoeffizient für die Vierfeldertafel beträgt 0,7071; er tritt stets bei vollkommener Kontingenz auf, also wenn die Felder b und c unbesetzt bleiben.

 

Vergleich mehrerer Stichproben von Alternativdaten
(k*2 – Felder – Kontingenztafel)

Vorausgesetzt werden n unabhängige Beobachtungen.

Stichprobe
(oder 2. Merkmal)
Merkmal
(+)
Merkmal
(-)

1
2
.
j
.
k
x1
x2
.
xj
.
xk
n1-x1
n2-x2
.
nj-xj
.
nk-xk
n1
n2
.
nj
.
nk
x n-x n

Zur Entscheidung über Beibehalten oder Ablehnung der Nullhypothese der Homogenität (Gleichheit) k binomialer Grundgesamtheiten dient der - Test.

   mit FG = k –1

n = Umfang der gesamten Stichproben, die "Ecksumme"
nj = Umfang der einzelnen Stichproben j
x = Gesamtzahl der Stichprobenelemente mit dem Merkmal "+"
xj = Häufigkeit des Merkmals "+" in der Stichprobe j


Letzte Änderung: 20.09.1999
Kontakt:
Wolfgang Stümer