Biometrieübung 9
Varianzanalyse

Formeln


Inhalt
Varianzanalyse - Einfache Klassifikation
Tuckey-Test
Tabelle der Signifikanzschranken der F-Verteilung für P=0,05
Tabelle der Signifikanzschranken der F-Verteilung für P=0,01
Tabelle der Signifikanzschranken des studentisierten Extrembereiches (Tuckey-Test) für P=0,05
Tabelle der Signifikanzschranken des studentisierten Extrembereiches (Tuckey-Test) für P=0,01

Varianzanalyse - Einfache Klassifikation

Gegeben seien n Meßwerte eines meßbaren Merkmals, die sich entsprechend der Versuchsanlage bei der einfachen Klassifikation in k (k2) Gruppen oder Klassen mit je n1,...,nk Elementen anordnen lassen. Man sagt: Ein Faktor A wirkt in k Stufen auf das Merkmal. Die n Meßwerte, die mit xij (i=1,...,k; j=1,...,ni) bezeichnet werden sollen, kann man in das folgende Versuchsschema eintragen. Dieser Versuchsplan wird ergänzt durch die Summen S1,...,Sk der Gruppen und ihrer Mittelwerte.

Anzahl der Meßwerte je Gruppe (j) Gruppen (Stufen) des Faktors A (i)  
1 2 ... k
1 x11 x21 ... xk1
2 x12 x22 ... .xk2
. .     .
. .     .
. .     .
ni x1n1 x2n2 ... xknk
Summen Si S1 S2 ... Sk Sg
Mittelwerte ...

Es gilt:

        Summe aller n Meßwerte

                Gesamtmittel

            Streuung der i-ten Gruppe

        Gesamtstreuung

Aufgabe der einfachen Klassifikation der Varianzanalyse ist es, die Mittelwerte der Gruppen miteinander zu vergleichen und damit die Wirkung (den Effekt) des Faktors A auf das Merkmal zu untersuchen. Sind die Umfänge ni der Gruppen verschieden, so spricht man von einer unbalancierten oder nichtorthogonalen Versuchsplan, gilt dagegen n1=...=nk=n0, so heißt der Versuchsplan balanciert oder orthogonal.
Zum Vergleich der Gruppenmittelwerte interpretiert man die k Gruppen als k unabhängige Stichproben mit den Umfängen n1,...,nk und setzt voraus, daß die i-te (i=1,...,k) stichprobe aus der normalverteilten Grundgesamtheit mit dem Erwartungswert und der von i unabhängigen und damit für alle k Grundgesamtheiten gleichen, aber unbekannten Streuung stammt.

Zu prüfen ist die Hypothese , die besagt, daß alle k Stichproben aus derselben Grundgesamtheit stammen, der Faktor A also keinen Einfluß auf das Merkmal ausübt.

Es ist üblich, die zur Durchführung der Varianzanalyse erforderlichen Rechengrößen schematisch in eine sogenannte Tafel der Varianzanalyse einzutragen.

Variationsursache

SQ

Freiheitsgrade
FG

MQ

Zwischen den Gruppen

k - 1

Innerhalb der Gruppen

n - k

Insgesamt (total)

n - 1

 

Testgröße F

   

Folgende Vereinfachungen können verwendet werden:

Aus dem Vergleich der beiden voneinander unabhängigen Streuungen MQZ und MQI mit Hilfe des (einseitigen) F-Test läßt sich folglich auf die Gültigkeit der Hypothese H0 (bzw. HA) schließen. Es wird die Testgröße gebildet, die die Realisierung der unter H0 der F-Verteilung mit m1=k-1 und m2=n-k Freiheitsgraden genügenden Stichprobenfunktion ist, und H0 abgelehnt, falls gilt, d.h., die Varianz zwischen den Gruppen MQZ wesentlich größer als die Varianz innerhalb der Gruppen MQI ist (STORM, Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle; Leipzig 1972).


Tuckey-Test

Hat man die Hypothese über die Gleichheit der k Mittelwerte in den Grundgesamtheiten abgelehnt, so interessiert die Frage, zwischen welchen der k Stichprobenmittelwerte signifikante Unterschiede bestehen. Zur Untersuchung dieses Problems gibt es eine Reihe von multiplen Testverfahren, wie z.B. der Duncan-Test, Newmann-Keuls-Test, der Tukey-Test und der Scheffé-Test. Im folgenden ist die Vorgehensweise beim Tukey-Test beschrieben:

Beim Tukey-Test wird jeder Mittelwert mit den Mittelwerten der anderen Gruppen verglichen. Dafür werden diese in eine Rangfolge nach ihrer Größe geordnet.

Für das Beispiel aus den Übungen sieht dies folgendermaßen aus:

i

1

2

4

3

5

32,1

40,2

41,1

44,1

58,3

In der folgenden Tabelle sind die Vergleiche für das Übungsbeispiel zusammengefaßt.

Vergleich
B mit A

Differenz
()

SE

q

q0,05;25;5

Hypothese

5 mit 1

58,3-32,1=26,2

1,28

20,47

4,166

H0: abgelehnt

5 mit 2

58,3-40,2=18,1

1,28

14,14

4,166

H0: abgelehnt

5 mit 4

58,3-41,1=17,2

1,28

13,44

4,166

H0: abgelehnt

5 mit 3

58,3-44,1=14,2

1,28

11,09

4,166

H0: abgelehnt

3 mit 1

44,1-32,1=12,0

1,28

9,38

4,166

H0: abgelehnt

3 mit 2

44,1-40,1=3,9

1,28

3,05

4,166

H0: nicht abgelehnt

3 mit 4

entfällt

       

4 mit 1

41,1-32,1=9,0

1,28

7,03

4,166

H0: abgelehnt

4 mit 2

entfällt

       

2 mit 1

40,2-32,1=8,1

1,28

6,33

4,166

H0: abgelehnt

Mit dem größten Mittelwert wird begonnen und dieser mit den geordneten Mittelwerten (vom kleinsten zum größten) der anderen Gruppen verglichen. Dabei wird für jedem Vergleich die Hypothese aufgestellt, daß die beiden Mittelwerte gleich sind. Über die Differenz der zwei Mittelwerte und der Hilfsgröße SE kommt man zu dem berechneten q, welches mit der Signifikanzschranke von q aus der Tabelle verglichen wird. Ist das berechnete q größer als der Tabellenwert, wird die Nullhypothese abgelehnt, damit unterscheiden sich die zwei Gruppen signifikant.

Bei nicht Ablehnung der Nullhypothese (berechnetes q kleiner als q aus der Tabelle) unterscheiden sich die Gruppen nicht signifikant. Gruppen die vom Mittelwert zwischen den sich nicht unterscheidenden Gruppen liegen, entstammen somit auch der selben Grundgesamtheit und der Vergleich kann entfallen (siehe Tabelle oben).

Die Formeln für die Hilfsgröße SE und für q lauten:

Aus der Tabelle der oberen Signifikanzschranken des studentisierten Extrembereiches kann man für ein bestimmtes (in unserem Beispiel ) ablesen.
FG = k - n = zu gehörende Freiheitsgrade
k = Anzahl der betrachteten Mittelwerte


Letzte Änderung: 23.08.1999
Kontakt:
Wolfgang Stümer