🔍
Kruskal-Wallis-Test in SPSS - Funktionsweise und Interpretation - Daten analysieren in SPSS (21) - YouTube
Channel: Statistik am PC
[0]
was ist der Kruskal-Wallist-Test, was hat
er für voraussetzungen udn wie funktioniert er?
[3]
Darum geht es jetzt im folgenden.
Zunächst was ist der Kruskal-Wallist-Test
[6]
der Kruskal-Wallist-Test testet mir
unabhängige stichproben und fragt, ob es
[11]
zentrale tendenzen gibt, die sich bei
mehreren unabhängigen stichproben
[15]
voneinander unterscheiden. dabei nimmt
man eben nicht jetzt stichproben-
[18]
mittelwerte oder vergleicht mittelwerte, sondern man nimmt die daten
[21]
sortiert, sie nach rängen und vergleicht
dann mehr oder weniger die ränge.
[24]
deswegen ist er auch ganz gut geeignet,
wenn ich jetzt sehr starke ausreißer
[27]
habe. die ausreißer werden dann aufgrund der rangbildung, ja, eben sehr stark
[31]
eingedampft, also es gibt dann faktisch
keine ausreißer mehr in dem sinne.
[34]
gleichzeitig hat er die voraussetzung,
dass er weniger voraussetzungen hat, als
[38]
jetzt beispielsweise eine ANOVA, also
er geht nicht davon aus, wie
[41]
typischerweise bei parametrischen tests,
dass meine daten normalverteilt
[44]
vorliegen und sie müssen auch nicht
zwingend metrisch vorliegen. also, der
[47]
Kruskal-Wallist-Test relaxiert
sozusagen meine voraussetzungen sehr
[51]
stark und ich kann den eigentlich, wenn
ich irgendwelche unabhängigen
[54]
stichproben habe, relativ unproblematisch
eigentlich immer anwenden. Für die
[59]
durchführung in SPSS habe ich hier wieder das datensample, was ich auch bei dem
[62]
Mann-Whitney-U-Test, übrigens link in
den infokarten dazu, verwendet habe und
[66]
zwar haben wir hier den ruhepuls und das
training. 0 bedeutet untrainiert, 1
[70]
mäßig trainiert und 2 stark
trainiert oder gut trainiert und es sind
[74]
unabhängige stichproben, das bedeutet
wir haben die leute auf der straße
[77]
angesprochen oder irgendwo anders herbekommen und die leute haben miteinander
[80]
nichts zu tun,
das heißt sie sind tatsächlich
[82]
unabhängig voneinander.
wenn wir jetzt einen Kruskal-Wallist-Test
[86]
durchführen wollen, gehen wir zunächst auf "Analysieren, "nicht parametrische Tests"
[89]
wir gehen auf "Alte Dialogfelder" und
dann gehen wir hier auf "k unabhängige
[93]
stichproben", weil wir mehr als zwei haben deswegen "k".
[96]
wir haben als testvariable unseren
Ruhepils und als training haben wir
[100]
die gruppierungsvariable. Die bereiche
definieren wir, haben hier 0,1 und 2 also
[104]
minimum ist 0, das maximum ist
offensichtlich 2. Man könnte zusätzlich
[110]
noch hier exakt, eine exakte signifikanz
ausrechnen lassen, das machen wir mal.
[116]
Wir werden auch gleich sehen, was da für
probleme auftreten,
[120]
klicken auf ok und bekommen die
ergebnisse und wir sehen jetzt hier
[123]
zunächst bei den rängen, wir haben 13
untrainierte, 13 mäßig trainiert und 13
[129]
gut trainiert und der mittlere rang ist
ja nichts anderes als die rangsumme
[133]
geteilt durch das n, also die
untrainierten sind natürlich in den
[136]
rängen, wenn wir von niedrig zuhen ruhepulsen sortieren, haben natürlich im
[140]
schnitt einen höheren rang, zum beispiel
eben die ränge, ja wahrscheinlich 26-39
[146]
und die aufsummiert und geteilt durch
die anzahl der individuen in dieser
[151]
stichprobe gibt eben den mittleren rang.
27,23 und wir sehen dass die mäßig
[155]
trainierten etwas besser sind und die gut
trainierten schon im mittel einen sehr viel
[159]
niedrigeren Rang haben. Wir sehen jetzt
hier statistik für den test, wir sehen
[163]
hier die asympathische Signifikanz, sie liegt bei 0,004,
[166]
das würde bedeuten, wir verwerfen unsere Nullhypothese. Erinnerung die Nullhypothese
[170]
bei solchen tests ist typischerweise
dass keine unterschiede vorliegen, also
[175]
wir verwerfen diese annahme dass keine
unterschiede vorliegen und müssen dem-
[179]
zufolge die alternativhypothese
annehmen, die besagt es liegen
[182]
unterschiede vor, also es ist durchaus
davon auszugehen, dass wir untrainierte,
[186]
mäßig trainierte und gut trainierte anhand deren Ruhepuls,
[190]
sozusagen unterschiede zwischen den
gruppen vorliegen. So, und ich haben
[194]
vorhin gesagt, dass wir die exakte Signifikanz uns ausgeben lassen
[196]
und wir haben jetzt hier aber, hier steht ein c dran und hier steht "wegen numerischer
[200]
probleme konnte die kalkulation nicht
durchgeführt werden"
[202]
das ist natürlich blöd. An und für sich
erst mal kein grund zur panik
[207]
zunächst würde man nämlich erstmal
überlegen, nimmt man jetzt an dieser
[210]
stelle, wenn man das verschriftlicht, die
[212]
asymptotische oder die exakte signifikanz.
wir müssten jetzt die asympottische
[217]
signifikanz nehmen, weil wir eine
stichprobe in summe haben, die größer 30 ist.
[220]
Das heißt, wir würden diesen wert
berichten und eben auf basis dessen auch
[225]
sagen können, wir würden unsere
Nullhypothese der gleichheit verwerfen können.
[229]
Wenn wir jetzt aber eine stichprobe haben, die kleiner 30 ist,
[232]
müsste man die exakte Signifikanz
nehmen, die kann man aufgrund numerischer
[236]
probleme nicht ausgeben lassen und das
ist jetzt sehr blöd und ich habe da ein
[240]
bisschen recherchiert und wie das ganze
funktioniert, oder wie man das ganze
[243]
jetzt umgehen kann, kommen wir gleich
dazu
[246]
wichtig, möchte ich an dieser stelle
nochmals betonen, wir haben jetzt
[248]
lediglich hiermit nur gezeigt, es gibt
signifikante unterschiede zwischen den
[253]
gruppen, aber ich weiß ja gar nicht
zwischen welchen gruppen und das muss
[256]
man definitiv noch mal mit ein paarweisen vergleich testen, denn ansonsten
[259]
kann ich ja nicht sagen, welche gruppen
sich jetzt tatsächlich unterscheiden
[263]
vielleicht unterscheiden sich die
untrainierten und die mäßig trainierten ja
[265]
gar nicht, aber die gut und die mäßig
trainierten und die gut und die
[268]
untrainierten, also wir sehen, wir haben
da durchaus die notwendigkeit noch ein
[272]
paarweisen vergleich durchzuführen und
das geht über "Analysieren" und
[275]
"nicht parametrisch" wieder. Wir gehen jetzt auf "unabhängige
[278]
stichproben" und lassen uns bei felder als testfeld den ruhepuls und als
[284]
training für die gruppenvariable einen
test ausführen. er erkennt an dieser
[289]
stelle automatisch, das es ein Kruskal-Wallist-Test sein wird
[293]
und wir kommen jetzt diese hypothesenübersicht ausgegeben und zwar steht
[296]
hier eben: wir lehnen, wie eben auch bei asymptotischer signifikanz, steht hier
[300]
0,004, also das ist bedeutend kleiner als 0,05. Wir lehnen die Nullhypothese ab
[305]
und wenn wir jetzt ein paarweisevergleich durchführen wollen, würden
[308]
doppelklick hierrauf und man müsste
jetzt, und jetzt aufpassen, das
[311]
funktioniert jetzt natürlich nicht, was
ich zeige, aber ich zeige einen
[314]
workaround, wie es dann doch funktioniert.
dann würde jetzt hier unter ansicht
[318]
"paarweise vergleiche" auswählen.
so jetzt haben wir aber wieder das ding,
[321]
was wir eben schon hatten. "Problem(e) bei Ansicht Paarweise Vergleiche aufgetreten.
[325]
Daher wird sie nicht angezeigt."
[326]
ich habe da ein bisschen recherchiert, tatsächlich
[328]
bei ibm selbst eine lösung gefunden, das
ist ein problem das existiert und zwar
[332]
gibt es zwei möglichkeiten, entweder man
stellt die lokalsettings des
[335]
rechners auf englisch, was ich jetzt
nicht unbedingt machen möchte. man kann
[339]
alternativ unter "Bearbeiten", "Optionen"
[345]
kann man hier unter "Ausgabe" gehen und
würde bei "Anzeige von Ausgaben" das ist
[349]
ja das was wir eben gemacht haben, nicht
dem modellviewer - das hier ist ein modellviewer,
[353]
sondern man würde pivottabellen
und diagramme ausgeben und dann auf "OK".
[357]
jetzt werden wir das ganze noch mal
durchführen
[361]
und jetzt bekommen wir hier ja schön
viel zeug, wollen wir nicht - wichtig ist uns
[366]
das ding, ja also wir sehen hier noch mal
die boxplots, also wir sehen definitiv
[368]
das ist ja hier der median, das für die Ruhepulse bei der untrainierten gruppe relativ
[374]
hohen Median und er sinkt dann je nach
training immer weiter. wir wollen im
[378]
prinzip genau diese tabelle hier. Es gibt
hier die vergleiche, die paarweise
[382]
vergleiche und wir sehen gut trainiert,
mäßig trainiert - signifikanz ,228 - 0,228
[388]
also können wir die Nullhypothese nicht verwerfen - es gibt keinen
[391]
signifikanten unterschied zwischen den
beiden. Gut trainiert untrainiert - sehr
[395]
gut 0,003 - das scheint also quasi der
ausschlag für unsere hier asymptotische
[400]
Signifikanz zu sein, die wir
haben, also die Nullhypothese
[404]
ablehnende gründe scheinen sich hierin
zu finden, also 0,003 bedeutend kleiner als
[409]
0,05 gut trainiert untrainiert ist
genau das, was wir hier zeigen können
[414]
und mäßig trainiert und trainiert gibt
es auch keinen wirklichen unterschied
[416]
also wir können eben anhand dessen, anhand der paarweisen vergleiche erkennen, dass
[421]
das meine stichproben sich insbesondere oder eigentlich fast nur bei
[426]
gut trainiert und untrainiert
unterscheiden.
[428]
jetzt haben wir ja nun gezeigt, dass es
signifikante unterschiede gibt und jetzt
[432]
möchte man natürlich noch schauen wie
groß ist denn die effektstärke?
[434]
Für die Effektstärke bietet sich folgende
formel an und zwar ist das "r", also so eine
[438]
art korrelationskoeffizient, der sich
aus dem quotienten ergibt des
[442]
z-standardisierten wertes geteilt durch die wurzel (n). n ist die anzahl der individuen in
[447]
einer stichprobe und daraus den betrag
und wir haben jetzt in unserer tabelle
[450]
die standardteststatistik dass es 3,315
und wir können das hier mal direkt
[454]
berechnen. 3,315 und das teilen wir jetzt
durch die wurzel unserer subjekte und
[460]
dabei muss man aufpassen, dass man nur die subjekte für >diesen< paarweisen
[464]
vergleich aufsummiert, also wir haben gut
trainiert 13 und untrainiert auch 13.
[468]
Das heißt wir ziehen an dieser stelle die
wurzel aus 26 und bekommen eine effekt-
[475]
stärke von 0,65 und es gibt drei
grenzen 0,1 ist eine schwache effekt-
[479]
stärke, 0,3 eine mittlere und 05 ist
eine starke effektstärke und 0,65 ist
[485]
ja offensichtlich größer als 0,5 das
heißt für den für den signifikanten
[488]
unterschied zwischen gut und
untrainierten haben wir eine effekt-
[493]
stärke von 0,65, also einen starken
effekt und andere effekt stärken
[498]
brauchen wir nicht ausrechnen, weil die
signifikanzen hier größer 0,05 sind
[501]
wir haben also an dieser stelle zeigen
können, dass mit dem Kruskal-Wallist-Test
[505]
zentrale tendenzunterschiede bestehen.
dazu haben wir eben die signifikanz uns
[509]
ausgeben lassen und gleichzeitig haben
wir bei signifikanten gruppen-
[513]
unterschieden bei unabhängigen
stichproben auch die effektstärke
[516]
ausrechnen können.
[517]
Das war es an dieser stelle auch schon wieder. Hat euch das
[519]
video gefallen, lasst mir einen Daumen nach oben da. Habt ihr fragen oder anregungen,
[522]
lasst es mich in den kommentaren wissen.
Ansonsten freue ich mich natürlich
[525]
über ein abonnement und sehe euch beim
nächsten video!
Most Recent Videos:
You can go back to the homepage right here: Homepage





