Példa kereszttáblák használatára
Nyissuk meg a smoking.sav állományt az SPSS-ben (65. ábra). Az adatbázisban munkaköri megoszlásokat (staff) láthatunk és azt tudjuk meg, hogy ki milyen fokon dohányzik (smoke). A count egy előzetes számolást tartalmaz azonos értékek esetén (például 10 olyan titkárnő van, aki nem dohányzik) (66. ábra).
65. ábra
66. ábra
A Crosstabs (Kereszttáblák) az Analyze/Descriptive Statistics menüpont alatt érhető el.
Vigyünk egy vagy több változót a Row(s) (sorok) ill. Column(s) (oszlopok) dobozba. Jelen esetben a sor tartalmazza a Staff Group változót, míg az oszlop Smoking változót (67. ábra). A sorváltozók kategóriái adják meg a tábla sorait, az oszlopváltozó kategóriái pedig a tábla oszlopait. Minden egyes sor- és oszlopváltozó párhoz generálódik egy kereszttábla. A Suppress Tables opció kiválasztása után csak a statisztikákat fogja megjeleníteni a program, a táblákat nem.
67. ábra
A Statistics gomb lenyomásával a sor- és oszlopváltozókra jellemző kétváltozós statisztikákat kérhetünk (68. ábra).
Válasszuk a Qhi-squere (khi-négyzet) vizsgálatot, majd nominális változók közül a Contingency cofficient, Phi and Cramér’s V, Lambda, Uncertaninty cofficient vizsgálatokat.
A khi-négyzet statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenőrizhessük. Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb, mint 5. A Pearson khi-négyzet a legelterjedtebb forma, a likelihood-ratio khi-négyzet a maximum likelihood elméleten alapszik.
A phi együttható a khi-négyzetnek a mintanagysággal korrigált értéke. A kontingencia együttható a mintanagyságot használja a számításnál.
A lambda százalékos formában azt mutatja meg, hogy függő változót a független változó milyen mértékben képes előre jelezni. A Cramer V a legmegbízhatóbb mutató, aminek a számításához szükség van a mintanagyságra és a kevesebb lehetőséget felkínáló ismert kategóriák számára.
68. ábra
A Cells gomb lenyomása után a cellák tartalmát határozhatjuk meg. A Format gomb lenyomása után megjelenő párbeszédablakban a táblázat formátumát adhatjuk meg. Pipáljuk az Observed, Expected négyzeteket, majd a Row, Column, Total mezőket, hogy megjeleníthessük a sorokat, oszlopokat és ezek összesítését (69. ábra).
69. ábra
A kereszttábla megmutatja, hogy a minta összesen 486 főt tartalmaz, és nincs hiányzó érték (24. táblázat).
Case Processing Summary
|
Cases |
|||||
|
Valid |
Missing |
Total |
|||
|
N |
Percent |
N |
Percent |
N |
Percent |
Staff Group * Smoking |
486 |
100,0% |
0 |
,0% |
486 |
100,0% |
24. táblázat
Az alábbi táblázat (25. táblázat) a Staff Group és a Smoking változók részletes megoszlását mutatja.
25. táblázat
A Pearson-féle Khi-négyzet próba alapján megállapítható, hogy a két változó szignifikáns (26. táblázat). A Khi-négyzet értéke (χ2) 117,025, míg a szabadságfok (df) 25.
26. táblázat
Az alábbi táblázatban (27. táblázat) látható, hogy a Lambda, a Goodman and Kruskal tau, Uncertainty Coffiecients szignifikancia szintje kisebb, mint 0,05. A Value értékeik a becslés hibavalószínűségének csökkenését jelzik, ha felszorozzuk őket százzal. A két változó (Staff Group és Smoking) Value értékei nem egyenlők, tehát a két változó nem azonos mértékben van hatással a másikra.
27. táblázat
A Phi, Cramer V, és a kontingencia együttható – azaz a szimmetrikus mutatók –mind szignifikánsak (Sig.<0,05). A kapcsolat erőssége a Phi alapján 0,491, Cramer V szerint 0,219, míg a kontingencia együttható szerint 0,441 (28. táblázat).
28. táblázat
A kereszttábla eredményeit a Bar Chart jól ábrázolja (70. ábra).
70. ábra