Példa a faktoranalízisre
Nyissuk meg az SPSS példaállományai közül a GSS93 subset.sav (31. ábra által jelzett) adatállományt.
31. ábra
Megnyitás után váltsunk Variable View nézetre és az alábbi változók (id, bigband, bluegrass, country, blues, musicals, classical, folk, jazz, opera, rap, heavymetal) kivételével töröljük a többit, és mentsük el zeneszeretet.sav néven (32.ábra).
32. ábra
Az adatbázisban a különböző zenefajtákat megítélését láthatjuk (33.ábra) egy 5 fokozatú skálán (1=nagyon szeretem, 2=szeretem, 3=közömbös, 4=nem szeretem, 5=nagyon nem szeretem). A 0, 8, 9 értékek a hiányzó értékeket jelölik, ami azt jelenti, hogy nem válaszoltak a kérdésre, vagy nem volt megfelelő a válasz.
33. ábra
A faktoranalízishez válasszuk ki az Analyze / Data Reduction / Factor menüpontot (34.ábra).
34. ábra
Vegyük át a nyíl segítségével a tizenegy zenetípust a Variables mező alá (35. ábra), majd a Descriptives gombra kattintsunk (35. ábra).
35. ábra
Vizsgáljuk meg, hogy az általunk kiválasztott változók alkalmasak-e a faktoranalízisre. Ehhez a KMO (Kaiser-Meyer-Olkin) értékét kell megvizsgálnunk. A Bartlett teszthez és a KMO megállapításához a Factor Analysis: Descriptives ablaknál a KMO and Bartlett’s test of sphericity mezőt pipáljuk ki, majd kattintsunk a Continue gombra, hogy megtudhassuk a KMO nagyságát (36. ábra).
36. ábra
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. |
,748 |
|
Bartlett's Test of Sphericity |
Approx. Chi-Square |
3048,818 |
|
df |
55 |
|
Sig. |
,000 |
8. táblázat
A KMO értékét mutatja a 8. táblázat. Jelen esetben: 0,748 a KMO, ami alapján a változók megfelelőnek tekinthetők (KMO>6), tehát alkalmasak a faktoranalízisre.
Miután eldöntöttük, hogy a változóink alkalmasak a faktoranalízisre, vizsgáljuk meg, hogy hány faktort kell képeznünk.
A Descriptives gombnál pipáljuk ki az Anti-image mezőt (37. ábra), majd a Continue gombot, és végül az OK-t, ami után megjelenik az Anti-image matrix (Anti-images Matrices), melyet a 9. táblázatban láthatunk.
37. ábra
9. táblázat
Communalities
|
Initial |
Extraction |
Bigband Music |
1,000 |
,550 |
Bluegrass Music |
1,000 |
,708 |
Country Western Music |
1,000 |
,691 |
Blues or R & B Music |
1,000 |
,771 |
Broadway Musicals |
1,000 |
,629 |
Classical Music |
1,000 |
,725 |
Folk Music |
1,000 |
,581 |
Jazz Music |
1,000 |
,769 |
Opera |
1,000 |
,635 |
Rap Music |
1,000 |
,650 |
Heavy Metal Music |
1,000 |
,678 |
Extraction Method: Principal Component Analysis.
10. táblázat
A hosszú kommunalitási (Communalities) tábla (10. táblázat) a bemenő és kijövő kommunalitás értékeket mutatja a faktorokra, ami kezdetben ez az érték 1.
A táblázat alján a kiválasztott módszert láthatjuk, mely jelen esetben a főkomponens módszer (Principal Component Analysis). Ennek a módszernek az a lényege, hogy azokat a faktorokat választjuk ki, melyek a legtöbb varianciát magyarázzák meg.
Total Variance Explained
Component |
Initial Eigenvalues |
Extraction Sums of Squared Loadings |
||||
|
Total |
% of Variance |
Cumulative % |
Total |
% of Variance |
Cumulative % |
1 |
3,276 |
29,779 |
29,779 |
3,276 |
29,779 |
29,779 |
2 |
1,661 |
15,098 |
44,876 |
1,661 |
15,098 |
44,876 |
3 |
1,392 |
12,651 |
57,527 |
1,392 |
12,651 |
57,527 |
4 |
1,058 |
9,620 |
67,147 |
1,058 |
9,620 |
67,147 |
5 |
,728 |
6,619 |
73,766 |
|
|
|
6 |
,658 |
5,978 |
79,744 |
|
|
|
7 |
,566 |
5,150 |
84,893 |
|
|
|
8 |
,496 |
4,510 |
89,404 |
|
|
|
9 |
,421 |
3,823 |
93,227 |
|
|
|
10 |
,397 |
3,608 |
96,835 |
|
|
|
11 |
,348 |
3,165 |
100,000 |
|
|
|
Extraction Method: Principal Component Analysis.
11. táblázat
A táblázat (11. táblázat) első oszlopa tartalmazza a kiinduló változóknak a számát, a második főoszlop mutatja a sajátértékeket és a varianciákat ennek a módszernek az alkalmazása után, a harmadik oszlopban a kiválasztott faktorokra jeleníti meg ugyanezeket.
Láthatjuk, hogy 4 faktort különített el az Anti-image eljárás. Ezt a Total Variance Explained (11. táblázat jobb oldala) és a Component Matrix (12 t.áblázat) is mutatja. A négy faktor együtt a teljes variancia 67,147%-át magyarázza (ezt az utolsó oszlopnak az utolsó sorában láthatjuk), ami eléri a minimumként megfogalmazott 60%-ot.
Component Matrix(a)
|
Component |
|||
|
1 |
2 |
3 |
4 |
Bigband Music |
,713 |
-,124 |
-,079 |
-,141 |
Bluegrass Music |
,426 |
-,430 |
,584 |
,017 |
Country Western Music |
,144 |
-,557 |
,600 |
,022 |
Blues or R & B Music |
,531 |
,362 |
,333 |
-,497 |
Broadway Musicals |
,743 |
-,033 |
-,266 |
,073 |
Classical Music |
,741 |
,073 |
-,334 |
,243 |
Folk Music |
,625 |
-,341 |
,091 |
,257 |
Jazz Music |
,526 |
,491 |
,131 |
-,485 |
Opera |
,712 |
,061 |
-,228 |
,267 |
Rap Music |
,087 |
,592 |
,388 |
,376 |
Heavy Metal Music |
-,018 |
,549 |
,404 |
,462 |
12. táblázat
A komponens mátrixból leolvashatjuk, hogy melyik változó melyik faktort jellemzi leginkább. A táblázatban szereplő értékek a faktorsúlyok.
Amennyiben nem megfelelő a négyes faktorszám, akkor a döntésben a Scree plot a segítségünkre lehet.Scree plot ábra az Extraction menüpontban a „Scree plot” bejelölésével kérhető (38.ábra).
38. ábra
39. ábra
Az 39. ábra azt mutatja, hogy a 11 faktor meredeksége az elsőtől az utolsó felé haladva csökken. Az ábrán könyökpontokat (elbow-kritérium) kell keresni, olyan helyet, ahol törés van a görbén, mert azokon a helyeken romlik el a magyarázott varianciának a növekedése.
Az ábrán az 5 faktorszámnál találunk könyökpontot. Az 5 faktorszámnál lévő törés tehát megerősíti azt, hogy 4 faktoros megoldást kell választanunk.
40. ábra
Vizsgáljuk meg a Maximum likelihood eljárással, hogy mi történne, ha 5 faktort használnánk. Methodnál válasszuk a Maximum likelihood-ot, majd állítsuk a faktorok számát (Number of factors) 5-re (40. ábra).
Goodness-of-fit Test
Chi-Square |
df |
Sig. |
16,466 |
10 |
,087 |
13. táblázat
A Maximum likelihood eljárás az 5 faktorra 0,087-es alacsony (<=0,1) szignifikanciaszintet adott eredményül (13. táblázat). Ez a 4 faktorral szemben még így is magasabb szignifikanciaszintet mutat. Tehát ez a módszer nem hozott megfelelő eredményt.
Rotated Component Matrix(a)
|
Component |
||||
|
1 |
2 |
3 |
4 |
5 |
Broadway Musicals |
,816 |
,139 |
,063 |
-,065 |
,006 |
Opera |
,770 |
,070 |
-,026 |
,116 |
,174 |
Classical Music |
,746 |
,115 |
-,187 |
,038 |
,384 |
Bigband Music |
,678 |
,282 |
,261 |
-,162 |
-,054 |
Blues or R & B Music |
,129 |
,863 |
,110 |
,084 |
,081 |
Jazz Music |
,220 |
,843 |
-,097 |
,082 |
-,011 |
Country Western Music |
2,99E-005 |
-,079 |
,885 |
-,029 |
-,016 |
Bluegrass Music |
,073 |
,179 |
,697 |
,006 |
,466 |
Rap Music |
,136 |
,095 |
,091 |
,823 |
-,333 |
Heavy Metal Music |
-,154 |
,083 |
-,119 |
,796 |
,261 |
Folk Music |
,425 |
,026 |
,261 |
-,036 |
,691 |
Extraction Method: Principal Component Analysis. |
Rotation Method: Varimax with Kaiser Normalization. |
Rotation converged in 8 iterations. |
14. táblázat
Amennyiben az 5 faktoros megoldást választjuk, akkor a Folk zene egyedül külön faktorba kerülne (14. táblázat).
Maradjunk a 4 faktoros megoldásnál és rotációs eljárással alakítsuk át a mátrixunkat. Válasszuk a Varimax Methodot és a Continue gombot (41. ábra), majd az Options gombnál a Sorted by size mezőt pipáljuk ki a rendezés érdekében (42. ábra).
41. ábra
42. ábra
Rotated Component Matrix(a)
|
Component |
|||
|
1 |
2 |
3 |
4 |
Classical Music |
,841 |
,097 |
-,072 |
,046 |
Opera |
,785 |
,090 |
,006 |
,103 |
Broadway Musicals |
,764 |
,190 |
,033 |
-,091 |
Folk Music |
,604 |
-,040 |
,463 |
-,012 |
Bigband Music |
,597 |
,340 |
,206 |
-,189 |
Blues or R & B Music |
,133 |
,850 |
,143 |
,105 |
Jazz Music |
,204 |
,843 |
-,086 |
,099 |
Country Western Music |
-,074 |
-,045 |
,825 |
-,058 |
Bluegrass Music |
,164 |
,137 |
,813 |
,018 |
Heavy Metal Music |
-,044 |
,018 |
-,012 |
,822 |
Rap Music |
,020 |
,142 |
-,027 |
,793 |
Extraction Method: Principal Component Analysis. |
Rotation Method: Varimax with Kaiser Normalization. |
Rotation converged in 5 iterations. |
15. táblázat
A 4 faktorra a Varimax rotálást alkalmazva a faktorok sokkal könnyebben értelmezhetőek (15. táblázat). Az oszlopokban az abszolút értékben 0,5-nél nagyobb számokat kell keresni (jelen esetben téglalappal jelöltük ezeket az értékeket). A kapott faktorokat a értelemszerű nevezzük el.
Az első faktorba tartozik: a Classical Music, Opera, Broadway Musicals, Folk Music és a Bigband Music.
A második faktort a Blues or R&B Music és a Jazz Music képzi.
A harmadik faktor a Country Western Music és a Bluegrass Music.
Az utolsó, negyedik faktor pedig a Heavy Metal Music és a Rap Music.