Lineáris regresszió
Az egyváltozós lineáris regresszió két – egy x független és egy y függő – folytonos változó összefüggésének jellemzése regressziós egyenessel.
A determinációs együttható (a korrelációs együttható négyzete), r2 azt mutatja meg, hogy az x-től való függés mennyiben magyarázza meg az y variabilitását.
Ha r2
- közelít a 0-hoz, akkor az x nem magyarázza az y-t, ha
- közelít 1-hez, akkor nagyon szoros az összefüggés.
Ha a két változó között van szignifikáns összefüggés, de az r2 kicsi, az azt jelenti, hogy más tényezők is szerepet játszanak az y meghatározásában.
A legegyszerűbb regressziós kapcsolat két változó között a grafikusan egy egyenes vonallal jellemezhető lineáris függvénykapcsolat. Első kérdésünk az, hogy a két változó között van-e egy egyenessel leírható összefüggés? Ha igen, akkor megkeressük a legjobb ilyen egyenest. Az ennél bonyolultabb, nemlineáris függvénykapcsolatok, vagy a kettőnél több változó függvénykapcsolatának vizsgálata a statisztika haladó témái közé tartoznak.
A regressziós kapcsolatban mind a két változó függhet a véletlentől is, de az is előfordulhat, hogy csak az egyik esetében lényeges a véletlentől függő komponens. A továbbiakban mi a két esetet nem különböztetjük meg.
A regresszióban a két változó szerepe nem felcserélhető. A lineáris regresszió y=ax+b képletében az egyik változó az x, a másik az y helyére kerül, és az x változó segítségével jósoljuk meg az y értékét. Itt elsősorban logikailag fontos, hogy a két változó szerepe nem felcserélhető (emlékezzünk arra, hogy a korreláció esetében a két változó közül egyik sem volt kitüntetett, azaz felcserélhetők voltak).
Gyakran az x változó esetében nem tételezzük fel, hogy a véletlen változás az x-t is közvetlenül érinti, hanem az x-t általunk választható rögzített és ismert értékként kezeljük, és a véletlentől való függés az y értékében jelenik meg. Az y tehát függ az x-től, de ezen kívül függhet a véletlen okozta ingadozástól is.
Hogyan határozzuk meg, hogy a pontok közé húzható rengeteg egyenes közül melyik az, amelyik az adatok összefüggését legjobban jellemzi? A grafikus ábrázolás pontdiagramja sejteti a lineáris összefüggést. Vonalzóval, „szemre” azonban általában lehetetlen megtalálni az egyenes és a pontok legjobb illeszkedését.