Skip navigation

Egymintás u-próba

Egymintás u-próba esetén ismert szórású normális eloszlású változó várható értékére végzünk hipotézisvizsgálatot .

Szemléltessük az alábbi példán a fenti gondolatmenetet.

 

Egy versenyző azt állítja, hogy tudja teljesíteni a versenyen való nevezéshez a 100 m-es síkfutásban a 12 másodperces szintidőt.

Az alábbi eredményeket mérték :

Ez alapján elfogadható-e a versenyző azon állítása, hogy teljesíti a szintet?

Tegyük fel, hogy tanuló futási teljesítményideje normális eloszlású, 1,5 sec szórású változó.

.

Amit ellenőrizni akarunk az az. hogy igaz-e a tanuló állítása hogy teljesíti a nevezéshez szükséges szintidőt.

Legyen  ahogyan a versenyző állítja.

Legyen ezért a nullhipotézis az, hogy:

Emellett fogalmazzuk meg az alternatív (vagy ellen) hipotézist:

 megengedett elsőfajú hibavalószínűség mellett döntsük el, hogy igazat mond-e a versenyző.

 

A fentebbi logikai menet alapján járunk el.

Ha igaz a nullhipotézis akkor :

.

 

A kritikus érték meghatározása és a hipotézisvizsgálat a fentebb leírt logikai menet alapján a következőképpen folytatódik.

A mintaátlag tehát egy olyan normális eloszlású valószínűségi változó melynek várható értéke a nullhipotézis igaz logikai értéke esetén 12, szórása  .

Ha a mintaátlag egy konkrét mért minta esetén nagyobb mint a 12 akkor ezt két részhatás eredményének tulajdoníthatjuk:

  • Egyrészt egy véletlen hatás eredményének, a mintavétel véletlen jellege miatt
  • Másrészt azon hatás eredményének, hogy tanuló átlagos futóteljesítménye nem

12 sec/100 m hanem annál rosszabb.

 

Hogy ezek közül melyiket vesszük figyelembe azt úgy döntjük el, hogy első lépésben meghatározzuk a kritikus értéket mely fölé 0,05 valószínűséggel kerülhet a mintaátlag értéke.

Ezt az értéket láthatjuk a sűrűségfüggvényen ábrázolva és Excelben számítva.

Ha a mintaátlag értéke ennél nagyobb azt mondjuk, hogy nem tulajdonítható a 12-től való fölfelé eltérés ekkora mértéke kizárólag a véletlennek.

Annak  valószínűsége hogy a  mintaátlag ennyire eltér a feltételezett várható értéktől  nagyon kicsi – a megengedett elsőfajú hibavalószínűséggel egyenlő – ezért ekkor azt feltételezzük hogy az eltérés mértéke döntően abból a hatásból ered, hogy 12-nél nagyobb a tanuló átlagos futóteljesítménye 100 m-en, így  nem igaz a tanuló állítása, a nullhipotézist el kell vetnünk és az alternatív hipotézist kell igaznak vennünk.

Az alternatív hipotézist a statisztikai irodalmakban gyakran ellenhipotézisként is nevezik.

 

Ekkor a kritikus tartomány azon valós számok halmaza melyek értéke legalább  .

Elfogadási tartomány a -nál kisebb valósak halmaza.

Ekkor ha a minta átlaga az elfogadási tartományba esik azt mondjuk a tanuló állítása igaz, a nullhipotézist elfogadjuk 0,05 elsőfajú hibavalószínűség mellett.

Az alternatív hipotézist ekkor elvetjük.

A mért eredményeken a mintaátlag .

A kritikus érték a mintaátlag eloszlása alapján: .

Mivel  így a mintaátlag az elfogadási tartományba esik ekkor a nullhipotézist elfogadjuk.

Az elfogadási tartomány meghatározására Excelben használhatjuk a NORM.INVERZ függvényt, mely meghatározza azt az értéket mely az elfogadási tartomány felső határa, az elutasítási tartomány legkisebb értéke.

A kritikus értéket hasonló gondolatmenettel vezethetjük le mint a konfidencia intervallum végpontjának meghatározását csak ebben  feladatban nem egy origóra szimmetrikus intervallumban keressük a minta értékét a standard normális eloszlássegítségével hanem egy olyan  kritikus értéket keresünk melyre:

 

ahol a megengedett elsőfajú hibavalószínűség.

A standard normális eloszlás eloszlásfüggvényével kifejezve:

Ekkor az elfogadási tartomány:

Ekkor a kritikus érték:

Kritikus érték direkt számítása Excel függvénnyel:

Ennek kapcsán tárgyalnunk kell az alternatív hipotézisek fajtáit.

A nullhipotézis alakja, mint ahogy elnevezéséből következik az eloszlás egy paraméterétől való 0 eltérés feltételezése.

Az előbbi feladatban a nullhipotézis alakja a következő volt:

A feladat jellegéből következett, hogy alternatív hipotézisként

állítást fogalmaztunk meg. Ha ugyanis a tanulóról a mérés kapcsán kiderül, hogy jobb átlagidőt fut mint a teljesítési szint azaz 12 sec/100m akkor is igazat állít.

Ezt az alternatív hipotézist jobboldali alternatív hipotézisnek nevezzük mivel a kritikus tartomány egy adott értékhez képest vele egyenlő vagy nála nagyobb értékek halmaza:

Lehetnek azonban olyan tipusú feladatok például egy termék súlya vagy  hossza egy gyártási feladat kapcsán vagy egy szállítás ideje egy szállítási feladatban amikor az sem jó ha a nullhipotézisben megfogalmazott értéknél kisebb az sem jó ha nagyobb értéket kapunk a mérés során.

Ekkor az alternatív vagy ellen hipotézis alakja a következő:

Ezt kétoldali alternatív vagy ellen hipotézisnek nevezzük.

Nézzük meg ezt egy példán keresztül:

Egy versenyen a 100 m es síkfutás szintidejét 12 sec-ban állapították meg.

A szintidőre időnként méréseket végeznek hogy korrigálni kell-e?

50  versenyzőnek felmérték az idejét és az alábbi időket kapták.

Tudjuk hogy az eredmények normális eloszlást mutatnak melynek szórása 1sec.

Továbbra is a megengedett elsőfajú hibavalószínűség.

Kérdés, hogy  meg kell-e változtatni a szintidőt a megállapítotthoz képest?

Ebben az esetben két kritikus értékünk van az -ra szimmetrikusan.

A felső kritikus érték számítása:

Felső kritikus érték számítása Excel függvény alapján:

Az alsó kritikus érték számítása:

Az alsó kritikus érték számítása Excel függvény alapján:

Itt az elfogadási tartomány a (11,723;12,277) intervallum.

Mivel a mintaátlag 12,159 így azt a következtetést vonhatjuk le, hogy tulajdonítható a 12-től való felfelé eltérés ekkora mértéke kizárólag a véletlennek, ezért a nullhipotézist elfogadjuk.

Ebből azt a következtetést kell levonni a döntéshozónak,  hogy  a szintidőt nem kell csökkenteni.

Kétoldali alternatív hipotézis ábrázolása :

Kétoldali alternatív hipotézis, kritikus értékek számítása.

Kihasználva a standard normális eloszlás eloszlásfüggvényére megismert összefüggést:

Kapjuk, hogy:

     Ez azt jelenti hogy egy

  • olyan  felső kritikus értéket számolunk mely fölé  valószínűséggel esik a mintaátlag,

és hasonlóan

  • olyan alsó kritikus értéket számolunk mely alá  valószínűséggel esik a mintaátlag

Így a kritikus értékek:

Baloldali alternatív hipotézis:

Egy diszkoszvető versenyen indulni szándékozó tanuló versenyző azt állítja dobóteljesítményével teljesíti  a 20 m-es nevezési szintet.

30 dobást végzett, melyek az alábbiak:

A dobások szórása ismert, .

megengedett elsőfajú hibavalószínűség mellett elfogadható-e az állítás?

Ekkor  .

A nullhipotézis a következő:         

Nyilván ha jobb a teljesítménye mint a nevezési szint, akkor állítása igaz.

Ezért a következőt fogalmazhatjuk meg.

Alternatív vagy ellen hipotézis: 

Kritikus érték számítása Excel függvénnyel

Baloldali alternatív hipotézis ábrázolása: