Skip navigation

Minta kvartilisei

Minta mediánját már meghatároztuk, most a minta kvartiliseit határozzuk meg.

Definíció: Általában kvantilisnek nevezünk egy a növekvően rendezett mintát p:(1-p) arányban osztó pontot.

Ezek közül kiemelt szerepe van a negyedelő pontoknak azaz a kvartiliseknek.

Definíció:Egy növekvően rendezett minta alsó kvartilisének nevezzük a növekvően rendezett mintát 1:3 arányban osztó pontot.

Egy minta felső kvartilisének nevezzük a növekvően rendezett mintát 3:1 arányban osztó pontot.

A kvartiliseket szerkesztésére a medián definíciójának segítségével adunk meg módszert.

A kvartilisek meghatározását többféleképp is végzik így a különböző módszertanok eltérő eredményt adhatnak.

Alsó kvartilis: a növekvően rendezett mintában a mediánnál kisebb mintaelemek mediánja, páratlan számú mintánál a mediánt is beleértve.

Felső kvartilis: a növekvően rendezett mintában a mediánnál nagyobb mintaelemek mediánja, páratlan számú mintánál a mediánt is beleértve

A felső kvartilis-alsó kvartilis különbséget interkvartilis tejedelemnek nevezzük.

Excelben ezt a következőképp lehet megvalósítani.

Kétféle KVARTILIS függvény van a 2010 vagy későbbi Excel verziókban.

KVARTILIS.KIZÁR  és KVARTILIS.TARTALMAZ

Mindkettő statisztikai függvény, abban különböznek, hogy az adatok kvartilisét számolják ki az értékek százalékosztálya alapján –  0 és 1 között – a KIZÁR a végpontok nélkül, a TARTALMAZ  a végpontokkal.

A bemutatott feladatban a VÉLETLEN.KÖZÖTT véletlenszám generáló függvénnyel generálva van egy 12 soros és 5 oszlopos táblázatban minta melynek értékei 1 és 20 közé lettek beállítva.

Ezekre az adatokra számol az Excel A KVARTILIS.TARTALMAZ függvény segítségével értékeket.

Ha a 0. kvartilist számíttatjuk annak értéke a minta minimuma lesz.

Ha a 4. kvartilist számíttatjuk annak értéke a minta maximuma lesz.

A KVARTILIS.KIZÁR nem számol 0. és 4. kvartiliseket.

A 2. kvartilis mindkét függvénynél a medián.

Fontos megjegyezni, hogy az Excel kvartilis számító függvénye nem a medián feletti illetve alatti medián módszertanával számol kvartilist, a nem az adatsorban található kvartilis számok nem számtani közép számítással adódnak az adatokból, hanem adatok közötti negyedelőpont vételével.

A medián kiszámítására természetesen külön statisztikai függvény van az Excelben, nem szükséges a  második kvartilis függvény alkalmazása, közvetlenül is kiszámítható.

Nézzük meg mi a különbség a kvartilisnek a medián alatti illetve medián feletti adatok mediánja definíciója között és az Excel által alkalmazott definíció között a fenti adatsor esetén:

Látható hogy amint fentebb is megjegyeztük : az Excel függvény a nem az adatsorban található kvartilis számok esetén  nem számtani közép számítással dolgozik, hanem  negyedelőpont vételével.

Így az is látszik hogy ugyanazon mintabeli értékek tartoznak az eredeti definíció és az Excek által megállapított kvartilis értékek fölé illetve alá.