Középértékek, szóródásmutatók

A sokaságot leíró és jellemző információk közül különösen jól használhatóak azok, amelyek tömörek, akár egyetlen számadatban sűrítve jellemzik a sokaságot. Ezek egyik típusa, a kvantilis értékek olyan osztópontot jelentenek, amelyekre nézve a sokaság a pont által jellemzett mennyiségi tulajdonság szerint részekre bontható: az ismérv értékénél nagyobb, illetve annál kisebb értékekkel jellemezhető azonos számosságú csoportokra (részsokaságokra). A kvantilisek közül a legismertebb a medián. Ez két egyenlő részre bontja a sokaságot: az egyikben a mediánnál kisebbek, a másikban pedig nagyobbak a mennyiségi ismérv értékei.

A medián mellett (amely az elemek gyakorisági sorában áll középen) a módusz is az úgynevezett helyzeti középértékek körébe tartozik. A divatra utaló nevéből (mode) is látható, hogy a leggyakoribb érték, ezért számítani sem kell, a gyakorisági sorból leolvasható. Használata akkor célszerű, amikor a vizsgált ismérv kiugró, szélső értékei nem fontosak a számunkra, ha azoktól el akarunk vagy tudunk tekinteni.

A származtatott statisztikai adatok egyik legfontosabb fajtáját jelentik az átlagok. Többféle átlag számítható, valamennyi úgynevezett számított középérték. Leggyakrabban használt fajtája, a számtani átlag mellett az alábbi átlagok számíthatóak ki mennyiségi ismérvekből:

  • harmonikus,
  • mértani,
  • négyzetes átlagok.

A számtani átlag egyértelműen meghatározott, könnyen értelmezhető, egyszerűen számítható, és az esetek nagy részében tipikus érték. Jól ismert, hogy a számtani átlag az a szám, amellyel az átlagolandó értékeket helyettesítve azok összege állandó marad. Maga az átlagszámítás is akkor indokolható, ha az átlagolandó értékek összegének van jelentése, azaz értelmezhető kategória. Ha az összes előforduló értéket összeadjuk és elosztjuk az elemek számával, egyszerű vagy súlyozatlan, ha a többször előforduló értékeket egy átlagolandó értéknek tekintjük és előfordulási gyakoriságával szorozzuk, akkor súlyozott számtani átlagot számolunk. A számtani átlag emellett az a szám is, amelynek értékétől az egyes előfordult értékekből számított különbségek négyzeteinek összege minimális. Ez tehát az a szám, amelyik a legközelebb van a sokaságban előforduló értékek összességéhez. Ez a tulajdonsága kapcsolja logikailag az átlagot a másik, a sokaságot jellemző mutatóhoz, a szóráshoz.

Egy sokaságot két adata, valamilyen középértéke és a sokaságot jellemző adatok szóródása együttesen eléggé jól leír. Míg a középérték a sokaság tipikusságára, adatainak valamilyen sűrűsödésére, a szóródás éppen az ellenkezőjére, az adatok különbözőségében mutatkozó sajátosságra irányítja a figyelmet.

A szóródás terjedelme igen egyszerű mutató, az előforduló legnagyobb és legkisebb érték különbsége. Ezért a véletlen hatások erősen befolyásolják, használata akkor indokolt, ha éppen ez fontos az elemzés számára.

Az átlagos eltérés az egyes értékek és azok számtani átlaga közötti eltérések értékeinek átlaga. Finomabb mutató a szórás, az átlagtól való eltérések négyzetes átlaga. (A szóródásmutatók kiszámítása azok bonyolult képleteibe való behelyettesítés helyett számítógépes programokkal igen egyszerűen történhet.)