1.2.1 Legfontosabb jellemzők

A Microsoft Excel táblázatkezelővel készült állományokat munkafüzetnek hívjuk. Alapértelmezett kiterjesztése a 2007-es verziótól kezdve .xlsx, mely egy nyílt XML szabványon alapuló, ZIP-pel tömörített fájlformátum. A szabványos XML leíró nyelv használata lehetővé teszi egészségügyi adataink interneten történő strukturált feldolgozását és könnyű hozzáférhetőségét.

A táblázatkezelők általános elveinek megfelelően, a munkafüzet munkalapokból áll, ezek közül az alul lévő fülek segítségével választhatunk. A munkalapok másolhatók, áthelyezhetők, átnevezhetők, elrejthetők, törölhetők, stb. (lásd a következő fejezetet). A későbbi könnyebb értelmezés és visszakeresés miatt érdemes a munkalapok nevét, sorrendjét az adott kutatási feladat logikája szerint szervezni, a nem használt vagy a feladat szempontjából lényegtelen munkalapokat elrejteni.

Viszonylag kevés alkalommal találkozunk egy adatfeldolgozás során olyan táblázattal, ahol a szükséges paraméterek (oszlopok) száma meghaladja a 20-30-at. Egy komolyabb kérdőív feldolgozásánál ugyanakkor ez az érték könnyen elérheti a párszázat, de pl. speciális genetikai adatbázisok kezelésekor már többezer paraméterrel is találkozhatunk. Erre is felkészülve, az Excelben az egy munkalapon használható oszlopok száma 16.384, ami pontosan 214.

MEGJEGYZÉS
Mivel ennyi betű az azonosításra használt angol ABC-ben nincs, ezért a Z betűt követően az azonosítás átvált kétbetűsre: AA, AB, AC, stb. De még ez sem elég, ezért a ZZ oszlop után már 3 betűs címkéket kell használnunk: AAA, AAB, AAC, stb. Így az utolsó oszlop XFD betűkkel van azonosítva. (Az utolsó oszlop elérése: Ctrl + →)

A sorok száma 1.048.576, ami pontosan 220. Ez a mennyiségű sor már szinte mindig elegendő, még az igen magas mintavételi frekvenciával vett mérési adataink tárolására is. (Az utolsó sor elérése: Ctrl + ↓) Amennyiben a rekordjaink száma meghaladja ezt az értéket, át kell gondolnunk az adataink rögzítésének paramétereit vagy fel kell darabolnunk a teljes adattáblát kisebb egységekre.

MEGJEGYZÉS
Csupán csak technikai jellegű, de gyakran az adatbevitelnél is hasznos ismernünk, hogy a táblázatkezelő celláiba beírt szöveges adatok alapesetben balra, míg a szám jellegű adatok (számok, tizedes törtek, dátumok, idő értékek, stb.) jobbra lesznek igazítva. Egy elgépelt numerikus adat, vagy egy számként értelmezett szöveges információ már az alapértelmezett igazítás miatt is gyorsan észrevehető.

Az adatainkat tartalmazó táblázatok megtervezésekor figyelembe kell vennünk néhány további, a táblázatkezelőre jellemző korlátot, amelyek Excel esetében a következő táblázatban találhatóak.

Cellák, számok

Maximum

Karakterek száma egy cellában

32 767 karakter

Soremelések maximális száma cellánként

253

Tizedesjegyek száma

15 számjegy

Megengedett legkisebb negatív szám

-2,2251E-308

Megengedett legkisebb pozitív szám

2 251E-308

Megengedett legnagyobb pozitív szám

9,99999999999999E+307

Megengedett legnagyobb negatív szám

-9,99999999999999E+307

Képlet tartalmának hosszúsága

8 192 karakter

A fenti paramétereket tekintve jól látható, hogy a táblázatkezelők általában megfelelően túltervezettek. Nem könnyű olyan egészségügyi adatokkal kapcsolatos példát találni, ami a fenti korlátokat megközelítené.

Licensed under the Creative Commons Attribution Share Alike License 4.0