Űrfelvételek feldolgozása - osztályozás

Bevezetés

A földi erőforráskutató műholdak viszonylag nagy területről, több sávban készítenek felvételeket. Így a geometriai felbontásnak megfelelően egy adott területről több mérési eredmény áll rendelkezésünkre. Pontosabban minden képelem egy földfelszíni területet határoz meg (geometriai korrekció után abszolút értelemben), és a képelem értékei (pixelértékek) az adott terület visszaverő, vagy kisurgárzási képességét írják le. Vagyis a pixelérték a terület reflektanciartékét fejezi ki közvetve vagy közvetlenül. Ha több spektrális sávban történik a reflektancia meghatározása, akkor a terepi spektrumok felvételével vagy az ún. spektrumkönyvtárak használatával azonosíthatjuk a pixelértékek alapján, hogy az adott területre milyen felszínborítás jellemző. Miután minden képelemhez nem lehet terepi adatokat hozzárendelni, így általában az ilyen pixelalapú kiértékelés során a digitális képfeldolgozás egy nagyon hatékony módszerét, az osztályozást tudjuk elvégezni. Az osztályozás célja, hogy a képelemeket a pixelértékek alapján a felhasználó által vagy automatikusan kijelölt osztályokba (klaszterekbe) soroljuk, és létrehozva egy tematikus térképet.

Az osztályozási módszerek rendkívül szerteágazóak, sok matematikai (geometriai, valószínűségszámítási) ismeretet igényelnek. A beépített funkciók révén ezek a módszerek nem feltétlenül jelennek meg a felhasználó előtt, ezért érdemes ezeket részletesebb tárgyalni. Nagy adatbázisok esetében gyakran használunk hasonló módszereket.

Az osztályozás lehet pixel vagy szubpixel alapú. Az előbbi esetben a pixelérték egy értékként jellemzi az adott felszín reflektancia-tulajdonságait. Pédául, ha több felszínborítási típus van egy területegységen belül, akkor az azokról visszaverődő elektromágneses sugárzást egy jelként értékeljük. Szubpixel alapú osztályozás esetén valamilyen képfeldolgozási módszerrel arra is próbálunk adatot kinyerni, hogy a területen belül milyen arányban fordulnak elő a különböző felszínborítási típusok.

A tananyagban jelenleg csak apixelalapú osztályozás két fő típusát az irányított és az automatikus osztályozást tekintjük át röviden.

Irányított osztályozás

Bevezetés

A multispektrális klasszifikáció során a képalkotó elemeket, a pixeleket, a pixelértékek alapján besoroljuk a véges számú osztályok egyikébe. Ha a pixel megfelel bizonyos kritériumoknak, akkor abba a tematikus osztályba fog tartozni, melyet a kritériumok szerint határoztunk meg. A fenti folyamatot a kép szegmentációjának is nevezik.

A klasszifikáció folyamata

Mintázat felismerés

Az emberi szem felismer bizonyos szerkezeteket és a színeket kategóriákba csoportosítja a színes képeken. A multispektrális, digitális képek esetén a számítástechnika és a matematika eszközeivel lehetőség van a spektrális mintázatok tudományos elven történő felismerésére. Statisztikák készíthetők a pixelek spektrális tulajdonságai szerint, és a pixelek osztályozhatók matematikai feltételek alapján. Ezt a folyamatot két jól elkülönülő részre, a betanításra (tréning) és a döntéshozási módszereket használó osztályozásra bontjuk.

Betanítás - Tréning

A számítógépet fel kell készíteni, be kell tanítani arra, hogy felismerje az adatokon belüli csoportokat. A tréning az a folyamat, melyben meghatározunk feltételeket, amelyekkel ezek a csoportok felismerhetők. A tréning vagy a felhasználó által irányított, un. supervised, vagy minimálisan irányított, un. unsupervised módszer lehet.

Irányított betanítás

Ezt a módszert az jellemzi, hogy végig a felhasználó irányítása alatt áll. Először a felhasználó kiválasztja azokat a pixeleket, amelyek reprezentálni fogják az adott osztályt. A pixelek kiválasztásakor használhatunk különböző forrásokat, légifelvételeket, térképeket, helyszíni megfigyelési adatokat, stb. A pixelértékek elemzése és a tematikus térkép osztályainak előzetes ismerete szükséges ehhez a módszerhez. A minta azonosítása készíti fel a számítógépet a hasonló tulajdonságú pixelek azonosítására.

Nem irányított betanítás

A nem irányított betanítás sokkal inkább automatizált folyamat. A képfeldolgozó program felismeri a hasonló tulajdonságú pixeleket, de ezek nem szükségszerűen illeszkednek a kép folyamatos, könnyen felismerhető területeihez, mint pl. a talajtípusokhoz, vagy területhasznosítási osztályokhoz. Ezek csak egyszerű pixel klaszterek, melyek a hasonló spektrális tulajdonságú pixeleket gyűjtik össze. Ezt a módszert általában akkor alkalmazzuk, ha kevés információnk van a klasszifikáció előtt a területről. A klasszifikáció után a felhasználónak kell értelmeznie a létrejött osztályokat.

Tanulók - signatures

A tréning eredménye a tanulók egy halmaza, amely tartalmazza a tanulóterületeket, vagy a klasztereket. Minden tanuló egy osztályt ír le, és a döntéshozási szabállyal együtt a képfile minden egyes pixele egy osztályhoz rendelhető. A tanulók aszerint csoportosíthatók, hogy hogyan és hol jelöltük ki azokat. A statisztikai paramétereken (pl. átlag, szórás, kovariancia mátrix, stb.) alapuló pixelhalmazt parametrikus tanulónak nevezi az ERDAS. A parametrikus pixelhalmazt kijelölhetjük a földrajzi térben egy terület lehatárolásával, mely a benne lévő pixelek értékei szerint jellemezhető statisztikus paraméterekkel. A tanulóterület kijelölése többféle módon is történhet. Parametrikus adatokkal jelölhetünk ki egy klasztert a spektrális térben, ha kijelölünk egy n-dimenziós pontot , mint klaszterközepet és meghatározzuk a klaszterbe tartozó, pl. egy bizonyos szórástartományon belül lévő pixeleket . A parametrikus tanulók a statisztikus osztályozási módszereknél, pl. a maximum likelihood, használhatók az osztályok meghatározására. A nem-parametrikus tanulókat nem statisztikai módszerekkel jelöljük ki. Ilyen lehet egy spektrális térben megadott diszkrét alakzat. Ezekkel az alakzatokkal az osztályok spektrális térbeli határait adjuk meg. A nem-parametrikus osztályozások fogják használni a nem-parametrikus tanulókat.

Az osztályba soroláskor azt vizsgáljuk, hogy az adott pixel kívül vagy belül van a spektrális térben lokalizált osztályokon. A supervised tréning során hozhatunk létre nem-parametrikus tanulókat (Kloer, 1994).

A tanulók értékelése

Alarm réteg

Az alarm értékelés lehetővé teszi, hogy összehasonlítsuk egy vagy több tanulóra a tervezett osztályozás eredményét az eredeti adatokkal.. A parallelepipedon döntési szabály alapján azok a pixelek kapnak új színt a megjelenített űrfelvétel feletti rétegben, amelyek megfelelnek az osztályozás kritériumának.

Ellipszis vizsgálat a spektrális térben

Az ellipszisek a tanulókban lévő pixelek osztályközepei, és a szórás alapján rajzolhatók ki, de lehetséges parallelepipedon határokat, az osztályközepet és a osztály nevét is megjeleníteni a 2-dimenziós spektrális térben. Ha jelentős az ellipszisek átlapolása, akkor a megjelenített két sávban (a spektrális tér 2 dimenziójában) a pixeleket nem lehet teljesen elkülöníteni a tanulók alapján. A legjobb, ha nincs átlapolás, de átlapolás a legtöbb esetben várható.

7.20. ábra - Ellipszis vizsgálat a spektrális térben

Ellipszis vizsgálat a spektrális térben

Kontingencia mátrix

A tanulóterület pixelei nem mindig homogének, ami azt jelenti, hogy az osztályozáskor nem minden pixel kerül abba az osztályba, amit az a tanulóterületen belüli többi pixellel együtt reprezentál. Minden pixel csak súly abban a statisztikában, amely meghatározza az osztályt. Ha a tanuló statisztikája jelentősen eltér a többi tanuló statisztikáitól, akkor a tanulón belüli pixelek jelentős része úgy osztályozódik, ahogy azt várjuk. Ez a kiértékelés a minimum távolság, a maximum likelihood vagy a Mahalanobis távolság döntési szabályt használja. A kontingencia mátrix mutatja százalékosan vagy számszerűen, hogy a tanulók pixelei hogyan osztályozódtak.

Szeparabilitás vizsgálat

A tanulók szeparabilitása (elkülönülése) a tanulók között mért statisztikus távolság. A szeparabilitást bármely két tanuló között megmérhetjük bármely sávokban, ezáltal kizárhatók azok a sávok, amelyek nem segítik az osztályozást (a tanulók nem különíthetők el egymástól megfelelően). Ha a távolság, (spektrális euklideszi távolság), két tanuló osztályközepe között nem elég nagy, akkor az osztályozás sem lesz sikeres.

Döntési szabály

A tanulók meghatározása után a kép pixeleit egyenként elemezve osztályozzuk és soroljuk be egy-egy osztályba (vagy marad osztályozatlan) a döntési szabály szerint. A döntési szabály egy matematikai algoritmus, mely a tanulók adatai alapján végzi el a pixelek osztályba sorolását.

7.21. ábra - Pixel alapú osztályozás döntési fája (Erdas Field Guide)

Pixel alapú osztályozás döntési fája (Erdas Field Guide)

Parametrikus döntési szabály

A parametrikus döntési szabály parametrikus tanulókat használ, melyek legfontosabb statisztikai paramétere az átlagvektor és a kovariancia mátrix. Amikor parametrikus döntési szabály szerint osztályozzuk a pixeleket, akkor minden pixelt besorolunk valamilyen osztályba, mert a parametrikus döntési tér folyamatos.

Nem-parametrikus döntési szabály

A nem-parametrikus döntési szabály nem statisztikákon alapul, így független az adatok tulajdonságaitól. Ha egy pixel egy nem-parametrikus tanuló határán belül van, akkor ez a döntési szabály a pixelt a tanuló által meghatározott osztályhoz rendeli. Vagyis a nem-parametrikus döntési szabály azt vizsgálja, hogy a pixel a tanuló határán belül vagy kívül helyezkedik-e el.

Az iteratív klasszifikáció

A klasszifikáció részlépéseit és a végeredmény is értékelni kell, s az esetleges hibákat javítani lehet, majd megismételhetjük vagy a részfolyamatot vagy az egész osztályozást. A megismételhető folyamatokat iteratívnak nevezzük.

Supervised klasszifikáció

A supervised tréning a priori (már ismert) információkon alapul. Ehhez ismerni kell pl. a területhasznosítási típusok bizonyos tulajdonságait, melyeket felszíni mérések biztosítanak. E méréseket legjobb, ha a kép felvételezés időpontjában végzünk el.

A tanulók kijelölése

A tanuló reprezentál egy osztályt

vektorréteg alapján

poligon definiálásával a képen

hasonló spektrális tulajdonságú szomszédos pixelek kijelölésével

adott területen belüli pixelek kijelölésével, melyek nem szükségszerűen hasonló spektrális tulajdonságúak

tematikus raszterréteg egy osztályát felhasználva

A tanulók attribútumai

A tanulókat többféle attribútummal látjuk el, amelyek egyrészt befolyásolják a döntéshozás eredményét, pl. a rang értéke, másrészt a kimenő tematikus raszterréteg paramétereit határozzák meg, pl. az osztályok színei, értékei, nevei, stb. A következő attribútumok minden tanulóra (parametrikus és nem-parametrikus) általánosan érvényesek:

név - azonosítja a tanulót, és az osztály neve lesz a kimenő tematikus raszterrétegen

szín - a tanuló színe és az osztály színe a kimenő tematikus raszterrétegen

érték - a kimenő osztály értéke és a tanuló értéke nem szükségszerű, hogy megegyező legyen, legjobb, ha pozitív egész.

rang - a rang értéke a rangfüggő műveletekben játszik szerepet, mint pl. a tanuló gyorsértékelése (alarm) vagy a parallelepipedon osztályozás

parallelepipedon határok - a határokat a parallelepipedon osztályozásban használjuk. A parametrikus tanuló további attribútumai lehetnek:

sávok száma - a bemenő kép sávjainak a száma

szélsőértékek - a klaszter vagy a tanuló minimum és maximum vektora

átlagértek - a klaszter vagy a tanuló átlagvektora

a klaszter vagy a tanuló kovariancia mátrixa

a klaszter vagy a tanuló pixeleinek a száma

A nem- parametrikus tanuló spektrális térben, nem statisztikai paraméterek alapján, kijelölt térrészletbe eső pixelek értékeit rögzíti. A tanulók vizsgálata, értékelése

tanuló gyorsértékelése (alarm)

ellipszis

kontingencia mátrix

divergencia

statisztikák és hisztogramok

A klasszifikáció döntési szabályai

Ha a tanulókat összegyűjtöttük és értékeltük, a következő lépés a döntéshozáson alapuló osztályozás elindítása. Az osztályozáskor minden egyes pixelt önállóan értékelünk. A döntési szabályban vagy algoritmusban meghatározó szerepe van a pixel helyét az n-dimenziós vektortérben kijelölő vektornak. Az alábbi ábra az ERDAS döntéshozási mechanizmusának folyamatábráját ábrázolja

Eszerint, ha nem-parametrikus tanulók nem szerepelnek, akkor a pixeleket csak parametrikus szabályok szerint osztályozzuk. Ha nem-parametrikus tanulók is vannak a tanulók között, akkor minden pixelt úgy osztályozunk, hogy minden tanulót nem-parametrikusnak tekintünk. Ekkor a következők szerint járunk el:

ha a nem-parametrikus teszt eredménye egy egyedi osztály, akkor a pixelt besoroljuk ebbe az osztályba

 ha a nem-parametrikus teszt eredménye egy üres osztály (pl. a pixel kívül esik minden nem-parametrikus döntési határon), akkor az osztályozatlansági szabályt alkalmazzuk. Ezzel a szabállyal a pixelt vagy tovább osztályozzuk a parametrikus szabállyal vagy marad osztályozatlan.

ha a pixel több mint egy osztályhoz is tartozhat, akkor az átlapolási szabályt alkalmazzuk. Eszerint a pixelt vagy tovább osztályozzuk a parametrikus szabállyal, vagy figyelembe vesszük a rangot, vagy marad osztályozatlan.

A nem-parametrikus szabályok közül a parallelepipedon és a térbeli alakzat szabályt, a parametrikus szabályok közül a minimális távolságok, a Mahalanobis távolság, és a maximum likelihood módszert elemezzük részletesen.

Parallelepipedon szabály (nem-parametrikus)

A parallelepipedon döntési szabályban a vizsgált pixel értékeit összehasonlítjuk az alsó és a felső határokkal. Az alsó és a felső határok lehetnek:

a tanulón belüli pixelek értékeinek minimális és maximális értéke minden sávban,

minden sáv szerint az átlag és annak valamilyen skalárral szorzott szórású környezete,

bármilyen határ, amit a felhasználó definiál az adatok, vagy a tanuló ismerete szerint. Ezek az ismeretek származhatnak a korábban tárgyalt tanulóértékelési technikák alapján.

Az alábbi ábra egy kétdimenziós példát ad a parallelepipedon osztályozásra.

7.22. ábra - Parallelepipedon osztályozás döntési szabálya (Erdas Field Guide)

Parallelepipedon osztályozás döntési szabálya (Erdas Field Guide)

A sávpáronként értelmezett és a sávonként vett minimális és maximális értékekkel lehatárolható téglalapok adják a 3-dimenziós térben értelmezett téglatest határoló felületeit, míg n-dimenzióban egy n-dimenziós parallelepipedont definiálhatunk.

Az osztályozás lépései

Ha a pixel egyetlen tanulóhoz tartozó parallelepipedonba esik, akkor a tanuló által kijelölt osztályba soroljuk.

Ha kettő vagy több parallelepipedon közös térrészébe, átlapoló területébe helyezhető el a vizsgált pixel, akkor osztályozhatjuk a tanulók rangja, vagy parametrikus szabály szerint.

A pixelt a magasabb rangú (alacsonyabb értékű) tanuló által reprezentált osztályba soroljuk.

Ha rangot nem vehetjük figyelembe, akkor a pixelt csak az átlapoló tanulókra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad, ha csak az egyik tanuló parametrikus, akkor a pixelt automatikusan ehhez az tanulóhoz, ill. az általa reprezentált osztályhoz soroljuk.

a pixel osztályozatlan marad

Ha a pixel nem esik egyik parallelepipedonba sem, akkor definiálni kell az osztályozást

a pixelt az összes tanulóra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad.

a pixel osztályozatlan marad

PARALLELEPIPEDON döntési szabály előnyei

Gyors és egyszerű, miután a pixelértékeket olyan határokhoz hasonlítjuk, amelyek változatlanok maradnak az osztályozás során mindegyik tanulóra vonatkozóan. Gyakran használható egy első szintű, kiterjedt osztályozás elvégzésére. A döntési szabállyal gyorsan csökkenthető a lehetséges osztályok száma, mielőtt valamilyen időigényes (minimális távolság, Mahalanobis távolság, maximum likelihood) módszert alkalmaznánk. Nem függ az adatok normális eloszlásától.

PARALLELEPIPEDON döntési szabály hátrányai

Miután a parallelepipedonoknak sarkai vannak, olyan pixel is osztályozható, amely távol van az átlagértéktől.

Feature space

Ugyanaz, mint a parallelepipedon, csak a spektrális térben kijelölt pixelhalmaz határai tetszőlegesek lehetnek.

Minimális távolság döntési szabály

A minimális távolság döntéshozási módszere, vagy más néven a spektrális távolság módszere az osztályozni kívánt pixel és mindegyik tanuló átlagos értéke közötti n darab lehetséges spektrális távolság mérésén alapul.

7.23. ábra - A minimális távolság döntési szabálya (ERDAS FIELD Guide)

A minimális távolság döntési szabálya (ERDAS FIELD Guide)

A fenti ábrán a spektrális távolságokat a kétdimenziós vektortérben vastag szakaszok jelzik a pixel és a tanulók átlagértékei között. A pixelt ahhoz az osztályhoz rendeljük, melyet reprezentáló tanuló átlagértékéhez a legközelebb van, vagyis amelyre az alábbi kifejezés minimális ahol

n = a sávok száma (dimenzió)

i = az adott sáv indexe

c = az adott osztály index

Xxyi =az i sáv x,y pixelének az értéke

SD xyc = az x,y pixel és a c osztály közötti távolság

MINIMUM TÁVOLSÁG döntési szabály előnyök

A véges számú távolság között mindig van legalább egy legkisebb, így nem lesz osztályozatlan pixel. A küszöbérték térképen, amely megmutatja a pixel és az osztályközép távolságát, a túl távol lévő pixelek kiszűrhetők. A parallelepipedon módszer után a leggyorsabb döntéshozó módszer.

MINIMUM TÁVOLSÁG döntési szabály hátrányok

Azok a pixelek, amelyek más feltételek esetén osztályozatlanok maradnának, osztályozottak lesznek. Nem veszi figyelembe az osztály variabilitását. Például egy városi területet reprezentáló osztály esetén, melynek nagy a varianciája, a középtől távol lévő pixelek, más osztályközepek közelsége miatt, más osztályhoz sorolódnak, vagyis az osztály alulreprezentált lesz. Fordítva, a kis varianciájú, homogén osztályok esetén, mint pl. egy vízfelület, a nem az osztályhoz tartozó pixelek, más osztályközepek relatíve nagyobb távolsága miatt a vízfelületként osztályozódnak. A vízfelület túlreprezentált lesz. Ha a nagy varianciájú tanuló jól elkülöníthető résztanulókra bontható, akkor ezek egy tanulóként való kezelése azt eredményezi, hogy az átlagvektor a két tanulórész közé mutat, ahol lehet, hogy nincs is pixel, vagy egy másik tanuló van. Ez különösen a minimális távolság módszerénél okoz látványos hibát. Ezt úgy javíthatjuk ki, hogy a tanulót felbontjuk alkotó részeire. Ez viszont azt eredményezi, hogy megszűnhetnek olyan osztályok, mint a városi beépítés, mert felbomlik útfelületre, zöldfelületre, vízfelületre, stb. Nagy varianciájú tanulókat a fentiek szerint csak akkor alkalmazhatunk osztályok reprezentálására, ha

nem bontható homogén, elkülönülő résztanulókra,

a legközelebbi tanuló átlagvektora és a nagy varianciájú tanuló átlagvektorának a távolsága legalább kétszerese az utóbbi a tanulón belül mérhető legnagyobb spektrális távolságnak.

Mahalanobis távolság

A Mahalanobis távolság hasonló a minimális spektrális távolsághoz, csak a kovariancia mátrixot használja az egyenletben. A mátrixban szereplő varianciák és kovarianciák értékei továbbviszik a tanulóban lévő nagy változékonyságú pixelek tulajdonságait az osztályra. Például, ha városi területet osztályozunk, amely tipikusan nagy varianciájú pixeleket tartalmazhat, a jól osztályozott pixel messzebb lehet az osztályközéptől, mint esetleg egy nem nagy varianciájú osztály, pl. a vízfelület esetén. ahol

D = Mahalanobis távolság

c = adott osztály

X = pixel vektora

Mc = osztály tanulójának átlagvektora

Cov c = a c osztály tanulójában lévő pixelek alapján számított kovariancia mátrix

Cov c -1 = Cov c inverze

T = transzponált függvény

MAHALANOBIS TÁVOLSÁG döntési szabály Előnyök

A tanulók variabilitását is figyelembe veszi, nem úgy mint a minimális távolság vagy a parallelepipedon módszer. Sokkal használhatóbb lehet mint a minimális távolság módszere, ha a statisztikai paramétereket (amelyeket kifejezünk a kovariancia mátrixban) figyelembe kell venni, de a maximum likelihood módszernél alkalmazható súlyfaktorok nem állnak rendelkezésre.

hátrányok

A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el (a spektrális térben). Lassabb, mint a parallelepipedon vagy a minimális távolság módszere. A Mahalanobis távolság módszere parametrikus, ami azt jelenti, hogy szükséges minden sáv adatainak normális eloszlása.

Maximum likelihood módszer

A Maximum likelihood módszer alkalmazhatóságához szükséges, hogy a sávonkénti adatok normális eloszlásúak legyenek. Ha ez nem áll fenn jobb eredményt kapunk a parallelepipedon vagy a minimális távolság módszerrel. A Maximum likelihood módszer azon alapul, hogy egy pixel milyen valószínűséggel tartozik egy adott osztályba. Az alapegyenlet feltételezi, hogy ezen valószínűségek egyenlők minden osztályra vonatkozóan és hogy a bemenő sávoknak normális az eloszlása.

Bayes osztályozó

Ha van előzetes, a priori információnk arról, hogy a valószínűségek nem egyenlők minden osztályra, akkor súlyokat adhatunk az egyes osztályoknak. A Maximum likelihood módszer ezt a változatát Bayes-féle döntési módszernek nevezik (Hord, 1982). Ha nincs előzetes információ a valószínűségekről, akkor a súlyok értéke 1.0 az egyenletben.

A Maximum likelihood és a Bayes-féle döntési módszer egyenlete:

MAXIMUM LIKELIHOOD/BAYES döntési szabály előnyök

A legpontosabb osztályozási módszer, ha a bemenő sávok adatai normális eloszlásúak, mert ez veszi figyelembe a legtöbb változót. A Mahalanobis távolság módszerhez hasonlóan a Maximum likelihood is a kovariancia mátrixot használja az osztályok variabilitásának jellemzésére.

Hátrányok

A bonyolult egyenlet miatt a számítás sok időt vesz igénybe. Az idő a sávok számának növekedésével egyenesen arányos. A Maximum likelihood parametrikus módszer. amely azt jelenti, hogy erősen függ az egyes sávok adatainak normális eloszlásától. A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el a spektrális térben.

Az osztályozás eredményének értékelése

Az osztályozás pontosságának, eredményének az értékelésére több módszer is létezik:

küszöbérték vizsgálat - a túlosztályozott osztályokban lévő kritikus pixelek kiszűrésére alkalmazott módszer

pontosság becslés - a klasszifikáció eredményének és földi vagy más meglévő adatok összehasonlításának módszere.

Küszöbérték vizsgálat

A küszöbérték vizsgálattal azonosíthatjuk azokat a pixeleket, amelyeket valószínűleg (most likely) rosszul osztályoztunk. Ezeket a pixeleket egy másik osztályba, általában az nulla osztályba, a nem osztályozottak közé sorolunk át. Ezeket a pixeleket a döntési szabályban használt távolságmérés alapján azonosítjuk.

Távolság file

Ha minimális távolság, a Mahalanobis távolság, a Maximum likelihood osztályozási módszert alkalmazzuk, mindannyiszor létrehozható egy-egy távolság file a kimenő raszterréteg mellett. A távolság file egy egysávos file, az adatok 32 bites tárolásban folyamatos raszterréteget alkotnak, amelyben minden pixelérték az alkalmazott távolságmérés eredményét mutatja.

A minimum távolság osztályozásnál minden távolságérték Euklideszi spektrális távolság a pixel és az osztály átlagértéke között.

Mahalanobis távolság, vagy a Maximum likelihood osztályozási módszert alkalmazva a távolságérték a pixel vektora és az osztály átlagvektora közötti Mahalanobis távolság.

7.24. ábra - A távolság file hisztogramja

A távolság file hisztogramja

Ez az eloszlási görbe a Chi2 eloszlási függvényéhez hasonló. A valószínűleg rosszul osztályozott pixelek távolságértékeik szerint a grafikon jobb oldalán helyezkednek el, melyek matematikai módszerekkel pontosan definiálhatók és levághatók a hisztogramról. A levágás helye a küszöbérték. A küszöbérték meghatározható:

interaktív módon a hisztogramon,

bemenő adatként, chi2 paraméterként.

Mindként esetben az eredmény az lesz, hogy a legnagyobb távolságértékű pixelek egy tematikus osztályba kerülnek, amely maszkként használható az osztályozás eredményeként létrejött tematikus raszterrétegen.

Pontosság becslés - Accuracy assessement

A pontosság becslése véletlenszerűen kiválasztott referencia pixelek és a tematikus raszterréteg összehasonlítását jelenti. A kiválasztott pixelek számának 250-nél nagyobbnak kell lenni ahhoz, hogy egy osztály átlagos pontosságát 5 %-kon belül megadhassuk. A referencia pixelek véletlenszerű kiválasztása történhet:

random módon - semmilyen szabályt nem használva,

stratégiai random módon - a referencia pixelek a tematikus osztályok területi arányának megfelelően oszlanak el véletlenszerűen az osztályokban,

kiegyenlített random módon - a referencia pixelek a tematikus osztályokban egyenlő számban oszlanak el véletlenszerűen.

A pontosság mérésének az eredménye vagy egy c x c méretű hibamátrixban jelenik meg, ahol c az osztályok száma, vagy egy egyszerű pontosság fileban, mely egy ASCII-file, tartalma a pontosság százalékos statisztikája a hibamátrix alapján.

Automatikus osztályozás

Automatikus osztályozást angolul Unsupervised training-nek hívják. Az ún. unsupervised osztályozás, nevezhetjük nem irányított osztályozásnak, csak minimális beavatkozást igényel a felhasználó részéről, de az osztályozás eredményét, az osztályokat megjelenítő térképet a felhasználónak kell értelmeznie, és az osztályoknak nevet adni, összevonni ha szükséges, stb. A nem irányított osztályozást, klaszterezésnek (clustering) is nevezik, mert a módszer a spektrális térben lehatárolható pixelcsoportok kialakítására törekszik. Ezeket a pixelcsoportokat, amelyek a statisztikai értelemben hasonló pixeleket tartalmazzák, klasztereknek hívják. Az osztályozás után kialakuló csoportokat térképi műveletekkel, GIS funkciókkal összevonhatjuk, elemezhetjük, illetve felhasználhatjuk a supervised osztályozásban mint a tanulóterületek.

Klaszterek

A klasztereket a klaszterező algoritmus határozza meg, amely az összes, vagy majdnem az összes pixelt felhasználja az elemzéskor. Az algoritmust az alábbi tulajdonságok jellemzik:

a, az ISODATA klaszterezési módszer a spektrális távolságot használja a csoportok elkülönítésekor, de iteratív módon osztályozza a pixeleket, vagyis újraértelmezi a kritériumokat minden osztályra és eszerint osztályozza újra a pixelek, így a spektrális távolságon alapuló csoportok egyre finomodnak.

b, az RGB klaszterezési módszer sokkal speciálisabb, mint az ISODATA módszer. Az RGB módszer 3 sáv 8 bites adatait használja fel az osztályokra bontásnál, úgy hogy a 3-dimenziós spektrális térben meghatározza a pixeleket befoglaló térrészleteket, s ezek lesznek az osztályok.

Ebben a fejezetben mindkét módszer részletes elemzésre kerül, bemutatva előnyeiket és hátrányaikat.

ISODATA

Az ISODATA osztályozás neve az Iterative Self-Organizing Data Analysis Technique (Gonzalez és Tou, 1974) kifejezés rövidítése. Jelentése: Ismétlődő önszervező adatelemző módszer. Ismétlődő (iteratív), mert a teljes klasszifikációt megismétli, amíg az eredmény meg nem felel a követelményeknek, és létrehozza a tematikus raszterréteget, s újraszámítja annak statisztikáját. Önszervező, mert minimális felhasználói segédlet szükséges a klaszterek kijelöléséhez. Az ISODATA módszer a minimális spektrális távolságok módszerét alkalmazza a pixelek osztályba sorolásakor. Az osztályozás meghatározott számú klaszter átlagértékének a megadásával kezdődik (beleértve a már létező tanulóterületek alapján számított osztályközepeket is), és ez ismétlődik, úgy hogy a klaszterközepek folyamatosan módosulnak egy új pixel osztályba sorolása után.

ISODATA klaszterezés paraméterei:

N a klaszterek maximális száma.

Minden klaszter a későbbi osztályt fogja meghatározni, így a klaszterek száma megadja az osztályok maximális számát is. Minden ISODATA osztályozási folyamat N klaszterközép meghatározásával kezdődik. Kevés pixelt tartalmazó klaszterek megszűnhetnek, ezért kevesebb mint N klaszter marad.

T - konvergencia küszöb, amely megadja, hogy maximálisan a pixelek hány százaléka maradhat változatlan az iterációk között.

M - az iterációk maximális száma.

Az ISODATA algoritmus első iteráció elején az N db klaszter átlagértékét határozza meg.

7.25. ábra - Az ISODATA osztályozás első lépée az osztályközepek kijelölése (ERDAS FIELD Guide)

Az ISODATA osztályozás első lépée az osztályközepek kijelölése (ERDAS FIELD Guide)

Minden egyes iteráció után, az új klaszterközepeket ismét meghatározza az aktuális klaszterbeli pixelek szerint. Ezeket a klaszterközepeket használja majd a következő iterációban a klaszterek meghatározásához.

7.26. ábra - Az ISODATA osztályozás második lépése képelemek osztályközepekhez rendelése a minimális távolság módszere alapján (ERDAS FIELD Guide)

Az ISODATA osztályozás második lépése képelemek osztályközepekhez rendelése a minimális távolság módszere alapján (ERDAS FIELD Guide)

7.27. ábra - Az ISODATA osztályozás harmadik lépése az új osztályközepek meghatározása (ERDAS FIELD Guide)

Az ISODATA osztályozás harmadik lépése az új osztályközepek meghatározása (ERDAS FIELD Guide)

Ez a folyamat addig folytatódik, amíg az iterációk eredményei között nagyon kicsi különbség nincs (Swain, 1973). A kezdő klaszterközepek a spektrális térben egy vektor mentén helyezkednek el, mely két végpontjának spektrális térbeli koordinátái az N-dimenziós térben:

(µ1-σ1, µ2-σ2, ... , µn-σn), ill. (µ1+σ1, µ2+σ2, ... , µn+σn).

Kétdimenzióban a kezdő klaszterközepek az A(µ1-σ1, µ2-σ2) és B(µ1+σ1, µ2+σ2) pontok között helyezkednek el.

A pixeleket egyenként soroljuk valamelyik osztályba a bal-felső sarokban lévő pixellel kezdve, majd soronként sorra kerül minden pixel. A pixel és a klaszterközepek térbeli távolságait kiszámítja az algoritmus és a pixelt ahhoz a klaszterhez rendeli, mely közepéhez a pixel legközelebb van a spektrális térben. Az ISODATA osztályozás eredménye egy tematikus raszterréteg és/vagy egy tanulóterület file. Az első iteráció eredménye hasonló a következő képhez. A második iteráció során minden klaszter átlagértékét újraszámítja az algoritmus. Minden pixel összemért az új klaszterközepekkel és hozzárendeli a legközelebbihez. Mindegyik iteráció után az ugyanabban a klaszterben maradó pixel százalékos aránya alapján indul el az újabb iteráció vagy, ha ez az arány eléri a konvergencia küszöböt, az algoritmus befejeződik. Lehetséges, hogy a változatlan pixelek százalékos aránya sohasem éri el ezt a küszöbértéket, ezért az iterációk számának (M) rögzítésével megakadályozható, hogy a program a végtelenségig fusson.

ISODATA klaszterezés előnyei

Iteratív. Ez az algoritmus nagyon alkalmas az egynemű adatokat tartalmazó spektrális klaszterek megtalálására. Nincs jelentősége, hogy a kezdő klaszterközepek hol helyezkednek el, ha elég sok iteráció engedélyezett. A kimenő tematikus raszterréteg hasonló a tanulóterületek alapján, a minimális távolságok módszerét alkalmazó osztályozás eredményéhez. Ezt a tematikus raszterréteget elemezhetjük és kezelhetjük a tanulóterületek szerint mielőtt az aktuális klasszifikációt végrehajtanánk.

ISODATA klaszterezés hátrányai

A klaszterezés sokszor ismételődő, ezért időigényes művelet. Nem veszi figyelembe a pixel térbeli homogenitást.

RGB klaszterezés

Az RGB klaszterezés egy egyszerű osztályozási és adattömörítési technika 3 sávra vonatkoztatva, 8 bites adatokon. Egyszerű és gyors algoritmus, amelyet akkor használunk, ha gyors osztályozási eredményre van szükség, de nem lényeges minden részlet teljes körű osztályozása. Alkalmas továbbá a 24 bites színes képek 8 bites színes képpé tömörítésére. Az algoritmus minden pixelt a 3 dimenziós spektrális térben helyez el, és utána egy térbeli háló szerint hozza létre a klasztereket. Minden klaszter egy osztály lesz a kimenő tematikus raszterrétegen. A 3-dimenziós tengelyek mentén a bemenő adatok szerinti hisztogramokat skálázza, majd a hisztogram alapján szétdarabolja az intervallumot, pl. a az átlaghoz képest valamilyen szórástávolságon belüli pixeleket, vagy a minimum és maximum értékek között. A sávonkénti osztályok száma alapértelmezésben: Vörös (Red) - 7 db, Zöld (Green) - 6 db, Kék (Blue) - 6 db, Definiálható, hogy a három sávot egyenként mennyi részre bontsa az algoritmus aszerint, hogy milyenek a sávok szerinti hisztogramok. A szélesebb hisztogram több szeletre, a keskenyebb hisztogram kevesebb szeletre bontható. Az IDRISI Composit parancsa a 3 bemenő sávot felbontja 6-6 intervallumra és a kimenő színes kép pixelértéke a következő képlettel számítható ki: pixelérték= B + 6*G + 36*R.

RGB klaszterezés előnyei

A leggyorsabb osztályozási módszer. A tervezésekor arra törekedtek, hogy gyors és egyszerű osztályozást adjon olyan alkalmazásokhoz, melyek nem igényelnek speciális osztályokat.

A pixelek vizsgálati sorrendje nem befolyásolja a kimenő adatokat.

Erősen interaktív funkció, iteratív módon változtathatjuk a paramétereket, amíg a klaszterek száma és a küszöb megfelel az analízis szempontjából.

Hátrányai

Pontosan három sávot használ az algoritmus, így nem lehetséges mindenféle alkalmazás.

Nem mindig hoz létre olyan tematikus filet, amely alkalmas a későbbi elemzésre.