A földi erőforráskutató műholdak viszonylag nagy területről, több sávban készítenek felvételeket. Így a geometriai felbontásnak megfelelően egy adott területről több mérési eredmény áll rendelkezésünkre. Pontosabban minden képelem egy földfelszíni területet határoz meg (geometriai korrekció után abszolút értelemben), és a képelem értékei (pixelértékek) az adott terület visszaverő, vagy kisurgárzási képességét írják le. Vagyis a pixelérték a terület reflektanciartékét fejezi ki közvetve vagy közvetlenül. Ha több spektrális sávban történik a reflektancia meghatározása, akkor a terepi spektrumok felvételével vagy az ún. spektrumkönyvtárak használatával azonosíthatjuk a pixelértékek alapján, hogy az adott területre milyen felszínborítás jellemző. Miután minden képelemhez nem lehet terepi adatokat hozzárendelni, így általában az ilyen pixelalapú kiértékelés során a digitális képfeldolgozás egy nagyon hatékony módszerét, az osztályozást tudjuk elvégezni. Az osztályozás célja, hogy a képelemeket a pixelértékek alapján a felhasználó által vagy automatikusan kijelölt osztályokba (klaszterekbe) soroljuk, és létrehozva egy tematikus térképet.
Az osztályozási módszerek rendkívül szerteágazóak, sok matematikai (geometriai, valószínűségszámítási) ismeretet igényelnek. A beépített funkciók révén ezek a módszerek nem feltétlenül jelennek meg a felhasználó előtt, ezért érdemes ezeket részletesebb tárgyalni. Nagy adatbázisok esetében gyakran használunk hasonló módszereket.
Az osztályozás lehet pixel vagy szubpixel alapú. Az előbbi esetben a pixelérték egy értékként jellemzi az adott felszín reflektancia-tulajdonságait. Pédául, ha több felszínborítási típus van egy területegységen belül, akkor az azokról visszaverődő elektromágneses sugárzást egy jelként értékeljük. Szubpixel alapú osztályozás esetén valamilyen képfeldolgozási módszerrel arra is próbálunk adatot kinyerni, hogy a területen belül milyen arányban fordulnak elő a különböző felszínborítási típusok.
A tananyagban jelenleg csak apixelalapú osztályozás két fő típusát az irányított és az automatikus osztályozást tekintjük át röviden.
Bevezetés
A multispektrális klasszifikáció során a képalkotó elemeket, a pixeleket, a pixelértékek alapján besoroljuk a véges számú osztályok egyikébe. Ha a pixel megfelel bizonyos kritériumoknak, akkor abba a tematikus osztályba fog tartozni, melyet a kritériumok szerint határoztunk meg. A fenti folyamatot a kép szegmentációjának is nevezik.
A klasszifikáció folyamata
Mintázat felismerés
Az emberi szem felismer bizonyos szerkezeteket és a színeket kategóriákba csoportosítja a színes képeken. A multispektrális, digitális képek esetén a számítástechnika és a matematika eszközeivel lehetőség van a spektrális mintázatok tudományos elven történő felismerésére. Statisztikák készíthetők a pixelek spektrális tulajdonságai szerint, és a pixelek osztályozhatók matematikai feltételek alapján. Ezt a folyamatot két jól elkülönülő részre, a betanításra (tréning) és a döntéshozási módszereket használó osztályozásra bontjuk.
Betanítás - Tréning
A számítógépet fel kell készíteni, be kell tanítani arra, hogy felismerje az adatokon belüli csoportokat. A tréning az a folyamat, melyben meghatározunk feltételeket, amelyekkel ezek a csoportok felismerhetők. A tréning vagy a felhasználó által irányított, un. supervised, vagy minimálisan irányított, un. unsupervised módszer lehet.
Irányított betanítás
Ezt a módszert az jellemzi, hogy végig a felhasználó irányítása alatt áll. Először a felhasználó kiválasztja azokat a pixeleket, amelyek reprezentálni fogják az adott osztályt. A pixelek kiválasztásakor használhatunk különböző forrásokat, légifelvételeket, térképeket, helyszíni megfigyelési adatokat, stb. A pixelértékek elemzése és a tematikus térkép osztályainak előzetes ismerete szükséges ehhez a módszerhez. A minta azonosítása készíti fel a számítógépet a hasonló tulajdonságú pixelek azonosítására.
Nem irányított betanítás
A nem irányított betanítás sokkal inkább automatizált folyamat. A képfeldolgozó program felismeri a hasonló tulajdonságú pixeleket, de ezek nem szükségszerűen illeszkednek a kép folyamatos, könnyen felismerhető területeihez, mint pl. a talajtípusokhoz, vagy területhasznosítási osztályokhoz. Ezek csak egyszerű pixel klaszterek, melyek a hasonló spektrális tulajdonságú pixeleket gyűjtik össze. Ezt a módszert általában akkor alkalmazzuk, ha kevés információnk van a klasszifikáció előtt a területről. A klasszifikáció után a felhasználónak kell értelmeznie a létrejött osztályokat.
Tanulók - signatures
A tréning eredménye a tanulók egy halmaza, amely tartalmazza a tanulóterületeket, vagy a klasztereket. Minden tanuló egy osztályt ír le, és a döntéshozási szabállyal együtt a képfile minden egyes pixele egy osztályhoz rendelhető. A tanulók aszerint csoportosíthatók, hogy hogyan és hol jelöltük ki azokat. A statisztikai paramétereken (pl. átlag, szórás, kovariancia mátrix, stb.) alapuló pixelhalmazt parametrikus tanulónak nevezi az ERDAS. A parametrikus pixelhalmazt kijelölhetjük a földrajzi térben egy terület lehatárolásával, mely a benne lévő pixelek értékei szerint jellemezhető statisztikus paraméterekkel. A tanulóterület kijelölése többféle módon is történhet. Parametrikus adatokkal jelölhetünk ki egy klasztert a spektrális térben, ha kijelölünk egy n-dimenziós pontot , mint klaszterközepet és meghatározzuk a klaszterbe tartozó, pl. egy bizonyos szórástartományon belül lévő pixeleket . A parametrikus tanulók a statisztikus osztályozási módszereknél, pl. a maximum likelihood, használhatók az osztályok meghatározására. A nem-parametrikus tanulókat nem statisztikai módszerekkel jelöljük ki. Ilyen lehet egy spektrális térben megadott diszkrét alakzat. Ezekkel az alakzatokkal az osztályok spektrális térbeli határait adjuk meg. A nem-parametrikus osztályozások fogják használni a nem-parametrikus tanulókat.
Az osztályba soroláskor azt vizsgáljuk, hogy az adott pixel kívül vagy belül van a spektrális térben lokalizált osztályokon. A supervised tréning során hozhatunk létre nem-parametrikus tanulókat (Kloer, 1994).
A tanulók értékelése
Alarm réteg
Az alarm értékelés lehetővé teszi, hogy összehasonlítsuk egy vagy több tanulóra a tervezett osztályozás eredményét az eredeti adatokkal.. A parallelepipedon döntési szabály alapján azok a pixelek kapnak új színt a megjelenített űrfelvétel feletti rétegben, amelyek megfelelnek az osztályozás kritériumának.
Ellipszis vizsgálat a spektrális térben
Az ellipszisek a tanulókban lévő pixelek osztályközepei, és a szórás alapján rajzolhatók ki, de lehetséges parallelepipedon határokat, az osztályközepet és a osztály nevét is megjeleníteni a 2-dimenziós spektrális térben. Ha jelentős az ellipszisek átlapolása, akkor a megjelenített két sávban (a spektrális tér 2 dimenziójában) a pixeleket nem lehet teljesen elkülöníteni a tanulók alapján. A legjobb, ha nincs átlapolás, de átlapolás a legtöbb esetben várható.
Kontingencia mátrix
A tanulóterület pixelei nem mindig homogének, ami azt jelenti, hogy az osztályozáskor nem minden pixel kerül abba az osztályba, amit az a tanulóterületen belüli többi pixellel együtt reprezentál. Minden pixel csak súly abban a statisztikában, amely meghatározza az osztályt. Ha a tanuló statisztikája jelentősen eltér a többi tanuló statisztikáitól, akkor a tanulón belüli pixelek jelentős része úgy osztályozódik, ahogy azt várjuk. Ez a kiértékelés a minimum távolság, a maximum likelihood vagy a Mahalanobis távolság döntési szabályt használja. A kontingencia mátrix mutatja százalékosan vagy számszerűen, hogy a tanulók pixelei hogyan osztályozódtak.
Szeparabilitás vizsgálat
A tanulók szeparabilitása (elkülönülése) a tanulók között mért statisztikus távolság. A szeparabilitást bármely két tanuló között megmérhetjük bármely sávokban, ezáltal kizárhatók azok a sávok, amelyek nem segítik az osztályozást (a tanulók nem különíthetők el egymástól megfelelően). Ha a távolság, (spektrális euklideszi távolság), két tanuló osztályközepe között nem elég nagy, akkor az osztályozás sem lesz sikeres.
Döntési szabály
A tanulók meghatározása után a kép pixeleit egyenként elemezve osztályozzuk és soroljuk be egy-egy osztályba (vagy marad osztályozatlan) a döntési szabály szerint. A döntési szabály egy matematikai algoritmus, mely a tanulók adatai alapján végzi el a pixelek osztályba sorolását.
Parametrikus döntési szabály
A parametrikus döntési szabály parametrikus tanulókat használ, melyek legfontosabb statisztikai paramétere az átlagvektor és a kovariancia mátrix. Amikor parametrikus döntési szabály szerint osztályozzuk a pixeleket, akkor minden pixelt besorolunk valamilyen osztályba, mert a parametrikus döntési tér folyamatos.
Nem-parametrikus döntési szabály
A nem-parametrikus döntési szabály nem statisztikákon alapul, így független az adatok tulajdonságaitól. Ha egy pixel egy nem-parametrikus tanuló határán belül van, akkor ez a döntési szabály a pixelt a tanuló által meghatározott osztályhoz rendeli. Vagyis a nem-parametrikus döntési szabály azt vizsgálja, hogy a pixel a tanuló határán belül vagy kívül helyezkedik-e el.
Az iteratív klasszifikáció
A klasszifikáció részlépéseit és a végeredmény is értékelni kell, s az esetleges hibákat javítani lehet, majd megismételhetjük vagy a részfolyamatot vagy az egész osztályozást. A megismételhető folyamatokat iteratívnak nevezzük.
Supervised klasszifikáció
A supervised tréning a priori (már ismert) információkon alapul. Ehhez ismerni kell pl. a területhasznosítási típusok bizonyos tulajdonságait, melyeket felszíni mérések biztosítanak. E méréseket legjobb, ha a kép felvételezés időpontjában végzünk el.
A tanulók kijelölése
A tanuló reprezentál egy osztályt
vektorréteg alapján
poligon definiálásával a képen
hasonló spektrális tulajdonságú szomszédos pixelek kijelölésével
adott területen belüli pixelek kijelölésével, melyek nem szükségszerűen hasonló spektrális tulajdonságúak
tematikus raszterréteg egy osztályát felhasználva
A tanulók attribútumai
A tanulókat többféle attribútummal látjuk el, amelyek egyrészt befolyásolják a döntéshozás eredményét, pl. a rang értéke, másrészt a kimenő tematikus raszterréteg paramétereit határozzák meg, pl. az osztályok színei, értékei, nevei, stb. A következő attribútumok minden tanulóra (parametrikus és nem-parametrikus) általánosan érvényesek:
név - azonosítja a tanulót, és az osztály neve lesz a kimenő tematikus raszterrétegen
szín - a tanuló színe és az osztály színe a kimenő tematikus raszterrétegen
érték - a kimenő osztály értéke és a tanuló értéke nem szükségszerű, hogy megegyező legyen, legjobb, ha pozitív egész.
rang - a rang értéke a rangfüggő műveletekben játszik szerepet, mint pl. a tanuló gyorsértékelése (alarm) vagy a parallelepipedon osztályozás
parallelepipedon határok - a határokat a parallelepipedon osztályozásban használjuk. A parametrikus tanuló további attribútumai lehetnek:
sávok száma - a bemenő kép sávjainak a száma
szélsőértékek - a klaszter vagy a tanuló minimum és maximum vektora
átlagértek - a klaszter vagy a tanuló átlagvektora
a klaszter vagy a tanuló kovariancia mátrixa
a klaszter vagy a tanuló pixeleinek a száma
A nem- parametrikus tanuló spektrális térben, nem statisztikai paraméterek alapján, kijelölt térrészletbe eső pixelek értékeit rögzíti. A tanulók vizsgálata, értékelése
tanuló gyorsértékelése (alarm)
ellipszis
kontingencia mátrix
divergencia
statisztikák és hisztogramok
A klasszifikáció döntési szabályai
Ha a tanulókat összegyűjtöttük és értékeltük, a következő lépés a döntéshozáson alapuló osztályozás elindítása. Az osztályozáskor minden egyes pixelt önállóan értékelünk. A döntési szabályban vagy algoritmusban meghatározó szerepe van a pixel helyét az n-dimenziós vektortérben kijelölő vektornak. Az alábbi ábra az ERDAS döntéshozási mechanizmusának folyamatábráját ábrázolja
Eszerint, ha nem-parametrikus tanulók nem szerepelnek, akkor a pixeleket csak parametrikus szabályok szerint osztályozzuk. Ha nem-parametrikus tanulók is vannak a tanulók között, akkor minden pixelt úgy osztályozunk, hogy minden tanulót nem-parametrikusnak tekintünk. Ekkor a következők szerint járunk el:
ha a nem-parametrikus teszt eredménye egy egyedi osztály, akkor a pixelt besoroljuk ebbe az osztályba
ha a nem-parametrikus teszt eredménye egy üres osztály (pl. a pixel kívül esik minden nem-parametrikus döntési határon), akkor az osztályozatlansági szabályt alkalmazzuk. Ezzel a szabállyal a pixelt vagy tovább osztályozzuk a parametrikus szabállyal vagy marad osztályozatlan.
ha a pixel több mint egy osztályhoz is tartozhat, akkor az átlapolási szabályt alkalmazzuk. Eszerint a pixelt vagy tovább osztályozzuk a parametrikus szabállyal, vagy figyelembe vesszük a rangot, vagy marad osztályozatlan.
A nem-parametrikus szabályok közül a parallelepipedon és a térbeli alakzat szabályt, a parametrikus szabályok közül a minimális távolságok, a Mahalanobis távolság, és a maximum likelihood módszert elemezzük részletesen.
Parallelepipedon szabály (nem-parametrikus)
A parallelepipedon döntési szabályban a vizsgált pixel értékeit összehasonlítjuk az alsó és a felső határokkal. Az alsó és a felső határok lehetnek:
a tanulón belüli pixelek értékeinek minimális és maximális értéke minden sávban,
minden sáv szerint az átlag és annak valamilyen skalárral szorzott szórású környezete,
bármilyen határ, amit a felhasználó definiál az adatok, vagy a tanuló ismerete szerint. Ezek az ismeretek származhatnak a korábban tárgyalt tanulóértékelési technikák alapján.
Az alábbi ábra egy kétdimenziós példát ad a parallelepipedon osztályozásra.
A sávpáronként értelmezett és a sávonként vett minimális és maximális értékekkel lehatárolható téglalapok adják a 3-dimenziós térben értelmezett téglatest határoló felületeit, míg n-dimenzióban egy n-dimenziós parallelepipedont definiálhatunk.
Az osztályozás lépései
Ha a pixel egyetlen tanulóhoz tartozó parallelepipedonba esik, akkor a tanuló által kijelölt osztályba soroljuk.
Ha kettő vagy több parallelepipedon közös térrészébe, átlapoló területébe helyezhető el a vizsgált pixel, akkor osztályozhatjuk a tanulók rangja, vagy parametrikus szabály szerint.
A pixelt a magasabb rangú (alacsonyabb értékű) tanuló által reprezentált osztályba soroljuk.
Ha rangot nem vehetjük figyelembe, akkor a pixelt csak az átlapoló tanulókra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad, ha csak az egyik tanuló parametrikus, akkor a pixelt automatikusan ehhez az tanulóhoz, ill. az általa reprezentált osztályhoz soroljuk.
a pixel osztályozatlan marad
Ha a pixel nem esik egyik parallelepipedonba sem, akkor definiálni kell az osztályozást
a pixelt az összes tanulóra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad.
a pixel osztályozatlan marad
PARALLELEPIPEDON döntési szabály előnyei
Gyors és egyszerű, miután a pixelértékeket olyan határokhoz hasonlítjuk, amelyek változatlanok maradnak az osztályozás során mindegyik tanulóra vonatkozóan. Gyakran használható egy első szintű, kiterjedt osztályozás elvégzésére. A döntési szabállyal gyorsan csökkenthető a lehetséges osztályok száma, mielőtt valamilyen időigényes (minimális távolság, Mahalanobis távolság, maximum likelihood) módszert alkalmaznánk. Nem függ az adatok normális eloszlásától.
PARALLELEPIPEDON döntési szabály hátrányai
Miután a parallelepipedonoknak sarkai vannak, olyan pixel is osztályozható, amely távol van az átlagértéktől.
Feature space
Ugyanaz, mint a parallelepipedon, csak a spektrális térben kijelölt pixelhalmaz határai tetszőlegesek lehetnek.
Minimális távolság döntési szabály
A minimális távolság döntéshozási módszere, vagy más néven a spektrális távolság módszere az osztályozni kívánt pixel és mindegyik tanuló átlagos értéke közötti n darab lehetséges spektrális távolság mérésén alapul.
A fenti ábrán a spektrális távolságokat a kétdimenziós vektortérben vastag szakaszok jelzik a pixel és a tanulók átlagértékei között. A pixelt ahhoz az osztályhoz rendeljük, melyet reprezentáló tanuló átlagértékéhez a legközelebb van, vagyis amelyre az alábbi kifejezés minimális ahol
n = a sávok száma (dimenzió)
i = az adott sáv indexe
c = az adott osztály index
Xxyi =az i sáv x,y pixelének az értéke
SD xyc = az x,y pixel és a c osztály közötti távolság
MINIMUM TÁVOLSÁG döntési szabály előnyök
A véges számú távolság között mindig van legalább egy legkisebb, így nem lesz osztályozatlan pixel. A küszöbérték térképen, amely megmutatja a pixel és az osztályközép távolságát, a túl távol lévő pixelek kiszűrhetők. A parallelepipedon módszer után a leggyorsabb döntéshozó módszer.
MINIMUM TÁVOLSÁG döntési szabály hátrányok
Azok a pixelek, amelyek más feltételek esetén osztályozatlanok maradnának, osztályozottak lesznek. Nem veszi figyelembe az osztály variabilitását. Például egy városi területet reprezentáló osztály esetén, melynek nagy a varianciája, a középtől távol lévő pixelek, más osztályközepek közelsége miatt, más osztályhoz sorolódnak, vagyis az osztály alulreprezentált lesz. Fordítva, a kis varianciájú, homogén osztályok esetén, mint pl. egy vízfelület, a nem az osztályhoz tartozó pixelek, más osztályközepek relatíve nagyobb távolsága miatt a vízfelületként osztályozódnak. A vízfelület túlreprezentált lesz. Ha a nagy varianciájú tanuló jól elkülöníthető résztanulókra bontható, akkor ezek egy tanulóként való kezelése azt eredményezi, hogy az átlagvektor a két tanulórész közé mutat, ahol lehet, hogy nincs is pixel, vagy egy másik tanuló van. Ez különösen a minimális távolság módszerénél okoz látványos hibát. Ezt úgy javíthatjuk ki, hogy a tanulót felbontjuk alkotó részeire. Ez viszont azt eredményezi, hogy megszűnhetnek olyan osztályok, mint a városi beépítés, mert felbomlik útfelületre, zöldfelületre, vízfelületre, stb. Nagy varianciájú tanulókat a fentiek szerint csak akkor alkalmazhatunk osztályok reprezentálására, ha
nem bontható homogén, elkülönülő résztanulókra,
a legközelebbi tanuló átlagvektora és a nagy varianciájú tanuló átlagvektorának a távolsága legalább kétszerese az utóbbi a tanulón belül mérhető legnagyobb spektrális távolságnak.
Mahalanobis távolság
A Mahalanobis távolság hasonló a minimális spektrális távolsághoz, csak a kovariancia mátrixot használja az egyenletben. A mátrixban szereplő varianciák és kovarianciák értékei továbbviszik a tanulóban lévő nagy változékonyságú pixelek tulajdonságait az osztályra. Például, ha városi területet osztályozunk, amely tipikusan nagy varianciájú pixeleket tartalmazhat, a jól osztályozott pixel messzebb lehet az osztályközéptől, mint esetleg egy nem nagy varianciájú osztály, pl. a vízfelület esetén. ahol
D = Mahalanobis távolság
c = adott osztály
X = pixel vektora
Mc = osztály tanulójának átlagvektora
Cov c = a c osztály tanulójában lévő pixelek alapján számított kovariancia mátrix
Cov c -1 = Cov c inverze
T = transzponált függvény
MAHALANOBIS TÁVOLSÁG döntési szabály Előnyök
A tanulók variabilitását is figyelembe veszi, nem úgy mint a minimális távolság vagy a parallelepipedon módszer. Sokkal használhatóbb lehet mint a minimális távolság módszere, ha a statisztikai paramétereket (amelyeket kifejezünk a kovariancia mátrixban) figyelembe kell venni, de a maximum likelihood módszernél alkalmazható súlyfaktorok nem állnak rendelkezésre.
hátrányok
A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el (a spektrális térben). Lassabb, mint a parallelepipedon vagy a minimális távolság módszere. A Mahalanobis távolság módszere parametrikus, ami azt jelenti, hogy szükséges minden sáv adatainak normális eloszlása.
Maximum likelihood módszer
A Maximum likelihood módszer alkalmazhatóságához szükséges, hogy a sávonkénti adatok normális eloszlásúak legyenek. Ha ez nem áll fenn jobb eredményt kapunk a parallelepipedon vagy a minimális távolság módszerrel. A Maximum likelihood módszer azon alapul, hogy egy pixel milyen valószínűséggel tartozik egy adott osztályba. Az alapegyenlet feltételezi, hogy ezen valószínűségek egyenlők minden osztályra vonatkozóan és hogy a bemenő sávoknak normális az eloszlása.
Bayes osztályozó
Ha van előzetes, a priori információnk arról, hogy a valószínűségek nem egyenlők minden osztályra, akkor súlyokat adhatunk az egyes osztályoknak. A Maximum likelihood módszer ezt a változatát Bayes-féle döntési módszernek nevezik (Hord, 1982). Ha nincs előzetes információ a valószínűségekről, akkor a súlyok értéke 1.0 az egyenletben.
A Maximum likelihood és a Bayes-féle döntési módszer egyenlete:
MAXIMUM LIKELIHOOD/BAYES döntési szabály előnyök
A legpontosabb osztályozási módszer, ha a bemenő sávok adatai normális eloszlásúak, mert ez veszi figyelembe a legtöbb változót. A Mahalanobis távolság módszerhez hasonlóan a Maximum likelihood is a kovariancia mátrixot használja az osztályok variabilitásának jellemzésére.
Hátrányok
A bonyolult egyenlet miatt a számítás sok időt vesz igénybe. Az idő a sávok számának növekedésével egyenesen arányos. A Maximum likelihood parametrikus módszer. amely azt jelenti, hogy erősen függ az egyes sávok adatainak normális eloszlásától. A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el a spektrális térben.
Az osztályozás eredményének értékelése
Az osztályozás pontosságának, eredményének az értékelésére több módszer is létezik:
küszöbérték vizsgálat - a túlosztályozott osztályokban lévő kritikus pixelek kiszűrésére alkalmazott módszer
pontosság becslés - a klasszifikáció eredményének és földi vagy más meglévő adatok összehasonlításának módszere.
Küszöbérték vizsgálat
A küszöbérték vizsgálattal azonosíthatjuk azokat a pixeleket, amelyeket valószínűleg (most likely) rosszul osztályoztunk. Ezeket a pixeleket egy másik osztályba, általában az nulla osztályba, a nem osztályozottak közé sorolunk át. Ezeket a pixeleket a döntési szabályban használt távolságmérés alapján azonosítjuk.
Távolság file
Ha minimális távolság, a Mahalanobis távolság, a Maximum likelihood osztályozási módszert alkalmazzuk, mindannyiszor létrehozható egy-egy távolság file a kimenő raszterréteg mellett. A távolság file egy egysávos file, az adatok 32 bites tárolásban folyamatos raszterréteget alkotnak, amelyben minden pixelérték az alkalmazott távolságmérés eredményét mutatja.
A minimum távolság osztályozásnál minden távolságérték Euklideszi spektrális távolság a pixel és az osztály átlagértéke között.
Mahalanobis távolság, vagy a Maximum likelihood osztályozási módszert alkalmazva a távolságérték a pixel vektora és az osztály átlagvektora közötti Mahalanobis távolság.
Ez az eloszlási görbe a Chi2 eloszlási függvényéhez hasonló. A valószínűleg rosszul osztályozott pixelek távolságértékeik szerint a grafikon jobb oldalán helyezkednek el, melyek matematikai módszerekkel pontosan definiálhatók és levághatók a hisztogramról. A levágás helye a küszöbérték. A küszöbérték meghatározható:
interaktív módon a hisztogramon,
bemenő adatként, chi2 paraméterként.
Mindként esetben az eredmény az lesz, hogy a legnagyobb távolságértékű pixelek egy tematikus osztályba kerülnek, amely maszkként használható az osztályozás eredményeként létrejött tematikus raszterrétegen.
Pontosság becslés - Accuracy assessement
A pontosság becslése véletlenszerűen kiválasztott referencia pixelek és a tematikus raszterréteg összehasonlítását jelenti. A kiválasztott pixelek számának 250-nél nagyobbnak kell lenni ahhoz, hogy egy osztály átlagos pontosságát 5 %-kon belül megadhassuk. A referencia pixelek véletlenszerű kiválasztása történhet:
random módon - semmilyen szabályt nem használva,
stratégiai random módon - a referencia pixelek a tematikus osztályok területi arányának megfelelően oszlanak el véletlenszerűen az osztályokban,
kiegyenlített random módon - a referencia pixelek a tematikus osztályokban egyenlő számban oszlanak el véletlenszerűen.
A pontosság mérésének az eredménye vagy egy c x c méretű hibamátrixban jelenik meg, ahol c az osztályok száma, vagy egy egyszerű pontosság fileban, mely egy ASCII-file, tartalma a pontosság százalékos statisztikája a hibamátrix alapján.
Automatikus osztályozást angolul Unsupervised training-nek hívják. Az ún. unsupervised osztályozás, nevezhetjük nem irányított osztályozásnak, csak minimális beavatkozást igényel a felhasználó részéről, de az osztályozás eredményét, az osztályokat megjelenítő térképet a felhasználónak kell értelmeznie, és az osztályoknak nevet adni, összevonni ha szükséges, stb. A nem irányított osztályozást, klaszterezésnek (clustering) is nevezik, mert a módszer a spektrális térben lehatárolható pixelcsoportok kialakítására törekszik. Ezeket a pixelcsoportokat, amelyek a statisztikai értelemben hasonló pixeleket tartalmazzák, klasztereknek hívják. Az osztályozás után kialakuló csoportokat térképi műveletekkel, GIS funkciókkal összevonhatjuk, elemezhetjük, illetve felhasználhatjuk a supervised osztályozásban mint a tanulóterületek.
Klaszterek
A klasztereket a klaszterező algoritmus határozza meg, amely az összes, vagy majdnem az összes pixelt felhasználja az elemzéskor. Az algoritmust az alábbi tulajdonságok jellemzik:
a, az ISODATA klaszterezési módszer a spektrális távolságot használja a csoportok elkülönítésekor, de iteratív módon osztályozza a pixeleket, vagyis újraértelmezi a kritériumokat minden osztályra és eszerint osztályozza újra a pixelek, így a spektrális távolságon alapuló csoportok egyre finomodnak.
b, az RGB klaszterezési módszer sokkal speciálisabb, mint az ISODATA módszer. Az RGB módszer 3 sáv 8 bites adatait használja fel az osztályokra bontásnál, úgy hogy a 3-dimenziós spektrális térben meghatározza a pixeleket befoglaló térrészleteket, s ezek lesznek az osztályok.
Ebben a fejezetben mindkét módszer részletes elemzésre kerül, bemutatva előnyeiket és hátrányaikat.
Az ISODATA osztályozás neve az Iterative Self-Organizing Data Analysis Technique (Gonzalez és Tou, 1974) kifejezés rövidítése. Jelentése: Ismétlődő önszervező adatelemző módszer. Ismétlődő (iteratív), mert a teljes klasszifikációt megismétli, amíg az eredmény meg nem felel a követelményeknek, és létrehozza a tematikus raszterréteget, s újraszámítja annak statisztikáját. Önszervező, mert minimális felhasználói segédlet szükséges a klaszterek kijelöléséhez. Az ISODATA módszer a minimális spektrális távolságok módszerét alkalmazza a pixelek osztályba sorolásakor. Az osztályozás meghatározott számú klaszter átlagértékének a megadásával kezdődik (beleértve a már létező tanulóterületek alapján számított osztályközepeket is), és ez ismétlődik, úgy hogy a klaszterközepek folyamatosan módosulnak egy új pixel osztályba sorolása után.
ISODATA klaszterezés paraméterei:
N a klaszterek maximális száma.
Minden klaszter a későbbi osztályt fogja meghatározni, így a klaszterek száma megadja az osztályok maximális számát is. Minden ISODATA osztályozási folyamat N klaszterközép meghatározásával kezdődik. Kevés pixelt tartalmazó klaszterek megszűnhetnek, ezért kevesebb mint N klaszter marad.
T - konvergencia küszöb, amely megadja, hogy maximálisan a pixelek hány százaléka maradhat változatlan az iterációk között.
M - az iterációk maximális száma.
Az ISODATA algoritmus első iteráció elején az N db klaszter átlagértékét határozza meg.
Minden egyes iteráció után, az új klaszterközepeket ismét meghatározza az aktuális klaszterbeli pixelek szerint. Ezeket a klaszterközepeket használja majd a következő iterációban a klaszterek meghatározásához.
7.26. ábra - Az ISODATA osztályozás második lépése képelemek osztályközepekhez rendelése a minimális távolság módszere alapján (ERDAS FIELD Guide)
7.27. ábra - Az ISODATA osztályozás harmadik lépése az új osztályközepek meghatározása (ERDAS FIELD Guide)
Ez a folyamat addig folytatódik, amíg az iterációk eredményei között nagyon kicsi különbség nincs (Swain, 1973). A kezdő klaszterközepek a spektrális térben egy vektor mentén helyezkednek el, mely két végpontjának spektrális térbeli koordinátái az N-dimenziós térben:
(µ1-σ1, µ2-σ2, ... , µn-σn), ill. (µ1+σ1, µ2+σ2, ... , µn+σn).
Kétdimenzióban a kezdő klaszterközepek az A(µ1-σ1, µ2-σ2) és B(µ1+σ1, µ2+σ2) pontok között helyezkednek el.
A pixeleket egyenként soroljuk valamelyik osztályba a bal-felső sarokban lévő pixellel kezdve, majd soronként sorra kerül minden pixel. A pixel és a klaszterközepek térbeli távolságait kiszámítja az algoritmus és a pixelt ahhoz a klaszterhez rendeli, mely közepéhez a pixel legközelebb van a spektrális térben. Az ISODATA osztályozás eredménye egy tematikus raszterréteg és/vagy egy tanulóterület file. Az első iteráció eredménye hasonló a következő képhez. A második iteráció során minden klaszter átlagértékét újraszámítja az algoritmus. Minden pixel összemért az új klaszterközepekkel és hozzárendeli a legközelebbihez. Mindegyik iteráció után az ugyanabban a klaszterben maradó pixel százalékos aránya alapján indul el az újabb iteráció vagy, ha ez az arány eléri a konvergencia küszöböt, az algoritmus befejeződik. Lehetséges, hogy a változatlan pixelek százalékos aránya sohasem éri el ezt a küszöbértéket, ezért az iterációk számának (M) rögzítésével megakadályozható, hogy a program a végtelenségig fusson.
ISODATA klaszterezés előnyei
Iteratív. Ez az algoritmus nagyon alkalmas az egynemű adatokat tartalmazó spektrális klaszterek megtalálására. Nincs jelentősége, hogy a kezdő klaszterközepek hol helyezkednek el, ha elég sok iteráció engedélyezett. A kimenő tematikus raszterréteg hasonló a tanulóterületek alapján, a minimális távolságok módszerét alkalmazó osztályozás eredményéhez. Ezt a tematikus raszterréteget elemezhetjük és kezelhetjük a tanulóterületek szerint mielőtt az aktuális klasszifikációt végrehajtanánk.
ISODATA klaszterezés hátrányai
A klaszterezés sokszor ismételődő, ezért időigényes művelet. Nem veszi figyelembe a pixel térbeli homogenitást.
Az RGB klaszterezés egy egyszerű osztályozási és adattömörítési technika 3 sávra vonatkoztatva, 8 bites adatokon. Egyszerű és gyors algoritmus, amelyet akkor használunk, ha gyors osztályozási eredményre van szükség, de nem lényeges minden részlet teljes körű osztályozása. Alkalmas továbbá a 24 bites színes képek 8 bites színes képpé tömörítésére. Az algoritmus minden pixelt a 3 dimenziós spektrális térben helyez el, és utána egy térbeli háló szerint hozza létre a klasztereket. Minden klaszter egy osztály lesz a kimenő tematikus raszterrétegen. A 3-dimenziós tengelyek mentén a bemenő adatok szerinti hisztogramokat skálázza, majd a hisztogram alapján szétdarabolja az intervallumot, pl. a az átlaghoz képest valamilyen szórástávolságon belüli pixeleket, vagy a minimum és maximum értékek között. A sávonkénti osztályok száma alapértelmezésben: Vörös (Red) - 7 db, Zöld (Green) - 6 db, Kék (Blue) - 6 db, Definiálható, hogy a három sávot egyenként mennyi részre bontsa az algoritmus aszerint, hogy milyenek a sávok szerinti hisztogramok. A szélesebb hisztogram több szeletre, a keskenyebb hisztogram kevesebb szeletre bontható. Az IDRISI Composit parancsa a 3 bemenő sávot felbontja 6-6 intervallumra és a kimenő színes kép pixelértéke a következő képlettel számítható ki: pixelérték= B + 6*G + 36*R.
RGB klaszterezés előnyei
A leggyorsabb osztályozási módszer. A tervezésekor arra törekedtek, hogy gyors és egyszerű osztályozást adjon olyan alkalmazásokhoz, melyek nem igényelnek speciális osztályokat.
A pixelek vizsgálati sorrendje nem befolyásolja a kimenő adatokat.
Erősen interaktív funkció, iteratív módon változtathatjuk a paramétereket, amíg a klaszterek száma és a küszöb megfelel az analízis szempontjából.
Hátrányai
Pontosan három sávot használ az algoritmus, így nem lehetséges mindenféle alkalmazás.
Nem mindig hoz létre olyan tematikus filet, amely alkalmas a későbbi elemzésre.