A SIFT jellemződetektor bemutatása
A SIFT (Scale Invariant Feature Transform) az egyik leggyakrabban használt és hivatkozott jellemzőpont detektor. Ebben a leckében röviden áttekintjük a SIFT működését. A teljes algoritmus megértéséhez javasoljuk a Lowe eredeti cikkének tanulmányozását.
A SIFT detektor fontosabb lépései
- Konvolváljuk a szürkeárnyalatos képet egy paraméterű Gauss-függvénnyel különböző skálafaktor mellett. Képezzük ezeknek a simított képeknek a különbségét (Difference of Gaussians - DoG). A jellemzőpontok a skálatérben a DoG képeken egy környezet maximumaiban lesznek.
- Küszöböljük az értékeket.
- Elimináljuk az élválaszokat (csak a sarokpontok érdekesek számunkra).
- A lokális orientációhoz határozzuk meg a domimáns gradiens irányt. Az így kapott skála és orientáció minden pont esetében meghatároz egy lokális koordináta-rendszert, tehát minden pont rendelkezik egy (x,y,,) koordinátával (ahol az skálaértéket, az orientációt jelöli).
- A jellemzőpont leírásához tekintsünk egy -os környezetet, amelyet tovább -es blokkokra osztunk.
- Számítsunk a blokkokban 8-irányú irányhisztogramot.
- Alkalmazzunk Gauss súlyozást a középpont körül, amelynek szórása (ahol a pont skálaértéke)
- Előáll egy 128 elemű jellemzővektor.