Detekcija lica Gaborovim filtrom Sveučilište u Zagrebu - FER Napredne metode digitalne obradbe signala Tomislav Androš Ivica Dvoršćak Saša Kovačec 25.siječnja, 2008
Motivacija Gaborov filtar je najbolja aproksimacija prostornog receptivnog polja stanice u vizualnom dijelu moždane kore dobro oponaša vizualni sustav nekih sisavaca jednostavan je za implementaciju koristi se za mnogobrojne probleme kao što su segmentacija tekstura, analiza dokumenata, detekcija rubova, kodiranje slike...
Gaborov filtar kompleksna sinusoida karakteristične frekvencije i orijentacije modulirana Gaussovom ovojnicom H(x,y) = s(x,y)*g(x,y) s(x,y) = g(x,y) =
Gaborov filtar frekvencijski odziv filtra: filtar možemo zamisliti kao Gaussovu funkciju posmaknutu u frekvenciji na poziciju od ishodišta i na orijentaciji filtar sa orijentacijom Θ ima snažan odziv na regiji koja ima varijaciju na istoj orijentaciji
Gaborov filtar Prolaskom slike kroz Gaborov filtar definiran s dobivamo sve komponente slike koje imaju energiju koncentriranu na
Baza ulaznih uzoraka koriste se lica i ne-lica, a zbog većeg broja uzoraka novi uzorci se dobivaju zrcaljenjem i posmicanjem originalne slike slike su veličine 27*18, a iz njih se dobiva vektor dimenzije 2160 koji je dobiven konvolucijom Gaborovog filtra i slike dimenzija značajki dobivenih konvolucijom je 3x veća od navedene, ali je smanjena zbog povećanja brzine učenja
Učenje učenje se izvodi neuronskom mrežom neuronska mreža je dvoslojna – ima 2160 ulaza, 100 skrivenih neurona te jedan izlazni neuron; sve transfer funkcije neurona su tansig mreža se uči backpropagation algoritmom koji koristi konjugirano gradijentni algoritam učenja - brži od metode najbržeg spusta parametri zaustavljanja su 400 iteracija ili MSE manja od
Testiranje – 1. faza testiranje se izvodi na slikama proizvoljne veličine na početku testiranja se ulazna slika konvoluira sa predlošcima koji su lica na slici dobivamo korelacijske regije koje su nam potencijalna lica one nam pomažu da smanjimo broj potencijalnih uzoraka i ubrzamo izračun
Testiranje – 2. faza stvaraju se vektori uzoraka iz korelacijskih regija i stavljaju se na mrežu definiran je prag za odziv koji mreža mora dostići da bi regija bila klasificirana kao lice stvara se mali krug oko centralnog piksela za čiji smo pravokutnik utvrdili da je lice krug nam služi za treću fazu koja morfološki određuje regiju lica
Testiranje – 3. faza gleda se matrica odziva mreže te se filtrira s pragom da se dobije binarna slika radi se dilatacija slike koristeći strukturni element krug – lice je kružnog oblika nakon toga se radi connected-component labeling – identificiraju se pojedini objekti traže se centroidi pojedinih objekata oko centroida se izrađuje zeleni pravokutnik(lice) koji se “zalijepi” na sliku
Problemi algoritam realiziran u Matlabu je spor povećanjem brzine opada detection rate empirijski se određuje prag koji minimizira false detection rate za veću brzinu treba smanjiti vrijednost praga korištena je mala baza lica, za veću bazu je bolji detection rate
Problemi problem je sekvencijalna obrada regija testirane slike kritičan je odabir načina na koji se dolazi do regija koja su potencijalna lica
Rezultati
Rezultati
Rezultati
HVALA NA PAŽNJI!!