Biografije Karakteristike Analiza

Teorija prepoznavanja uzoraka. Metode temeljene na pretpostavkama o klasi funkcija odlučivanja

I znakove. Takvi se zadaci rješavaju prilično često, na primjer, prilikom prelaska ili vožnje ulice na semaforima. Prepoznavanje boje upaljenog semafora i poznavanje pravila na cesti omogućuje vam donošenje ispravne odluke o tome hoćete li u ovom trenutku prijeći ulicu ili ne.

U procesu biološke evolucije mnoge su životinje rješavale probleme uz pomoć vizualnog i slušnog aparata. prepoznavanje uzorka dovoljno dobro. Stvaranje umjetnih sustava prepoznavanje uzorka ostaje težak teorijski i tehnički problem. Potreba za takvim prepoznavanjem javlja se u raznim područjima – od vojnih poslova i sigurnosnih sustava do digitalizacije svih vrsta analognih signala.

Tradicionalno, zadaci prepoznavanja slika uključeni su u opseg zadataka umjetne inteligencije.

Smjerovi u prepoznavanju uzoraka

Postoje dva glavna smjera:

  • Proučavanje sposobnosti prepoznavanja koje posjeduju živa bića, njihovo objašnjenje i modeliranje;
  • Razvoj teorije i metoda za konstruiranje uređaja namijenjenih rješavanju pojedinačnih problema u primijenjenim problemima.

Formalna izjava o problemu

Prepoznavanje uzoraka je dodjeljivanje početnih podataka određenoj klasi isticanjem bitnih značajki koje karakteriziraju te podatke iz ukupne mase nebitnih podataka.

Prilikom postavljanja problema prepoznavanja pokušavaju koristiti matematički jezik, nastojeći, za razliku od teorije umjetnih neuronskih mreža, gdje je temelj dobivanje rezultata eksperimentom, eksperiment zamijeniti logičkim zaključivanjem i matematičkim dokazima.

Najčešće se jednobojne slike razmatraju u problemima prepoznavanja uzoraka, što omogućuje razmatranje slike kao funkcije na ravnini. Ako uzmemo u obzir točku skupu na ravnini T, gdje je funkcija x(x,y) izražava u svakoj točki slike svoju karakteristiku - svjetlinu, prozirnost, optičku gustoću, tada je takva funkcija formalni zapis slike.

Skup svih mogućih funkcija x(x,y) na površini T- postoji model skupa svih slika x. Predstavljanje koncepta sličnosti između slika možete postaviti zadatak prepoznavanja. Specifičan oblik takve postavke uvelike ovisi o kasnijim fazama prepoznavanja u skladu s ovim ili drugim pristupom.

Metode prepoznavanja uzoraka

Za optičko prepoznavanje slike, možete primijeniti metodu iteracije nad izgledom objekta pod različitim kutovima, mjerilima, pomacima itd. Za slova trebate iterirati font, svojstva fonta itd.

Drugi pristup je pronaći konturu objekta i ispitati njegova svojstva (povezanost, prisutnost uglova itd.)

Drugi pristup je korištenje umjetnih neuronskih mreža. Ova metoda zahtijeva ili veliki broj primjera zadatka prepoznavanja (s točnim odgovorima), ili posebnu strukturu neuronske mreže koja uzima u obzir specifičnosti ovog zadatka.

Perceptron kao metoda prepoznavanja uzoraka

F. Rosenblatt, uvodeći pojam modela mozga, čija je zadaća pokazati kako psihološke pojave mogu nastati u nekom fizičkom sustavu čija su struktura i funkcionalna svojstva poznata – opisao je najjednostavniji eksperimenti diskriminacije. Ovi eksperimenti su u potpunosti povezani s metodama prepoznavanja uzoraka, ali se razlikuju po tome što algoritam rješenja nije deterministički.

Najjednostavniji eksperiment, na temelju kojeg je moguće dobiti psihološki značajne informacije o određenom sustavu, svodi se na to da se modelu predoče dva različita podražaja i da se na njih traži na različite načine reagirati. Svrha takvog eksperimenta može biti proučavanje mogućnosti njihove spontane diskriminacije od strane sustava u nedostatku intervencije eksperimentatora, ili, obrnuto, proučavanje prisilne diskriminacije, u kojoj eksperimentator nastoji naučiti sustav da izvrši potrebna klasifikacija.

U eksperimentu učenja, perceptron se obično prikazuje s određenim slijedom slika, koji uključuje predstavnike svake od klasa koje treba razlikovati. Prema nekom pravilu modifikacije memorije, točan izbor reakcije je pojačan. Zatim se kontrolni podražaj prikazuje perceptronu i određuje se vjerojatnost dobivanja ispravnog odgovora za podražaje ove klase. Ovisno o tome odgovara li odabrani kontrolni podražaj ili ne s jednom od slika koje su korištene u sekvenci treninga, dobivaju se različiti rezultati:

  • 1. Ako se kontrolni poticaj ne podudara ni s jednim poticajem učenja, tada je eksperiment povezan ne samo s čista diskriminacija, ali također uključuje elemente generalizacije.
  • 2. Ako kontrolni podražaj pobuđuje određeni skup osjetilnih elemenata koji su potpuno različiti od onih elemenata koji su se aktivirali pod utjecajem prethodno prikazanih podražaja iste klase, tada je pokus proučavanje čista generalizacija .

Perceptroni nemaju sposobnost čiste generalizacije, ali sasvim zadovoljavajuće funkcioniraju u eksperimentima diskriminacije, osobito ako se kontrolni podražaj dovoljno poklapa s jednim od obrazaca o kojima je perceptron već stekao određeno iskustvo.

Primjeri problema s prepoznavanjem uzoraka

  • Prepoznavanje slova.
  • Prepoznavanje crtičnog koda.
  • Prepoznavanje registarskih tablica.
  • Prepoznavanje lica.
  • Prepoznavanje govora.
  • Prepoznavanje slike.
  • Prepoznavanje lokalnih područja zemljine kore u kojima se nalaze nalazišta minerala.

Programi za prepoznavanje uzoraka

vidi također

Bilješke

Linkovi

  • Jurij Lifšic. Kolegij "Suvremeni problemi teorijske informatike" - predavanja o statističkim metodama prepoznavanja uzoraka, prepoznavanja lica, klasifikacije teksta
  • Journal of Pattern Recognition Research (Journal of Pattern Recognition Research)

Književnost

  • David A. Forsyth, Jean Pons Računalni vid. Moderni pristup = Računalni vid: Moderni pristup. - M.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Računalni vid = Računalni vid. - M.: Binom. Laboratorij znanja, 2006. - S. 752. - ISBN 5947743841
  • A. L. Gorelik, V. A. Skripkin, Metode prepoznavanja, M .: Viša škola, 1989.
  • Š.-K. Cheng, Principi dizajna vizualnih informacijskih sustava, M.: Mir, 1994.

Zaklada Wikimedia. 2010 .

- u tehnologiji, znanstveni i tehnički smjer povezan s razvojem metoda i konstrukcijom sustava (uključujući i na temelju računala) za utvrđivanje pripadnosti određenog objekta (predmeta, procesa, pojave, situacije, signala) jednom od prije ... ... Veliki enciklopedijski rječnik

Jedna od novih regija kibernetika. Sadržaj teorije R. o. je ekstrapolacija svojstava objekata (slika) koji pripadaju nekoliko klasa na objekte koji su im u nekom smislu bliski. Obično, pri podučavanju automata R. o. tamo je ... ... Geološka enciklopedija

Engleski prepoznavanje, slika; njemački Gestalt alterkennung. Grana matematičke kibernetike koja razvija principe i metode za razvrstavanje i identifikaciju objekata opisanih konačnim skupom značajki koje ih karakteriziraju. Antinazi. Enciklopedija ... ... Enciklopedija sociologije

Prepoznavanje uzorka- metoda proučavanja složenih objekata uz pomoć računala; sastoji se u odabiru značajki i razvoju algoritama i programa koji omogućuju računalima da automatski klasificiraju objekte prema tim značajkama. Na primjer, da odredite koji ... ... Ekonomsko-matematički rječnik

- (tehnički), znanstveno-tehnički smjer povezan s razvojem metoda i izgradnjom sustava (uključujući i računalne) za utvrđivanje pripadnosti objekta (predmeta, procesa, pojave, situacije, signala) jednom od prije ... ... enciklopedijski rječnik

PREPOZNAVANJE UZORKA- dio matematičke kibernetike koji razvija metode za klasifikaciju, kao i identifikaciju objekata, pojava, procesa, signala, situacija svih onih objekata koji se mogu opisati konačnim skupom određenih osobina ili svojstava, ... ... Ruska sociološka enciklopedija

prepoznavanje uzorka- 160 prepoznavanje uzoraka: Identifikacija oblika i konfiguracija pomoću automatskih sredstava

Pregled postojećih metoda prepoznavanja uzoraka

L.P. Popova , I O. Datiev

Sposobnost "prepoznavanja" smatra se glavnim svojstvom ljudskih bića, kao i drugih živih organizama. Prepoznavanje uzoraka je grana kibernetike koja razvija principe i metode za klasifikaciju i identifikaciju objekata, pojava, procesa, signala, situacija – svih onih objekata koji se mogu opisati konačnim skupom nekih značajki ili svojstava koja karakteriziraju objekt.

Slika je opis objekta. Slike imaju karakteristično svojstvo koje se očituje u činjenici da upoznavanje s konačnim brojem pojava iz istog skupa omogućuje prepoznavanje proizvoljno velikog broja njegovih predstavnika.

Postoje dva glavna smjera u teoriji prepoznavanja uzoraka:

    proučavanje moći prepoznavanja koje posjeduju ljudska bića i drugi živi organizmi;

    razvoj teorije i metoda za izradu uređaja namijenjenih rješavanju pojedinačnih problema prepoznavanja uzoraka u određenim područjima primjene.

Nadalje, članak opisuje probleme, principe i metode implementacije sustava za prepoznavanje uzoraka koji se odnose na razvoj drugog smjera. U drugom dijelu članka govori se o metodama neuronske mreže prepoznavanja uzoraka, što se može pripisati prvom smjeru teorije prepoznavanja uzoraka.

Problemi izgradnje sustava za prepoznavanje slika

Zadaci koji se javljaju u izgradnji sustava za automatsko prepoznavanje uzoraka obično se mogu razvrstati u nekoliko glavnih područja. Prvi od njih se odnosi na prikaz početnih podataka dobivenih kao rezultata mjerenja za objekt koji treba prepoznati. problem osjetljivosti. Svaka izmjerena vrijednost je neka "karakteristika slike ili objekta. Pretpostavimo, na primjer, da su slike alfanumerički znakovi. U ovom slučaju, mjerna mrežnica, slična onoj prikazanoj na slici 1 (a), može se uspješno koristiti u senzoru Ako se mrežnica sastoji od n-elemenata, tada se rezultati mjerenja mogu predstaviti kao vektor mjerenja ili vektor slike ,

gdje svaki element xi uzima, na primjer, vrijednost 1 ako slika simbola prolazi kroz i-tu stanicu retine, a vrijednost 0 u suprotnom.

Razmotrite sl. 2(b). U ovom slučaju slike su kontinuirane funkcije (vrste zvučnih signala) varijable t. Ako se vrijednosti funkcije mjere u diskretnim točkama t1,t2, ..., tn, tada se vektor slike može formirati uzimanjem x1= f(t1),x2=f(t2),... , xn = f(tn).

Slika 1. Mjerenje mrežnice

Drugi problem prepoznavanja uzoraka vezan je uz odabir karakterističnih značajki ili svojstava iz dobivenih početnih podataka i smanjenje dimenzije vektora uzoraka. Ovaj se problem često definira kao problem predobradu i odabir značajke.

Značajke klase slika su karakteristična svojstva zajednička svim slikama dane klase. Obilježja koja karakteriziraju razlike između pojedinih klasa mogu se tumačiti kao međuklasna obilježja. Unutarrazredne značajke koje su zajedničke svim klasama koje se razmatraju ne nose korisne informacije sa stajališta prepoznavanja i ne moraju se uzeti u obzir. Odabir značajki smatra se jednim od važnih zadataka povezanih s konstrukcijom sustava prepoznavanja. Ako rezultati mjerenja omogućuju dobivanje kompletnog skupa razlikovnih značajki za sve klase, stvarno prepoznavanje i klasifikacija uzoraka neće uzrokovati posebne poteškoće. Automatsko prepoznavanje bi se tada svelo na jednostavan proces uparivanja ili postupke kao što je traženje tablice. U većini praktičnih problema prepoznavanja, međutim, određivanje kompletnog skupa razlikovnih značajki iznimno je teško, ako ne i nemoguće. Iz izvornih podataka obično je moguće izdvojiti neke od razlikovnih značajki i koristiti ih za pojednostavljenje procesa automatskog prepoznavanja uzoraka. Konkretno, dimenzija mjernih vektora može se smanjiti korištenjem transformacija koje minimiziraju gubitak informacija.

Treći problem povezan s konstrukcijom sustava za prepoznavanje uzoraka je pronaći optimalne postupke odlučivanja potrebnih za identifikaciju i klasifikaciju. Nakon što prikupljeni podaci o uzorcima koji se trebaju prepoznati budu predstavljeni točkama ili vektorima mjerenja u prostoru uzorka, neka stroj shvati kojoj klasi uzoraka ti podaci odgovaraju. Neka je stroj dizajniran tako da razlikuje M klase, označene s w1, w2, ... ..., wm. U ovom slučaju se može smatrati da se prostor slike sastoji od M regija, od kojih svaka sadrži točke koje odgovaraju slikama iz iste klase. U ovom slučaju, problem prepoznavanja se može smatrati konstruiranjem granica regija odlučivanja koje razdvajaju M klase na temelju registriranih mjernih vektora. Neka su te granice definirane, na primjer, funkcijama odlučivanja d1(h),d2(x),..., dm(h). Ove funkcije, također nazvane diskriminantne funkcije, su skalarne i jednovrijedne funkcije slike x. Ako je di (x) > dj (x), tada slika x pripada klasi w1. Drugim riječima, ako i-ta funkcija odlučivanja di(x) ima najveću vrijednost, onda je na Sl. 2 (na shemi "GR" - generator odlučujućih funkcija).

Slika 2. Shema automatske klasifikacije.

Funkcije odlučivanja mogu se dobiti na više načina. U onim slučajevima kada su dostupne potpune a priori informacije o prepoznatljivim obrascima, funkcije odlučivanja mogu se točno odrediti na temelju tih informacija. Ako su o obrascima dostupne samo kvalitativne informacije, mogu se napraviti razumne pretpostavke o obliku funkcija odlučivanja. U potonjem slučaju granice regija odlučivanja mogu značajno odstupati od pravih, te je stoga potrebno stvoriti sustav koji će nizom uzastopnih prilagodbi postići zadovoljavajući rezultat.

Objekti (slike) koje treba prepoznati i klasificirati pomoću automatskog sustava za prepoznavanje uzoraka moraju imati skup mjerljivih karakteristika. Kada su za cijelu skupinu slika rezultati odgovarajućih mjerenja slični, smatra se da ti objekti pripadaju istoj klasi. Svrha sustava za prepoznavanje uzoraka je odrediti, na temelju prikupljenih informacija, klasu objekata sa karakteristikama sličnim onima izmjerenim za prepoznatljive objekte. Točnost prepoznavanja ovisi o količini razlikovnih informacija sadržanih u mjerenim karakteristikama i učinkovitosti korištenja tih informacija.

      Osnovne metode za implementaciju sustava za prepoznavanje uzoraka

Prepoznavanje uzoraka je zadatak konstruiranja i primjene formalnih operacija na numeričkim ili simboličkim prikazima objekata stvarnog ili idealnog svijeta, čiji rezultati odražavaju odnose ekvivalencije između tih objekata. Relacije ekvivalencije izražavaju pripadnost evaluiranih objekata nekim klasama koje se smatraju neovisnim semantičkim jedinicama.

Prilikom konstruiranja algoritama za prepoznavanje, klase ekvivalencije može postaviti istraživač koji koristi vlastite smislene ideje ili koristi vanjske dodatne informacije o sličnosti i različitosti objekata u kontekstu problema koji se rješava. Tada se govori o "razlučivanju s učiteljem". Inače, t.j. kada automatizirani sustav rješava problem klasifikacije bez uključivanja vanjskih informacija o obuci, govorimo o automatskoj klasifikaciji ili "nenadziranom prepoznavanju". Većina algoritama za prepoznavanje uzoraka zahtijeva uključivanje vrlo značajne računalne snage, koju može osigurati samo računalna tehnologija visokih performansi.

Razni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev J., R.I. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin i drugi) daju drugačiju tipologiju metoda prepoznavanja uzoraka. Neki autori razlikuju parametarske, neparametarske i heurističke metode, dok drugi izdvajaju skupine metoda temeljenih na povijesnim školama i trendovima u ovom području.

Istodobno, dobro poznate tipologije ne uzimaju u obzir jednu vrlo značajnu karakteristiku, koja odražava specifičnosti načina na koji se znanje o predmetnom području predstavlja bilo kojim formalnim algoritmom za prepoznavanje uzoraka. D.A. Pospelov identificira dva glavna načina predstavljanja znanja:

    Intenzionalni prikaz – u obliku dijagrama odnosa između atributa (obilježja).

    Ekstenzivni prikaz – uz pomoć konkretnih činjenica (predmeta, primjera).

Treba napomenuti da je postojanje ovih dviju skupina metoda prepoznavanja: onih koje rade sa značajkama i onih koje operiraju s objektima, duboko prirodno. S ove točke gledišta, niti jedna od ovih metoda, uzeta odvojeno od druge, ne omogućuje formiranje adekvatne refleksije predmetnog područja. Između ovih metoda postoji odnos komplementarnosti u smislu N. Bohra, stoga bi obećavajući sustavi prepoznavanja trebali osigurati implementaciju obje ove metode, a ne bilo koje od njih.

Dakle, klasifikacija metoda prepoznavanja koju je predložio D. A. Pospelov temelji se na temeljnim zakonima koji su u osnovi ljudskog načina spoznaje općenito, što ga stavlja u vrlo poseban (privilegirani) položaj u odnosu na druge klasifikacije, koje na toj pozadini izgledaju lakši i umjetni.

Intenzivne metode

Posebnost intenzivnih metoda je da koriste različite karakteristike značajki i njihovih odnosa kao elemente operacija u konstrukciji i primjeni algoritama za prepoznavanje uzoraka. Takvi elementi mogu biti pojedinačne vrijednosti ili intervali vrijednosti značajki, prosječne vrijednosti i varijance, matrice odnosa značajki itd., na kojima se izvode radnje, izražene u analitičkom ili konstruktivnom obliku. Pritom se objekti u ovim metodama ne smatraju integralnim informacijskim jedinicama, već djeluju kao indikatori za procjenu interakcije i ponašanja njihovih atributa.

Skupina intenzivnih metoda prepoznavanja uzoraka je opsežna, a njezina je podjela na podklase donekle proizvoljna:

– metode temeljene na procjenama gustoće distribucije vrijednosti obilježja

– metode temeljene na pretpostavkama o klasi funkcija odlučivanja

– logičke metode

– lingvističke (strukturalne) metode.

Metode temeljene na procjenama gustoće distribucije vrijednosti obilježja. Ove metode prepoznavanja uzoraka posuđene su iz klasične teorije statističkih odluka, u kojoj se predmeti proučavanja smatraju realizacijama višedimenzionalne slučajne varijable raspoređene u prostoru značajki prema nekom zakonu. Temelje se na Bayesovskoj shemi odlučivanja, koja se poziva na apriorne vjerojatnosti objekata koji pripadaju jednoj ili drugoj prepoznatljivoj klasi i uvjetne gustoće distribucije vrijednosti vektora obilježja. Te se metode svode na određivanje omjera vjerojatnosti u različitim područjima višedimenzionalnog prostora značajki.

Skupina metoda temeljenih na procjeni gustoće distribucije vrijednosti obilježja izravno je povezana s metodama diskriminantne analize. Bayesov pristup odlučivanju jedna je od najrazvijenijih u modernoj statistici, tzv. parametarskih metoda, za koje se analitički izraz zakona distribucije (u ovom slučaju normalnog zakona) smatra poznatim i samo malim potrebno je procijeniti broj parametara (srednji vektori i matrice kovarijance).

Ova skupina također uključuje metodu za izračun omjera vjerojatnosti za neovisne značajke. Ova metoda, s izuzetkom pretpostavke o neovisnosti obilježja (koja se u stvarnosti gotovo nikad ne ispunjava), ne zahtijeva poznavanje funkcionalnog oblika zakona raspodjele. Može se pripisati neparametarskim metodama.

Ostale neparametarske metode, koje se koriste kada je oblik krivulje gustoće distribucije nepoznat i ne mogu se napraviti pretpostavke o njegovoj prirodi, zauzimaju poseban položaj. To uključuje poznatu metodu višedimenzionalnih histograma, metodu “k-najbližih susjeda”, metodu Euklidske udaljenosti, metodu potencijalnih funkcija itd., čija je generalizacija metoda koja se naziva “Parzenove procjene”. Ove metode formalno djeluju s objektima kao integralnim strukturama, ali ovisno o vrsti zadatka prepoznavanja, mogu djelovati i u intenzivnim i ekstenzionalnim hipostazama.

Neparametarske metode analiziraju relativne brojeve objekata koji spadaju u zadane višedimenzionalne volumene i koriste različite funkcije udaljenosti između objekata uzorka za obuku i prepoznatih objekata. Za kvantitativne značajke, kada je njihov broj mnogo manji od veličine uzorka, operacije s objektima igraju srednju ulogu u procjeni gustoće lokalne distribucije uvjetnih vjerojatnosti, a objekti ne nose semantičko opterećenje neovisnih informacijskih jedinica. Istovremeno, kada je broj obilježja razmjeran ili veći od broja objekata koji se proučavaju, a obilježja su kvalitativne ili dihotomne prirode, onda ne može biti govora ni o kakvim lokalnim procjenama gustoće distribucije vjerojatnosti. U tom se slučaju objekti u ovim neparametarskim metodama smatraju samostalnim informacijskim jedinicama (holističke empirijske činjenice) i te metode dobivaju značenje procjene sličnosti i različitosti objekata koji se proučavaju.

Dakle, iste tehnološke operacije neparametarskih metoda, ovisno o uvjetima problema, imaju smisla ili lokalne procjene gustoće distribucije vjerojatnosti vrijednosti obilježja, ili procjene sličnosti i razlike objekata.

U kontekstu intenzivne reprezentacije znanja ovdje se razmatra prva strana neparametarskih metoda, kao procjene gustoće distribucije vjerojatnosti. Mnogi autori primjećuju da neparametarske metode kao što su Parzenove procjene dobro funkcioniraju u praksi. Glavne poteškoće u primjeni ovih metoda su potreba za pamćenjem cijelog uzorka za obuku kako bi se izračunale procjene lokalne gustoće distribucije vjerojatnosti i visoka osjetljivost na nereprezentativnost uzorka za obuku.

Metode temeljene na pretpostavkama o klasi funkcija odlučivanja. U ovoj skupini metoda opći oblik funkcije odlučivanja smatra se poznatim i daje se njezin funkcionalni kvalitet. Na temelju ove funkcionalnosti traži se najbolja aproksimacija funkcije odlučivanja za slijed treninga. Najčešći su prikazi funkcija odlučivanja u obliku linearnih i generaliziranih nelinearnih polinoma. Funkcionalnost kvalitete pravila odlučivanja obično je povezana s greškom klasifikacije.

Glavna prednost metoda temeljenih na pretpostavkama o klasi funkcija odlučivanja je jasnoća matematičke formulacije problema prepoznavanja kao problema pronalaženja ekstrema. Rješenje ovog problema često se postiže korištenjem neke vrste gradijentnih algoritama. Raznolikost metoda ove skupine objašnjava se širokim rasponom korištenih funkcija kvalitete pravila odlučivanja i algoritama pretraživanja ekstrema. Generalizacija razmatranih algoritama, koji uključuju, posebice, Newtonov algoritam, algoritme tipa perceptron, itd., je metoda stohastičke aproksimacije. Za razliku od parametarskih metoda prepoznavanja, uspjeh ove skupine metoda ne ovisi toliko o neusklađenosti teorijskih ideja o zakonima raspodjele objekata u prostoru značajki s empirijskom stvarnošću. Sve operacije podređene su jednom glavnom cilju - pronalaženju ekstrema funkcionalne kvalitete pravila odlučivanja. Istodobno, rezultati parametarske i razmatrane metode mogu biti slični. Kao što je gore prikazano, parametarske metode za slučaj normalnih distribucija objekata u različitim klasama s jednakim matricama kovarijacije dovode do linearnih funkcija odlučivanja. Također napominjemo da se algoritmi za odabir informativnih značajki u linearnim dijagnostičkim modelima mogu tumačiti kao posebne varijante gradijentnih algoritama za traženje ekstrema.

Mogućnosti gradijentnih algoritama za pronalaženje ekstrema, posebno u skupini pravila linearnog odlučivanja, prilično su dobro proučene. Konvergencija ovih algoritama dokazana je samo za slučaj kada su prepoznatljive klase objekata prikazane u prostoru značajki kompaktnim geometrijskim strukturama. Međutim, želja za postizanjem dovoljne kvalitete pravila odlučivanja često se može zadovoljiti uz pomoć algoritama koji nemaju rigorozni matematički dokaz konvergencije rješenja globalnom ekstremumu.

Takvi algoritmi uključuju veliku skupinu postupaka heurističkog programiranja koji predstavljaju smjer evolucijskog modeliranja. Evolucijsko modeliranje je bionička metoda posuđena iz prirode. Temelji se na korištenju poznatih mehanizama evolucije kako bi se proces smislenog modeliranja složenog objekta zamijenio fenomenološkim modeliranjem njegove evolucije.

Poznati predstavnik evolucijskog modeliranja u prepoznavanju uzoraka je metoda grupnog obračuna argumenata (MGUA). GMDH se temelji na principu samoorganizacije, a GMDH algoritmi reproduciraju shemu masovne selekcije. U GMDH algoritmima se članovi generaliziranog polinoma sintetiziraju i odabiru na poseban način, koji se često naziva Kolmogorov-Gaborov polinom. Ova sinteza i selekcija se provode sve složenije, te je nemoguće unaprijed predvidjeti kakav će konačni oblik imati generalizirani polinom. Najprije se obično razmatraju jednostavne parne kombinacije početnih značajki iz kojih se sastavljaju jednadžbe odlučujućih funkcija, u pravilu, ne više od drugog reda. Svaka se jednadžba analizira kao nezavisna funkcija odlučivanja, a vrijednosti parametara sastavljenih jednadžbi se na ovaj ili onaj način pronalaze iz uzorka za obuku. Zatim se iz dobivenog skupa funkcija odlučivanja odabire dio najboljeg u nekom smislu. Kvaliteta pojedinih funkcija odlučivanja provjerava se na kontrolnom (testnom) uzorku, što se ponekad naziva principom vanjskog zbrajanja. Odabrane određene funkcije odlučivanja se u nastavku razmatraju kao međuvarijable koje služe kao početni argumenti za sličnu sintezu novih funkcija odlučivanja itd. Proces takve hijerarhijske sinteze nastavlja se sve dok se ne postigne ekstremum kriterija kvalitete funkcije odlučivanja, što u praksi očituje se u pogoršanju ove kvalitete pri pokušaju daljnjeg povećanja redoslijeda članova polinoma u odnosu na izvorne značajke.

Načelo samoorganizacije na kojem se temelji GMDH naziva se heuristička samoorganizacija, budući da se cijeli proces temelji na uvođenju vanjskih dodataka odabranih heuristički. Rezultat odluke može značajno ovisiti o tim heuristikama. Rezultirajući dijagnostički model ovisi o tome kako su objekti podijeljeni na uzorke za obuku i testiranje, kako je određen kriterij kvalitete prepoznavanja, koliko je varijabli preskočeno u sljedećem retku za odabir itd.

Ove značajke GMDH algoritama također su karakteristične za druge pristupe evolucijskom modeliranju. Ali ovdje napominjemo još jedan aspekt razmatranih metoda. To je njihova sadržajna bit. Koristeći metode temeljene na pretpostavkama o klasi funkcija odlučivanja (evolucijske i gradijentne), moguće je izgraditi dijagnostičke modele visoke složenosti i dobiti praktički prihvatljive rezultate. Istodobno, postizanje praktičnih ciljeva u ovom slučaju nije popraćeno izvlačenjem novih znanja o prirodi prepoznatljivih predmeta. Mogućnost izdvajanja tog znanja, posebice znanja o mehanizmima interakcije atributa (obilježja), ovdje je u osnovi ograničena zadanom strukturom takve interakcije, fiksiranom u odabranom obliku odlučujućih funkcija. Stoga je maksimum što se može reći nakon konstruiranja određenog dijagnostičkog modela navesti kombinacije značajki i samih značajki koje su uključene u rezultirajući model. Ali značenje kombinacija koje odražavaju prirodu i strukturu distribucije objekata koji se proučavaju često ostaje neotkriveno u okviru ovog pristupa.

Booleove metode. Logičke metode prepoznavanja uzoraka temelje se na aparatu logičke algebre i omogućuju rad s informacijama sadržanim ne samo u pojedinačnim značajkama, već iu kombinacijama vrijednosti značajki. U ovim metodama vrijednosti bilo kojeg atributa smatraju se elementarnim događajima.

U najopćenitijem obliku, logičke metode mogu se okarakterizirati kao svojevrsno traženje logičkih obrazaca u uzorku obuke i formiranje određenog sustava pravila logičke odluke (na primjer, u obliku konjukcija elementarnih događaja), svaki od koji ima svoju težinu. Skupina logičkih metoda je raznolika i uključuje metode različite složenosti i dubine analize. Za dihotomne (booleove) značajke popularni su takozvani klasifikatori nalik stablu, metoda ispitivanja slijepe ulice, Kora algoritam i drugi. Složenije metode temelje se na formalizaciji induktivnih metoda D.S. Milla. Formalizacija se provodi izgradnjom kvazi-aksiomatske teorije i temelji se na višestruko sortiranoj viševrijednoj logici s kvantifikatorima nad torovima promjenjive duljine.

Kora algoritam, kao i druge logičke metode prepoznavanja uzoraka, prilično je naporan, budući da je pri odabiru veznika potrebno potpuno nabrajanje. Stoga se pri primjeni logičkih metoda postavljaju visoki zahtjevi na učinkovitu organizaciju računskog procesa, a te metode dobro funkcioniraju s relativno malim dimenzijama prostora značajki i samo na moćnim računalima.

Jezične (sintaktičke ili strukturne) metode. Lingvističke metode prepoznavanja uzoraka temelje se na korištenju posebnih gramatika koje generiraju jezike, uz pomoć kojih se može opisati skup svojstava prepoznatljivih objekata. Gramatika se odnosi na pravila za konstruiranje objekata od ovih neizvedenih elemenata.

Ako se opis slika vrši uz pomoć nederivativnih elemenata (podslika) i njihovih odnosa, tada se koristi lingvistički ili sintaktički pristup za izgradnju sustava automatskog prepoznavanja po principu zajedništva svojstava. Slika se može opisati korištenjem hijerarhijske strukture podslika slične sintaktičkoj strukturi jezika. Ova okolnost omogućuje primjenu teorije formalnih jezika u rješavanju problema prepoznavanja uzoraka. Pretpostavlja se da gramatika slika sadrži konačan skup elemenata koji se nazivaju varijable, neizvedeni elementi i pravila zamjene. Priroda pravila zamjene određuje vrstu gramatike. Među najproučavanijim gramatikama su redovite, bez konteksta i gramatike izravnih sastavnica. Ključne točke ovog pristupa su izbor neizvedenih elemenata slike, udruživanje tih elemenata i relacija koji ih povezuju u gramatiku slike i, konačno, implementacija procesa analize i prepoznavanja u odgovarajućim Jezik. Ovaj pristup je posebno koristan kada se radi sa slikama koje se ili ne mogu opisati numeričkim mjerenjima, ili su toliko složene da se njihova lokalna obilježja ne mogu identificirati te se moraju pozivati ​​na globalna svojstva objekata.

Na primjer, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev predlaže sljedeću strukturu sustava za obradu slike (slika 3.), koristeći lingvistički pristup, gdje je svaki od funkcionalnih blokova softverski (mikroprogramski) kompleks (modul) koji implementira odgovarajuće funkcije.

Slika 3. Strukturni dijagram prepoznavača

Pokušaji primjene metoda matematičke lingvistike na problem analize slike dovode do potrebe rješavanja niza problema vezanih uz preslikavanje dvodimenzionalne strukture slike na jednodimenzionalne lance formalnog jezika.

Ekstenzivne metode

U metodama ove skupine, za razliku od intenzivnog smjera, svakom proučavanom objektu u većoj ili manjoj mjeri daje se neovisna dijagnostička vrijednost. U svojoj osnovi, ove metode su bliske kliničkom pristupu, koji ljude ne promatra kao lanac objekata rangiranih prema jednom ili drugom pokazatelju, već kao integralne sustave, od kojih je svaki individualan i ima posebnu dijagnostičku vrijednost. Takav pažljiv odnos prema predmetima proučavanja ne dopušta isključiti ili izgubiti informacije o svakom pojedinom objektu, što se događa kada se primjenjuju metode intenzivnog usmjeravanja, koristeći objekte samo za otkrivanje i fiksiranje obrazaca ponašanja njihovih atributa.

Glavne operacije u prepoznavanju uzoraka pomoću razmatranih metoda su operacije utvrđivanja sličnosti i razlike objekata. Objekti u navedenoj skupini metoda imaju ulogu dijagnostičkih presedana. Pritom, ovisno o uvjetima pojedinog zadatka, uloga pojedinog presedana može varirati u najširim granicama: od glavnog i definirajućeg do vrlo neizravnog sudjelovanja u procesu priznavanja. Zauzvrat, uvjeti problema mogu zahtijevati sudjelovanje različitog broja dijagnostičkih presedana za uspješno rješenje: od jednog u svakoj prepoznatljivoj klasi do cjelokupne veličine uzorka, kao i različite načine izračunavanja mjera sličnosti i razlike predmeta. Ovi zahtjevi objašnjavaju daljnju podjelu ekstenzijskih metoda u podklase:

    metoda usporedbe prototipa;

    metoda k-najbližeg susjeda;

    timovi pravila odlučivanja.

Metoda usporedbe prototipa. Ovo je najjednostavniji način ekstenzijskog prepoznavanja. Koristi se, na primjer, kada se prepoznate klase prikazuju u prostoru značajki u kompaktnim geometrijskim grupama. U ovom slučaju, središte geometrijskog grupiranja klase (ili objekt najbliži središtu) obično se bira kao točka prototipa.

Za klasifikaciju nepoznatog objekta pronalazi se prototip koji mu je najbliži, a objekt pripada istoj klasi kao i ovaj prototip. Očito se ovom metodom ne formiraju generalizirane slike klasa.

Različite vrste udaljenosti mogu se koristiti kao mjera blizine. Često se za dihotomne značajke koristi Hammingova udaljenost, koja je u ovom slučaju jednaka kvadratu euklidske udaljenosti. U ovom slučaju, pravilo odlučivanja za razvrstavanje objekata je ekvivalentno linearnoj funkciji odlučivanja.

Ovu činjenicu treba posebno istaknuti. Jasno pokazuje vezu između prototipa i indikativnog prikaza informacija o strukturi podataka. Koristeći gornji prikaz, na primjer, bilo koja tradicionalna mjerna skala, koja je linearna funkcija vrijednosti dihotomnih značajki, može se smatrati hipotetičkim dijagnostičkim prototipom. Zauzvrat, ako nam analiza prostorne strukture prepoznatih klasa dopušta da zaključimo da su one geometrijski kompaktne, tada je dovoljno svaku od tih klasa zamijeniti jednim prototipom, koji je zapravo ekvivalentan linearnom dijagnostičkom modelu.

U praksi se, naravno, situacija često razlikuje od opisanog idealiziranog primjera. Istraživač koji namjerava primijeniti metodu prepoznavanja temeljenu na usporedbi s prototipovima dijagnostičkih klasa suočava se s teškim problemima. To je prije svega izbor mjere blizine (metrike), koja može značajno promijeniti prostornu konfiguraciju distribucije objekata. I, drugo, neovisni problem je analiza višedimenzionalnih struktura eksperimentalnih podataka. Oba ova problema posebno su akutna za istraživača u uvjetima velike dimenzije prostora obilježja, što je tipično za stvarne probleme.

Metoda k-najbližih susjeda. Metoda k-najbližeg susjeda za rješavanje problema diskriminantne analize prvi je put predložena davne 1952. godine. To je kako slijedi.

Prilikom razvrstavanja nepoznatog objekta pronalazi se zadani broj (k) drugih objekata koji su mu geometrijski najbliži u prostoru značajki (najbliži susjedi) za koje je već poznato da pripadaju prepoznatljivim klasama. Odluka da se nepoznati objekt dodijeli određenoj dijagnostičkoj klasi donosi se analizom informacija o tom poznatom članstvu njegovih najbližih susjeda, na primjer, korištenjem jednostavnog brojanja glasova.

U početku se metoda k-najbližeg susjeda smatrala neparametarskom metodom za procjenu omjera vjerojatnosti. Za ovu metodu dobivene su teorijske procjene njezine učinkovitosti u usporedbi s optimalnim Bayesovim klasifikatorom. Dokazano je da vjerojatnosti asimptotske pogreške za metodu k-najbližeg susjeda ne premašuju pogreške Bayesovog pravila najviše dva puta.

Kao što je gore navedeno, u stvarnim je problemima često potrebno raditi s objektima koji su opisani velikim brojem kvalitativnih (dihotomnih) značajki. Istovremeno, dimenzija prostora obilježja je razmjerna ili prelazi volumen uzorka koji se proučava. U takvim je uvjetima prikladno svaki objekt uzorka za obuku interpretirati kao zaseban linearni klasifikator. Tada ova ili ona dijagnostička klasa nije predstavljena jednim prototipom, već skupom linearnih klasifikatora. Kombinirana interakcija linearnih klasifikatora rezultira linearnom površinom koja razdvaja prepoznatljive klase u prostoru značajki. Vrsta razdjelne plohe, koja se sastoji od komada hiperravnina, može se mijenjati i ovisi o relativnom položaju razvrstanih agregata.

Također se može koristiti i druga interpretacija k-najbližih susjednih mehanizama klasifikacije. Temelji se na ideji postojanja nekih latentnih varijabli, apstraktnih ili povezanih nekom transformacijom s izvornim prostorom značajki. Ako su razmaci u paru između objekata u prostoru latentnih varijabli jednaki kao u prostoru početnih obilježja, a broj tih varijabli je mnogo manji od broja objekata, onda se može razmotriti interpretacija metode k-najbližih susjeda. sa stajališta usporedbe neparametarskih procjena gustoće distribucije uvjetne vjerojatnosti. Ovdje predstavljen koncept latentnih varijabli blizak je po prirodi konceptu prave dimenzionalnosti i drugim prikazima koji se koriste u različitim metodama redukcije dimenzionalnosti.

Pri korištenju metode k-najbližih susjeda za prepoznavanje uzoraka, istraživač mora riješiti težak problem odabira metrike za određivanje blizine dijagnosticiranih objekata. Ovaj problem u uvjetima velike dimenzije prostora značajki izrazito je otežan zbog dovoljno zahtjevnosti ove metode, što postaje značajno čak i za računala visokih performansi. Stoga je i ovdje, kao i u metodi usporedbe prototipa, potrebno riješiti kreativni problem analize višedimenzionalne strukture eksperimentalnih podataka kako bi se minimizirao broj objekata koji predstavljaju dijagnostičke klase.

Algoritmi za izračun ocjena (glasovanje). Načelo rada algoritama za izračunavanje rezultata (ABO) je izračunavanje prioriteta (bodova sličnosti) koji karakteriziraju „blizinu“ prepoznatih i referentnih objekata prema sustavu ansambala značajki, koji je sustav podskupova danog skup značajki.

Za razliku od svih prethodno razmatranih metoda, algoritmi za izračun procjena rade s opisima objekata na temeljno nov način. Za ove algoritme, objekti postoje istovremeno u vrlo različitim podprostorima prostora značajki. Klasa ABO dovodi ideju korištenja obilježja do svog logičnog zaključka: budući da nije uvijek poznato koje su kombinacije obilježja najinformativnije, u ABO se stupanj sličnosti objekata izračunava uspoređivanjem svih mogućih ili određenih kombinacija obilježja. uključeni u opise objekata.

Timovi pravila odlučivanja. Pravilo odluke koristi dvostupanjsku shemu prepoznavanja. Na prvoj razini rade privatni algoritmi prepoznavanja čiji se rezultati kombiniraju na drugoj razini u bloku sinteze. Najčešće metode takve kombinacije temelje se na dodjeli područja nadležnosti određenog algoritma. Najjednostavniji način pronalaženja područja kompetencije je a priori podjela prostora značajki na temelju stručnih razmatranja određene znanosti (na primjer, stratifikacija uzorka prema nekom obilježju). Zatim se za svako od odabranih područja izrađuje vlastiti algoritam prepoznavanja. Druga metoda temelji se na korištenju formalne analize za određivanje lokalnih područja prostora značajki kao susjedstva prepoznatljivih objekata za koje je dokazana uspješnost bilo kojeg određenog algoritma prepoznavanja.

Najopćenitiji pristup konstrukciji bloka sinteze razmatra rezultirajuće pokazatelje parcijalnih algoritama kao početne značajke za konstruiranje novog generaliziranog pravila odlučivanja. U ovom slučaju mogu se koristiti sve navedene metode intenzionalnih i ekstenzijskih smjerova u prepoznavanju uzoraka. Učinkoviti za rješavanje problema stvaranja skupa pravila odlučivanja su logički algoritmi tipa “Kora” i algoritmi za izračunavanje procjena (ABO), koji čine osnovu tzv. algebarskog pristupa, koji pruža istraživanje i konstruktivan opis algoritmi za prepoznavanje, unutar kojih se uklapaju svi postojeći tipovi algoritama.

Metode neuronskih mreža

Metode neuronskih mreža su metode koje se temelje na korištenju različitih vrsta neuronskih mreža (NN). Glavna područja primjene različitih NN-ova za prepoznavanje uzoraka i slika:

    aplikacija za izdvajanje ključnih karakteristika ili značajki danih slika,

    klasifikacija samih slika ili karakteristika koje su iz njih već izvučene (u prvom slučaju, izdvajanje ključnih karakteristika događa se implicitno unutar mreže),

    rješenje optimizacijskih problema.

Višeslojne neuronske mreže. Arhitektura višeslojne neuronske mreže (MNN) sastoji se od sekvencijalno povezanih slojeva, pri čemu je neuron svakog sloja svojim ulazima povezan sa svim neuronima prethodnog sloja, te s izlazima sljedećeg sloja.

Najjednostavnija primjena jednoslojnog NN-a (koji se naziva auto-asocijativna memorija) je osposobiti mrežu za rekonstrukciju slika feeda. Unošenjem testne slike na ulaz i izračunom kvalitete rekonstruirane slike, može se procijeniti koliko je dobro mreža prepoznala ulaznu sliku. Pozitivna svojstva ove metode su da mreža može oporaviti izobličene i bučne slike, ali nije prikladna za ozbiljnije svrhe.

MNN se također koristi za izravnu klasifikaciju slika - ulaz je ili sama slika u nekom obliku, ili skup prethodno ekstrahiranih ključnih karakteristika slike, na izlazu neuron s maksimalnom aktivnošću ukazuje na pripadnost prepoznatoj klasi (sl. . 4). Ako je ova aktivnost ispod određenog praga, tada se smatra da dostavljena slika ne pripada nijednoj od poznatih klasa. Proces učenja uspostavlja korespondenciju ulaznih slika s pripadanjem određenom razredu. To se zove učenje pod nadzorom. Ovaj pristup je dobar za zadatke kontrole pristupa za malu grupu ljudi. Ovaj pristup omogućuje izravnu usporedbu samih slika od strane mreže, ali s povećanjem broja sati, vrijeme obuke i rada mreže raste eksponencijalno. Stoga, za zadatke kao što je traženje slične osobe u velikoj bazi podataka, potrebno je izdvojiti kompaktan skup ključnih značajki iz kojih se može pretraživati.

Pristup klasifikaciji koji koristi frekvencijske karakteristike cijele slike opisan je u . Korišten je jednoslojni NS baziran na viševrijednim neuronima.

B prikazuje korištenje NN za klasifikaciju slike, kada mrežni ulaz prima rezultate dekompozicije slike metodom glavnih komponenti.

U klasičnom MNS-u međuslojne neuronske veze su potpuno povezane, a slika je predstavljena kao jednodimenzionalni vektor, iako je dvodimenzionalna. Arhitektura konvolucijske neuronske mreže ima za cilj prevladati ove nedostatke. Koristio je lokalna receptorska polja (omogućuje lokalnu dvodimenzionalnu povezanost neurona), opće težine (omogućava otkrivanje nekih značajki bilo gdje na slici) i hijerarhijsku organizaciju s prostornim poduzorkovanjem (prostorno poduzorkovanje). Konvolucijski NN (CNN) pruža djelomičnu otpornost na promjene skale, pomake, rotacije, izobličenja.

MNS se također koriste za otkrivanje objekata određene vrste. Uz činjenicu da svaki obučeni MNS može u određenoj mjeri odrediti pripadaju li slike “vlastitim” klasama, može se posebno osposobiti za pouzdano otkrivanje određenih klasa. U ovom slučaju, izlazne klase bit će klase koje pripadaju i ne pripadaju danom tipu slike. Za detekciju slike lica na ulaznoj slici korišten je detektor neuronske mreže. Slika je skenirana s prozorom veličine 20x20 piksela, koji je doveden na ulaz mreže, koja odlučuje da li zadano područje pripada klasi lica. Trening je rađen na pozitivnim primjerima (razne slike lica) i negativnim primjerima (slike koje nisu lica). Kako bi se povećala pouzdanost detekcije, korišten je tim NN-a uvježbanih s različitim početnim težinama, uslijed čega su NN-i griješili na različite načine, a konačnu odluku donosio je glasovanjem cijelog tima.

Slika 5. Glavne komponente (eigenfaces) i dekompozicija slike na glavne komponente

NN se također koristi za izdvajanje ključnih karakteristika slike, koje se zatim koriste za kasniju klasifikaciju. U , prikazana je metoda za implementaciju metode analize glavne komponente neuronskom mrežom. Bit metode analize glavne komponente je dobivanje maksimalno dekoreliranih koeficijenata koji karakteriziraju ulazne obrasce. Ti se koeficijenti nazivaju glavnim komponentama i koriste se za statističku kompresiju slike, u kojoj se mali broj koeficijenata koristi za predstavljanje cijele slike. NN s jednim skrivenim slojem koji sadrži N neurona (što je mnogo manje od dimenzije slike), uvježban metodom povratnog širenja pogreške za vraćanje ulazne slike na izlazu, formira koeficijente prvih N glavnih komponenti na izlazu skrivenih neurona, koji se koriste za usporedbu. Obično se koristi 10 do 200 glavnih komponenti. Kako se broj komponente povećava, njezina reprezentativnost uvelike opada i nema smisla koristiti komponente s velikim brojevima. Pri korištenju nelinearnih aktivacijskih funkcija neuronskih elemenata moguća je nelinearna dekompozicija na glavne komponente. Nelinearnost vam omogućuje da preciznije odražavate varijacije u ulaznim podacima. Primjenjujući analizu glavnih komponenti na dekompoziciju slika lica, dobivamo glavne komponente, nazvane pravilna lica, koje također imaju korisno svojstvo - postoje komponente koje uglavnom odražavaju takve bitne karakteristike lica kao što su spol, rasa, emocije. Kada se restauriraju, komponente imaju izgled lica, pri čemu prvi odražavaju najopćenitiji oblik lica, a drugi predstavljaju različite manje razlike između lica (slika 5.). Ova metoda je dobro primjenjiva za pretraživanje sličnih slika lica u velikim bazama podataka. Također je prikazana mogućnost daljnjeg smanjenja dimenzija glavnih komponenti uz pomoć NS-a. Procjenom kvalitete rekonstrukcije ulazne slike može se vrlo precizno utvrditi pripada li ona klasi lica.

Neuronske mreže visokog reda. Neuralne mreže visokog reda (HNN) razlikuju se od MNN-a po tome što imaju samo jedan sloj, ali ulazi neurona također primaju članove visokog reda koji su proizvod dvije ili više komponenti ulaznog vektora. Takve mreže također mogu formirati složene površine za razdvajanje.

Hopfieldove neuronske mreže. Hopfield NN (HSH) je jednoslojni i potpuno povezan (ne postoje veze neurona na sebe), njegovi izlazi su povezani s ulazima. Za razliku od MNS-a, NSH je opuštajući, t.j. kada je postavljen na početno stanje, funkcionira dok ne dosegne stabilno stanje, što će biti njegova izlazna vrijednost. Za traženje globalnog minimuma u odnosu na probleme optimizacije koriste se stohastičke modifikacije NSH.

Korištenje NSH-a kao asocijativne memorije omogućuje vam da točno vratite slike na koje je mreža uvježbana kada se iskrivljena slika unese na ulaz. Mreža će u tom slučaju “zapamtiti” najbližu (u smislu lokalnog minimuma energije) sliku i tako je prepoznati. Takvo funkcioniranje se također može smatrati sekvencijalnom primjenom gore opisane auto-asocijativne memorije. Za razliku od auto-asociativne memorije, NSH će savršeno točno vratiti sliku. Kako bi se izbjegli minimumi smetnji i povećao kapacitet mreže, koriste se različite metode.

Kohonenove samoorganizirajuće neuronske mreže. Kohonenove samoorganizirajuće neuronske mreže (SNNC) pružaju topološko uređenje prostora ulazne slike. Oni omogućuju topološki kontinuirano preslikavanje ulaznog n-dimenzionalnog prostora u izlazni m-dimenzionalni, m<

Kognitron. Kognitron je u svojoj arhitekturi sličan strukturi vizualnog korteksa, ima hijerarhijsku višeslojnu organizaciju, u kojoj su neuroni između slojeva povezani samo lokalno. Osposobljen natjecateljskim učenjem (bez učitelja). Svaki sloj mozga provodi različite razine generalizacije; ulazni sloj je osjetljiv na jednostavne uzorke, kao što su linije, i njihovu orijentaciju u određenim područjima vizualnog područja, dok je odgovor ostalih slojeva složeniji, apstraktniji i neovisan o položaju uzorka. Slične funkcije implementiraju se u kognitronu modeliranjem organizacije vizualnog korteksa.

Neokognitron je daljnji razvoj ideje kognitrona i točnije odražava strukturu vizualnog sustava, omogućuje vam prepoznavanje slika bez obzira na njihove transformacije, rotacije, izobličenja i promjene skale.

Cognitron je moćan alat za prepoznavanje slika, međutim, zahtijeva visoke računske troškove, koji su trenutno nedostižni.

Razmatrane metode neuronske mreže omogućuju brzo i pouzdano prepoznavanje slike, no pri korištenju ovih metoda nastaju problemi u prepoznavanju trodimenzionalnih objekata. Međutim, ovaj pristup ima mnoge prednosti.

      Zaključak

Trenutno postoji prilično velik broj automatskih sustava za prepoznavanje uzoraka za različite primijenjene probleme.

Prepoznavanje obrazaca formalnim metodama kao temeljni znanstveni smjer je neiscrpno.

Matematičke metode obrade slike imaju širok raspon primjena: znanost, tehnologija, medicina, društvena sfera. U budućnosti će se uloga prepoznavanja uzoraka u ljudskom životu još više povećati.

Metode neuronske mreže omogućuju brzo i pouzdano prepoznavanje slike. Ovaj pristup ima mnoge prednosti i jedan je od najperspektivnijih.

Književnost

    D.V. Brilyuk, V.V. Starovoitov. Metode neuronske mreže prepoznavanja slike // /

    Kuzin L.T. Osnove kibernetike: Osnove kibernetičkih modela. T.2. - M.: Energija, 1979. - 584 str.

    Peregudov F.I., Tarasenko F.P. Uvod u analizu sustava: Udžbenik. - M .: Viša škola, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Teorijske osnove informacijske tehnologije. - M.: Energija, 1979. - 511s.

    Tu J., Gonzalez R. Principi prepoznavanja uzoraka. / Per. s engleskog. - M.: Mir, 1978. - 410s.

    Winston P. Umjetna inteligencija. / Per. s engleskog. - M.: Mir, 1980. - 520s.

    Fu K. Strukturne metode u prepoznavanju uzoraka: Prevedeno s engleskog. - M.: Mir, 1977. - 320s.

    Tsypkin Ya.Z. Osnove informacijske teorije identifikacije. - M.: Nauka, 1984. - 520s.

    Pospelov G.S. Umjetna inteligencija temelj je nove informacijske tehnologije. - M.: Nauka, 1988. - 280s.

    Yu. Lifshits, Statističke metode prepoznavanja uzoraka ///modern/07modernnote.pdf

    Bohr N. Atomska fizika i ljudsko znanje. / Prijevod s engleskog. - M.: Mir, 1961. - 151s.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Obrada slike na računalu.1987.-236s.

    Duda R., Hart P. Prepoznavanje uzoraka i analiza scene. / Prijevod s engleskog. - M.: Mir, 1978. - 510s.

    Vojvoda V.A. Računalna psihodijagnostika. - Sankt Peterburg: Bratstvo, 1994. - 365 str.

    Aizenberg I. N., Aizenberg N. N. i Krivosheev G. A. Viševrijedni i univerzalni binarni neuroni: algoritmi učenja, primjene za obradu i prepoznavanje slika. Bilješke s predavanja iz umjetne inteligencije - strojno učenje i rudarenje podataka u prepoznavanju uzoraka, 1999., str. 21-35 (prikaz, stručni).

    Ranganath S. i Arun K. Prepoznavanje lica pomoću značajki transformacije i neuronskih mreža. Prepoznavanje uzoraka 1997, sv. 30, str. 1615-1622 (prikaz, stručni).

    Golovko V.A. Neurointeligencija: teorija i primjena. Knjiga 1. Organizacija i obuka neuronskih mreža s izravnom i povratnom spregom - Brest: BPI, 1999, - 260s.

    Vetter T. i Poggio T. Klase linearnih objekata i sinteza slike iz jednog primjera slike. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, str. 733-742 (prikaz, stručni).

    Golovko V.A. Neurointeligencija: teorija i primjena. Knjiga 2. Samoorganizacija, tolerancija grešaka i korištenje neuronskih mreža - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. i Back A. D. Prepoznavanje lica: pristup konvolucijskoj neuronskoj mreži. IEEE Transakcije na neuronskim mrežama, Posebno izdanje o neuronskim mrežama i prepoznavanju uzoraka, pp. 1-24 (prikaz, stručni).

    Wasserman F. Tehnologija neuroračunala: Teorija i praksa, 1992. - 184 str.

    Rowley H. A., Baluja S. i Kanade T. Detekcija lica temeljena na neuronskoj mreži. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, str. 23-37 (prikaz, stručni).

    Valentin D., Abdi H., O "Toole A. J. i Cottrell G. W. Connectionistički modeli obrade lica: anketa. IN: Pattern Recognition 1994, Vol. 27, str. 1209-1230.

    Dokument

    Oni izrađuju algoritme priznanjeslike. Metodepriznanjeslike Kao što je gore navedeno ... stvarnost nije postoji"ekosustavi općenito" i postojati samo nekoliko ... zaključaka iz ovog detaljnog pregledmetodepriznanje predstavili smo u...

  1. Pregled metoda za identifikaciju ljudi na temelju slika lica, uzimajući u obzir značajke vizualnog prepoznavanja

    Pregled

    ... priznanje od strane osobe s objektima niskog kontrasta, uklj. osobe. Donio pregled uobičajen metode ... Postoji cijela linija metode ... put, kao rezultat studije, platforma za razvoj metodapriznanje ...

  2. Imeni Glazkova Valentina Vladimirovna ISTRAŽIVANJE I RAZVOJ METODA ZA KONSTRUKCIJU SOFTVERSKIH ALATA ZA KLASIFIKACIJU VIŠETEMATSKIH HIPERTEKSTNIH DOKUMENTA Specijalnost 05

    Sažetak disertacije

    hipertekstualni dokumenti. Poglavlje sadrži pregledpostojanjemetode rješenje problema koji se razmatra, opis ... odsijecanjem najmanje relevantnih klasa // Matematika metodepriznanjeslike: 13. sveruska konferencija. Lenjingradska oblast...

  3. Slide 0 Pregled zadataka bioinformatike vezanih uz analizu i obradu genetskih tekstova

    Predavanje

    DNA i proteinske sekvence. Pregled zadaci bioinformatike kao zadaci ... signali zahtijevaju korištenje suvremenih metodepriznanjeslike, statistički pristupi i ... s niskom gustoćom gena. Postojanje programi za predviđanje gena ne...

Poglavlje 3: Analitički pregled metoda prepoznavanja uzoraka i donošenja odluka

Teorija prepoznavanja uzoraka i automatizacija upravljanja

Glavni zadaci adaptivnog prepoznavanja uzoraka

Prepoznavanje je informacijski proces koji provodi neki informacijski pretvarač (inteligentni informacijski kanal, sustav za prepoznavanje) koji ima ulaz i izlaz. Ulaz sustava je informacija o tome koje značajke imaju prikazani objekti. Izlaz sustava prikazuje informacije o tome kojim klasama (generalizirane slike) su dodijeljeni prepoznatljivi objekti.

Prilikom izrade i rada automatiziranog sustava za prepoznavanje uzoraka rješava se niz zadataka. Razmotrimo ukratko i jednostavno ove zadatke. Napominjemo da se formulacije ovih zadataka, kao i sam skup, ne podudaraju s različitim autorima, jer u određenoj mjeri ovisi o specifičnom matematičkom modelu na kojem se temelji ovaj ili onaj sustav prepoznavanja. Osim toga, neki zadaci u pojedinim modelima prepoznavanja nemaju rješenje i, sukladno tome, nisu postavljeni.

Zadatak formaliziranja predmetnog područja

Zapravo, ovaj zadatak je zadatak kodiranja. Sastavlja se popis generaliziranih klasa, koji može uključivati ​​specifične implementacije objekata, kao i popis značajki koje ti objekti, u principu, mogu imati.

Zadatak formiranja uzorka za obuku

Uzorak za obuku je baza podataka koja sadrži opise specifičnih implementacija objekata u jeziku značajki, dopunjena informacijama o pripadnosti tih objekata određenim klasama prepoznavanja.

Zadatak osposobljavanja sustava prepoznavanja

Uzorak za obuku koristi se za formiranje generaliziranih slika klasa prepoznavanja na temelju generalizacije informacija o tome koje značajke imaju objekti uzorka za obuku koji pripadaju ovoj klasi i drugim klasama.

Problem smanjenja dimenzije prostora značajki

Nakon osposobljavanja sustava za prepoznavanje (dobivanje statistike o raspodjeli frekvencija obilježja po klasama), postaje moguće za svaku značajku odrediti vrijednost za rješavanje problema prepoznavanja. Nakon toga, najmanje vrijedne značajke mogu se ukloniti iz sustava značajki. Zatim se sustav prepoznavanja mora ponovno osposobiti, jer se kao rezultat uklanjanja nekih značajki mijenja statistika distribucije preostalih obilježja po klasama. Taj se proces može ponoviti, tj. biti iterativni.

Zadatak prepoznavanja

Prepoznaju se objekti prepoznatljivog uzorka, koji se, posebice, mogu sastojati od jednog predmeta. Prepoznatljivi uzorak formiran je slično kao i trening, ali ne sadrži podatke o pripadnosti objekata klasama, jer se upravo to utvrđuje u procesu prepoznavanja. Rezultat prepoznavanja svakog objekta je distribucija ili popis svih klasa prepoznavanja u silaznom redoslijedu stupnja sličnosti prepoznatog objekta s njima.

Zadatak kontrole kvalitete prepoznavanja

Nakon prepoznavanja može se utvrditi njegova primjerenost. Za objekte uzorka za obuku to se može učiniti odmah, jer je za njih jednostavno poznato kojim klasama pripadaju. Za ostale objekte ove se informacije mogu dobiti kasnije. U svakom slučaju, može se odrediti stvarna prosječna vjerojatnost pogreške za sve klase prepoznavanja, kao i vjerojatnost pogreške prilikom dodjele prepoznatog objekta određenoj klasi.

Rezultate prepoznavanja treba tumačiti uzimajući u obzir dostupne informacije o kvaliteti prepoznavanja.

Zadatak prilagodbe

Ako se kao rezultat postupka kontrole kvalitete utvrdi da je nezadovoljavajući, tada se opisi pogrešno prepoznatih objekata mogu kopirati iz prepoznatljivog uzorka u osposobljavajući, dopuniti odgovarajućim klasifikacijskim podacima i koristiti za preoblikovanje odluke. pravila, tj. uzeti u obzir. Štoviše, ako ti objekti ne pripadaju već postojećim klasama prepoznavanja, što bi mogao biti razlog za njihovo netočno prepoznavanje, onda se ovaj popis može proširiti. Kao rezultat toga, sustav prepoznavanja se prilagođava i počinje adekvatno klasificirati te objekte.

Problem inverznog prepoznavanja

Zadaća prepoznavanja je da za dati objekt, prema njegovim poznatim značajkama, sustav utvrdi njegovu pripadnost nekoj dotad nepoznatoj klasi. U inverznom problemu prepoznavanja, naprotiv, za danu klasu prepoznavanja, sustav određuje koje su značajke najkarakterističnije za objekte ove klase, a koje nisu (ili koji objekti uzorka za obuku pripadaju ovoj klasi).

Zadaci klasterske i konstruktivne analize

Klasteri su takve grupe objekata, klasa ili obilježja da su unutar svakog klastera što sličniji, a između različitih klastera što je moguće više različiti.

Konstrukt (u kontekstu koji se razmatra u ovom odjeljku) je sustav suprotnih klastera. Dakle, u određenom smislu, konstrukti su rezultat klaster analize klastera.

U klaster analizi kvantitativno se mjeri stupanj sličnosti i razlike objekata (klasa, obilježja), te se ta informacija koristi za klasifikaciju. Rezultat klaster analize je sama klasifikacija objekata po klasterima. Ova se klasifikacija može predstaviti u obliku semantičkih mreža.

Zadatak kognitivne analize

U kognitivnoj analizi, informacije o sličnosti i različitosti klasa ili obilježja interesiraju istraživača same po sebi, a ne da bi ih koristile za klasifikaciju, kao u klaster i konstruktivnoj analizi.

Ako se dvije klase prepoznavanja karakteriziraju istim obilježjem, onda to pridonosi sličnosti ovih dviju klasa. Ako je za jednu od klasa ova značajka nekarakteristična, onda to doprinosi razlici.

Ako su dva znaka u međusobnoj korelaciji, onda se u određenom smislu mogu smatrati jednim znakom, a ako su antikorelirani, onda različitim. Uzimajući u obzir ovu okolnost, prisutnost različitih obilježja u različitim klasama također daje određeni doprinos njihovoj sličnosti i različitosti.

Rezultati kognitivne analize mogu se prikazati u obliku kognitivnih dijagrama.

Metode prepoznavanja uzoraka i njihove karakteristike

Načela klasifikacije metoda prepoznavanja uzoraka

Prepoznavanje uzoraka je zadatak konstruiranja i primjene formalnih operacija na numeričkim ili simboličkim prikazima objekata stvarnog ili idealnog svijeta, čiji rezultati rješenja odražavaju odnose ekvivalencije između tih objekata. Relacije ekvivalencije izražavaju pripadnost evaluiranih objekata nekim klasama koje se smatraju neovisnim semantičkim jedinicama.

Prilikom konstruiranja algoritama za prepoznavanje, klase ekvivalencije može postaviti istraživač koji koristi vlastite smislene ideje ili koristi vanjske dodatne informacije o sličnosti i različitosti objekata u kontekstu problema koji se rješava. Tada se govori o "prepoznavanju s učiteljem". Inače, t.j. kada automatizirani sustav rješava problem klasifikacije bez uključivanja vanjskih informacija o obuci, govorimo o automatskoj klasifikaciji ili "nenadziranom prepoznavanju". Većina algoritama za prepoznavanje uzoraka zahtijeva uključivanje vrlo značajne računalne snage, koju može osigurati samo računalna tehnologija visokih performansi.

Razni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin i drugi) daju drugačiju tipologiju metoda prepoznavanja uzoraka. Neki autori razlikuju parametarske, neparametarske i heurističke metode, dok drugi izdvajaju skupine metoda temeljenih na povijesnim školama i trendovima u tom području. Primjerice, u radu, koji daje akademski pregled metoda prepoznavanja, korištena je sljedeća tipologija metoda prepoznavanja uzoraka:

  • metode temeljene na principu razdvajanja;
  • statističke metode;
  • metode izgrađene na temelju "potencijalnih funkcija";
  • metode za izračun ocjena (glasovanje);
  • metode temeljene na propozicionom računu, posebice na aparatu algebre logike.

Ova se klasifikacija temelji na razlici u formalnim metodama prepoznavanja uzoraka, pa je stoga izostavljeno razmatranje heurističkog pristupa prepoznavanju, koji je dobio pun i adekvatan razvoj u ekspertnim sustavima. Heuristički pristup temelji se na teško formaliziravom znanju i intuiciji istraživača. Istodobno, istraživač sam određuje koje informacije i kako sustav treba koristiti za postizanje željenog učinka prepoznavanja.

Slična tipologija metoda prepoznavanja s različitim stupnjevima detalja nalazi se u mnogim djelima o prepoznavanju. Pritom, poznate tipologije ne uzimaju u obzir jednu vrlo značajnu karakteristiku koja odražava specifičnosti načina na koji se znanje o predmetnom području predstavlja bilo kojim formalnim algoritmom za prepoznavanje uzoraka.

D.A. Pospelov (1990) identificira dva glavna načina predstavljanja znanja:

  • intenzivna, u obliku sheme veza između atributa (obilježja).
  • ekstenzijski, uz pomoć konkretnih činjenica (objekata, primjera).

Intenzivna reprezentacija bilježi obrasce i odnose koji objašnjavaju strukturu podataka. Što se tiče dijagnostičkih zadataka, takva se fiksacija sastoji u određivanju operacija nad atributima (značajkama) objekata koji dovode do traženog dijagnostičkog rezultata. Intenzionalni prikazi se provode kroz operacije nad vrijednostima atributa i ne podrazumijevaju operacije nad određenim informacijskim činjenicama (objektima).

Zauzvrat, ekstenzijske reprezentacije znanja povezane su s opisom i fiksiranjem specifičnih objekata iz predmetnog područja i implementiraju se u operacije čiji su elementi objekti kao integralni sustavi.

Moguće je povući analogiju između intenzivne i ekstenzijske reprezentacije znanja i mehanizama koji su u osnovi aktivnosti lijeve i desne hemisfere ljudskog mozga. Ako desnu hemisferu karakterizira holistički prototipski prikaz okolnog svijeta, tada lijeva hemisfera djeluje obrascima koji odražavaju veze atributa ovoga svijeta.

Gore opisana dva temeljna načina predstavljanja znanja omogućuju nam da predložimo sljedeću klasifikaciju metoda prepoznavanja uzoraka:

  • intenzivne metode temeljene na operacijama s atributima.
  • ekstenzijske metode temeljene na operacijama s objektima.

Potrebno je naglasiti da je postojanje ove dvije (i samo dvije) skupine metoda prepoznavanja: onih koje operiraju obilježjima i onih koje operiraju s objektima, duboko prirodno. S ove točke gledišta, niti jedna od ovih metoda, uzeta odvojeno od druge, ne omogućuje formiranje adekvatne refleksije predmetnog područja. Prema autorima, između ovih metoda postoji odnos komplementarnosti u smislu N. Bohra, stoga bi obećavajući sustavi prepoznavanja trebali osigurati implementaciju obje ove metode, a ne bilo koje od njih.

Dakle, klasifikacija metoda prepoznavanja koju je predložio D. A. Pospelov temelji se na temeljnim zakonima na kojima se temelji ljudski način spoznaje općenito, što ga stavlja u vrlo poseban (privilegirani) položaj u odnosu na druge klasifikacije, koje na toj pozadini izgledaju lakši i umjetni.

Intenzivne metode

Posebnost intenzivnih metoda je da koriste različite karakteristike značajki i njihovih odnosa kao elemente operacija u konstrukciji i primjeni algoritama za prepoznavanje uzoraka. Takvi elementi mogu biti pojedinačne vrijednosti ili intervali vrijednosti značajki, prosječne vrijednosti i varijance, matrice odnosa značajki itd., na kojima se izvode radnje, izražene u analitičkom ili konstruktivnom obliku. Pritom se objekti u ovim metodama ne smatraju integralnim informacijskim jedinicama, već djeluju kao indikatori za procjenu interakcije i ponašanja njihovih atributa.

Skupina intenzivnih metoda prepoznavanja uzoraka je opsežna, a njezina je podjela na podklase donekle proizvoljna.

Metode temeljene na procjenama gustoće distribucije vrijednosti obilježja

Ove metode prepoznavanja uzoraka posuđene su iz klasične teorije statističkih odluka, u kojoj se predmeti proučavanja smatraju realizacijama višedimenzionalne slučajne varijable raspoređene u prostoru značajki prema nekom zakonu. Temelje se na Bayesovskoj shemi odlučivanja, koja se poziva na apriorne vjerojatnosti objekata koji pripadaju jednoj ili drugoj prepoznatljivoj klasi i uvjetne gustoće distribucije vrijednosti vektora obilježja. Te se metode svode na određivanje omjera vjerojatnosti u različitim područjima višedimenzionalnog prostora značajki.

Skupina metoda temeljenih na procjeni gustoće distribucije vrijednosti obilježja izravno je povezana s metodama diskriminantne analize. Bayesov pristup odlučivanju jedna je od najrazvijenijih u modernoj statistici, tzv. parametarskih metoda, za koje se analitički izraz zakona distribucije (u ovom slučaju normalnog zakona) smatra poznatim i samo malim potrebno je procijeniti broj parametara (srednji vektori i matrice kovarijance).

Glavne poteškoće u primjeni ovih metoda su potreba za pamćenjem cijelog uzorka za obuku kako bi se izračunale procjene lokalne gustoće distribucije vjerojatnosti i visoka osjetljivost na nereprezentativnost uzorka za obuku.

Metode temeljene na pretpostavkama o klasi funkcija odlučivanja

U ovoj skupini metoda opći oblik funkcije odlučivanja smatra se poznatim i daje se njezin funkcionalni kvalitet. Na temelju ove funkcionalnosti, najbolja aproksimacija funkcije odlučivanja nalazi se iz slijeda treninga. Najčešći su prikazi funkcija odlučivanja u obliku linearnih i generaliziranih nelinearnih polinoma. Funkcionalnost kvalitete pravila odlučivanja obično je povezana s greškom klasifikacije.

Glavna prednost metoda temeljenih na pretpostavkama o klasi funkcija odlučivanja je jasnoća matematičke formulacije problema prepoznavanja kao problema pronalaženja ekstrema. Raznolikost metoda ove skupine objašnjava se širokim rasponom korištenih funkcija kvalitete pravila odlučivanja i algoritama pretraživanja ekstrema. Generalizacija razmatranih algoritama, koji uključuju, posebice, Newtonov algoritam, algoritme tipa perceptron, itd., je metoda stohastičke aproksimacije.

Mogućnosti gradijentnih algoritama za pronalaženje ekstrema, posebno u skupini pravila linearnog odlučivanja, prilično su dobro proučene. Konvergencija ovih algoritama dokazana je samo za slučaj kada su prepoznatljive klase objekata prikazane u prostoru značajki kompaktnim geometrijskim strukturama.

Dovoljno visoka kvaliteta pravila odlučivanja može se postići korištenjem algoritama koji nemaju rigorozan matematički dokaz konvergencije rješenja globalnom ekstremumu. Takvi algoritmi uključuju veliku skupinu postupaka heurističkog programiranja koji predstavljaju smjer evolucijskog modeliranja. Evolucijsko modeliranje je bionička metoda posuđena iz prirode. Temelji se na korištenju poznatih mehanizama evolucije kako bi se proces smislenog modeliranja složenog objekta zamijenio fenomenološkim modeliranjem njegove evolucije. Poznati predstavnik evolucijskog modeliranja u prepoznavanju uzoraka je metoda grupnog obračuna argumenata (MGUA). GMDH se temelji na principu samoorganizacije, a GMDH algoritmi reproduciraju shemu masovne selekcije.

Međutim, postizanje praktičnih ciljeva u ovom slučaju nije popraćeno izvlačenjem novih znanja o prirodi prepoznatljivih predmeta. Mogućnost izdvajanja tog znanja, posebice znanja o mehanizmima interakcije atributa (obilježja), ovdje je u osnovi ograničena zadanom strukturom takve interakcije, fiksiranom u odabranom obliku odlučujućih funkcija.

Booleove metode

Logičke metode prepoznavanja uzoraka temelje se na aparatu logičke algebre i omogućuju rad s informacijama sadržanim ne samo u pojedinačnim značajkama, već iu kombinacijama vrijednosti značajki. U ovim metodama vrijednosti bilo kojeg atributa smatraju se elementarnim događajima.

U najopćenitijem obliku, logičke metode mogu se okarakterizirati kao svojevrsno traženje logičkih obrazaca u uzorku obuke i formiranje određenog sustava pravila logičke odluke (na primjer, u obliku konjukcija elementarnih događaja), svaki od koji ima svoju težinu. Skupina logičkih metoda je raznolika i uključuje metode različite složenosti i dubine analize. Za dihotomne (booleove) značajke popularni su takozvani klasifikatori nalik stablu, metoda ispitivanja slijepe ulice, Barkov algoritam itd.

Kora algoritam, kao i druge logičke metode prepoznavanja uzoraka, prilično je naporan u smislu izračunavanja, budući da je pri odabiru veznika potrebno potpuno nabrajanje. Stoga se pri primjeni logičkih metoda postavljaju visoki zahtjevi na učinkovitu organizaciju računskog procesa, a te metode dobro funkcioniraju s relativno malim dimenzijama prostora značajki i samo na moćnim računalima.

Jezične (strukturalne) metode

Lingvističke metode prepoznavanja uzoraka temelje se na korištenju posebnih gramatika koje generiraju jezike koji se mogu koristiti za opisivanje skupa svojstava prepoznatljivih objekata.

Za različite klase objekata razlikuju se nederivativni (atomski) elementi (podslike, znakovi) i mogući odnosi među njima. Gramatika se odnosi na pravila za konstruiranje objekata od ovih neizvedenih elemenata.

Dakle, svaki je objekt skup nederivativnih elemenata, međusobno "povezanih" na ovaj ili onaj način, ili, drugim riječima, "rečenicom" nekog "jezika". Želio bih naglasiti vrlo značajnu ideološku vrijednost ove misli.

Raščlanjivanjem (raščlanjivanjem) "rečenice", utvrđuje se njezina sintaktička "ispravnost" ili, ekvivalentno, može li neka fiksna gramatika koja opisuje klasu generirati postojeći opis objekta.

Međutim, zadatak obnavljanja (definiranja) gramatika iz određenog skupa iskaza (rečenica – opisa objekata) koji generiraju dati jezik teško je formalizirati.

Ekstenzivne metode

U metodama ove skupine, za razliku od intenzivnog smjera, svakom proučavanom objektu u većoj ili manjoj mjeri daje se neovisna dijagnostička vrijednost. U svojoj osnovi, ove metode su bliske kliničkom pristupu, koji ljude ne promatra kao lanac objekata rangiranih prema jednom ili drugom pokazatelju, već kao integralne sustave, od kojih je svaki individualan i ima posebnu dijagnostičku vrijednost. Takav pažljiv odnos prema predmetima proučavanja ne dopušta isključiti ili izgubiti informacije o svakom pojedinom objektu, što se događa kada se primjenjuju metode intenzivnog usmjeravanja, koristeći objekte samo za otkrivanje i fiksiranje obrazaca ponašanja njihovih atributa.

Glavne operacije u prepoznavanju uzoraka pomoću razmatranih metoda su operacije utvrđivanja sličnosti i razlike objekata. Objekti u navedenoj skupini metoda imaju ulogu dijagnostičkih presedana. Pritom, ovisno o uvjetima pojedinog zadatka, uloga pojedinog presedana može varirati u najširim granicama: od glavnog i definirajućeg do vrlo neizravnog sudjelovanja u procesu priznavanja. Zauzvrat, uvjeti problema mogu zahtijevati sudjelovanje različitog broja dijagnostičkih presedana za uspješno rješenje: od jednog u svakoj prepoznatljivoj klasi do cjelokupne veličine uzorka, kao i različite načine izračunavanja mjera sličnosti i razlike predmeta. Ovi zahtjevi objašnjavaju daljnju podjelu ekstenzijskih metoda u podklase.

Metoda usporedbe prototipa

Ovo je najjednostavniji način ekstenzijskog prepoznavanja. Koristi se, na primjer, u slučaju kada su prepoznate klase prikazane u prostoru značajki kompaktnim geometrijskim grupiranjima. U ovom slučaju, središte geometrijskog grupiranja klase (ili objekt najbliži središtu) obično se bira kao točka prototipa.

Za klasifikaciju nepoznatog objekta pronalazi se prototip koji mu je najbliži, a objekt pripada istoj klasi kao i ovaj prototip. Očito se ovom metodom ne formiraju generalizirane slike klasa.

Različite vrste udaljenosti mogu se koristiti kao mjera blizine. Često se za dihotomne značajke koristi Hammingova udaljenost, koja je u ovom slučaju jednaka kvadratu euklidske udaljenosti. U ovom slučaju, pravilo odlučivanja za razvrstavanje objekata je ekvivalentno linearnoj funkciji odlučivanja.

Ovu činjenicu treba posebno istaknuti. Jasno pokazuje vezu između prototipa i indikativnog prikaza informacija o strukturi podataka. Koristeći gornji prikaz, na primjer, bilo koja tradicionalna mjerna skala, koja je linearna funkcija vrijednosti dihotomnih značajki, može se smatrati hipotetičkim dijagnostičkim prototipom. Zauzvrat, ako nam analiza prostorne strukture prepoznatih klasa dopušta da zaključimo da su one geometrijski kompaktne, tada je dovoljno svaku od tih klasa zamijeniti jednim prototipom, koji je zapravo ekvivalentan linearnom dijagnostičkom modelu.

U praksi se, naravno, situacija često razlikuje od opisanog idealiziranog primjera. Istraživač koji namjerava primijeniti metodu prepoznavanja temeljenu na usporedbi s prototipovima dijagnostičkih klasa suočava se s teškim problemima.

Prvo, to je izbor mjere blizine (metrike), koja može značajno promijeniti prostornu konfiguraciju distribucije objekata. Drugo, neovisni problem je analiza višedimenzionalnih struktura eksperimentalnih podataka. Oba ova problema posebno su akutna za istraživača u uvjetima velike dimenzije prostora obilježja, što je tipično za stvarne probleme.

k metoda najbližeg susjeda

Metoda k najbližih susjeda za rješavanje problema diskriminantne analize prvi je put predložena davne 1952. godine. To je kako slijedi.

Prilikom razvrstavanja nepoznatog objekta pronalazi se zadani broj (k) drugih objekata koji su mu geometrijski najbliži u prostoru značajki (najbliži susjedi) za koje je već poznato da pripadaju prepoznatljivim klasama. Odluka da se nepoznati objekt dodijeli određenoj dijagnostičkoj klasi donosi se analizom informacija o tom poznatom članstvu njegovih najbližih susjeda, na primjer, korištenjem jednostavnog brojanja glasova.

U početku se metoda k najbližih susjeda smatrala neparametričnom metodom za procjenu omjera vjerojatnosti. Za ovu metodu dobivene su teorijske procjene njezine učinkovitosti u usporedbi s optimalnim Bayesovim klasifikatorom. Dokazano je da vjerojatnosti asimptotske pogreške za metodu k najbližeg susjeda ne premašuju pogreške Bayesovog pravila najviše dva puta.

Pri korištenju metode k najbližih susjeda za prepoznavanje uzoraka, istraživač mora riješiti težak problem odabira metrike za određivanje blizine dijagnosticiranih objekata. Ovaj problem u uvjetima velike dimenzije prostora značajki izrazito je otežan zbog dovoljno zahtjevnosti ove metode, što postaje značajno čak i za računala visokih performansi. Stoga je i ovdje, kao i u metodi usporedbe prototipa, potrebno riješiti kreativni problem analize višedimenzionalne strukture eksperimentalnih podataka kako bi se minimizirao broj objekata koji predstavljaju dijagnostičke klase.

Potreba za smanjenjem broja objekata u uzorku za obuku (dijagnostički presedani) je nedostatak ove metode, jer smanjuje reprezentativnost uzorka za obuku.

Algoritmi za izračun ocjena ("glasovanje")

Princip rada evaluacijskih algoritama (ABO) je izračunavanje prioriteta (bodova sličnosti) koji karakteriziraju "blizinu" prepoznatih i referentnih objekata prema sustavu ansambala značajki, koji je sustav podskupova danog skupa značajki. .

Za razliku od svih prethodno razmatranih metoda, algoritmi za izračun procjena rade s opisima objekata na temeljno nov način. Za ove algoritme, objekti postoje istovremeno u vrlo različitim podprostorima prostora značajki. Klasa ABO dovodi ideju korištenja obilježja do svog logičnog zaključka: budući da nije uvijek poznato koje su kombinacije obilježja najinformativnije, u ABO se stupanj sličnosti objekata izračunava uspoređivanjem svih mogućih ili određenih kombinacija obilježja. uključeni u opise objekata.

Korištene kombinacije atributa (podprostora) nazivaju se skupovima podrške ili skupovima djelomičnih opisa objekata. Uvodi se koncept generalizirane blizine između prepoznatog objekta i objekata uzorka za obuku (s poznatom klasifikacijom), koji se nazivaju referentnim objektima. Ta je blizina predstavljena kombinacijom blizine prepoznatog objekta s referentnim objektima izračunatim na skupovima djelomičnih opisa. Dakle, ABO je proširenje metode k najbližih susjeda, u kojoj se blizina objekata razmatra samo u jednom zadanom prostoru značajki.

Još jedno proširenje ABO-a je da se u ovim algoritmima problem određivanja sličnosti i razlike objekata formulira kao parametarski i odabire se faza postavljanja ABO-a prema uzorku za obuku, na kojoj su optimalne vrijednosti odabrani su uneseni parametri. Kriterij kvalitete je greška prepoznavanja, a doslovno je sve parametrizirano:

  • pravila za izračunavanje blizine objekata po pojedinim značajkama;
  • pravila za izračunavanje blizine objekata u podprostorima značajki;
  • stupanj važnosti određenog referentnog objekta kao dijagnostičkog presedana;
  • značaj doprinosa svakog referentnog skupa značajki konačnoj ocjeni sličnosti prepoznatog objekta s bilo kojom dijagnostičkom klasom.

Parametri hladnjaka zraka postavljaju se u obliku graničnih vrijednosti i (ili) kao težine navedenih komponenti.

Teorijske mogućnosti ABO-a barem nisu niže od bilo kojeg drugog algoritma za prepoznavanje uzoraka, budući da se uz pomoć ABO-a mogu implementirati sve zamislive operacije s objektima koji se proučavaju.

No, kako to obično biva, proširenje potencijala nailazi na velike poteškoće u njihovoj praktičnoj implementaciji, posebice u fazi konstruiranja (ugađanja) algoritama ovog tipa.

Odvojene poteškoće uočene su ranije kada se raspravljalo o metodi k najbližih susjeda, koja bi se mogla tumačiti kao skraćena verzija ABO. Također se može razmotriti u parametarskom obliku i svesti problem na pronalaženje ponderirane metrike odabrane vrste. Istodobno, već ovdje za visokodimenzionalne probleme postavljaju se složena teorijska pitanja i problemi povezani s organizacijom učinkovitog računskog procesa.

Za ABO, ako pokušate iskoristiti mogućnosti ovih algoritama u potpunosti, te se poteškoće višestruko povećavaju.

Navedeni problemi objašnjavaju činjenicu da je u praksi korištenje ABO-a za rješavanje visokodimenzionalnih problema popraćeno uvođenjem bilo kakvih heurističkih ograničenja i pretpostavki. Konkretno, postoji primjer korištenja ABO-a u psihodijagnostici, u kojem je testiran tip ABO-a, koji je zapravo ekvivalent metodi k najbližih susjeda.

Odlučujuća pravila kolektiva

Na kraju pregleda metoda prepoznavanja uzoraka, zadržimo se na još jednom pristupu. To su takozvani timovi pravila odlučivanja (CRC).

Budući da se različiti algoritmi za prepoznavanje ponašaju različito na istom uzorku objekata, prirodno se postavlja pitanje sintetičkog pravila odlučivanja koje adaptivno koristi prednosti ovih algoritama. Pravilo sintetičkog odlučivanja koristi dvorazinsku shemu prepoznavanja. Na prvoj razini rade privatni algoritmi prepoznavanja čiji se rezultati kombiniraju na drugoj razini u bloku sinteze. Najčešće metode takve kombinacije temelje se na dodjeli područja nadležnosti određenog algoritma. Najjednostavniji način pronalaženja područja kompetencije je a priori dijeljenje prostora atributa na temelju stručnih razmatranja određene znanosti (na primjer, stratifikacija uzorka prema nekom atributu). Zatim se za svako od odabranih područja izrađuje vlastiti algoritam prepoznavanja. Druga metoda temelji se na korištenju formalne analize za određivanje lokalnih područja prostora značajki kao susjedstva prepoznatljivih objekata za koje je dokazana uspješnost bilo kojeg određenog algoritma prepoznavanja.

Najopćenitiji pristup konstrukciji bloka sinteze razmatra rezultirajuće pokazatelje parcijalnih algoritama kao početne značajke za konstruiranje novog generaliziranog pravila odlučivanja. U ovom slučaju mogu se koristiti sve navedene metode intenzionalnih i ekstenzijskih smjerova u prepoznavanju uzoraka. Učinkoviti za rješavanje problema stvaranja skupa pravila odlučivanja su logički algoritmi tipa "Kora" i algoritmi za izračunavanje procjena (ABO), koji čine osnovu tzv. algebarskog pristupa, koji omogućuje istraživanje i konstruktivan opis algoritmi za prepoznavanje, unutar kojih se uklapaju svi postojeći tipovi algoritama.

Komparativna analiza metoda prepoznavanja uzoraka

Usporedimo gore opisane metode prepoznavanja uzoraka i procijenimo stupanj njihove adekvatnosti zahtjevima formuliranim u odjeljku 3.3.3 za SDA modele za prilagodljive automatizirane upravljačke sustave za složene sustave.

Za rješavanje stvarnih problema iz skupine metoda intenzivnog smjera praktičnu vrijednost imaju parametarske metode i metode temeljene na prijedlozima o obliku odlučujućih funkcija. Parametarske metode čine osnovu tradicionalne metodologije za konstruiranje pokazatelja. Primjena ovih metoda u stvarnim problemima povezana je s nametanjem jakih ograničenja na strukturu podataka, što dovodi do linearnih dijagnostičkih modela s vrlo približnim procjenama njihovih parametara. Pri korištenju metoda temeljenih na pretpostavkama o obliku funkcija odlučivanja, istraživač je također prisiljen okrenuti se linearnim modelima. To je zbog velike dimenzije prostora značajki, što je tipično za stvarne probleme, koji s povećanjem stupnja funkcije polinoma odlučivanja daje ogroman porast broja svojih članova uz problematično popratno povećanje kvaliteta prepoznavanja. Tako, projicirajući područje potencijalne primjene metoda intenzivnog prepoznavanja na stvarne probleme, dobivamo sliku koja odgovara dobro uhodanoj tradicionalnoj metodologiji linearnih dijagnostičkih modela.

Svojstva linearnih dijagnostičkih modela, u kojima je dijagnostički pokazatelj predstavljen ponderiranim zbrojem početnih značajki, dobro su proučena. Rezultati ovih modela (uz odgovarajuću normalizaciju) tumače se kao udaljenosti od proučavanih objekata do neke hiperravnine u prostoru značajki ili, što je ekvivalentno, kao projekcije objekata na neku ravnu crtu u danom prostoru. Stoga su linearni modeli prikladni samo za jednostavne geometrijske konfiguracije područja prostora značajki u koje se mapiraju objekti različitih dijagnostičkih klasa. Uz složenije distribucije, ovi modeli u osnovi ne mogu odražavati mnoge značajke eksperimentalne strukture podataka. Istodobno, takve značajke mogu pružiti vrijedne dijagnostičke informacije.

Istodobno, pojavu u bilo kojem stvarnom problemu jednostavnih višedimenzionalnih struktura (posebno višedimenzionalnih normalnih distribucija) treba smatrati iznimkom, a ne pravilom. Često se dijagnostičke klase formiraju na temelju složenih vanjskih kriterija, što automatski povlači geometrijsku heterogenost ovih klasa u prostoru značajki. To se posebno odnosi na kriterije “života” koji se najčešće susreću u praksi. U takvim uvjetima, korištenje linearnih modela hvata samo najgrublje uzorke eksperimentalnih informacija.

Korištenje ekstenzijskih metoda nije povezano ni s kakvim pretpostavkama o strukturi eksperimentalnih informacija, osim što unutar prepoznatih klasa mora postojati jedna ili više grupa objekata koji su donekle slični, a objekti različitih klasa moraju se međusobno razlikovati po nekima. put. Očito je da je za bilo koju konačnu dimenziju uzorka za obuku (a ne može biti različit) ovaj zahtjev uvijek zadovoljen jednostavno zato što postoje slučajne razlike između objekata. Kao mjere sličnosti koriste se različite mjere blizine (udaljenosti) objekata u prostoru obilježja. Stoga učinkovita uporaba ekstenzijskih metoda prepoznavanja uzoraka ovisi o tome koliko su dobro definirane te mjere blizine, kao i o tome koji objekti uzorka za obuku (objekti s poznatom klasifikacijom) igraju ulogu dijagnostičkih presedana. Uspješno rješavanje ovih problema daje rezultat koji se približava teorijski dostižnim granicama učinkovitosti prepoznavanja.

Prednosti ekstenzijskih metoda prepoznavanja uzoraka suprotstavlja se, prije svega, visoka tehnička složenost njihove praktične provedbe. Za prostore s visokodimenzionalnim značajkama, naizgled jednostavan zadatak pronalaženja parova najbližih točaka pretvara se u ozbiljan problem. Također, mnogi autori kao problem navode potrebu za pamćenjem dovoljno velikog broja objekata koji predstavljaju prepoznatljive klase.

Samo po sebi to nije problem, ali se percipira kao problem (npr. u metodi k najbližih susjeda) iz razloga što pri prepoznavanju svakog objekta dolazi do potpunog nabrajanja svih objekata u uzorku za obuku.

Stoga je preporučljivo primijeniti model sustava prepoznavanja, u kojem se otklanja problem cjelovitog nabrajanja objekata uzorka za obuku tijekom prepoznavanja, budući da se ono provodi samo jednom prilikom formiranja generaliziranih slika klasa prepoznavanja. U samom prepoznavanju, identificirani objekt uspoređuje se samo s generaliziranim slikama klasa prepoznavanja, čiji je broj fiksan i uopće ne ovisi o dimenziji uzorka za obuku. Ovaj pristup vam omogućuje povećanje dimenzije uzorka za obuku sve dok se ne postigne potrebna visoka kvaliteta generaliziranih slika, bez straha da bi to moglo dovesti do neprihvatljivog povećanja vremena prepoznavanja (budući da vrijeme prepoznavanja u ovom modelu ne ovisi o dimenzija treninga uopće).uzorci).

Teorijski problemi primjene ekstenzijskih metoda prepoznavanja vezani su uz probleme traženja informativnih skupina obilježja, pronalaženja optimalnih metrika za mjerenje sličnosti i razlike objekata, te analiziranja strukture eksperimentalnih informacija. Istodobno, uspješno rješenje ovih problema omogućuje ne samo dizajniranje učinkovitih algoritama za prepoznavanje, već i prijelaz s ekstenzivnog znanja o empirijskim činjenicama na intenzivno znanje o obrascima njihove strukture.

Prijelaz s ekstenzivnog znanja na intenzivno znanje događa se u fazi kada je formalni algoritam prepoznavanja već izgrađen i kada je dokazana njegova učinkovitost. Zatim se provodi proučavanje mehanizama kojima se postiže dobivena učinkovitost. Takvo istraživanje, povezano s analizom geometrijske strukture podataka, može, primjerice, dovesti do zaključka da je dovoljno objekte koji predstavljaju određenu dijagnostičku klasu zamijeniti jednim tipičnim predstavnikom (prototipom). Ovo je ekvivalentno, kao što je gore navedeno, postavljanju tradicionalne linearne dijagnostičke skale. Također je moguće da je dovoljno svaku dijagnostičku klasu zamijeniti s nekoliko objekata koji su smisleni kao tipični predstavnici nekih potklasa, što je ekvivalentno konstruiranju lepeze linearnih ljestvica. Postoje i druge opcije, o kojima će biti riječi u nastavku.

Dakle, pregled metoda prepoznavanja pokazuje da je u današnje vrijeme teorijski razvijen niz različitih metoda prepoznavanja uzoraka. Literatura daje njihovu detaljnu klasifikaciju. Međutim, za većinu ovih metoda izostaje njihova softverska implementacija, što je duboko prirodno, čak bi se moglo reći i "predodređeno" karakteristikama samih metoda prepoznavanja. O tome se može suditi po tome što se takvi sustavi malo spominju u stručnoj literaturi i drugim izvorima informacija.

Posljedično, pitanje praktične primjenjivosti pojedinih teorijskih metoda prepoznavanja za rješavanje praktičnih problema sa stvarnim (tj. prilično značajnim) dimenzijama podataka i na stvarnim modernim računalima ostaje nedovoljno razvijeno.

Navedenu okolnost možemo razumjeti ako se prisjetimo da složenost matematičkog modela eksponencijalno povećava složenost softverske implementacije sustava i u istoj mjeri smanjuje šanse da će ovaj sustav funkcionirati u praksi. To znači da se na tržištu mogu implementirati samo softverski sustavi koji se temelje na prilično jednostavnim i “transparentnim” matematičkim modelima. Stoga programer koji je zainteresiran za repliciranje svog softverskog proizvoda pristupa pitanju odabira matematičkog modela ne s čisto znanstvenog stajališta, već kao pragmatičar, uzimajući u obzir mogućnosti implementacije softvera. Smatra da bi model trebao biti što jednostavniji, što znači da bi se trebao provoditi po nižoj cijeni i kvalitetnije, a trebao bi i funkcionirati (biti praktički učinkovit).

S tim u vezi, zadatak implementacije u sustave prepoznavanja mehanizma za generaliziranje opisa objekata koji pripadaju istoj klasi, t.j. mehanizam za formiranje kompaktnih generaliziranih slika. Očito je da će takav mehanizam generalizacije omogućiti "komprimiranje" bilo kojeg uzorka za obuku u smislu dimenzije na bazu generaliziranih slika koje su unaprijed poznate u smislu dimenzije. To će nam također omogućiti da postavimo i riješimo niz problema koji se ne mogu ni formulirati u takvim metodama prepoznavanja kao što su usporedba s metodom prototipa, metodom k najbližih susjeda i ABO.

Ovo su zadaci:

  • utvrđivanje informacijskog doprinosa značajki informacijskom portretu generalizirane slike;
  • klaster-konstruktivna analiza generaliziranih slika;
  • određivanje semantičkog opterećenja obilježja;
  • semantička klaster-konstruktivna analiza obilježja;
  • smislena usporedba generaliziranih slika klasa međusobno i međusobnog obilježja (kognitivni dijagrami, uključujući Merlinove dijagrame).

Metoda koja je omogućila rješavanje ovih problema također razlikuje perspektivni sustav koji se temelji na njemu od drugih sustava, kao što se prevoditelji razlikuju od interpretatora, budući da je zbog formiranja generaliziranih slika u ovom perspektivnom sustavu vrijeme prepoznavanja neovisno o veličina uzorka za obuku. Poznato je da upravo postojanje ove ovisnosti dovodi do praktički neprihvatljivog utroška računalnog vremena za prepoznavanje u metodama kao što su metoda k najbližih susjeda, ABO i CRP na takvim dimenzijama uzorka za obuku, kada se može govoriti o dovoljnoj statistika.

Kao zaključak kratkog pregleda metoda prepoznavanja, predstavljamo bit navedenog u sažetoj tablici (Tablica 3.1), koja sadrži kratak opis različitih metoda prepoznavanja uzoraka u sljedećim parametrima:

  • klasifikacija metoda prepoznavanja;
  • područja primjene metoda prepoznavanja;
  • klasifikacija ograničenja metoda prepoznavanja.
Klasifikacija metoda prepoznavanja Područje primjene Ograničenja (nedostaci)
Intenzivne metode prepoznavanja Metode temeljene na procjenama gustoće distribucije vrijednosti značajki (ili sličnosti i razlika između objekata) Problemi s poznatom distribucijom, obično normalni, potreba za prikupljanjem velike statistike Potreba za nabrajanjem cijelog skupa za obuku tijekom prepoznavanja, visoka osjetljivost na nereprezentativnost skupa za obuku i artefakata
Metode temeljene na pretpostavkama o klasi funkcija odlučivanja Klase bi trebale biti dobro odvojive, sustav značajki trebao bi biti ortonormalan Oblik funkcije odlučivanja mora biti poznat unaprijed. Nemogućnost uzimanja u obzir novih spoznaja o korelacijama između značajki
Booleove metode Prilikom odabira pravila logičnog odlučivanja (veznika) potrebno je kompletno nabrajanje. Visoka računska složenost
Jezične (strukturalne) metode Problemi male dimenzije prostornog prostora Zadatak vraćanja (definiranja) gramatike iz određenog skupa iskaza (opisa objekata) teško je formalizirati. Neriješeni teorijski problemi
Ekstenzivne metode prepoznavanja Metoda usporedbe prototipa Problemi male dimenzije prostornog prostora Velika ovisnost rezultata klasifikacije o mjerama udaljenosti (metrika). Nepoznata optimalna metrika
k metoda najbližeg susjeda Velika ovisnost rezultata klasifikacije o mjerama udaljenosti (metrika). Potreba za potpunim nabrajanjem uzorka za obuku tijekom prepoznavanja. Računalna složenost
Algoritmi za izračun bodova (glasovanje) AVO Problemi male dimenzije u smislu broja klasa i značajki Ovisnost rezultata klasifikacije o mjeri udaljenosti (metrika). Potreba za potpunim nabrajanjem uzorka za obuku tijekom prepoznavanja. Visoka tehnička složenost metode
Kolektivi odlučujućih pravila (CRC) Problemi male dimenzije u smislu broja klasa i značajki Vrlo visoka tehnička složenost metode, neriješen broj teorijskih problema, kako u određivanju područja nadležnosti pojedinih metoda, tako i u samim pojedinim metodama

Tablica 3.1 - Zbirna tablica klasifikacije metoda prepoznavanja, usporedba područja njihove primjene i ograničenja

Uloga i mjesto prepoznavanja uzoraka u automatizaciji upravljanja složenim sustavima

Sustav automatiziranog upravljanja sastoji se od dva glavna dijela: upravljačkog objekta i upravljačkog sustava.

Upravljački sustav obavlja sljedeće funkcije:

  • identifikacija stanja kontrolnog objekta;
  • razvoj kontrolnog djelovanja na temelju ciljeva upravljanja, uzimajući u obzir stanje kontrolnog objekta i okoline;
  • pružanje kontrolnog učinka na objekt upravljanja.

Prepoznavanje uzoraka nije ništa drugo nego identifikacija stanja nekog objekta.

Stoga se mogućnost korištenja sustava za prepoznavanje uzoraka u fazi identifikacije stanja kontrolnog objekta čini sasvim očitom i prirodnom. Međutim, to možda neće biti potrebno. Stoga se postavlja pitanje u kojim slučajevima je preporučljivo koristiti sustav prepoznavanja u automatiziranom sustavu upravljanja, a u kojim nije.

Prema literaturnim podacima, u mnogim prethodno razvijenim i modernim automatiziranim sustavima upravljanja u podsustavima za identifikaciju stanja kontrolnog objekta i generiranje upravljačkih radnji koriste se deterministički matematički modeli „izravnog brojanja“ koji nedvosmisleno i jednostavno određuju što treba učiniti s kontrolnim objektom ako ima određene vanjske parametre.

Pritom se ne postavlja niti rješava pitanje kako su ti parametri povezani s određenim stanjima kontrolnog objekta. Ova pozicija odgovara stajalištu, koje se sastoji u činjenici da je njihov odnos jedan-na-jedan prihvaćen "po defaultu". Stoga se pojmovi: "parametri kontrolnog objekta" i "stanje kontrolnog objekta" smatraju sinonimima, a pojam "stanje kontrolnog objekta" uopće nije eksplicitno uveden. Međutim, očito je da je u općem slučaju odnos između promatranih parametara kontrolnog objekta i njegovog stanja dinamičan i vjerojatnost.

Dakle, tradicionalni automatizirani upravljački sustavi su u biti parametarski upravljački sustavi, t.j. sustavi koji ne upravljaju stanjima kontrolnog objekta, već samo njegovim vidljivim parametrima. Odluka o kontrolnoj radnji donosi se u takvim sustavima kao da je "na slijepo", tj. bez formiranja cjelovite slike kontrolnog objekta i okoline u njihovom trenutnom stanju, kao i bez predviđanja razvoja okoline i reakcije kontrolnog objekta na određene upravljačke radnje na njega, djelujući istovremeno s predviđenim utjecajem okoline. .

Iz pozicija razvijenih u ovom radu, pojam "donošenja odluka" u modernom smislu teško je primjenjiv na tradicionalne automatizirane sustave upravljanja. Činjenica je da "odlučivanje", barem, uključuje holističku viziju objekta u okruženju, i to ne samo u njegovom trenutnom stanju, već i u dinamici, te u međusobnoj interakciji i s upravljačkim sustavom, podrazumijeva razmatranje različitih alternativnih opcija za razvoj cjelokupnog sustava, kao i sužavanje raznolikosti (smanjenje) tih alternativa na temelju određenih ciljnih kriterija. Ništa od toga, očito, nije u tradicionalnom ACS-u, ili jest, već u pojednostavljenom obliku.

Naravno, tradicionalna metoda je adekvatna i njena primjena je sasvim ispravna i opravdana u slučajevima kada je objekt upravljanja doista stabilan i kruto određen sustav, a utjecaj okoline na njega se može zanemariti.

Međutim, u drugim slučajevima ova metoda je neučinkovita.

Ako je kontrolni objekt dinamičan, tada modeli koji su u osnovi njegovih algoritama upravljanja brzo postaju neadekvatni, kako se mijenja odnos između ulaznih i izlaznih parametara, kao i sam skup bitnih parametara. U biti, to znači da su tradicionalni automatizirani upravljački sustavi u stanju kontrolirati stanje kontrolnog objekta samo blizu ravnotežne točke pomoću slabih upravljačkih djelovanja na njega, t.j. metodom malih perturbacija. Daleko od stanja ravnoteže, s tradicionalnog stajališta, ponašanje kontrolnog objekta izgleda nepredvidivo i nekontrolirano.

Ako ne postoji nedvosmislen odnos između ulaznih i izlaznih parametara kontrolnog objekta (odnosno između ulaznih parametara i stanja objekta), drugim riječima, ako taj odnos ima izraženu vjerojatnost, tada deterministički modeli, u za koji se pretpostavlja da je rezultat mjerenja određenog parametra jednostavno broj, u početku nije primjenjiv. Osim toga, oblik ovog odnosa može jednostavno biti nepoznat i tada je potrebno poći od najopćenitije pretpostavke: da je vjerojatnost ili uopće nije definiran.

Automatizirani upravljački sustav izgrađen na tradicionalnim principima može raditi samo na temelju parametara čiji su obrasci odnosa već poznati, proučeni i reflektirani u matematičkom modelu, u ovoj studiji postavljen je zadatak razviti takve metode za projektiranje automatiziranog upravljanja. sustava koji će omogućiti stvaranje sustava koji mogu identificirati i postaviti najvažnije parametre, te odrediti prirodu veza između njih i stanja kontrolnog objekta.

U tom slučaju potrebno je primijeniti razvijenije i adekvatnije metode mjerenja stvarnoj situaciji:

  • klasifikacija ili prepoznavanje uzoraka (učenje na temelju uzorka za obuku, prilagodljivost algoritama za prepoznavanje, prilagodljivost skupova klasa i proučavanih parametara, odabir najznačajnijih parametara i smanjenje dimenzije opisa uz zadržavanje zadane redundancije itd.);
  • statistička mjerenja, kada rezultat mjerenja određenog parametra nije jedan broj, već distribucija vjerojatnosti: promjena statističke varijable ne znači promjenu njezine vrijednosti same po sebi, već promjenu karakteristika distribucije vjerojatnosti njegove vrijednosti.

Kao rezultat toga, automatizirani sustavi upravljanja temeljeni na tradicionalnom determinističkom pristupu praktički ne rade sa složenim dinamičkim višeparametarskim slabo određenim objektima upravljanja, kao što su, na primjer, makro- i mikro-društveno-ekonomski sustavi u dinamičnoj ekonomiji tranzicijsko razdoblje”, hijerarhijske elite i etničke skupine, društvo i biračko tijelo, fiziologija i psiha čovjeka, prirodni i umjetni ekosustavi i mnogi drugi.

Vrlo je značajno da je sredinom 80-ih škola I. Prigožina razvila pristup, prema kojem se u razvoju bilo kojeg sustava (uključujući osobu) izmjenjuju razdoblja tijekom kojih se sustav ponaša ili kao „uglavnom deterministički“, ili kao "uglavnom nasumično". Naravno, pravi upravljački sustav mora stabilno upravljati kontrolnim objektom ne samo u "determinističkim" dijelovima njegove povijesti, već iu točkama kada njegovo daljnje ponašanje postaje vrlo neizvjesno. Samo to znači da je potrebno razviti pristupe upravljanju sustavima u čijem ponašanju postoji veliki element slučajnosti (ili onoga što se trenutno matematički opisuje kao "slučajnost").

Stoga će sastav obećavajućih automatiziranih upravljačkih sustava koji osiguravaju upravljanje složenim dinamičkim višeparametarskim slabo determinističkim sustavima, kao bitnim funkcionalnim poveznicama, očito uključivati ​​podsustave za identifikaciju i predviđanje stanja okoline i upravljačkog objekta, temeljene na metodama umjetne inteligencije. (prvenstveno prepoznavanje uzoraka), metode potpore odlučivanju i teorija informacija.

Razmotrimo ukratko pitanje korištenja sustava za prepoznavanje slika za donošenje odluke o kontrolnoj radnji (o ovom pitanju ćemo detaljnije govoriti kasnije, jer je ono ključno za ovaj rad). Ako ciljna i druga stanja kontrolnog objekta uzmemo kao klase prepoznavanja, a čimbenike koji na njega utječu kao značajke, tada se u modelu prepoznavanja uzoraka može formirati mjera odnosa između čimbenika i stanja. To omogućuje dobivanje informacija o čimbenicima koji doprinose ili ometaju njegov prijelaz u ovo stanje, na temelju zadanog stanja kontrolnog objekta, te na temelju toga razvijati odluku o kontrolnom djelovanju.

Čimbenici se mogu podijeliti u sljedeće skupine:

  • karakteriziranje pretpovijesti kontrolnog objekta;
  • karakteriziranje trenutnog stanja kontrolnog objekta;
  • okolišni čimbenici;
  • tehnološki (upravljani) čimbenici.

Dakle, sustavi za prepoznavanje slika mogu se koristiti kao dio automatiziranog sustava upravljanja: u podsustavima za identifikaciju stanja kontrolnog objekta i generiranje upravljačkih radnji.

Ovo je korisno kada je kontrolni objekt složen sustav.

Donošenje odluke o kontrolnom djelovanju u automatiziranom sustavu upravljanja

Rješenje problema sinteze adaptivnih automatiziranih sustava upravljanja složenim sustavima razmatra se u ovom radu, uzimajući u obzir brojne i duboke analogije između metoda prepoznavanja uzoraka i donošenja odluka.

S jedne strane, zadatak prepoznavanja uzoraka je odluka o pripadnosti prepoznatljivog objekta određenoj klasi prepoznavanja.

S druge strane, autori predlažu da se problem odlučivanja smatra inverznim problemom dekodiranja ili inverznim problemom prepoznavanja uzoraka (vidi odjeljak 2.2.2).

Zajedničkost temeljnih ideja na kojima se temelje metode prepoznavanja uzoraka i odlučivanja postaje posebno očita kada se one razmatraju sa stajališta teorije informacija.

Raznolikost zadataka donošenja odluka

Donošenje odluka kao ostvarenje cilja

Definicija: donošenje odluke (“izbor”) je radnja na skupu alternativa, uslijed čega se izvorni skup alternativa sužava, t.j. smanjen je.

Izbor je radnja koja daje svrhovitost svakoj aktivnosti. Kroz radnje izbora ostvaruje se podređivanje svih aktivnosti određenom cilju ili skupu međusobno povezanih ciljeva.

Dakle, da bi čin izbora postao moguć, potrebno je sljedeće:

  • stvaranje ili otkrivanje skupa alternativa na kojima se može napraviti izbor;
  • utvrđivanje ciljeva za čije se postizanje bira;
  • razvoj i primjena metode za međusobnu usporedbu alternativa, t.j. određivanje ocjene preferencije za svaku alternativu prema određenim kriterijima, što omogućuje neizravnu procjenu kako svaka alternativa ispunjava cilj.

Suvremeni rad u području podrške odlučivanju otkrio je karakterističnu situaciju koja se sastoji u tome da je potpuna formalizacija pronalaženja najboljeg (u određenom smislu) rješenja moguća samo za dobro proučene, relativno jednostavne probleme, dok je u praksi Češći su slabo strukturirani problemi, za koje nisu razvijeni potpuno formalizirani algoritmi (osim iscrpnog nabrajanja i pokušaja i pogrešaka). Međutim, iskusni, kompetentni i sposobni stručnjaci često donose odluke koje se pokažu prilično dobrim. Stoga je aktualni trend u praksi odlučivanja u prirodnim situacijama kombinirati sposobnost osobe za rješavanje neformaliziranih problema sa mogućnostima formalnih metoda i računalnog modeliranja: interaktivni sustavi za podršku odlučivanju, ekspertni sustavi, adaptivni čovjek-stroj automatizirani. upravljački sustavi, neuronske mreže i kognitivni sustavi.

Donošenje odluka kao uklanjanje nesigurnosti (informacijski pristup)

Proces dobivanja informacija može se smatrati smanjenjem nesigurnosti kao rezultatom prijema signala, a količina informacija - kvantitativnom mjerom stupnja uklanjanja nesigurnosti.

Ali kao rezultat odabira nekog podskupa alternativa iz skupa, t.j. kao rezultat donošenja odluke događa se isto (smanjenje neizvjesnosti). To znači da svaki izbor, svaka odluka generira određenu količinu informacija, te se stoga može opisati u terminima teorije informacija.

Klasifikacija problema odlučivanja

Mnoštvo zadataka odlučivanja posljedica je činjenice da se svaka komponenta situacije u kojoj se donosi odluka može implementirati u kvalitativno različitim opcijama.

Evo samo nekoliko od ovih opcija:

  • skup alternativa, s jedne strane, može biti konačan, prebrojiv ili kontinuiran, a s druge strane može biti zatvoren (tj. potpuno poznat) ili otvoren (uključujući nepoznate elemente);
  • evaluacija alternativa može se provesti prema jednom ili više kriterija, koji zauzvrat mogu biti kvantitativni ili kvalitativni;
  • način izbora može biti jednokratni (jednokratni) ili višestruki, ponavljajući, uključujući povratnu informaciju o rezultatima izbora, t.j. omogućavanje učenja algoritama odlučivanja, uzimajući u obzir posljedice prethodnih izbora;
  • posljedice odabira svake alternative mogu biti točno poznate unaprijed (izbor pod izvjesnošću), imaju vjerojatnost kada su vjerojatnosti mogućih ishoda poznate nakon što je izbor napravljen (izbor pod rizikom) ili imaju dvosmislen ishod s nepoznatim vjerojatnostima (izbor pod neizvjesnošću);
  • odgovornost za izbor može izostati, biti individualna ili grupna;
  • stupanj konzistentnosti ciljeva u grupnom izboru može varirati od potpune podudarnosti interesa stranaka (kooperativni izbor) do njihove suprotnosti (izbor u konfliktnoj situaciji). Moguće su i međuvarijante: kompromis, koalicija, rastući ili tinjajući sukob.

Različite kombinacije ovih opcija dovode do brojnih problema u odlučivanju koji su proučavani u različitom stupnju.

Jezici za opisivanje metoda donošenja odluka

O jednoj te istoj pojavi može se govoriti na različitim jezicima različitog stupnja općenitosti i adekvatnosti. Do danas su postojala tri glavna jezika za opisivanje izbora.

Najjednostavniji, najrazvijeniji i najpopularniji je kriterijski jezik.

Jezik kriterija

Naziv ovog jezika povezan je s osnovnom pretpostavkom da se svaka pojedinačna alternativa može vrednovati nekim određenim (jednim) brojem, nakon čega se usporedba alternativa svodi na usporedbu njihovih odgovarajućih brojeva.

Neka je, na primjer, (X) skup alternativa, a x neka određena alternativa koja pripada ovom skupu: x∈X. Tada se smatra da se za sve x može zadati funkcija q(x), koja se zove kriterij (kriterij kvalitete, funkcija cilja, funkcija preferencije, funkcija korisnosti, itd.), koja ima svojstvo da ako je alternativa x 1 poželjnije od x 2 (označeno: x 1 > x 2), zatim q (x 1) > q (x 2).

U ovom slučaju izbor se svodi na pronalaženje alternative s najvećom vrijednošću funkcije kriterija.

Međutim, u praksi se korištenje samo jednog kriterija za usporedbu stupnja preferencije alternativa pokazuje kao neopravdano pojednostavljenje, budući da detaljnije razmatranje alternativa dovodi do potrebe da se one procjenjuju ne prema jednoj, već prema mnogima. kriteriji koji mogu biti različite prirode i kvalitativno različiti jedni od drugih.

Primjerice, pri odabiru najprihvatljivijeg tipa zrakoplova za putnike i operativnu organizaciju na određenim vrstama ruta, usporedba se provodi istovremeno prema mnogim skupinama kriterija: tehničkim, tehnološkim, ekonomskim, društvenim, ergonomskim itd.

Višekriterijski problemi nemaju jedinstveno opće rješenje. Stoga se predlaže mnogo načina da se problemu s više kriterija da poseban oblik koji omogućuje jedno opće rješenje. Naravno, ova rješenja su općenito različita za različite metode. Stoga je možda glavna stvar u rješavanju problema s više kriterija opravdanost ove vrste njegove formulacije.

Koriste se različite opcije za pojednostavljenje problema višekriterijske selekcije. Nabrojimo neke od njih.

  1. Uvjetna maksimizacija (ne pronalazi se globalni ekstremum integralnog kriterija, već lokalni ekstrem glavnog kriterija).
  2. Potražite alternativu s danim svojstvima.
  3. Pronalaženje Pareto skupa.
  4. Svođenje višekriterijskog problema na jednokriterijski uvođenjem integralnog kriterija.

Razmotrimo detaljnije formalnu formulaciju metode svođenja problema s više kriterija na jednokriterijski.

Uvodimo integralni kriterij q 0 (x) kao skalarnu funkciju vektorskog argumenta:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Integralni kriterij omogućuje poredanje alternativa po q 0 , čime se ističe najbolja (u smislu ovog kriterija). Oblik funkcije q 0 određen je time kako konkretno zamišljamo doprinos svakog kriterija integralnom kriteriju. Obično se koriste aditivne i multiplikacijske funkcije:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Koeficijenti s i daju:

  1. Bezdimenzionalnost ili pojedinačna dimenzija broja a i ⋅q i /s i (različiti pojedini kriteriji mogu imati različite dimenzije i tada je nad njima nemoguće izvršiti aritmetičke operacije i svesti ih na integralni kriterij).
  2. Normalizacija, tj. odredba uvjeta: b i ⋅q i /s i<1.

Koeficijenti a i i b i odražavaju relativni doprinos pojedinih kriterija q i integralnom kriteriju.

Dakle, u višekriterijskom okruženju, problem donošenja odluke o izboru jedne od alternativa svodi se na maksimiziranje integralnog kriterija:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Glavni problem u višekriterijskoj formulaciji problema odlučivanja je taj što je potrebno pronaći takav analitički oblik koeficijenata a i i b i koji bi osigurao sljedeća svojstva modela:

  • visok stupanj adekvatnosti predmetnog područja i stajališta stručnjaka;
  • minimalne računske poteškoće u maksimiziranju integralnog kriterija, t.j. njegov izračun za različite alternative;
  • stabilnost rezultata maksimiziranja integralnog kriterija od malih perturbacija početnih podataka.
  • Stabilnost rješenja znači da bi mala promjena početnih podataka trebala dovesti do male promjene vrijednosti integralnog kriterija, a prema tome i do male promjene odluke koja se donosi. Dakle, ako su početni podaci praktički isti, onda odluku treba donijeti ili ista ili vrlo bliska.

Jezik sekvencijalnog binarnog odabira

Jezik binarnih relacija je generalizacija višekriterijalnog jezika i temelji se na činjenici da kada ocjenjujemo neku alternativu, ta je ocjena uvijek relativna, t.j. eksplicitno ili češće implicitno, druge alternative iz skupa koji se proučava ili iz opće populacije koriste se kao baza ili referentni okvir za usporedbu. Ljudsko razmišljanje temelji se na traženju i analizi suprotnosti (konstrukta), pa nam je uvijek lakše izabrati jednu od dvije suprotne opcije nego jednu opciju iz velikog i nimalo nesređenog skupa.

Stoga se glavne pretpostavke ovog jezika svode na sljedeće:

  • ne vrednuje se jedna alternativa, tj. nije uvedena funkcija kriterija;
  • za svaki par alternativa može se na neki način utvrditi da je jedna od njih poželjnija od druge, ili da su jednake ili neusporedive;
  • odnos preferencije u bilo kojem paru alternativa ne ovisi o drugim alternativama koje su predstavljene za izbor.

Postoje različiti načini za određivanje binarnih odnosa: izravni, matrični, korištenje grafova preferencija, metoda sekcija itd.

Odnosi između alternativa jednog para izražavaju se kroz koncepte ekvivalencije, reda i dominacije.

Generalizirani jezik izbora funkcija

Jezik funkcija izbora temelji se na teoriji skupova i omogućuje rad s preslikavanjima skupova u njihove podskupove koji odgovaraju različitim izborima bez potrebe za nabrajanjem elemenata. Ovaj jezik je vrlo općenit i potencijalno dopušta da se opiše bilo koji izbor. Međutim, matematički aparat generaliziranih funkcija izbora trenutno se razvija i testira uglavnom na problemima koji su već riješeni korištenjem kriterija ili binarnih pristupa.

grupni izbor

Neka postoji grupa ljudi koja ima pravo sudjelovati u kolektivnom donošenju odluka. Pretpostavimo da ova grupa razmatra neki skup alternativa, a svaki član grupe napravi svoj izbor. Zadatak je razviti rješenje koje na određeni način koordinira individualne izbore i na neki način izražava "opće mišljenje" grupe, t.j. uzeti kao grupni izbor.

Naravno, različite grupne odluke odgovarat će različitim principima za koordinaciju pojedinačnih odluka.

Pravila za usklađivanje pojedinačnih odluka u grupnom izboru nazivaju se pravila glasovanja. Najčešće je "pravilo većine", u kojem grupnu odluku donosi alternativa koja dobije najviše glasova.

Mora se shvatiti da takva odluka samo odražava prevladavanje različitih stajališta u skupini, a ne uistinu optimalnu opciju za koju nitko uopće ne smije glasati. "Istina se ne utvrđuje glasanjem."

Osim toga, postoje takozvani "paradoksi glasanja", od kojih je najpoznatiji Arrowov paradoks.

Ovi paradoksi mogu dovesti, a ponekad i dovode, do vrlo neugodnih obilježja postupka glasovanja: na primjer, postoje slučajevi kada grupa uopće ne može donijeti niti jednu odluku (nema kvoruma ili svatko glasa za svoju jedinstvenu opciju itd. .), a ponekad (u višestepenom glasovanju) manjina može nametnuti svoju volju većini.

Izbor pod neizvjesnošću

Izvjesnost je poseban slučaj neizvjesnosti, naime: to je nesigurnost blizu nule.

U modernoj teoriji izbora vjeruje se da postoje tri glavne vrste nesigurnosti u problemima donošenja odluka:

  1. Informacijska (statistička) nesigurnost početnih podataka za donošenje odluka.
  2. Neizvjesnost posljedica odlučivanja (izbora).
  3. Neodređenost u opisu sastavnica procesa odlučivanja.

Razmotrimo ih redom.

Informacijska (statistička) nesigurnost u početnim podacima

Podaci dobiveni o predmetnom području ne mogu se smatrati apsolutno točnima. Osim toga, očito je da nas ti podaci sami po sebi ne zanimaju, već samo kao signali koji, možda, nose određene informacije o tome što nas doista zanima. Stoga je realnije smatrati da imamo posla s podacima koji nisu samo bučni i netočni, već i neizravni, a možda i nepotpuni. Osim toga, ti se podaci ne odnose na cjelokupnu proučavanu (opću) populaciju, već samo na njenu određenu podskupinu, o kojoj smo zapravo mogli prikupiti podatke, ali u isto vrijeme želimo izvući zaključke o cjelokupnoj populaciji, te također želimo znati stupanj pouzdanosti ovih zaključaka.

U tim uvjetima koristi se teorija statističkih odluka.

U ovoj teoriji postoje dva glavna izvora nesigurnosti. Prvo, nije poznato kakvoj se distribuciji pokoravaju izvorni podaci. Drugo, nije poznato kakvu distribuciju ima skup (opća populacija) o čemu želimo izvući zaključke iz njegovog podskupa koji čini početne podatke.

Statistički postupci su postupci donošenja odluka koji uklanjaju obje ove vrste nesigurnosti.

Treba napomenuti da postoji niz razloga koji dovode do pogrešne primjene statističkih metoda:

  • statistički zaključci, kao i svaki drugi, uvijek imaju određenu pouzdanost ili sigurnost. No, za razliku od mnogih drugih slučajeva, pouzdanost statističkih nalaza poznata je i utvrđena tijekom statističkih istraživanja;
  • kvaliteta rješenja dobivenog primjenom statističkog postupka ovisi o kvaliteti početnih podataka;
  • podaci koji nemaju statističku prirodu ne bi trebali biti podvrgnuti statističkoj obradi;
  • potrebno je koristiti statističke postupke koji odgovaraju razini a priori informacija o populaciji koja se proučava (na primjer, ne biste trebali primjenjivati ​​metode analize varijance na ne-Gaussove podatke). Ako je distribucija izvornih podataka nepoznata, onda je potrebno utvrditi ili koristiti nekoliko različitih metoda i usporediti rezultate. Ako se jako razlikuju, to ukazuje na neprimjenjivost nekog od korištenih postupaka.

Neizvjesnost posljedica

Kada su posljedice izbora alternative jedinstveno određene samom alternativom, tada ne možemo razlikovati alternativu i njezine posljedice, uzimajući zdravo za gotovo da odabirom alternative zapravo biramo njezine posljedice.

Međutim, u stvarnoj praksi često se mora suočiti sa složenijom situacijom, kada izbor jedne ili druge alternative dvosmisleno određuje posljedice napravljenog izbora.

U slučaju diskretnog skupa alternativa i ishoda po njihovom izboru, pod uvjetom da je skup mogućih ishoda zajednički za sve alternative, možemo pretpostaviti da se različite alternative međusobno razlikuju u distribuciji vjerojatnosti ishoda. Ove distribucije vjerojatnosti, u općem slučaju, mogu ovisiti o rezultatima izbora alternativa i ishodima koji su se kao rezultat toga stvarno dogodili. U najjednostavnijem slučaju, ishodi su jednako vjerojatni. Sami ishodi obično imaju značenje dobitaka ili gubitaka i kvantificirani su.

Ako su ishodi jednaki za sve alternative, onda nema što birati. Ako su različite, onda se alternative mogu usporediti uvođenjem određenih kvantitativnih procjena za njih. Raznolikost problema u teoriji igara povezana je s različitim izborom numeričkih karakteristika gubitaka i dobitaka kao rezultat izbora alternativa, različitim stupnjevima sukoba između strana koje biraju alternative itd.

Ovu vrstu neizvjesnosti smatrajte nejasnom nesigurnošću

Svaki problem izbora je cilj sužavanja skupa alternativa. I formalni opis alternativa (sama njihova lista, popis njihovih atributa ili parametara) i opis pravila za njihovu usporedbu (kriteriji, odnosi) uvijek se daju u terminima jedne ili druge mjerne skale (čak i kada je onaj koji zar ovo ne zna za ovo).

Poznato je da su sve ljestvice zamagljene, ali u različitom stupnju. Pojam "zamućenje" odnosi se na svojstvo ljestvice, koje se sastoji u tome da je uvijek moguće predstaviti dvije alternative koje se razlikuju, t.j. različite u jednoj skali i nerazlučive, t.j. su identični, u drugom - više zamagljeni. Što je manje gradacija u određenoj ljestvici, to je zamućenije.

Dakle, možemo jasno vidjeti alternative i istovremeno ih nejasno klasificirati, t.j. biti dvosmislen o tome kojim klasama pripadaju.

Već u svom prvom radu o donošenju odluka u nejasnoj situaciji, Bellman i Zadeh iznijeli su ideju da se i ciljevi i ograničenja trebaju predstaviti kao neizraziti (fuzzy) skupovi na skupu alternativa.

O nekim ograničenjima optimizacijskog pristupa

U svim gore razmatranim problemima odabira i metodama odlučivanja, problem je bio pronaći one najbolje u početnom skupu pod zadanim uvjetima, tj. optimalne alternative u određenom smislu.

Ideja optimalnosti je središnja ideja kibernetike i čvrsto je ušla u praksu projektiranja i upravljanja tehničkim sustavima. Istodobno, ova ideja zahtijeva oprezan stav kada je pokušavamo prenijeti na područje upravljanja složenim, velikim i slabo determiniranim sustavima, kao što su, na primjer, društveno-ekonomski sustavi.

Za ovaj zaključak postoje dobri razlozi. Razmotrimo neke od njih:

  1. Optimalno rješenje često se pokaže nestabilnim, t.j. manje promjene uvjeta problema, ulaznih podataka ili ograničenja mogu dovesti do odabira bitno različitih alternativa.
  2. Optimizacijski modeli razvijeni su samo za uske klase prilično jednostavnih zadataka koji ne odražavaju uvijek adekvatno i sustavno stvarne objekte upravljanja. Najčešće metode optimizacije omogućuju optimizaciju samo prilično jednostavnih i formalno opisanih podsustava nekih velikih i složenih sustava, t.j. dopuštaju samo lokalnu optimizaciju. Međutim, ako svaki podsustav nekog velikog sustava radi optimalno, to uopće ne znači da će i sustav kao cjelina također optimalno raditi. Stoga optimizacija podsustava ne dovodi nužno do njegovog ponašanja, što se od njega traži pri optimizaciji sustava u cjelini. Štoviše, ponekad lokalna optimizacija može dovesti do negativnih posljedica za sustav u cjelini. Stoga je kod optimizacije podsustava i sustava u cjelini potrebno odrediti stablo ciljeva i podciljeva te njihov prioritet.
  3. Često se maksimiziranje kriterija optimizacije prema nekom matematičkom modelu smatra ciljem optimizacije, ali u stvarnosti je cilj optimizirati objekt upravljanja. Optimizacijski kriteriji i matematički modeli uvijek su povezani s ciljem samo posredno, t.j. više ili manje adekvatna, ali uvijek približna.

Stoga se ideja optimalnosti, koja je iznimno plodna za sustave koji se podvrgavaju odgovarajućoj matematičkoj formalizaciji, mora prenijeti na složene sustave s oprezom. Naravno, matematički modeli koji se ponekad mogu predložiti za takve sustave mogu se optimizirati. No uvijek treba voditi računa o snažnom pojednostavljenju ovih modela, koje se u slučaju složenih sustava više ne može zanemariti, kao i o činjenici da je stupanj adekvatnosti ovih modela u slučaju složenih sustava zapravo nepoznat. . Stoga nije poznato kakvo je čisto praktično značenje ova optimizacija. Visoka praktičnost optimizacije u tehničkim sustavima ne bi smjela stvarati iluziju da će biti jednako učinkovita u optimizaciji složenih sustava. Smisleno matematičko modeliranje složenih sustava vrlo je teško, približno i netočno. Što je sustav složeniji, to treba biti pažljiviji prema ideji njegove optimizacije.

Stoga, pri razvoju metoda upravljanja za složene, velike, slabo određene sustave, autori smatraju glavnom ne samo optimalnost odabranog pristupa s formalno-matematičkog stajališta, već i njegovu primjerenost cilju i samoj prirodi sustava. kontrolni objekt.

Metode odabira stručnjaka

U proučavanju složenih sustava često se javljaju problemi koji se iz različitih razloga ne mogu rigorozno postaviti i riješiti primjenom trenutno razvijenog matematičkog aparata. U tim se slučajevima pribjegava uslugama stručnjaka (analitičara sustava) čije iskustvo i intuicija pomažu u smanjenju složenosti problema.

Međutim, mora se uzeti u obzir da su stručnjaci sami po sebi vrlo složeni sustavi, a njihove aktivnosti također ovise o mnogim vanjskim i unutarnjim uvjetima. Stoga se u načinu organiziranja stručnih procjena velika pozornost pridaje stvaranju povoljnih vanjskih i psiholoških uvjeta za rad stručnjaka.

Na rad stručnjaka utječu sljedeći čimbenici:

  • odgovornost za korištenje rezultata ispitivanja;
  • znajući da su uključeni i drugi stručnjaci;
  • dostupnost informacija kontakt između stručnjaka;
  • međuljudski odnosi stručnjaka (ako postoji informacijski kontakt među njima);
  • osobni interes stručnjaka za rezultate procjene;
  • osobne kvalitete stručnjaka (samopoštovanje, konformizam, volja itd.)

Interakcija između stručnjaka može ili stimulirati ili inhibirati njihovu aktivnost. Stoga se u različitim slučajevima koriste različite metode ispitivanja koje se razlikuju po prirodi međusobne interakcije stručnjaka: anonimne i otvorene ankete i upitnici, sastanci, rasprave, poslovne igre, brainstorming itd.

Postoje različite metode matematičke obrade stručnih mišljenja. Od stručnjaka se traži da procijene različite alternative bilo jednim ili sustavom pokazatelja. Osim toga, od njih se traži da procijene stupanj važnosti svakog pokazatelja (njegovu "težinu" ili "doprinos"). Samim stručnjacima također se dodjeljuje razina kompetencije koja odgovara doprinosu svakog od njih rezultirajućem mišljenju skupine.

Razvijena metoda rada sa stručnjacima je "Delphi" metoda. Glavna ideja ove metode je da kritika i argumentacija imaju blagotvoran učinak na stručnjaka, ako nije narušeno njegovo samopoštovanje i osigurani su uvjeti koji isključuju osobni sukob.

Treba naglasiti da postoji temeljna razlika u prirodi korištenja ekspertnih metoda u ekspertnim sustavima iu podršci odlučivanju. Ako se u prvom slučaju od stručnjaka traži da formaliziraju metode donošenja odluka, onda u drugom - samo samu odluku, kao takvu.

Budući da su stručnjaci uključeni u implementaciju upravo onih funkcija koje trenutno ili uopće ne pružaju automatizirani sustavi, ili ih izvode lošije nego ljudi, obećavajući smjer u razvoju automatiziranih sustava je maksimalna automatizacija ovih funkcija.

Automatizirani sustavi za podršku odlučivanju

Osoba je oduvijek koristila pomoćnike u donošenju odluka: oni su bili i jednostavno davatelji informacija o objektu kontrole i konzultanti (savjetnici) koji nude opcije za odluke i analiziraju njihove posljedice. Osoba koja je donosila odluke uvijek ih je donosila u određenom informacijskom okruženju: za vojnog zapovjednika ovo je stožer, za rektora akademsko vijeće, za ministra kolegij.

U naše vrijeme informacijska infrastruktura odlučivanja nezamisliva je bez automatiziranih sustava za iterativno ocjenjivanje odluka, a posebno sustava za podršku odlučivanju (DDS – Decision Support Systems), t.j. automatizirani sustavi koji su posebno dizajnirani za pripremu informacija koje su osobi potrebne za donošenje odluke. Razvoj sustava za potporu odlučivanju provodi se, posebice, u okviru međunarodnog projekta koji se provodi pod pokroviteljstvom Međunarodnog instituta za primijenjenu analizu sustava u Laxenburgu (Austrija).

Izbor u stvarnim situacijama zahtijeva izvođenje niza operacija, od kojih neke učinkovitije izvodi osoba, a druge stroj. Učinkovita kombinacija njihovih prednosti uz istodobnu kompenzaciju nedostataka utjelovljena je u automatiziranim sustavima za podršku odlučivanju.

Čovjek u uvjetima neizvjesnosti donosi odluke bolje od stroja, ali da bi donio pravu odluku, potrebne su mu i adekvatne (potpune i pouzdane) informacije koje karakteriziraju predmetno područje. No, poznato je da se osoba slabo nosi s velikim količinama “sirovih” neobrađenih informacija. Stoga uloga stroja u potpori odlučivanju može biti da izvrši preliminarnu pripremu informacija o kontrolnom objektu i nekontroliranim čimbenicima (okolini), da pomogne u sagledavanju posljedica donošenja određenih odluka, kao i da sve te informacije predstavi u vizualnom obliku. i prikladan način za donošenje odluka oblik.

Dakle, automatizirani sustavi za potporu odlučivanju kompenziraju slabosti osobe, oslobađajući je od rutinske preliminarne obrade informacija, te joj pružaju ugodno informacijsko okruženje u kojem može bolje pokazati svoje prednosti. Ovi sustavi nisu usmjereni na automatizaciju funkcija donositelja odluka (i kao rezultat toga otuđivanje od njega tih funkcija, a time i odgovornosti za donesene odluke, što je često općenito neprihvatljivo), već na pružanje pomoći u pronalaženju dobro rješenje.

  • tutorial

Dugo sam želio napisati opći članak koji će sadržavati same osnove prepoznavanja slika, svojevrsni vodič za osnovne metode, koji govori kada ih primijeniti, koje zadatke rješavaju, što se može raditi navečer na koljenu i o čemu je bolje ne razmišljati bez tima ljudi u 20.

Već duže vrijeme pišem neke članke o optičkom prepoznavanju, pa mi par puta mjesečno pišu razni ljudi s pitanjima na ovu temu. Ponekad imate osjećaj da živite s njima u različitim svjetovima. S jedne strane, razumijete da je osoba najvjerojatnije profesionalac u srodnoj temi, ali zna vrlo malo o metodama optičkog prepoznavanja. A ono što najviše smeta je što pokušava primijeniti metodu iz obližnjeg polja znanja, što je logično, ali ne radi u potpunosti u prepoznavanju slika, ali to ne razumije i jako se uvrijedi ako mu počne govoriti nešto iz vrlo osnove. A s obzirom na to da pričanje iz osnova zahtijeva puno vremena, kojeg često nema, postaje još tužnije.

Ovaj je članak osmišljen tako da osoba koja se nikada nije bavila metodama prepoznavanja slika može u roku od 10-15 minuta u svojoj glavi stvoriti određenu osnovnu sliku svijeta koja odgovara temi i razumjeti u kojem smjeru treba kopati. Mnoge od ovdje opisanih metoda primjenjive su na radarsku i audio obradu.
Počet ću s nekoliko principa koje uvijek počinjemo govoriti potencijalnom kupcu ili osobi koja želi početi raditi optičko prepoznavanje:

  • Prilikom rješavanja problema uvijek idite od najjednostavnijeg. Mnogo je lakše objesiti narančastu etiketu na osobu nego pratiti osobu, ističući je u kaskadama. Mnogo je lakše uzeti kameru s višom rezolucijom nego razviti algoritam super-razlučivosti.
  • Strogi iskaz problema u metodama optičkog prepoznavanja redovi su veličine važniji nego u problemima programiranja sustava: jedna dodatna riječ u TK-u može dodati 50% posla.
  • U problemima prepoznavanja ne postoje univerzalna rješenja. Ne možete napraviti algoritam koji će jednostavno "prepoznati bilo koji natpis". Znak na ulici i list teksta bitno su različiti objekti. Vjerojatno je moguće napraviti opći algoritam (dobar primjer iz Googlea), ali to će zahtijevati puno rada velikog tima i sastojati se od desetaka različitih potprograma.
  • OpenCV je biblija koja ima mnogo metoda i s kojom možete riješiti 50% volumena gotovo svakog problema, no OpenCV je samo mali dio onoga što se može učiniti u stvarnosti. U jednoj studiji u zaključcima je pisalo: "Problem se ne rješava OpenCV metodama, dakle, nerješiv je." Pokušajte to izbjeći, nemojte biti lijeni i trezveno procijenite trenutni zadatak svaki put ispočetka, bez korištenja OpenCV predložaka.
Vrlo je teško dati nekakav univerzalni savjet ili reći kako stvoriti neku vrstu strukture oko koje možete izgraditi rješenje za proizvoljne probleme računalnog vida. Svrha ovog članka je strukturirati ono što se može koristiti. Pokušat ću postojeće metode podijeliti u tri skupine. Prva skupina je predfiltriranje i priprema slike. Druga skupina je logička obrada rezultata filtriranja. Treća skupina su algoritmi za donošenje odluka temeljeni na logičkoj obradi. Granice između grupa su vrlo proizvoljne. Za rješavanje problema nije uvijek potrebno primijeniti metode iz svih skupina, ponekad su dovoljne dvije, a ponekad čak i jedna.

Ovdje prikazan popis metoda nije potpun. Predlažem da u komentare dodam kritičke metode koje nisam napisao i svakoj pripišem 2-3 popratne riječi.

Dio 1. Filtriranje

U ovu grupu sam smjestio metode koje vam omogućuju odabir područja od interesa na slikama bez njihove analize. Većina ovih metoda primjenjuje neku vrstu uniformne transformacije na sve točke na slici. Na razini filtriranja slika se ne analizira, ali se točke koje se filtriraju mogu smatrati područjima s posebnim karakteristikama.
Binarizacija praga, odabir područja histograma
Najjednostavnija transformacija je binarizacija slike po pragu. Za RGB i slike u sivim tonovima, prag je vrijednost boje. Postoje idealni problemi u kojima je takva transformacija dovoljna. Pretpostavimo da želite automatski odabrati stavke na bijelom listu papira:




Odabir praga po kojem se odvija binarizacija uvelike određuje sam proces binarizacije. U ovom slučaju, slika je binarizirana prosječnom bojom. Obično se binarizacija provodi s algoritmom koji adaptivno odabire prag. Takav algoritam može biti izbor očekivanja ili načina. I možete odabrati najveći vrh histograma.

Binarizacija može dati vrlo zanimljive rezultate pri radu s histogramima, uključujući i situaciju ako sliku ne promatramo u RGB-u, već u HSV-u. Na primjer, segmentirajte boje koje vas zanimaju. Na ovom principu moguće je izraditi i detektor etiketa i detektor ljudske kože.
Klasično filtriranje: Fourier, LPF, HPF
Klasične metode filtriranja iz radarske i obrade signala mogu se uspješno primijeniti u raznim zadacima prepoznavanja uzoraka. Tradicionalna metoda u radaru, koja se gotovo nikad ne koristi u slikama u svom čistom obliku, je Fourierova transformacija (točnije, FFT). Jedna od rijetkih iznimaka gdje se koristi 1D Fourierova transformacija je kompresija slike. Za analizu slike, jednodimenzionalna transformacija obično nije dovoljna, morate koristiti mnogo više resursno intenzivnu dvodimenzionalnu transformaciju.

Malo ljudi to zapravo izračuna, obično je puno brže i lakše koristiti konvoluciju područja od interesa s gotovim filterom izoštrenim na visoke (HPF) ili niske (LPF) frekvencije. Takva metoda, naravno, ne dopušta analizu spektra, ali u konkretnom zadatku obrade videa obično nije potrebna analiza, već rezultat.


Najjednostavniji primjeri filtara koji naglašavaju niske frekvencije (Gaussov filtar) i visoke frekvencije (Gaborov filtar).
Za svaku točku slike odabire se prozor i množi s filtrom iste veličine. Rezultat takve konvolucije je nova vrijednost točke. Pri implementaciji LPF-a i HPF-a dobivaju se slike ove vrste:



Talasi
Ali što ako upotrijebimo neku proizvoljnu karakterističnu funkciju za konvoluciju sa signalom? Tada će se zvati "Transformacija talasa". Ova definicija talasa nije točna, ali tradicionalno, u mnogim timovima, wavelet analiza je potraga za proizvoljnim uzorkom na slici pomoću konvolucije s modelom ovog uzorka. Postoji skup klasičnih funkcija koje se koriste u wavelet analizi. To uključuje Haarov val, Morletov val, meksički šešir i tako dalje. Haar primitivi, o kojima je bilo nekoliko mojih prethodnih članaka ( , ), odnose se na takve funkcije za dvodimenzionalni prostor.


Gore su 4 primjera klasičnih talasa. 3D Haar val, 2D Meyerov val, Meksički šešir, val Daubechies. Dobar primjer korištenja proširene interpretacije valova je problem pronalaženja svjetlucanja u oku, za koji je sam bljesak valovit:

Klasični talasi se obično koriste za , ili za njihovu klasifikaciju (opisati će se u nastavku).
Poveznica
Nakon ovako slobodnog tumačenja valova s ​​moje strane, vrijedno je spomenuti stvarnu korelaciju koja je u njihovoj osnovi. Prilikom filtriranja slika, ovo je nezamjenjiv alat. Klasična aplikacija je korelacija video tokova za pronalaženje pomaka ili optičkih tokova. Najjednostavniji detektor pomaka je također, u određenom smislu, korelator razlike. Tamo gdje slike nisu u korelaciji, bilo je kretanja.

Filtriranje funkcija
Zanimljiva klasa filtara su funkcije filtriranja. To su čisto matematički filtri koji vam omogućuju otkrivanje jednostavne matematičke funkcije na slici (pravac, parabola, krug). Gradi se akumulirana slika u kojoj se za svaku točku izvorne slike ucrtava skup funkcija koje je generiraju. Najklasičnija transformacija je Houghova transformacija za linije. U ovoj transformaciji, za svaku točku (x;y), nacrtan je skup točaka (a;b) pravca y=ax+b, za koje vrijedi jednakost. Nabavite prekrasne slike:


(prvi plus za onoga tko prvi nađe kvaku na slici i takvu definiciju i objasni je, drugi plus za onoga tko prvi kaže što je ovdje prikazano)
Houghova transformacija omogućuje vam da pronađete bilo koje funkcije koje se mogu parametrirati. Na primjer krugovi. Postoji modificirana transformacija koja vam omogućuje traženje bilo kojeg . Ova transformacija je užasno draga matematičarima. Ali pri obradi slika, to, nažalost, ne radi uvijek. Vrlo mala brzina, vrlo visoka osjetljivost na kvalitetu binarizacije. Čak i u idealnim situacijama, radije sam se snalazio s drugim metodama.
Pandan Hough transformaciji za linije je Radon transformacija. Izračunava se putem FFT-a, što daje povećanje performansi u situaciji kada ima puno bodova. Osim toga, može se primijeniti na nebinariziranu sliku.
Filtriranje kontura
Posebna klasa filtara je filtriranje rubova i kontura. Putovi su vrlo korisni kada želimo prijeći s rada sa slikom na rad s objektima na toj slici. Kada je objekt prilično složen, ali dobro prepoznatljiv, tada je često jedini način rada s njim odabir njegovih kontura. Postoji niz algoritama koji rješavaju problem filtriranja kontura:

Najčešće korišten je Kenny koji dobro radi i čija implementacija je u OpenCV-u (Sobel je također tu, ali lošije traži konture).



Ostali filteri
Iznad su filteri čije modifikacije pomažu riješiti 80-90% zadataka. No, osim njih, postoje još rijetki filtri koji se koriste u lokalnim zadacima. Takvih filtera ima na desetke, neću ih sve nabrajati. Zanimljivi su iterativni filtri (primjerice ), kao i ridgelet i curvlet transformacije, koji su legura klasičnog valnog filtriranja i analize u području transformacije radona. Beamlet transformacija lijepo radi na granici valne transformacije i logičke analize, omogućujući vam da istaknete konture:

Ali te su transformacije vrlo specifične i prilagođene rijetkim zadacima.

Dio 2. Logička obrada rezultata filtriranja

Filtriranje daje skup podataka prikladnih za obradu. Ali često ne možete samo uzeti i koristiti ove podatke bez obrade. U ovom odjeljku bit će nekoliko klasičnih metoda koje vam omogućuju da prijeđete sa slike na svojstva objekata ili na same objekte.
Morfologija
Prijelaz s filtriranja na logiku, po mom mišljenju, su metode matematičke morfologije ( , ). Zapravo, ovo su najjednostavnije operacije povećanja i erodiranja binarnih slika. Ove metode omogućuju uklanjanje šuma s binarne slike povećanjem ili smanjenjem dostupnih elemenata. Na temelju matematičke morfologije, postoje algoritmi za konturiranje, ali obično koriste neke vrste hibridnih algoritama ili algoritama zajedno.
analiza konture
U odjeljku o filtriranju već su spomenuti algoritmi za dobivanje granica. Rezultirajuće granice jednostavno se pretvaraju u konture. Za Canny algoritam to se događa automatski, za druge algoritme je potrebna dodatna binarizacija. Možete dobiti konturu za binarni algoritam, na primjer, s algoritmom buba.
Kontura je jedinstvena karakteristika objekta. Često vam to omogućuje da identificirate objekt duž konture. Postoji moćan matematički aparat koji vam to omogućuje. Aparat se naziva analiza kontura ( , ).

Da budem iskren, nikada nisam uspio primijeniti analizu kontura u stvarnim problemima. Potrebni su previše idealni uvjeti. Ili nema granice, ili je previše buke. Ali, ako trebate nešto prepoznati u idealnim uvjetima, onda je analiza kontura izvrsna opcija. Radi vrlo brzo, lijepa matematika i razumljiva logika.
Singularne točke
Ključne točke su jedinstvene karakteristike objekta koje omogućuju da se objekt poveže sam sa sobom ili sa sličnim klasama objekata. Postoje deseci načina odabira takvih točaka. Neke metode ističu posebne točke u susjednim okvirima, neke nakon duljeg vremenskog razdoblja i pri promjeni osvjetljenja, neke vam omogućuju da pronađete posebne točke koje ostaju tako čak i kada se objekt rotira. Počnimo s metodama koje nam omogućuju da pronađemo posebne točke koje nisu tako stabilne, ali se brzo izračunavaju, a zatim ćemo ići u sve većoj složenosti:
Prvi razred. Singularne točke koje su stabilne sekundama. Takve se točke koriste za usmjeravanje objekta između susjednih video okvira ili za konvergiranje slika sa susjednih kamera. Te točke uključuju lokalne maksimume slike, kutove na slici (najbolji od detektora, možda, Haris detektor), točke u kojima se postižu maksimumi disperzije, određene gradijente itd.
Drugi razred. Pojedinačne točke koje su stabilne pri promjeni osvjetljenja i malim pokretima objekta. Takve točke služe prvenstveno za obuku i naknadnu klasifikaciju tipova objekata. Primjerice, klasifikator za pješake ili klasifikator lica proizvod je sustava izgrađenog upravo na takvim točkama. Neki od prethodno spomenutih valova mogu biti osnova za takve točke. Na primjer, Haar primitivi, pretraživanje odsjaja, traženje drugih specifičnih značajki. Ove točke uključuju točke pronađene metodom histograma usmjerenih gradijenata (HOG).
Treći razred. stabilne točke. Znam samo za dvije metode koje daju potpunu stabilnost i za njihove modifikacije. Ovo i . Omogućuju vam da pronađete ključne točke čak i kada rotirate sliku. Izračun takvih točaka traje dulje od ostalih metoda, ali prilično ograničeno vrijeme. Nažalost, ove metode su patentirane. Iako je u Rusiji nemoguće patentirati algoritme, pa ga koristite za domaće tržište.

Dio 3. Trening

Treći dio priče bit će posvećen metodama koje ne rade izravno sa slikom, ali koje vam omogućuju donošenje odluka. U osnovi, to su različite metode strojnog učenja i donošenja odluka. Nedavno je Yandyks objavio na Habru na ovu temu, postoji jako dobar izbor. Evo ga u tekstualnoj verziji. Za ozbiljno proučavanje teme, toplo preporučam da ih pogledate. Ovdje ću pokušati identificirati nekoliko osnovnih metoda koje se koriste posebno u prepoznavanju uzoraka.
U 80% situacija suština učenja u problemu prepoznavanja je sljedeća:
Postoji testni uzorak na kojem se nalazi nekoliko klasa objekata. Neka to bude prisutnost / odsutnost osobe na fotografiji. Za svaku sliku postoji skup značajki koje su istaknute nekom značajkom, bilo da je to Haar, HOG, SURF ili neki val. Algoritam učenja mora izgraditi takav model, prema kojem će moći analizirati novu sliku i odlučiti koji se od objekata nalazi na slici.
Kako se to radi? Svaka od testnih slika točka je u prostoru značajki. Njegove koordinate su težina svake značajke na slici. Neka naši znakovi budu: “Prisutnost očiju”, “Prisutnost nosa”, “Prisutnost dvije ruke”, “Prisutnost ušiju” itd. Sve ove znakove dodijelit ćemo detektorima koje imamo, koji su trenirani na dijelovima tijela sličnim ljudskim. Za osobu u takvom prostoru ispravna točka bit će . Za majmuna, točka za konja. Klasifikator je obučen na uzorku primjera. No, nisu na svim fotografijama bile ruke, druge nisu imale oči, a na trećoj je majmun imao ljudski nos zbog greške u klasifikatoru. Ljudski klasifikator koji se može obučiti automatski dijeli prostor značajki na način da kaže: ako je prva značajka u rasponu od 0,5 U biti, svrha klasifikatora je ucrtati u prostor značajki područja karakteristična za objekte klasifikacije. Ovako će izgledati uzastopna aproksimacija odgovora za jedan od klasifikatora (AdaBoost) u dvodimenzionalnom prostoru:


Postoji mnogo klasifikatora. Svaki od njih bolje radi u nekim svojim zadaćama. Zadatak odabira klasifikatora za određeni zadatak uvelike je umjetnost. Evo nekoliko lijepih slika na temu.
Jednostavno kućište, jednodimenzionalno razdvajanje
Uzmimo primjer najjednostavnijeg slučaja klasifikacije, kada je prostor obilježja jednodimenzionalan, a trebamo odvojiti 2 klase. Situacija se događa češće nego što se čini: na primjer, kada trebate razlikovati dva signala ili usporediti uzorak s uzorkom. Recimo da imamo uzorak za obuku. U tom slučaju se dobiva slika, gdje će os X biti mjera sličnosti, a os Y broj događaja s takvom mjerom. Kada je željeni objekt sličan samom sebi, dobiva se lijevi Gaussov. Kad nije slično – točno. Vrijednost X=0,4 razdvaja uzorke tako da pogrešna odluka minimizira vjerojatnost donošenja bilo kakve pogrešne odluke. Upravo je potraga za takvim separatorom zadatak klasifikacije.


Mala napomena. Kriterij koji minimalizira pogrešku neće uvijek biti optimalan. Sljedeći grafikon je graf stvarnog sustava za prepoznavanje šarenice. Za takav sustav kriterij se bira na način da se minimizira vjerojatnost lažnog primanja autsajdera u objekt. Takva se vjerojatnost naziva "pogreška prve vrste", "vjerojatnost lažne uzbune", "lažno pozitivna". U engleskoj literaturi "False Access Rate".
) AdaBusta je jedan od najčešćih klasifikatora. Na primjer, na njemu je izgrađena kaskada Haar. Obično se koristi kada je potrebna binarna klasifikacija, ali ništa ne sprječava podučavanje za više razreda.
SVM ( , , , ) Jedan od najmoćnijih klasifikatora s mnogo implementacija. U principu, na zadacima učenja s kojima sam se susreo, radio je slično kao adabusta. Smatra se prilično brzim, ali je njegov trening teži od onog kod Adabuste i zahtijeva odabir ispravnog kernela.

Tu su i neuronske mreže i regresija. Ali da bismo ih ukratko razvrstali i pokazali po čemu se razlikuju, potreban je članak puno veći od ovoga.
________________________________________________
Nadam se da sam uspio dati brzi pregled korištenih metoda bez poniranja u matematiku i opis. Možda će ovo nekome pomoći. Iako je, naravno, članak nedorečen i nema ni riječi o radu sa stereo slikama, niti o LSM-u s Kalmanovim filterom, niti o adaptivnom Bayesovom pristupu.
Ako vam se sviđa članak, pokušat ću napraviti drugi dio s izborom primjera kako se rješavaju postojeći problemi ImageRecognition.

I konačno

Što čitati?
1) Jednom mi se jako svidjela knjiga "Digitalna obrada slike" B. Yana, koja je napisana jednostavno i jasno, ali je u isto vrijeme data gotovo sva matematika. Dobro za upoznavanje s postojećim metodama.
2) Klasik žanra je R Gonzalez, R. Woods "Digital Image Processing". Iz nekog razloga, bilo mi je teže od prvog. Mnogo manje matematike, ali više metoda i slika.
3) “Obrada i analiza slike u problemima strojnog vida” - napisano na temelju kolegija koji se izvodi na jednom od odsjeka PhysTech. Mnogo metoda i njihov detaljan opis. No, po mom mišljenju, knjiga ima dva velika minusa: knjiga je snažno fokusirana na softverski paket koji dolazi s njom, u knjizi se prečesto opis jednostavne metode pretvara u matematičku džunglu iz koje je teško razabrati strukturni dijagram metode. Ali autori su napravili zgodnu stranicu na kojoj je predstavljen gotovo sav sadržaj - wiki.technicalvision.ru Dodaj oznake

Metoda iteracije. U ovoj metodi se vrši usporedba s određenom bazom podataka, gdje za svaki od objekata postoje različite opcije za modificiranje prikaza. Na primjer, za optičko prepoznavanje slike možete primijeniti metodu iteracije pod različitim kutovima ili mjerilima, pomacima, deformacijama itd. Za slova možete iterirati font ili njegova svojstva. U slučaju prepoznavanja zvučnih uzoraka, postoji usporedba s nekim poznatim uzorcima (riječ koju govore mnogi ljudi). Nadalje, vrši se dublja analiza karakteristika slike. U slučaju optičkog prepoznavanja, to može biti definicija geometrijskih karakteristika. Uzorak zvuka u ovom slučaju se podvrgava analizi frekvencije i amplitude.

Sljedeća metoda je korištenje umjetnih neuronskih mreža(INS). Zahtijeva ili ogroman broj primjera zadatka prepoznavanja, ili posebnu strukturu neuronske mreže koja uzima u obzir specifičnosti ovog zadatka. No, ipak, ovu metodu karakterizira visoka učinkovitost i produktivnost.

Metode temeljene na procjenama gustoće distribucije vrijednosti obilježja. Posuđeno iz klasične teorije statističkih odluka, u kojoj se predmeti proučavanja razmatraju kao realizacije višedimenzionalne slučajne varijable raspoređene u prostoru značajki prema nekom zakonu. Temelje se na Bayesovoj shemi donošenja odluka, koja se poziva na početne vjerojatnosti objekata koji pripadaju određenoj klasi i gustoće distribucije uvjetnih značajki.

Skupina metoda temeljenih na procjeni gustoće distribucije vrijednosti obilježja izravno je povezana s metodama diskriminantne analize. Bayesov pristup donošenju odluka jedna je od najrazvijenijih parametarskih metoda u modernoj statistici, za koju se smatra da je analitički izraz zakona distribucije (normalni zakon) poznat i samo mali broj parametara (srednji vektori i matrice kovarijansi). ) potrebno je procijeniti. Smatra se da su glavne poteškoće u primjeni ove metode potreba za pamćenjem cijelog skupa za obuku za izračunavanje procjena gustoće i visoka osjetljivost na skup za vježbanje.

Metode temeljene na pretpostavkama o klasi funkcija odlučivanja. U ovoj skupini se smatra poznatim tip funkcije odlučivanja i daje se njezin funkcionalni kvalitet. Na temelju ove funkcionalnosti, optimalna aproksimacija funkciji odlučivanja nalazi se iz slijeda treninga. Funkcija kvalitete pravila odluke obično je povezana s greškom. Glavna prednost metode je jasnoća matematičke formulacije problema prepoznavanja. Mogućnost izvlačenja novog znanja o prirodi objekta, posebice znanja o mehanizmima interakcije atributa, ovdje je bitno ograničena danom strukturom interakcije, fiksiranom u odabranom obliku funkcija odlučivanja.

Metoda usporedbe prototipa. Ovo je najlakša metoda ekstenzivnog prepoznavanja u praksi. Primjenjuje se kada su prepoznatljive klase prikazane kao kompaktne geometrijske klase. Zatim se središte geometrijskog grupiranja (ili objekt najbliži središtu) bira kao točka prototipa.

Za klasificiranje neodređenog objekta pronalazi se prototip koji mu je najbliži, a objekt pripada istoj klasi kao i on. Očito se ovom metodom ne stvaraju nikakve generalizirane slike. Različite vrste udaljenosti mogu se koristiti kao mjera.

Metoda k najbližih susjeda. Metoda se sastoji u tome da se prilikom razvrstavanja nepoznatog objekta pronađe zadani broj (k) geometrijski najbližeg prostora značajki drugih najbližih susjeda za koje je već poznato da pripadaju klasi. Odluka o dodjeli nepoznatog objekta donosi se analizom informacija o njegovim najbližim susjedima. Potreba za smanjenjem broja objekata u uzorku za obuku (dijagnostički presedani) je nedostatak ove metode, jer se time smanjuje reprezentativnost uzorka za obuku.

Na temelju činjenice da se različiti algoritmi za prepoznavanje ponašaju različito na istom uzorku, postavlja se pitanje sintetičkog pravila odlučivanja koje bi koristilo prednosti svih algoritama. Za to postoji sintetička metoda ili skupovi pravila odlučivanja koja kombiniraju najpozitivnije aspekte svake od metoda.

U zaključku pregleda metoda prepoznavanja predstavljamo bit navedenog u sažetoj tablici, dodajući još neke metode koje se koriste u praksi.

Tablica 1. Klasifikacijska tablica metoda prepoznavanja, usporedba područja njihove primjene i ograničenja

Klasifikacija metoda prepoznavanja

Područje primjene

Ograničenja (nedostaci)

Intenzivne metode prepoznavanja

Metode temeljene na procjenama gustoće

Problemi s poznatom distribucijom (normalno), potreba za prikupljanjem velike statistike

Potreba za nabrajanjem cijelog skupa za obuku tijekom prepoznavanja, visoka osjetljivost na nereprezentativnost skupa za obuku i artefakata

Metode temeljene na pretpostavci

Klase bi trebale biti dobro razdvojene

Oblik funkcije odlučivanja mora biti poznat unaprijed. Nemogućnost uzimanja u obzir novih spoznaja o korelacijama između značajki

Booleove metode

Problemi male dimenzije

Prilikom odabira pravila logičnog odlučivanja potrebno je kompletno nabrajanje. Visok intenzitet rada

Lingvističke metode

Zadatak određivanja gramatike za određeni skup iskaza (opisa objekata) teško je formalizirati. Neriješeni teorijski problemi

Ekstenzivne metode prepoznavanja

Metoda usporedbe prototipa

Problemi male dimenzije prostornog prostora

Velika ovisnost rezultata klasifikacije o metrici. Nepoznata optimalna metrika

k metoda najbližeg susjeda

Velika ovisnost rezultata klasifikacije o metrici. Potreba za potpunim nabrajanjem uzorka za obuku tijekom prepoznavanja. Računalna složenost

Algoritmi za izračun ocjena (ABO)

Problemi male dimenzije u smislu broja klasa i značajki

Ovisnost rezultata klasifikacije o metrici. Potreba za potpunim nabrajanjem uzorka za obuku tijekom prepoznavanja. Visoka tehnička složenost metode

Pravila kolektivnog odlučivanja (CRC) je sintetička metoda.

Problemi male dimenzije u smislu broja klasa i značajki

Vrlo visoka tehnička složenost metode, neriješen broj teorijskih problema, kako u određivanju područja nadležnosti pojedinih metoda, tako i u samim pojedinim metodama