Biografije Karakteristike Analiza

Algoritmi za kompresiju digitalne slike koristeći ortogonalne transformacije. Ortogonalne transformacije

Transformacije koje se koriste za kompresiju slika trebaju biti brze i, ako je moguće, lako implementirane na računaru. To prvenstveno podrazumijeva da takve transformacije moraju biti linearne. Odnosno, pretvorene vrijednosti su linearne kombinacije (zbirovi sa nekim množiocima ili težinama) originalnih vrijednosti (piksela), s određenim brojem (faktorom transformacije) koji služi kao odgovarajući množitelj ili težina. Dakle, gde. Na primjer, kada se ova transformacija može napisati u matričnom obliku

,

koji će u opštem slučaju imati sledeći oblik: . Svaki vektor stupca matrice naziva se "osnovni vektor".

Važan zadatak je određivanje koeficijenata konverzije. Glavni zahtjev je da nakon transformacije vrijednost bude velika, a sve ostale vrijednosti da postanu male. Osnovni omjer pretpostavlja da će biti velik ako ponderi pojačaju odgovarajuće vrijednosti. To će se dogoditi, na primjer, ako komponente vektora i imaju bliske vrijednosti i iste predznake. Naprotiv, bit će mali ako su težine male i polovina njih ima suprotan predznak od odgovarajućeg broja. Stoga, ako se dobiju veliki, vektori su slični originalnom vektoru, a mali znače da su komponente vrlo različite od . Stoga se bazni vektori mogu tumačiti kao alat za izdvajanje nekih karakteristika originalnog vektora.

U praksi, ponderi ne bi trebali ovisiti o izvornim podacima. U suprotnom, morat će se dodati komprimiranoj datoteci za korištenje od strane dekodera. Ovo razmatranje, kao i činjenica da su ulazni podaci pikseli, odnosno nenegativne vrijednosti, određuju način na koji se biraju bazni vektori. Prvi vektor, onaj koji generiše , mora se sastojati od bliskih, eventualno podudarnih brojeva. To će povećati nenegativne vrijednosti piksela. A svi ostali vektori baze trebali bi se sastojati od polovice pozitivnih brojeva, a druga polovina - od negativnih. Nakon množenja pozitivnim vrijednostima i njihovog zbrajanja, rezultat će biti mali broj. (Ovo je posebno tačno kada su originalni podaci blizu, a znamo da su susedni pikseli obično bliski po veličini.) Podsetimo se da su bazni vektori neki alat za izdvajanje karakteristika iz originalnih podataka. Stoga bi dobar izbor bili bazni vektori koji se međusobno jako razlikuju i stoga mogu izdvojiti različite karakteristike. Ovo dovodi do ideje da osnovni vektori moraju biti međusobno ortogonalni. Ako se matrica transformacije sastoji od ortogonalnih vektora, onda se transformacija naziva ortogonalnom. Još jedno zapažanje koje omogućava da izbor baznih vektora bude ispravan je da ovi vektori moraju imati sve veće frekvencije preokreta da bi izvukli, da tako kažem, visokofrekventne karakteristike kompresibilnih podataka prilikom izračunavanja transformiranih vrijednosti.

Ova svojstva zadovoljava sljedeća ortogonalna matrica:

. (3.5)

Prvi bazni vektor (gornji red) su sve jedinice, tako da je njegova frekvencija nula. Svi ostali vektori imaju dva +1 i dva -1, tako da će dati male konvertovane vrednosti, a njihove frekvencije (merene brojem promena karaktera po redu) se povećavaju. Ova matrica je slična Hadamard Walshovoj transformacijskoj matrici (vidi jednadžbu (3.11)). Na primjer, transformirajmo početni vektor (4,6,5,2):

.

Rezultat je prilično ohrabrujući, budući da je broj postao veliki (u odnosu na originalne podatke), a druga dva broja mala. Izračunajmo energije originalnih i transformiranih podataka. Početna energija je , a nakon konverzije je postala energija koja je četiri puta veća. Energija se može uštedjeti množenjem matrice transformacije sa faktorom 1/2. Novi proizvod će biti jednak . Dakle, energija je sačuvana i koncentrisana u prvoj komponenti, i sada je ukupne energije početnih podataka, u kojima je prva komponenta činila samo 20%.

Još jedna prednost matrice je to što radi i inverznu transformaciju. Originalni podaci (4,6,5,2) se vraćaju pomoću proizvoda.

Sada smo u poziciji da cijenimo zasluge ove transformacije. Kvantiziramo transformirani vektor (8.5,1.5,–2.5,0.5) zaokružujući ga na cijeli broj i dobijamo (9.1,–3.0). Uradimo obrnutu transformaciju i dobijemo vektor (3.5,6.5,5.5,2.5). U sličnom eksperimentu, jednostavno uklonimo dva najmanja broja i dobijemo (8.5.0,–2.5.0), a zatim radimo inverznu transformaciju ovog grubo kvantizovanog vektora. To rezultira rekonstruiranim podacima (3,5.5,5.5,3) koji su također prilično bliski originalu. Dakle, naš zaključak: čak i ova jednostavna i intuitivna transformacija je dobar alat za "cijeđenje" suvišnosti iz originalnih podataka. Sofisticiranije transformacije daju rezultate koji omogućavaju obnavljanje podataka sa visokim stepenom sličnosti čak i sa veoma grubom kvantizacijom.

Neki umjetnici prikazuju sunce žutom bojom
mrlja, a druga žuta mrlja na suncu.
- Pablo Picasso

"Slika u poligrafiji" - Specifičnost slike u poligrafiji. Glavno svojstvo štampane slike. Book. Posebnost većine slikovnih štamparija. Množina Masovni karakter Javna dostupnost. Povezivanje slike sa tekstom. Umjetnost knjige. Font.

"Vektorska i rasterska grafika" - Vektorski primitivi se definiraju pomoću opisa. Principi konstruisanja vektorskih i rasterskih slika. Vektorske slike zauzimaju relativno malu količinu memorije. Vrste kompjuterske grafike. Vektorske slike opisuju se desetinama, a ponekad i hiljadama naredbi. Nedostaci rasterske grafike.

"Kompjuterska grafika" - Glavni problemi pri radu sa rasterskom grafikom. Vrste kompjuterske grafike razlikuju se po principima formiranja slike. Kompjuterska grafika. Fraktalna grafika. Vrste kompjuterske grafike. Velike količine podataka. Pixel. Uporedne karakteristike rasterske i vektorske grafike. Svaka tačka ekrana može imati samo dva stanja - "crno" ili "bijelo".

"Kreiranje grafike" - Ivice platna. Zadatak 4. Napravite crtež koji se sastoji od autooblika. Kreirajte crtež pomoću trake sa alatkama Crtanje. Položaj grafičke slike u tekstu. Umetnite sliku iz kolekcije u tekst. Platno. Uporedne karakteristike rasterske i vektorske grafike. Značajke kreiranja vektorske slike u programu Word 2003.

“Slika ljudske glave” - Ostala hladna, mrtva lica Zatvorena rešetkama, kao tamnica. Drugi su kao kule u kojima niko ne živi i dugo gleda kroz prozor. Šta su portreti? Proporcije lica osobe. Slika crta lica. Lice i emocije osobe. N. Zabolotsky. Koja su lica? Crtež ljudske glave. Zaista je svijet i sjajan i divan!

"Bitmape" - Zaključci o eksperimentu. Crveni. Koje primarne boje koristi kompjuter? Rastersko kodiranje grafičkih informacija. Bitmap. Pikseli različitih boja. Plava (tirkizna). Siva. Pink. Paleta savremenih računara. Sve boje mogu biti numerisane, a svaki broj se može pretvoriti u binarni kod.

  • Specijalnost HAC RF05.13.11
  • Broj strana 382
Teza Dodaj u korpu 500p

KONCEPTI I PROBLEMI

1.1. Osnovni pristupi problemu kompresije slike

1.1.1. Matematički model diskretne slike

1.1.2. Mjera greške pri obnavljanju slike

1.1.3. Početne ideje za tehnike kompresije fotografija

1.1.4. JPEG varijanta zasnovana na upotrebi DCT

1.1.5. Problem izbora ekspanzijskih baza

1.2. Korištenje Wavelet transformacije za kompresiju fotografija

1.2.1. Osnovni pojmovi, definicije, specifičnosti wavelet transformacija

1.2.2. 2D Wavelet Transforms

1.2.3. Glavne ideje modernih algoritama za kompresiju slike talasića

1.3. Karakteristike obrade video sekvenci

1.4. Opća izjava o problemu optimizacije kodiranja s gubicima

Uvod u rad (dio apstrakta) na temu "Matematičke metode i algoritmi za kompresiju digitalne slike primjenom ortogonalnih transformacija"

Problemi u vezi sa skladištenjem, obradom i prenosom vizuelnih slika (slika) pratili su čovečanstvo kroz njegovu istoriju. Pojava televizije direktno je povezala zadatke obrade slike sa zadacima obrade električnih signala, a razvoj digitalne elektronike doveo je do toga da je rašireni prijelaz s analognih oblika predstavljanja signala na digitalni postao karakteristična karakteristika modernih elektronskih sistema. U tom smislu, pitanja digitalne obrade slike (DPI) danas su od posebne važnosti.

Diskretna crno-bijela polutonska slika može se definirati nekom matricom, čiji su elementi (tačke slike, također nazvane pikseli) uzorci funkcije dobivene kao rezultat nekog prostornog uzorkovanja, koja opisuje raspodjelu svjetline na kontinuirana slika. Digitalna slika je matrica dobijena kao rezultat kvantizacije element po element (sa konačnim brojem nivoa) vrijednosti uzorka diskretne slike. Za opis slike u boji (diskretna ili digitalna), potrebne su tri matrice koje odgovaraju tri komponente svjetline u odabranom prostoru boja, na primjer RGB (crvena, zelena, plava). Opis slike u obliku matrice(a) svjetline će se zvati direktnom reprezentacijom.

Obrada, pohrana, prijenos digitalnih slika uz direktnu prezentaciju zahtijevaju ogromne količine podataka. Tako, na primjer, za snimanje samo jednog okvira visokokvalitetne slike u boji veličine 1024x1024 piksela, kada se svaki uzorak kodira sa 24 bita (8 bita po komponenti boje), bit će potrebno 3 megabajta podataka. Naravno, pri gledanju videa prihvatljiva je manja rezolucija ekrana, međutim, za prikazivanje digitalnog videa u realnom vremenu potreban je prijenos podataka brzinom od oko 160 megabita/s. Prethodno navedeno objašnjava ogromno interesovanje koje se manifestuje širom sveta u potrazi za načinima za efikasno kodiranje slika.

Već u zoru razvoja digitalnih metoda obrade slike (kraj pedesetih - početak šezdesetih) redundantnost direktnog predstavljanja slika bila je očigledna, međutim, najjednostavnije metode koje se koriste za kompresiju podataka, kao što je diferencijalna impulsna kodna modulacija praćena statističkim kodiranja, dao je više nego skromne rezultate. Pitanje korištenja frekventnih metoda za kompresiju slike postalo je moguće zbog pojave rada Cooleya i Tukeya 1965. godine, koji je sadržavao opis algoritma za brzo izračunavanje diskretne Fourierove transformacije (DFT). Ideja o zamjeni slike kao direktnog objekta kodiranja uzorcima njenog dvodimenzionalnog DFT spektra iznesena je 1968. godine. DFT kodiranje se temelji na činjenici da su za većinu prirodnih slika vrijednosti mnogih DFT koeficijenata relativno male. Takvi koeficijenti se često mogu potpuno odbaciti, ili se mali broj bitova može dodijeliti njihovom kodiranju, bez rizika od uvođenja bilo kakvog značajnog izobličenja. Godine 1969. Pratt, Andrews i Kane su predložili korištenje Adamardove transformacije umjesto Fourierove transformacije za kodiranje slika, što u mnogim praktičnim slučajevima može značajno smanjiti količinu potrebnog izračunavanja. Od tada su poduzeta istraživanja o primjeni diskretnih Karhunen-Loeve i Haar transformacija na kodiranje slike. Karhunen-Loeve transformacija je optimalna u smislu da daje minimalnu efektivnu grešku kodiranja kada se odbaci neki od koeficijenata transformacije, ali, nažalost, zahtijeva poznavanje statističkih karakteristika obrađenih slika i nema brzi algoritam proračuna; transformacija

Haar, naprotiv, karakterizira visoko efikasan algoritam proračuna, ali, po pravilu, daje relativno veliku grešku kodiranja. 1971. Shibata i Enomoto su predložili takozvanu nagnutu transformaciju vektora od 4 ili 8 komponenti posebno za upotrebu u kodiranju slika. Ubrzo nakon toga, Pratt, Chen i Wilch razvili su generalizirani algoritam nagnute transformacije za dugačke vektore i dvodimenzionalne nizove.

Sve prednosti kodiranja slike upotrebom ortogonalnih transformacija u konačnici proizlaze iz posebnosti distribucije energije među elementima transformacije - zbog toga je generalizirani dvodimenzionalni spektar1 pogodniji za kodiranje od slike u originalnom prikazu. Zbog značajnih korelacija između elemenata slike prirodne prirode, glavna energija u diskretnom spektru teži da se koncentriše u relativno malom broju uzoraka koji odgovaraju sporo oscilirajućim baznim funkcijama. Stoga, bez značajnog oštećenja naknadne restauracije slike, mali spektralni koeficijenti se općenito mogu postaviti na nulu, a preostali elementi spektra mogu se digitalizirati (kvantizirati i kodirati). Ovdje je prikladno napomenuti da je korištenje algoritama za kompresiju podataka sa gubitkom za stvarne fotografske slike (tj. sivih tonova) fundamentalne prirode, budući da se, uz pretpostavku prisutnosti neke greške u rekonstruiranoj slici, može postići mnogo viši nivo kompresije podataka. postignuto. Greška može biti toliko mala da je neće uočiti ljudsko oko. Osim toga, snimljene slike

1 Svugdje ćemo pojam spektra razumjeti na generaliziran način, kao rezultat unitarne transformacije (ne nužno pomoću DFT-a) jednodimenzionalnog ili dvodimenzionalnog skupa podataka. skener ili uređaj za digitalno snimanje videa, neminovno imaju komponentu šuma, čije je tačno očuvanje tokom kodiranja besmisleno.

Kao što su pokazali Ahmed i saradnici, kada se primeni na kodiranje slike za koje je odgovarajući Markovljev statistički model, diskretna kosinusna transformacija (DCT), koja ima brz računski algoritam, približava se Karhunen-Loeve transformaciji u efikasnosti spektralnog predstavljanja podataka (vidi takođe). Ova činjenica je bila razlog zašto je DCT poslužio kao osnova za razvoj standarda kompresije JPEG fotografija. Ovaj standard je rezultat višegodišnjeg truda. tim stručnjaka formiran 1987. godine od predstavnika dvije renomirane međunarodne organizacije: ISO i ITU. Pojava zajedničke JPEG grupe uzrokovana je porastom broja programera i korisnika različitih sistema kliringa i rezultirajućom potrebom za objedinjavanjem formata za komprimovanu reprezentaciju digitalnih slika. Rezultirajuća specifikacija je dokument koji danas prate gotovo svi programeri softverskih sistema za klirinške kuće opšte namene. Od 1994. godine se proizvode specijalizovana mikrokola koja implementiraju kompresiju i oporavak preko JPEG-a u hardveru i obezbeđuju obradu slike u boji u realnom vremenu (480x640 piksela, 30 frejmova/s). Sa stanovišta dostižnog nivoa kompresije, JPEG verzija zasnovana na upotrebi DCT nije najbolja među trenutno postojećim metodama za efikasno kodiranje slike. Dakle, metode zasnovane na korišćenju talasnih transformacija2 mogu da obezbede znatno više nivoe kompresije - iz tog razloga, u proširenom standardu JPEG2000,

U domaćoj literaturi, umjesto direktnog prijevoda riječi wavelet, često se koristi i izraz splash. postoji u obliku preliminarne (nacrta) specifikacije od 20003. godine, već je omogućena mogućnost primjene wavelet transformacija. Međutim, preuranjeno je reći da kompresija slike pomoću DCT-a danas postaje zastarjela, budući da su, u poređenju sa wavelet transformacijama, računski troškovi potrebni za implementaciju DCT-a mnogo manji. Detaljniji pregled savremenih metoda kompresije slike i razlika u korišćenim pristupima biće dat u prvom poglavlju ovog rada.

Teško je precijeniti značaj problema kompresije podataka u obradi slike – dovoljno je analizirati rast broja relevantnih publikacija uočen u posljednjoj deceniji. Dakle, značajan dio sadržaja mjesečnog časopisa IEEE Transactions on Image Processing, koji izlazi od 1992. godine, čine članci posvećeni ovoj temi. Također je nemoguće ne primijetiti činjenicu da se algoritmi za kompresiju slike i teorija koja je u njihovoj osnovi razvijaju uglavnom u inostranstvu, prvenstveno u SAD-u. Naravno, nemoguće je govoriti o nedostatku domaćeg rada u ovoj oblasti, ali je nesumnjiva potreba za značajnim proširenjem ruskog fronta istraživanja.

Složenost algoritama koji se koriste za kompresiju slike stalno raste - to se ne odnosi samo na količinu proračuna, već i na ideološke osnove konstrukcije algoritama: funkcionalna analiza, teorija vjerovatnoće, teorija informacija, diskretna matematika i algebra su isprepleteni. u njihovoj osnovi na kompleksan način. U isto vrijeme, zadatke postavlja praksa, koja zahtijeva postojanu i stalnu pažnju na mogućnosti stvarne opreme prilikom njihovog rješavanja.

3 2. januara 2001., prvi dio "JPEG 2000 sistem kompresije slike: Part I Core Coding System" konačno je odobren za usvajanje kao zvanični međunarodni standard ISO/IEC 15444-1.

Stoga je zadatak disertacije definisan kao proučavanje teorijskih pitanja efikasnog kodiranja slike korišćenjem ortogonalnih transformacija i razvoj odgovarajućih algoritama kompresije pogodnih za praktičnu upotrebu na osnovu univerzalnih računarskih alata opšte namene. Novinu rada određuju prvi put predloženi algoritmi i metode za rješavanje problema, koji se podnose na odbranu (vidi dolje). Relevantnost je zbog primijenjenog fokusa rada i izuzetne važnosti problema kompresije podataka u Clearinghouse-u.

U prvom poglavlju disertacije date su preliminarne informacije potrebne za dalje izlaganje, dat je kratak pregled i klasifikacija glavnih pristupa implementaciji efikasnog kodiranja slike. Upotreba algoritama za kompresiju podataka sa gubitkom za slike u sivim tonovima je sveprisutna: uz pretpostavku prisustva greške u rekonstruiranoj slici, može se postići mnogo viši nivo kompresije podataka. Najčešće se kvalitet obrade slike obično procjenjuje pomoću srednje kvadratne greške (RMS):

RMS = X y)2 > gdje je ~ matrica originalne slike, L

X = (x/y) je matrica slike dobijene nakon obrade (kompresija i oporavak podataka). Za logaritamsku vrijednost RMS-a koristi se općeprihvaćena mjera PSNR (odnos vršnog signala i šuma).

255 vrijednosti signal-šum), PSNR = 201g-[dB].

Metode kompresije slike pogodno je razmotriti u obliku opće šeme koja se sastoji od tri glavne faze: smanjenje međuelementne korelacije podataka, kvantizacija elemenata podataka, statističko kodiranje. Kvantizacija je glavna tehnika kompresije sa gubicima. U stvari,

N-1M-1 kvantizacija je izdvajanje neke glavne informacije iz ulaznih podataka, kada se izostavi njen manje značajan dio. Koriste se i skalarna i vektorska kvantizacija. U skalarnom slučaju, elementi skupa podataka koji se obrađuju kvantiziraju se nezavisno jedan od drugog.

Prenošenje slike u generalizovanu spektralnu oblast korišćenjem neke linearne transformacije ^ može značajno smanjiti međuelementnu korelaciju u matrici transformacije Y=77(X) u poređenju sa korelacijom elemenata u matrici diskretne slike X. Tada nezavisna komponenta- pokomponentno kodiranje vektora Y, a ne vektora X, postaje efikasnije. Također možete dati energetsku interpretaciju svrhe korištenja transformacija, koja je u tom smislu koncentriranje maksimalnog dijela energije originalnog diskretnog signala (X matrica) u minimalnom broju spektralnih koeficijenata (Y matrični elementi). Postoji određena veza između raspodjele energije u generaliziranom spektru i dekorelirajućih svojstava transformacija. Proučavanje djelotvornosti dekorelirajućih svojstava je stoga važan zadatak pri odabiru transformacije za primjenu na šemu kompresije.

Prave fotografske slike su dvodimenzionalni signali koji imaju nehomogenosti (obilježja) u područjima kontura objekta, tako da osnova funkcija koje se koriste za dekompoziciju mora imati dobru lokalizaciju u području slike. Međutim, u pozadinskim područjima, slika se može smatrati realizacijom stacionarnog signala, što čini poželjnijim korištenje frekventno lokalizirane osnove za dekompoziciju (dobro je poznato da su koeficijenti trigonometrijskog proširenja stacionarnog signala nekorelirano). Nemoguće je postići i visoku rezoluciju u frekvencijskom i vremenskom domenu zbog Heisenbergovog principa nesigurnosti.

Mogući izlaz je korištenje funkcionalnih talasnih baza (burstova) koje imaju promjenjivu rezoluciju vremenske frekvencije. Pristupi zasnovani na burst-u trenutno su dominantni u obradi fotografija, postepeno zamjenjujući tradicionalni alat za dekorelaciju, diskretnu kosinusnu transformaciju (DCT).

U prvom poglavlju se napominje da se u cilju optimizacije algoritama kompresije podataka sa gubitkom često koristi pristup baziran na minimiziranju Lagrange RD funkcije. Neka je X neki skup ulaznih podataka, koji je, kao rezultat postupka kompresije-oporavka, pridružen< выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU (0.1)

Potraga za rješenjem problema (0.1) u većini slučajeva se svodi na glomazne numeričke procedure iterativne prirode. Ako nije dato ograničenjem R(X,u)

Prvo poglavlje takođe ukratko navodi karakteristike povezane sa obradom (kompresija-oporavak) dinamičkih slika. Glavna transformacija koja se koristi za video kompresiju je i dalje DCT, jer je jednostavnija u smislu količine proračuna u odnosu na wavelet transformacije. Kao i kod statičkog sažimanja, algoritmi video kodiranja su često složeniji od algoritama za dekodiranje. Implementacija softverske video kompresije u realnom vremenu, stoga, nameće značajna ograničenja na dozvoljenu složenost proračuna.

Drugo poglavlje je posvećeno proučavanju metoda za teorijsku analizu dekorrelacijske efikasnosti transformacija namijenjenih za korištenje u kompresiji podataka. Predložena je nova metoda koja se zasniva na procjeni vrijednosti bezuslovne entropije koeficijenata transformacije i oslanja se na sljedeće rezonovanje. Neka je poznata matrica kovarijanse Kx početnog vektora podataka

X = (x0,l;1,.,q:Dr1)r, vektorski spektar Y se dobija kao rezultat neke ortogonalne transformacije sa matricom Y=LX. Izostavljajući proračune, možemo napisati prosječnu bezuslovnu entropiju za koeficijente vektorskog spektra:

Nsr = - X | /k (u, x) \ o% / k (tk, ok, x) 4x \u003d

0.3) A k=0 k=0 funkcija gustoće vjerovatnoće za

1 Ar-1 1 1\-11 1

A°(x)loe/Ax>/x; gdje je /k(mkox) spektralne karakteristike yk (Az-ta komponenta vektora Y), /u^ je matematičko očekivanje, ok je standardna devijacija, /k(x) = Što je niža prosječna entropija (0,3) , što je efikasnije naknadno nezavisno kodiranje komponenti spektra.

Kao kriterijum za efikasnost dekorelacije predlaže se da se uzme u obzir vrednost prosečnog viška entropije dobijene iz formule (0.3) kao rezultat određenih transformacija, a koja se izražava kroz elemente matrice:

1\ ^ ae1^x k=0 y-=0 ^

Vrijednost (0.4) je nenegativna, a što je njena vrijednost veća, to je niža efikasnost dekorrelirajuće transformacije sa matricom.Numerički proračuni vrijednosti (0.4) za različite transformacije i tipove kovarijansnih matrica pokazali su rezultate koji su u potpunosti konzistentni sa poznatim podacima.

Od velikog interesa za analizu je model diskretnog signala (vektor X), koji ima statistiku diskretnog Markovljevog procesa prvog reda, kada matrica kovarijanse ima sljedeći oblik:

N-2 pK-1 pM-2

Ovaj model se također često koristi za opisivanje međulinijske i međukolone korelacije u diskretnim slikama. Kod p=1, kada su sve komponente u originalnom vektoru X iste (za bilo koja dva uzorka vektora koeficijent korelacije je jednak jedan), izračunavanje uvedenog kriterijuma (0.4) za matricu (0.5) je nemoguće, jer u ovom slučaju imamo<ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. U 2. poglavlju je dokazana sljedeća teorema.

Teorema 2.1. Za bilo koju ortogonalnu matricu (L/x/U) takvu da

V/ = OD,. ,LG -1: >y0 . = -(osnovna funkcija s indeksom nula je LA/U normalizirana konstantna komponenta) i matrica kovarijanse (0,5) lm/ 2 N-1 N-1

1nDYA(\U,Kx) = - \o%

Različite studije, uključujući one sprovedene u Poglavlju 2, pokazuju da među diskretnim transformacijama koje imaju brze računske algoritme (za dimenziju N aritmetičkih operacija implementiranih u -Wo^N), karakteristike dekorelacije za Markovljev proces (0,5) daje upotrebu DCT. Uprkos prisutnosti dobro razvijenih brzih algoritama proračuna, DCT u osnovi zahtijeva operacije množenja za svoju implementaciju i primjetno je inferioran u smislu količine izračunavanja, na primjer, Haar, Walsh i Chrestenson-Levy transformacijama. Zasebno pitanje, kojem se posvećuje velika pažnja u Poglavlju 2, je konstrukcija (sinteza) nove transformacije koja ima i visoke karakteristike dekorelacije za model (0,5) i mnogo brže algoritme proračuna nego za DCT. Rezultirajuća diskretna pseudokosinusna transformacija (DPCT) definirana je za vektore takve dimenzije A^, za koje je moguće proširenje N=N1 ■. -Yn, i Y do (2,3,4). Tada se DPCT matrica (u ovom slučaju indeks označava dimenziju transformacije) konstruiše kao direktni (tenzorski) proizvod elementarnih DPCT matrica (\¥2,\¥3,\U4): = \¥Rr1 ® . ® \Ul,n, a elementarne matrice su ortogonalne i dobivene su kao rezultat određenih modifikacija DCT matrice odgovarajuće dimenzije4. Elementarne matrice se mogu predstaviti kao proizvod neke dijagonalne matrice B i matrice C, a struktura C vam omogućava da implementirate množenje sa proizvoljnim vektorom u, SI, samo uz pomoć operacija sabiranja i oduzimanja.

Svojstva tenzorskog proizvoda impliciraju reprezentaciju = OdgSd, gdje je dijagonalna matrica ®, a matrica

Cm \u003d Ssh ®.®Syp. Strukture matrica C2, C3, C4, C2, B3, B4 date su u poglavlju 2. Dakle, implementacija DPCT Y = \Ud,X = B^C^X sastoji se u implementaciji množenja matricu Cm vektorom, Y = C^X, i naknadnom normalizacijom rezultujućeg vektora Y: Y = S^Y. Za izračunavanje DPCT-a zgodno je koristiti brze algoritme zasnovane na faktoriziranoj predstavi za matricu Oy u obliku proizvoda rijetko popunjenih matrica5: »1^ ,

1dg. - jedinična matrica dimenzije TS. xA/" -. Pošto su matrice Tg /)

J J J se na određeni način sastoje od rijetkih matrica-blokova; množenje matrice Td/) vektorom se također svodi samo na operacije sabiranja i oduzimanja brojeva. Izgrađeni su brzi inverzni DPCT algoritmi

4 Pod tenzorskim (direktnim) proizvodom matrica (/=0,.,7]-1; m=0,.,A-1) i .,/¿-1) podrazumijevamo matricu

8=B®C=K/))= . ,a=0X.,u-\,p=0X.,1ir\.

5 Da biste opravdali valjanost ovog gledišta, pogledajte str. 84-85 iz monografije. slično, jer zbog ortogonalnosti DPCT-a:

Napominjemo da normalizacija (množenje matricom Dy) neophodna za izračunavanje DHFT-a i inverznog DPCT-a za šemu kompresije sa skalarnom kvantizacijom koeficijenata transformacije ne otežava proračune. Normalizacija se može kombinovati u kompresiji podataka sa skalarnom fazom kvantizacije yj - goips1(y7 / c()) odabirom za svaki element y. transformirani pojedinačni korak kvantizacije qj=qldjj (gdje je

Element dijagonalne normalizacijske matrice B^). Kada A vraća vektor Y ~ Y, y my ■, faktore za elemente y ^ također treba odabrati pojedinačno, u obliku

Kako je pokazala teorijska analiza, za model (0.5) DPCT ima veću efikasnost dekorelacije u odnosu na druge brze transformacije, čija se implementacija također svodi samo na operacije sabiranja i oduzimanja brojeva.

Treće poglavlje posvećeno je proučavanju primjene diskretne Chrestenson-Levy transformacije (DLCT) za kompresiju slike i predstavlja razvoj istraživanja autora dr. sc.

Sistem Chrestenson-Levyjevih funkcija (xm na poluintervalu xx = u(L 0 na dijagonali matrice dimenzije rpxrn postoji p matrica veličine rpLxrpL, preostali elementi matrice su nula). -1) ima sljedeći oblik: ™ = \ Sa t ( . 0, sa t. F 7

Diskretne (digitalne) polutonske slike opisuju se u obliku realne matrice X. Prilikom obrade realnih vektora (matrica), DPCL spektar se razlaže na parove složenih konjugiranih elemenata, tako da se neki od elemenata spektra ne mogu izračunati. Uzimanje ovih karakteristika u obzir nam je omogućilo da predložimo DPCL i inverzne DPCL algoritme sa nepotpunim proračunom za obradu realnih nizova. Prilikom obrade stvarnih skupova podataka moguće je koristiti i "kombinovane" transformacije, slično kao što se radi pri izračunavanju diskretne Fourierove transformacije. Istovremeno se iz dva realna vektora X i X2 formira kompleksni vektor X=X1+/X2 i vrši se transformacija.

Ako koristimo reprezentaciju u osnovi za kompleksne brojeve r=xHy (1 r=a+Pd e~2n"/3), onda se izračunavanje DPCL-a (za p= 3) može izvesti bez upotrebe operacija množenja (normalizujući faktor

1/4p", vidi (0.7) - ne uzima se u obzir), koristeći operacije sabiranja i oduzimanja (tu činjenicu je utvrdio A.V. Efimov). Upotreba algoritama sa nepotpunim izračunavanjem osnove (1, q) podrazumijeva brojne karakteristike, o kojima se govori u poglavlju 3. Kada je dimenzija matrice slike 3x3r, izračunavanje DPCL-a ili inverznog DPCL-a algoritmima sa nepotpunim proračunom zahtijeva 7(n + r) -3 "+ r" 1 operacije sabiranja (oduzimanja), operacije množenja i dijeljenja se ne koriste.osnova (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

Za obradu nepokretnih slika u autorovom doktorskom radu predložen je algoritam kompresije u kojem se originalna slika deli za obradu na elementarne fragmente X, 9x9 tačaka, a svaki matrični fragment se obrađuje pomoću DPCL-a (prema algoritam sa nepotpunim proračunom). Poglavlje 3 daje kratak opis algoritma kompresije, koji je potvrdio valjanost upotrebe diskretne Chrestenson-Levy transformacije za kompresiju slike. Priroda grešaka unesenih u proces kompresije-dekompresije je drugačija za JPEG metodu zasnovanu na DCT-u i za predloženu šemu: kada se koristi JPEG, dolazi do "zamućenja", dok nova šema kompresije dovodi do "nazubljenosti" slike. Ipak, subjektivni kvalitet percepcije pri korištenju obje razmatrane metode kompresije je približno isti. Procjene veličine izobličenja u smislu PSNR vrijednosti, obavljene za određeni broj testnih slika dimenzija 720x504=362880 piksela, također su dale bliske rezultate: za neke slike, mala prednost JPEG standarda zasnovanog na DCT-u može biti Uočeno, za druge slike, bolji kvalitet restauracije je moguć korištenjem nove metode. Razlike su male, posebno na niskim nivoima kompresije. Procjene računskih troškova pokazuju da algoritam zasnovan na DPCL-u nije inferioran u odnosu na JPEG u smislu računske složenosti implementacije. Algoritam kompresije slike koji koristi DPCL i ima karakteristike uporedive sa JPEG-om rezultat je koji je autor dobio po prvi put.

Četvrto poglavlje se bavi razvojem šema kompresije koristeći obradu slike po fragmentu. Obično je za takve sheme upotreba DCT-a najefikasnija, stoga je značajan dio četvrtog poglavlja posvećen proučavanju njegovih svojstava koja su neophodna za izgradnju algoritama kompresije. Jer Budući da je dvodimenzionalni DCT odvojiva transformacija (svedena na jednodimenzionalne transformacije duž redova i duž stupaca obrađene matrice), mnoga svojstva dvodimenzionalnog DCT proizlaze iz svojstava jednodimenzionalnog.

Za koeficijente jednodimenzionalnog DCT, definisane formulom, dobija se sljedeća veza (b*10): kk (0.8) w- #

2S gdje je A/=xy-Xy 1 - prva razlika između očitavanja originalnog vektora podataka X = (l;0,d:1,.,l:lg1)T. Formula (0.8) pokazuje da razlike A, - imaju različit karakter uticaja na DCT spektar. Dakle, razlika Am-xm-x^/2-\ (kada je IV paran) ulazi u sve koeficijente y2m sa maksimalnim (jediničnim) težinama u modulu. Razlika između očitanja x0 i uopće nije uključena u (0.8), što u osnovi razlikuje DCT od njegovog "progenitora" - diskretne Fourierove transformacije, čiji je amplitudski spektar invarijantan na cikličke pomake (x0->x)- >.->Xl>-1- >*o) komponenta vektora podataka X.

Uz pretpostavku nekoreliranih razlika6 A; i jednakosti na nulu njihovih matematičkih očekivanja E(A/)=0, proučavane su i probabilističke procjene, posebno vrijednost ukupne varijanse varijabilnih komponenti DCT spektra: E - ¿,0(uk). Ovaj zbir se može predstaviti u terminima k= 1 disperzije prvih razlika vektora podataka na sljedeći način:

Teorema 4.1: za koeficijente $(/) relacija je tačna: Ova teorema još jednom potvrđuje da za korišćeni probabilistički model vektora X, razlika Am (u ovom slučaju njegova varijansa) daje najveći doprinos. Što je broj razlike bliži N/2, to je veća vrijednost težine £(/") i veći je doprinos razlike A energiji varijabilnih komponenti. Istraživanje DCT spektra za neku karakteristiku

6 Za Markovljev model (0,5) ova pretpostavka nije tačna. signali su takođe potvrdili da kada se koriste tehnike za kodiranje spektra iz JPEG (posebno, kodiranje niza nula - run-length encoding), efikasnost kodiranja će se pogoršati kada zasićenje informacijama diskretnog signala padne na centralne uzorke vektora.

Pored ispitivanja opštih svojstava DCT-a, Poglavlje 4 istražuje mogućnost optimizacije JPEG kodiranja koje čuva format izlaznih podataka. U razvoju ideja Crouse-Ramchandranovog rada predložen je algoritam koji vrši dodatnu optimizaciju skalarne kvantizacije DCT koeficijenata, što podrazumijeva određeno poboljšanje karakteristika kompresije prema JPEG standardu zbog zanemarljive komplikacije procedure optimizacije.

Za kompresiju fotografija koristeći 8x8 DCT, u četvrtom poglavlju razvijen je novi algoritam, koji se razlikuje od JPEG-a u fazi entropijskog kodiranja, za koji se koristi nekoliko statističkih modela i višenitni algoritam aritmetičkog kodiranja. Izbor modela se vrši na određeni način prema kontekstu već obrađenih podataka. Predloženi algoritam za aritmetičko kontekstno kodiranje DCT koeficijenata poboljšava kompresiju podataka za 10% u poređenju sa standardnom JPEG šemom (JPEG Optimizer™ v.4.0 služi kao referenca, pogledajte http://xat.com).

Značajna pažnja u četvrtom poglavlju posvećena je proučavanju općih teorijskih i praktičnih aspekata primjene vektorske kvantizacije (VC) za kompresiju slike u domenu transformacije, ne nužno koristeći DCT. Da biste to učinili, spektri fragmenata slike moraju biti podijeljeni u određene zone, od kojih svaka odgovara zasebnom toku podataka koji je podvrgnut VC-u. Formulirajmo problem particioniranja koreliranog skupa podataka, koji predstavljamo kao vektor Y, na klastere (klase). Početni parametri su matrica kovarijanse Ku vektora Y i ograničenje na maksimalnu nesigurnost (entropiju) Hmax za svaki klaster u particiji. Potrebno je pronaći takvu particiju skupa slučajnih komponenti Y=(70,., GLr1) na podskupove

Y(A) = ^n. „Y^], k=1,.,M, tako da je:

b*"^ . (0,) n(y^)kvazioptimalne metode: algoritam "Rast klastera" i algoritam "Izolacija jakih veza". Obje predložene metode za numeričko traženje rješenja (0.9) su zasnovane na o minimiziranju entropije međuklasterskih veza

Hsv(\a\.,\(m))=^H(\(k))-H(Y). Particije bliže optimalnom k=1 koje zadovoljava (0.9)) prikazane su drugim od navedenih algoritama.

U zaključku, u četvrtom poglavlju, predložena je opća šema kompresije koja koristi adaptivni NE-optimizirani VC u području spektra fragmenata slike. One. formalizirana je opća shema kompresije statičkih slika uz korištenje vektorske kvantizacije u području ortogonalnih transformacija, koja je orijentirana na obradu slike fragment po fragment.

Peto poglavlje je posvećeno proučavanju i razvoju algoritama kompresije nepokretne slike u oblasti talasnih transformacija. Pusti sada

W = označava diskretnu matricu talasnog spektra dobijenu kao rezultat dvodimenzionalnih n koraka th wavelet transformacije matrice diskretne slike. Broj koraka wavelet transformacije određuje broj nivoa frekvencije u spektru, za n koraka imamo n+1 nivoa. U ovom slučaju, koeficijenti talasne ekspanzije mogu biti uređeni u obliku skupa struktura stabla (7), čiji su korijeni elementi koji leže u najnižem frekvencijskom opsegu spektra (podopseg), vidi sliku. Takav poredak određuje za talasne koeficijente (čvorove stabla) odnose roditelj-dijete. Ideološke osnove razvijenog algoritma kompresije su ukorijenjene u radu Lewis-Knowlesa i Xiong-Ramchandran-Orcharda; u ovom slučaju, glavni zadatak s kojim se suočava algoritam kompresije je pronalaženje RD-optimalne topologije (tj. strukture S, koja se dobija nakon obrezivanja grana originalnog stabla T), minimizirajući Lagrangeovu funkciju za fiksnu vrijednost H : J(S*) = m [A£) + R(S)].

Ideja, koja se vraća na rad i koristi se u istom obliku u , je sljedeća: što je veća apsolutna vrijednost talasnog koeficijenta I wj (ili energije, wf) roditeljskog čvora /, to je manja vjerovatnoća da će ovaj čvor imati nulte (tj. skraćene) grane, koje treba koristiti za kodiranje topologije stabla S. Tačnije predviđanje izgleda nulte grane može se napraviti ako kao prediktivnu vrijednost koristimo R, zbroj, koji uključuje, osim wf, i kvadrate vrijednosti talasnih koeficijenata koji su susjedni u podpojasu čvoru i. Eksperimentalne studije statističkih zavisnosti sprovedene u poglavlju 5 pokazale su svrsishodnost upotrebe vrednosti P( za prediktivnu vrednost koeficijenata-suseda. fotografske slike. Za kodiranje topologije "orezanog" stabla ξ, svaki čvor z od stablu kome se dodeljuje znak prisutnosti (n, ) treba na određeni način grupirati u nove elemente podataka (Tu), koji se podvrgavaju adaptivnom aritmetičkom kodiranju, a koristi se nekoliko statističkih modela, kontekst (tj. prema već kodirani podaci) pravilo odabira modela je postavljeno na određeni način prema prediktivnim vrijednostima (T5, - ).

Nekoliko statističkih modela se takođe koristi za kodiranje skalarno kvantizovanih talasnih koeficijenata koji ne spadaju u nulte (skraćene) grane. Predloženo pravilo za kontekstualni izbor modela uzima u obzir i vrijednost prediktivne vrijednosti P( roditeljskog čvora i vrijednosti wavelet koeficijenata susjednih čvorova koji se nalaze u istom podopsiju, pored obrađenog, Odabir statističkog modela za kodiranje skalarno kvantiziranog wavelet koeficijenta Wj=XQw\l^(Wjld), koji odgovara čvoru stabla B, vrši se prema vrijednosti l, =0.36P n-1.0 b( 1 U

M?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Poređenje rezultata dobijenih u eksperimentima obrade stvarne slike sa rezultatima primjene drugih poznatih algoritama za kompresiju vallet slike pokazuje da predloženi algoritam ima vrlo visoke performanse. Dakle, za dobro poznatu testnu sliku Lena sa nivoom kompresije od 0,5 bita po pikselu (16 puta), greška PSNR=37,66 dB.

Završne studije poglavlja 5 odnose se na konstrukciju hibridne sheme kodiranja talasnog spektra, kada je, pored metode sečenja grana talasnih koeficijenata opisanog gore, postoji i mogućnost vektorske „samokvantizacije“ grana. dozvoljeno, što se može tumačiti kao fraktalno kodiranje u domenu talasnih transformacija (vidi, na primjer, ). Hibridni algoritam dobijen kao rezultat zahteva mnogo veću količinu proračuna, ali se pokazalo da je fraktalna komponenta kodiranja u ovom slučaju skoro potpuno potisnuta osnovnom shemom kompresije talasa zasnovanom na rezivanju grana. Treba, međutim, napomenuti da je "veza" pristupa u hibridnom algoritmu napravljena na jednostavan način, a mogućnosti daljeg razvoja ovdje ostavljaju široko polje za istraživanje.

Šesto poglavlje posvećeno je proučavanju algoritama dinamičke kompresije slike u cilju konstruisanja šeme video kompresije pogodne za implementaciju softvera u realnom vremenu na bazi personalnih računara.

Okvir video sekvence je matrica piksela iz Mi redova i M2 kolona: B=(bkj), A:=0.1,.,MG1, /=0.1,.,M2-1, a pod pojmom video sekvenca podrazumijevamo uređeni skup okvira B0 ,!*jedan,. ,Vg,. Nazovimo (y, x)-blok okvira B (y, x-cijelobrojne koordinate) neku podmatricu BytX=(bkii), gdje je k=y,y+\,.y+Ni-\, 1=x>x+ \,.y+nrA. U razvijenom algoritmu, svaki okvir video sekvence se tokom obrade deli na susedne matrične blokove (BWjn) veličine 8x8, m,n=0.8.16. Ako je bilo koji blok video sekvence u određenom smislu "sličan" originalnom bloku B"m, smatramo da je blok B1m>n pomjereni fragment B^J prethodnog okvira, te da se kodira (m, n) blok slike, dovoljno je navesti koordinatni blok u prethodnom okviru, y njih ili promjene u koordinatama y-t i x-n. Poseban slučaj premještenog bloka je fiksni blok, kada je t = y, l \u003d x kao novo. Ovu ideologiju prate moderni međunarodni standardi video kompresije MPEG, H.261-H263, a svi su također bazirani na korištenju DCT-a za kodiranje novih blokova.

Razvoj novog algoritma video kompresije izveden je kao dio općeg pristupa RD-optimizaciji kompresije s gubicima. U razvijenom algoritmu, za odabir metode kodiranja za sljedeći obrađeni blok B1m p, vodimo se kriterijem za minimum Lagrangeove funkcije za blok: J(b)-D(b)+?iR(b) . Pretpostavimo da argument b=0 odgovara kodiranju pomjerenog (fiksnog) bloka, a ¿=1 novom. Tada ako je J(l)>/(0), tada je blok kodiran kao pomjeren, a kao nov - inače.

Kada se koristi RD-optimizacija, problem pronalaženja pomaknutih blokova je formuliran na sljedeći način. Za dati (m, n)-blok B1m n-tog okvira, pronaći u prethodnom rekonstruisanom okviru takav (y, x)-blok l., tako da Lagrangeova RD-funkcija uzima minimalnu vrijednost

(0.10) tt,v)e£2 i " "

V -V t, p y, x

Ovdje se uzima u obzir da će koordinate pronađenog bloka biti kodirane kao relativne, tj. vektor pomaka r = (y-m, x-n).) Garantuje se da se minimum (0.10) pronađe samo uz kompletno nabrajanje elemenata (u, y) e £ 1, a da bi se algoritam pretraživanja implementirao u realnu vrijeme, samo tačke (y, u) koje su dovoljno blizu tački (m, n) moraju se smatrati područjem O. Povećanje efikasnosti pretraživanja proširenjem regiona C2 postiže se korišćenjem različitih algoritama usmerenog pretraživanja orijentisanih na minimiziranje greške reprezentacije pomerenog bloka | | u "ra>n, što odgovara konkretnom slučaju (0.11) sa R ​​= 0. Usmereno algoritmi pretraživanja približno pronalaze minimum (0,11), međutim, zbog značajnog proširenja područja pretraživanja, obično je moguće pronaći veći broj pomjerenih blokova, sa složenošću sličnom punom nabrajanju.

U šestom poglavlju predlaže se novi algoritam usmjerene pretrage za pomjereni blok, koji je fokusiran na približno rješenje problema (0.10) već za proizvoljnu vrijednost X. Posebnost predloženog algoritma je da mali pomaci slike blokovi se traže preciznije, jer treba strogo pratiti zbog specifičnosti vizuelne percepcije. Da bi se povećala efikasnost algoritma pretraživanja dobijenog u Poglavlju 6 za vektor pomaka (A, AX) obrađenog bloka, treba izgraditi prognozu na vektorima pomaka (d^A^) i (d * D) već dva obrađene "susjede" (respektivno, vertikalni susjed i susjed horizontalno). Sama prognoza je relativne koordinate (y0, * 0), koje određuju prijenos središta područja pretraživanja: od tačke (t, p) do tačke (w, p) \u003d (t + y0, p + x °). Eksperimentalno je potvrđeno da se broj novih blokova slike smanjuje za 5,25% ako se usvoji sljedeće pravilo predviđanja:

0,0), oba susjedna bloka su nova

D^D^), horizontalno - novo, vertikalno - pomaknuto (Anu, Akh), horizontalno - pomaknuto, vertikalno - novo ((d;, SPIRIT)+(DA, DAH),)/2, oba susjeda - pomjereni blokovi

Prateći ideologiju MPEG standarda, u razvijenoj šemi kompresije, obrada novih blokova se takođe vrši pomoću kvantizacije, nakon čega sledi statističko kodiranje dvodimenzionalnih DCT koeficijenata. Rezultat DCT bloka Ovdje> i označimo S, S=F(BW>„). Označimo i: Se=fe;/=round(5M/^i;))^=0, Q = qD/=0 - jedna od JPEG matrica kvantizacije. Za statističko kodiranje matrice S koristi se algoritam kontekstnog kodiranja predložen u poglavlju 4, u kojem je uvedena dodatna faza optimizacije RD. Neka je ZQ =(z0,.,z63)

Vektor dobijen kao rezultat cik-cak čitanja podataka iz SQ matrice prema pravilu definisanom JPEG standardom (S0<->ZQ). RDOptimizacija statističkog kodiranja je moguća zbog produženja nulte serije komponenti u vektoru ZQ njihovim dodatnim nuliranjem. Kako bi se izbjegla primjetna komplikacija kodnog algoritma kao rezultat, u optimiziranoj verziji kontekstualnog algoritma kodiranja za DCT koeficijente analizira se samo mogućnost povećanja konačne nulte serije, što daje najveći doprinos dodatnoj minimizaciji funkcija J(Zq)=D(Zq)+ÀR(Zq). U ovom slučaju se pretpostavlja da je data matrica Q koja određuje kvantizaciju DCT koeficijenata. Univerzalni algoritam kodiranja mora raditi sa određenim skupom matrica kvantizacije (Q/), sa mogućnošću odabira potrebne matrice za specifične zahtjeve kvaliteta i nivoa kompresije. Ako je skup matrica dovoljno velik, tada se odabir matrice kvantizacije Q prema minimalnom principu funkcije J(Zq) pretvara u glomazan postupak koji se ne može implementirati u realnom vremenu standardnim sredstvima. Osim toga, s velikim rasponom mogućih vrijednosti indeksa j, njegovo kodiranje za svaki novi blok posebno povlači neprihvatljivo visoke dodatne troškove bita. Stoga je samo nekoliko matrica iz skupa koje preporučuje JPEG odabrano kao početni skup, koje odgovaraju najboljem, najgorem i nekim srednjim nivoima kvaliteta. U eksperimentima je korišten broj matrica |(Q/)|=4. Da bi se ubrzalo izvođenje operacija dijeljenja, koje su neophodne za kvantizaciju, elementi matrice (Q,) su zaokruženi na najbližu vrijednost 2k, k=G,\,. Ovaj pristup omogućava zamjenu operacija cjelobrojnog dijeljenja i množenja pomacima bitova binarnog prikaza brojeva, koje se obično mnogo brže izvode realnim hardverom.

Pored upotrebe algoritma za kodiranje DCT konteksta (iz poglavlja 4), Poglavlje 6 predlaže alternativni algoritam entropijskog kodiranja u kojem se kvantizirani DCT spektri dijele na fiksne regije koje formiraju zasebne (nezavisne) tokove podataka za aritmetičko kodiranje i eksperimentalnu tehniku za konstruisanje particije predlaže se spektri za takve regije. Unatoč činjenici da je u općoj šemi video kompresije izbor napravljen u korist prvog algoritma kodiranja spektra, korištenje aritmetičkog kodiranja s fiksnom podjelom spektra na regije nezavisnog kodiranja može biti poželjnije kada se koriste drugi (osim DCT) ) transformacije, kao i u šemama kompresije. , korištenjem vektorske kvantizacije spektra. Na primjer, u krugu o kojem se raspravlja u poglavlju 4. (Upotreba vektorske kvantizacije u algoritmima u realnom vremenu je teška.)

Prilikom proučavanja karakteristika konačnog algoritma video kompresije, za procjenu veličine greške kodiranja u rekonstruiranoj sekvenci V0,V1,.,VL:~1, korišten je vršni odnos signal-šum, koji je određen na sljedeći način :

PSNR = 101 g ¿III

dB], pri čemu Mi i M2 postavljaju veličinu kadra u pikselima. Za eksperimente su odabrane poznate testne sekvence News, Container ship, Hall monitor, Akiyo, Claire. Rezultati numeričkih eksperimenata koje je dobio diplomirani student F.V. Strelkov pokazali su da u svim testovima predložena šema kompresije daje dobre rezultate, nadmašujući karakteristike MPEG-2 enkodera koji je razvila grupa MSSG (mpeg2encode, verzija 1.1, vidi http://www. .mpeg .org/MSSG). Softverska kompresija video sekvenci se vrši u realnom vremenu.

Rezultati istraživanja provedenog u radu disertacije sumirani su u završnom dijelu - "Glavni zaključci i zaključci".

Za odbranu disertacije podnose se sljedeći glavni rezultati:

Metoda za procjenu efikasnosti dekoreliranja ortogonalnih transformacija i algoritmi za grupisanje koreliranih podataka na osnovu nje;

DPKP i brzi algoritam za njegovo izračunavanje;

Novi brzi DPCL algoritam i njegova modifikacija - algoritam sa nekompletnim proračunom; Algoritam kombinovanih proračuna DPCL za obradu realnih nizova u bazi (1,exp(-2to/3));

Metoda kompresije slike zasnovana na specijalnoj metodi za aritmetičko kodiranje DPCL spektra blokova slike;

Determinističke i probabilističke procjene DCT koeficijenata;

Algoritam za kontekstualno kodiranje DCT spektra slika;

Opća shema kompresije slike zasnovana na adaptivnoj vektorskoj kvantizaciji u području ortogonalnih transformacija;

Algoritmi kompresije talasa za statične slike;

Algoritam za traženje pomaknutih blokova slike;

Eksperimentalna tehnika za konstruisanje podele spektra u oblasti nezavisnog kodiranja;

algoritam video kompresije.

Glavni rezultati predstavljeni u disertaciji objavljeni su u 30 radova. Sve teorijske rezultate prikazane u radu od 11 koautorskih radova autor je lično dobio. U slučajevima kada su date eksperimentalne numeričke podatke (tabele, grafikone) iz zajedničkih radova dobili koautori, to je jasno naznačeno u toku izlaganja prilikom citiranja rezultata.

Algoritam video kompresije predložen u šestom poglavlju implementiran je u softver kao dio rada koji se obavlja u Državnoj ustanovi NPK „Tehnološki centar“ Moskovskog državnog instituta za elektronsku tehnologiju i u Istraživačko-proizvodnom preduzeću „Tehnologija“. Implementacija razvijenih biblioteka video kompresije izvedena je u nizu softverskih sistema koji obrađuju video slike (uključujući i kodiranje) u realnom vremenu, među kojima je od najvećeg praktičnog interesa Visual Security sistem video nadzora i snimanja (vidi http:/ /www.tcen.ru /vs). Kopije dokumenata o korištenju i implementaciji rezultata rada na disertaciji dostupne su u Dodatku 6.

Zaključak disertacije na temu "Matematička i softverska podrška za računare, komplekse i računarske mreže", Umnyashkin, Sergej Vladimirovič

ZAKLJUČCI I ZAKLJUČCI

U predstavljenom radu disertacije istražuju se različiti aspekti primjene diskretnih ortogonalnih transformacija za kompresiju digitalne slike, kako sa strane čisto formalne teorijske analize, tako i sa strane zahtjeva i ograničenja koja praksa nameće konkretnim računskim shemama i algoritmi. Općenito, sadržaj rada je primijenjen, pa je većina teorijskih rezultata potkrijepljena računskim eksperimentima, čiji rezultati, pak, nisu samo služili kao ilustracija ili test teorije, već su često davali poticaj i bili izvorni materijal za dalja istraživanja.

Na osnovu rezultata istraživanja provedenog u radu disertacije, mogu se izvesti sljedeći zaključci.

1. Ortogonalne transformacije su glavni alat koji se koristi za dekorelaciju podataka tokom kompresije slike. U slučaju kada je matematički model diskretnog signala specificiran kovarijansnom matricom, preporučljivo je koristiti prosječni kriterij viška entropije koji je predložen u radu za analizu efikasnosti dekorelirajuće obrade.

2. Specifično za kompresiju koreliranih podataka, dobijena je i po prvi put uvedena diskretna pseudokosinusna transformacija (DtSP). U šemi kompresije, koja pretpostavlja prisustvo faze skalarne kvantizacije koeficijenata transformacije, među razmatranim brzim transformacijama, čija se implementacija svodi samo na operacije sabiranja-oduzimanja (Walsh, Haar, pseudo-kosinus), DPCT daje najbolji rezultati dekorelacije za diskretni signal opisan Markovljevim modelom.

3. Koristeći dobijene brze DPCL algoritame koji uzimaju u obzir specifičnosti obrade realnih nizova, predložena šema kompresije slike zasnovana na aritmetičkom kodiranju DPCL koeficijenata postiže karakteristike koje su bliske JPEG varijanti zasnovanoj na DCT po kvalitetu obrade i složenost računanja.

4. Kada se koristi statističko kodiranje DCT koeficijenata prema JPEG metodi, prisustvo "skokova" diskretnog signala je najmanje poželjno u centralnom području fragmenata obrade.

5. Metoda multimodelnog (multi-stream) aritmetičkog kodiranja ima visoku efikasnost primjene u različitim šemama i algoritmima kompresije podataka, a jedna od ključnih tačaka u razvoju šema kompresije je definisanje pravila za izbor trenutni model kodiranja u kontekstu već obrađenih podataka. Dakle, upotreba algoritma višemodelnog kontekstualnog aritmetičkog kodiranja DCT koeficijenata predloženog u poglavlju 4 u JPEG šemi povećava efikasnost kompresije podataka za 10%.

6. Prilikom komprimiranja slika korištenjem multimodelskog kodiranja struktura stabla talasnih spektra, pravilo odabira modela treba izgraditi prema kombinovanom kontekstu, koji uzima u obzir i okruženje samog talasnog koeficijenta u podopsiju i okruženje talasnog spektra. “roditeljski” koeficijent. Novi efikasni algoritam kompresije digitalne slike sa gubitkom dobijen na ovoj osnovi, koji je razvijen na osnovu rezultata proučavanja statističkih svojstava spektra diskretnih talasnih transformacija, pokazuje visoke karakteristike kompresije sa složenošću implementacije prihvatljivom za širok spektar primena.

7. Da bi se eliminirala međuokvirna (vremenska) redundantnost video podataka, predloženi hibridni algoritam usmjerene pretrage, u kojem se mali pomaci traže precizno i ​​temeljito, a značajni pomaci grublje, treba prepoznati kao najpoželjniji za praktičnu upotrebu među proučavani algoritmi za kompenzaciju pomaka bloka.

8. Korišćenjem predloženog algoritma video kompresije, koji je razvijen na osnovu pristupa RD-optimizacije, uzimajući u obzir zahtjeve i specifičnosti softverske implementacije, ostvaruje se kompresija i restauracija videa u realnom vremenu na bazi savremenih personalnih računara. , sa visokim kvalitetom obrade.

Rezultati sprovedenog istraživanja ogledaju se u 30 publikacija, o kojima se izveštava i raspravlja na mnogim sveruskim i međunarodnim konferencijama. Generalno, u radu disertacije dobijeni su novi naučni rezultati, čije su teorijske odredbe omogućile da se u velikoj meri razviju i formalizuju postupci za analizu i sintezu šema kompresije digitalne slike zasnovane na upotrebi diskretnih ortogonalnih transformacija.

Razvijeni pristupi i preporuke doveli su do izgradnje specifičnih šema i algoritama kompresije, od kojih su mnogi implementirani u softver i eksperimentalno potvrdili efikasnost njihove primjene. Rezultati istraživanja kompresije videa, koji su sprovedeni u okviru istraživanja koje je vodio autor, a finansirano od strane Ministarstva nauke i industrije Ruske Federacije, implementirani su u obliku algoritama u hardversko-softverskom sistemu Visual Security ( vidi Dodatak br. 6).

Spisak referenci za istraživanje disertacije Doktor fizičkih i matematičkih nauka Umnjaškin, Sergej Vladimirovič, 2001.

1. Apstraktni algebarski sistemi i digitalna obrada signala / Varičenko L.V., Labunets V.G., Rakov M.A. Kijev: Naukova dumka, 1986. -248 str.

2. Aleksejev A.G. Grupiranje koreliranog skupa podataka // "Mikroelektronika i informatika 99". VI sveruski međuuniverzitetski n.-t. konf. Art. i asp.: Tez. doc. - M.: MIET, 1999. - Str. 133.

3. Ahmed N., Pao K. Ortogonalne transformacije u digitalnoj obradi signala: Per. sa engleskog. M.: Komunikacija, 1980. - 248 str.

4. Vatolin D.S. Hibridna shema fraktalne kompresije i vektorske kvantizacije za male blokove // ​​Zbornik radova međunarodne konferencije Graphicon-98. Moskva, 1998, str. 205-212.

5. Vilenkin N. Ya. O jednoj klasi potpunih ortogonalnih sustava // Izv. Akademija nauka SSSR-a. Ser. mat. 1947. - T.P. - S. 363-400.

6. Vorobyov V.I., Gribunin V.G. Teorija i praksa talasne transformacije. -S.-Pb.: Vojnoizdavačka kuća. Univerzitet komunikacija, 1999. 204 str.

7. M. V. Gašnjikov, N. K. Glumov i V. V. Sergeev, “Informaciona tehnologija za kompresiju slike u operativnim sistemima daljinske detekcije”, Izv. 1999. - br. 1. - S. 99-107.

8. Gold B., Reider C. Digitalna obrada signala: TRANS. sa engleskog. M.: Sov. radio, 1973. - 368 str.

9. B. I. Goluboe, A. V. Efimov i V. A. Skvortsov, Walshove serije i transformacije: teorija i primjene. M.: Nauka, 1987. - 344 str.

10. Gorlov S.K., Korystin A.V., Rodin V.A. O jednoj implementaciji metode kompresije mapiranja korištenjem nelinearne aproksimacije Fourier-Haarovih suma// Teor. funkcije i cca.: Tr. 7. Saratov, zima. škola (1994). Dio 2. Saratov: Izdavačka kuća SSU, 1995.

11. Dmitriev V.I. Primijenjena teorija informacija: Proc. za stud. univerziteti. -M.: Više. škola, 1989. 320 str.

12. Efimov A.V., Pospelov A.S., Umnyashkin C.V. Neka svojstva multiplikativnih ortonormalnih sistema koji se koriste u digitalnoj obradi signala // Zbornik radova Matematičkog instituta. V.A.Steklov RAS. T.219. - 1997. - C 137-182.

13. Efimov A.V., Umnyashkin C.V. Brzi algoritmi za izračunavanje diskretne Chrestenson-Levy transformacije i procjenu njenih spektralnih. karakteristike// Teor. funkcije i cca.: Tr. 7. Saratov, zima. škola (1994). Dio 2. - Saratov: Izdavačka kuća SSU, 1995. S. 9-20.

14. Žukov V.G. Istraživanje metoda za poređenje dislociranih blokova slike u algoritmima kompresije video sekvence. //Mikroelektronika i informatika-99. Vseros. međuuniverzitetski n.-t. konf. studenti i postdiplomci: Sažeci izvještaja. M.: MYET, 1999. - S. 137.

15. Žukov DM. Ekvivalencija jednodimenzionalne i dvodimenzionalne Chrestenson-Levyjeve transformacije // Metode obrade digitalne slike: Sat. naučnim tr. MIET. M.: MIET, 1982 - S. 65-70.

16. Zadiraka V.K., Evtušenko V.N. Metoda optimalnog zonskog kodiranja korištenjem Kose transformacije // Kibernetika i analiza sistema. 1994. - br. 4. - Sa. 56-60.

17. Istraživanje i razvoj softverskih algoritama kompresije podataka sa gubicima za digitalnu video obradu: Izveštaj o istraživanju (konačni) / HI 111 "Tehnologija"; ruke -Umnyashkin C.B. "Gledajte"; br država. per. 01200004624; Inv. br. 100704. - Moskva, 2000. - 48 str.

18. Kendal M. Korelacije ranga. M.: Statistika, 1975. - 216 str.

19. Kovalenko KN., Filippova A.A. Teorija vjerojatnosti i matematička statistika. M.: Više. škola, 1982. - 256 str.

20. Korn G., Korn T. Priručnik iz matematike za naučnike i inženjere: Per. sa engleskog. M.: Nauka, 1970. - 720 str.

21. Kochetkov M.E. Kompresija digitalne slike korištenjem vektorske kvantizacije u domeni diskretnih ortogonalnih transformacija: Diss. cand. tech. nauke. M., 1999. -191 str.

22. Kochetkov M.E., Umnyashkin C.V. Višenitna implementacija algoritma aritmetičkog kodiranja / M.: MGIET (TU), 1998. 21 str. Deponovano u VINITI 25. decembra 1998. br. 3884-B98.

23. Kochetkov M.E., Umnyashkin C.V. O poređenju kriterijuma za procenu efektivnosti dekorelacionih transformacija / M.: MGIET (TU), 1998. 34 str. - Dep. u VINITI 13.04.98, br. 1069-B98.

24. Lesin V.V., Lisovets Yu.P. Osnove metoda optimizacije: Proc. dodatak. - M.: Izdavačka kuća MAI, 1998. 344 str.

25. Lisovets Yu.P., Pospelov AS Multiplikativne holografske transformacije za obradu slike // Metode digitalne obrade slike: Sat. naučnim tr. M.: MIET, 1982 - S. 100-109.

26. Litosh I.P. Kombinacija algoritama za fraktalnu i talasnu kompresiju digitalnih slika // "Mikroelektronika i informatika -2001". U1P sve-ruski međuuniverzitetski n.-t. konf. Art. i asp.: Tez. doc. - M.: MIET, 2001. - Str. 147.

27. Markov A.A. Kompresija digitalnih slika pomoću \vavelet-transformacija // "Mikroelektronika i informatika 2000". VII Sveruski međuuniverzitetski n.-t. konf. Art. i asp.: Tez. doc. -M.: MIET, 2000. -S. 114.

28. Wise A.E. Numeričke metode za PC u BASIC-u, Fortranu i Pascalu. - Tomsk: MP "RASKO", 1991. -272 str.

29. I. Ya. Novikov i S. B. Stechkin, “Osnovne konstrukcije talasa,” Fundamental and Applied Mathematics. 1997. - Sveska 3. - Br. 4. -str.999-1028.

30. Nussbaumer G. Brza Fourierova transformacija i algoritmi za izračunavanje konvolucija: Per. sa engleskog. M.: Radio i komunikacija, 1985. - 248 str.

31. Peev E., Boyanov K, Belcheva O. Metode i alati za kompresiju slike // Automatizacija i informatika.-1994.-28, br. 3.-str.3-14.

32. Petukhov A.P. Uvod u teoriju talasnih baza. Sankt Peterburg: Izdavačka kuća St. Petersburg State Technical University, 1999. 132 str.

33. Pospelov A. S. Metode za obradu digitalnih video informacija pomoću transformacija holografskog tipa // Sat. tr. intl. sastanak od strane programera. i mat. metode rješavanja fizičkih. problemi (Dubna, 14-19. jun 1993.). Komunikacija OINIR11-94-100. - C, 71-73.

34. Pospelov A. S. Neki matematički problemi i algoritmi za digitalnu obradu informacija korištenjem diskretnih transformacija: Diss. za takmičenje uch. korak, dr fiz.-mate. nauke. M., 1992. -398 str.

35. Primjena digitalne obrade signala: Per. sa engleskog. / Ed. E. Oppenheim. M: Mir, 1980. - 552 str.

36. Pratt W. Digitalna obrada slike: TRANS. sa engleskog. M.: Mir, 1982. - Knjige 1 i 2. - 312 i 480 str.

37. Pratt W, Cash D., Andrews X. Kodiranje slike korištenjem Adamardove transformacije // TIER. 1969. - T.57. - br. 1. - S. 66-77.

38. Ptachek M. Digitalna televizija. Teorija i tehnologija / Per. iz Čeha, ur. L.S. Vilenchika. M.: Radio i komunikacija, 1990. -528 str.

39. Rozanov Yu.A. slučajni procesi. M.: Nauka, 1971. - 288 str.

40. Sveshnikov A.A. Primijenjene metode teorije slučajnih funkcija. M. : Nauka, 1968.-463 str.

41. Trakhtman V.A. Spektralna analiza u osnovi Vilenkin-Chrestensonovih funkcija//Radiotehnika i elektronika. -1975. -T. 20.-#1. -str.130-138.

42. Trakhtman A.M., Trakhtman V.A. Osnove teorije diskretnih signala na konačnim intervalima. M.: Sov. Radio, 1975.

43. Umnyashkin C.B. Algoritam za grupisanje koreliranih podataka // VII Međunarodna konferencija. Matematika. Ekonomija. Ekologija.

44. Obrazovanje. Međunarodni simpozijum. Fourierovi redovi i njihove primjene: sažeci. Rostov: Rost. stanje ekonomije, akad., 1999. - S. 211-212.

45. Umnyashkin C.B. Algoritam za traženje pomjerenih blokova za kodiranje digitalnih video slika. 38-41.

46. ​​Umnyashkin S. V. Algoritam za kodiranje fraktalnih slika u domeni talasnih transformacija // Računalna matematika. Optazzaschya calculus: Zbornik naučnih radova. Volume 1. - Kshv: 1Institut of schbzrnetics ím. V.M. Glushkova, 2001. - S. 385-391.

47. Umnyashkin C.B. Brzi algoritmi za izračunavanje diskretne multiplikativne transformacije / M.: MGIET (TU), 1995. 15 str. - Dep. u VINITI 16.02.95, br. 442-B95.

48. Umnyashkin C.B. Brzi algoritam za izračunavanje diskretne Chrestenson-Levy transformacije za obradu realnih nizova / M.: MGIET (TU), 1995. 19 str. - Dep. u VINITI 05.12.95, br. 3212-B95.

49. Umnyashkin S. V. Upotreba kontekstualnog aritmetičkog kodiranja za povećanje kompresije podataka prema JPECj šemi. Izvestiya vuzov. Elektronika. Broj 3. - 2001. - S. 96-98.

50. Umnyashkin C.B. Kompenzacija kretanja objekata pri kompresiji video podataka // "Elektronika i informatika XXI vek" Treći međunarodni naučno-tehnički skup: Zbornik radova. doc. - M.: MIET, 2000.-S. 365-366.

51. Umnyashkin S. V. Wavelet kompresija digitalnih slika sa predviđanjem statističkih modela. Izvestiya vuzov. Elektronika. br. 5. - 2001. - S.86-94.

52. Umnyashkin C.B. Metoda kodiranja diskretne slike zasnovana na Chrestenson-Levy transformaciji // Mikroelektronika i informatika -96: Zbornik radova. izvještaj međuuniverzitetski sci.-tech. konf. M.: MGIET (TU), 1996. - Str.167.

53. Umnyashkin C.B. O grupisanju koreliranih podataka. // Informacijske tehnologije u inovativnim projektima. Međunarodna konferencija (Iževsk, 20-22. april 1999.): Materijali izvještaja. -Izhevsk, IzhGTU, 1999. S. 59-65.

54. Umnyashkin C.B. O kvantizaciji elemenata spektra diskretne Chrestenson-Levyjeve transformacije / M.: MGIET (TU), 1995. 12 str. - Dep. u VINITI 16.02.95, br. 441-B95.

55. Umnyashkin C.B. O modifikaciji diskretne kosinusne transformacije // Teorija aproksimacije i harmonijska analiza: Proc. izvještaj intl. konf. (Tula, 26-29. maj 1998). Tula: TulGU, 1998. - S.264-265.

56. Umnyashkin C.B. O modifikaciji diskretne kosinusne transformacije // Izv. Tul. stanje univerzitet Ser. Matematika. Mehanika. Informatika. Tula: TulGU, 1998. T. 4. Br. 1. S. 143-147.

57. Umnyashkin C.B. O procjeni dekorelacijskih svojstava diskretnih transformacija // Mikroelektronika i informatika 97: Sažeci izvještaja. međuuniverzitetsku naučno-tehničku konferenciju. Dio 2. - M. MGIET (TU), 1997.-S. 110:

58. Umnyashkin C.B. Osobitosti upotrebe diskretne Chrestenson-Levyjeve transformacije u obradi realnih nizova // Mikroelektronika i informatika: Zbornik radova. izvještaj međuuniverzitetski sci.-tech. konf. 1214 apr. 1995. M.: MGIET (TU), 1995. - S. 188-189.

59. Umnyashkin C.B. Procjena učinkovitosti korištenja unitarnih transformacija za kodiranje diskretnih signala // Informatika i komunikacije: Sat. naučnim tr. ed. V.A. Barkhotkina. M.: MIET.- 1997. S.73-78.

60. Umnyashkin C.B. Primjena diskretne Chrestenson-Levy transformacije u digitalnoj obradi slike. Dis. cand. tech. nauke. - Moskva, 1997. - 198 str.

61. Umnyashkin C.B. Pseudokosinusna transformacija za kompresiju diskretnih signala // Informacijske tehnologije i problemi mikroelektronike. Sat. naučnim tr. -M.: MIET. -1999. str.158-170.

62. Umnyashkin SV Shema RD-optimizirane kompresije za obradu video podataka u realnom vremenu // Prihvaćeno za objavljivanje u časopisu Izvestiya vuzov. Elektronika". br. 6. - 2001.

63. Umnyashkin C.B. Kompresija digitalne slike pomoću diskretne Chrestenson-Levyjeve transformacije // Međubranski naučni i tehnički časopis "Odbrambeni kompleks - do naučnog i tehničkog napretka Rusije", br. 2, 2000. str.28-39.

64. Umnyashkin C.V., Kosmach M.V. Optimizacija kodiranja digitalne slike JPEG metodom // Izvestiya vuzov. Elektronika. br. 4-5. -2000. - S. 139-141.

65. Umnyashkin C.V., Kochetkov M.E. Analiza efikasnosti korišćenja diskretnih ortogonalnih transformacija za digitalno kodiranje koreliranih podataka // Izvestiya vuzov. Elektronika. br. 6. - 1998. - S. 79-84.

66. Umnyashkin C.V., Strelkov F.V., Zhukov V.G. Algoritmi pretraživanja u tri koraka za pomaknute blokove slike // Informacijske tehnologije i sustavi upravljanja. Sat. naučnim tr. ed. V. A. Barkhotkina.- M: MIET, 2000. S. 47-55.

67. Harmut X. Teorija analize sekvence. Osnove i primjena: Per. sa engleskog - M.: Mir, 1980. 574 str.

68. Digitalna obrada televizijskih i kompjuterskih slika / Ed. Yu.B.Zubarev i V.PDvorkovich. M.: Međunarodni centar za naučne i tehničke informacije, 1997. - 212 str.

69. Chen Sh.-K. Principi projektovanja vizuelnih informacionih sistema. -M.: Mir, 1994. 408 str.

70. Andrews G. Upotreba računara za obradu slika / Per. sa engleskog. ed. B.F. Kurjanova. M.: Energija. - 1977. -161 str.

71. Yavorsky B.M., Detlaf A.A. Priručnik iz fizike za inženjere i studente.-Izdanje 7. ispravljeno.-M.: Nauka, 1977.-944 str.

72. Yaroslavsky JI.II. Uvod u digitalnu obradu slike. M.: Sov. radio, 1979.-312 str.

73. Yaroslavsky L.P. Digitalna obrada signala u optici i holografiji. Uvod u digitalnu optiku. M.: Radio i komunikacija. - 1987. -296 str.

74. Ahmed N., Natarajan T., Rao K.R. O obradi slike i diskretnoj kosinusnoj transformaciji // IEEE Trans. kompjuteri. -1974. V. C-23 - br. 1. - P.90-93.

75. Allen J.B. andRabiner L. R. Jedinstveni pristup kratkotrajnoj Fourierovoj analizi, sinteza//Proc. IEEE 1977.-Vol. 65.-br.Iyu-R. 1558-1564.

76. Anderson J.B., Huang T.S. Piecewise Fourierova transformacija za kompresiju propusnog opsega slike // IEEE Trans. komun. -1972.- V. COM-20 br. 3. -P.488-491.

77. Andrews H.C., Hunt B.R. Digital Image Restoration.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 str.

78. Andrews H.C., Pratt W.K. Fourierova transformacija kodiranja slika // Hawaii International Conference on System Science, januar 1968. P. 677-679.

79. Andrews H.C., Pratt W.K. Transformirajte kodiranje slike // Proc. Računalna obrada u komunikacijama. New York: Polytechnic Press, 1969. -P. 63-84.

80. Antonini M., Barlaud M., Mathieu P. i Daubechies I., Kodiranje slike korištenjem wavelet transformacije // IEEE Trans. ImageProc. Vol. 1. - br. 2, 1992. -Str. 205-220.

81. Barnsley F., Jacquin A. Primjena rekurentnih iteriranih funkcijskih sistema na slike//Proc. SPIE.- 1988.-Vol. 1001.-p. 122-131.

82. Berger T. Teorija izobličenja brzine. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Procjena pomaka hijerarhijskim usklađivanjem blokova // Proc. SPIE Conf. Na Visu. komun. I Image Proc. Cambrige, 1988. - P. 942-951.

84. Bilgin A., Sementilli.P. i Marcellin M. Progresivno kodiranje slike pomoću kvantizacije rešetke // IEEE Trans. ImageProc. 1999.-V.8.-№11.-P. 1638-1643.

85. Černov V.M., Dmitrijev A.G. Kompresija slike korišćenjem diskretnih ortogonalnih transformacija sa osnovnim funkcijama poput šuma // Računarska optika. 1999. - Br. 19. - S. 184-187.

86. Cheung S.K., Ro L.M. Hibridni adaptivni algoritam pretraživanja za brzu procjenu kretanja bloka // Proc. IEEE International Symp. na Signal Proc. i njegovu aplikaciju. (avg. 1996.). Vol.1. 1996 - P.365-368.

87Chrestenson H.E. Klasa generaliziranih Walshovih funkcija // Pacifik. J Math. -1955.-V.5.-No.l.-P. 17-32.

88. Chrysafis C. Optimizacija izobličenja stope kompresije slike Wavelet i smanjenje složenosti: doktorska disertacija (elektrotehnička). University of Southern California, Los Angeles, 2000. - 144 str.

89. Chrysafis C., Ortega A. Učinkovito entropijsko kodiranje zasnovano na kontekstu za kompresiju slike talasa s gubicima // Proc. Konferencija o kompresiji podataka. - Snowbird (Utah), 1997. P. 241-250.

90. Cho N., Lee S. Brzi algoritam i implementacija 2-D diskretne kosinusne transformacije, IEEE Trans. kola i sistemi. 1991.-V.38. - P.297-305.

91. ChouP.A., Lookabaugh T., GrayR.M. Entropijski ograničena vektorska kvantizacija 11 IEEE Trans. ASSP. 1989. - Vol. 37.-#1. -P.31-42.

92. Kodiranje pokretnih slika i zvuka (MPEG-4). Standard ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., Feauveau J.-C., Biortogonalne baze kompaktno oslonjenih talasa, Comm. Pure Apple. Math. 1992. - V. 45. - Br. 5. - P. 485560.

94. Coifman R. i Wickerhauser M. V., Entropijski bazirani algoritmi za najbolju osnovnu selekciju, IEEE Trans. teorija informacija. 1992. - Vol. 38. - br. 2 - str. 713718.

95. Cooley J.W., Tukey J.W. Algoritam za strojno računanje složenih Fourierovih redova // Mach. Račun. 1965. - V. 19. - P. 297-301.

96. Cosman P.C., GrayRM., i VetterliM. Vektorska kvantizacija podopseva slike: istraživanje // IEEE Trans. ImageProc. 1996. - V. 5. - Br. 5. - P. 202225.

97. Costantini R. et al. Video koder niske složenosti zasnovan na diskretnoj Walsh Hadamard transformaciji //Proc. Evropska konferencija o obradi signala 2000. (Tampere, Finska, 5.-8. septembar). -2000. -P.1217-1221.

98. Crouse M. i Ramchandran K. Zajedničko postavljanje praga i odabir kvantizatora za transformacijsko kodiranje slike: analiza ograničena entropijom i primjene na osnovni JPEG // IEEE Trans, on Image Processing. 1997. - Vol. 6. -№2 - P. 285-297.

99. Davis G.M., Analiza fraktalne kompresije slike zasnovana na talasima, IEEE Trans. ImageProc. 1998. - V.7-№2. -P.141-154.

100. Davis G., Nosratinia A. Kodiranje slike zasnovano na talasima: Pregled // Primijenjena i računalna kontrola, signali i kola. -1998. -V.l. -#1. -P. 205269.

101. Deever A. i Hemami S. Koji je vaš znak?: Efikasno kodiranje znakova za ugrađeno kodiranje talasne slike 11 Proc. of Data Compression Conference, 2000.-P.273-282.

102. Duhamel P., Guillemont C. Izračunavanje polinomske transformacije 2-D DCT-a, Proc. ASSP "90. 1990. - P.1515-1518.

103. EfimovA. V. Multiplikativni funkcijski sustavi i njihove primjene u obradi diskretnih informacija // Aproksimacija i funkcionalni prostori/ Publikacije Banachovog centra (Varšava). 1989. - V.22. - P. 111-117.

104. Eflmov V.M., Kolesnikov A.N. Kompresija slike s preliminarnom interpolacijom signala // Prepoznavanje uzoraka i analiza slike. 1996. - Vol. 6. - br. 1.

105. Eliott D.F., Rao K.R. Brze transformacije: algoritmi, analize, aplikacije. - London: Academic Press inc., 1982. 488 str.

106. Enomoto II, Shibata K. Ortogonalni transformacijski sistem kodiranja za televizijske signale, IEEE Trans. Elektromagnetna kompatibilnost. 1971. - Posebno izdanje o Walshovim funkcijama. -V. EMC-13. - Broj 3. - str. 11-17.

107. Feig E. Brzo skalirani DCT algoritam, Proc. SPIE Int. soc. Opt. inž. 1990.-Vol. 1244.-p. 2-13.

108. Fischer T.R. i WangM. Entropijski ograničena kodirana kvantizacija//IEEE Trans. inf. teorija. 1992. - Vol. 38 - br. 2 - str. 415-426.

109. Fisher Y. Fraktalna kompresija: teorija i primjena na digitalne slike. -New York: Spinger Verlag, 1994. 341 str.

110. Good J. Interakcioni algoritam i praktična Fourierova analiza // J. Royal Stat. soc. (London). 1958.-V.B-20. - P. 361-372.

111. Grey R.M. Vektorska kvantizacija //IEEE ASSP Magazine. -Apr. 1984.-P.4-29

112. Grey R, Neuhoff D. Kvantizacija //IEEE Trans. inf. teorija. okt. 1998. - Vol. 44.-No. 6.-P. 2325-2383.

113. HabibiA., WintzP.A. Kodiranje slike linearnom transformacijom i blok kvantizacijom//IEEE Trans. Comm. Tech. -1971. -V. COM-19. br. 1. -P.50-63.

114. Hamidi M., Pearl J. Poređenje kosinusnih i Fourierovih transformacija Markov-I signala 11 IEEE Trans. ASSP. V.24. - 1976. - P.428-429.

115. Hauque M.A. Dvodimenzionalna brza kosinusna transformacija // IEEE Trans. ASSP. -1985. V. 33. - br. 6. - P.1532-1538.

116. Huang J. Y., Schultheiss. Blok kvantizacija koreliranih Gausovih slučajnih varijabli// IEEE Trans. Komunikacije. -1963. -V. CS-11(sept.)-P. 289296.

117. Informaciona tehnologija Generičko kodiranje pokretnih slika i povezanih audio informacija: Video. //Preporuka ITU-T H.262. - Standard ISO/IEC 13818-2-2000.

118. ISO/IEC JTC1 komitet Nacrt 10918-1. Digitalna kompresija i kodiranje neprekidnih fotografija. Dio 1. Zahtjevi i smjernice. -1991.

119. ISO/IEC JTC1 komitet Nacrt 10918-2. Digitalna kompresija i kodiranje neprekidnih fotografija. Dio 2. Ispitivanje usklađenosti. 1991.

120. Jacquin A. Fraktalno kodiranje slike zasnovano na teoriji iteriranih kontraktivnih transformacija slike // Proc. SPIE Visual Comm. I Image Proc. 1990. - P.227-239.

121. Jacquin A. Kodiranje slike zasnovano na fraktalnoj teoriji iteriranih kontraktivnih transformacija slike // IEEE Trans. ImageProc. 1992. - Vol.1. - br. 1. -P. 18-30.

122. Jafarkhani H., Farvardin N. i Lee C.-C., Adaptivno kodiranje slike zasnovano na diskretnoj talasnoj transformaciji 11 Proc. IEEE Int. Konf. ImageProc. Vol. 3 - Austin (TX), 1994. - P. 343-347.

123. Jain J.R. i Jain A.K. Mjerenje pomaka i njegova primjena u interframe kodiranju slike // IEEE Trans. Comm. 1981. - Vol. 29. - br. 12. -P.1799-1806.

124. JoshiR.L., Fischer T.R. i Bamberger R.H. Optimalna klasifikacija u podpojasnom kodiranju slika // Proc. IEEE Int. Konf. ImageProc. Vol. 2 - Austin (TX), 1994.-Str. 883-887.

125. Joshi R.L. et al., Poređenje različitih metoda klasifikacije u podpojasnom kodiranju slika// IEEE Trans. obrada slike. 1997. - Vol. 6. - Nov. - P. 1473-1486, 1997.

126JPEG2000. Dio 1. Završna komisija Nacrt verzija 1.0. ISO/IEC JTC1/SC29 WG1.-205 str.

127. Kasner J.H., Marcellin M.W. Adaptivno talasno kodiranje slika // Proc. IEEE Int. Konf. ImageProc. Vol. 3 - Austin (TX), 1994. - P. 358-362.

128. Koga T. et al, Interframe kodiranje s kompenziranim pokretom za video konferencije, Proceedings of the National Telecommunications Conference, New Orleans, Louisiana, nov. 29 dec. 3. - 1981. - Vol. 4.-P.G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C. i Smith M.J.T. Video kodiranje podpojasnog podpojasa ograničeno na brzinu izobličenja. // IEEE Transakcije o obradi slika. -1999. -Vol. 8.-№2.-P. 145-154.

130. Kurosaki M., WakiH. LSI za kompresiju/dekompresiju slike u boji kompatibilan sa JPEG // Mitsubishi Elec. Adv. -1994. -V.68, sept. -P.17-18.

131. Levy P. Sur une generalization des fonctions orthogonales de M. Rademacher II Comment, math. helv. 1944. - V.16. - P. 146-152.

132. Lewis A.S., Knowles G. Kompresija slike korištenjem 2-D Wavelet Transform. II IEEE Trans. ImageProc. 1992. - Vol. 1. - br. 2. - P.244-250.

133. Linde Y., Buzo A., Grey R.M. Algoritam za dizajn vektorskog kvantizatora // IEEE Trans. OnComm. - 1980. - V.28. br. 1. - P.8^95.

134. LoPresto S.M., Ramchandran K., OrchardM.T. Kodiranje slike zasnovano na modeliranju mješavine koeficijenata talasa i okvira za brzu procjenu-kvantizaciju // Proc. Konferencija o kompresiji podataka. Snowbird (Utah), 1997. - P. 221-230.

135. Mallat S., Višerezoluciona aproksimacija i talasne ortonormalne baze L2(R), Trans. AMS. 1989. - V.315. -P.69-87.

136. Marcellin M. et al. Pregled JPEG-2000 // Proc. Konferencija o kompresiji podataka, J. A. Storer i M. Cohn, ur. Snowbird, Utah, mar. 28 mar. 30, 2000. Snowbird, 2000. - P. 523-541.

137. MarchallX. Procjena pokreta i kompenzacija za video kodiranje s vrlo malom brzinom u bitovima: aplikacije doktora nauka. Université Catholique de Louvalin. -Louvalin-la-Neuve, 1998. - 228 str.

138. Nasrabadi N.M., Kralj R.A. Kodiranje slike pomoću vektorske kvantizacije: pregled // IEEE Trans, on Communication. 1988. - V. 36. - Br. 8. - P. 957-971.

139. Nelson M., Gailly J A. Knjiga kompresije podataka (drugo izdanje). New York: M&T Books, 1995. - 541 str.

140. Pearl J. O kodiranju i filtriranju stacionarnih signala diskretnim Fourierovim transformacijama // IEEE Trans. inf. teorija. 1973. - Vol. IT-19. - P. 229-232.

141 Pratt W.K., Andrews H.C. Primjena Fourier-Hadamardove transformacije na kompresiju propusnog opsega // Kompresija propusnog opsega slike / Ed.: Huang T.S., Tretiak O.J. New York: Gordong and Breach, 1972. - P. 515-554.

142 Pratt W.K, Chen W.H., Welch L.R. Kodiranje slike nagnute transformacije // IEEE Trans. komun. -1974. -V. COM-22. P.1075-1093.

143. Queluz M.P., Procjena pokreta za video kodiranje: pregled // HF Magazine -decembar 1995. Specijalno izdanje o video kodiranju. - Ne. 4.-pp. 5-28.

144. Ramachandran K, Vetteri M. Najbolje baze talasnih paketa u smislu izobličenja brzine, IEEE Trans. ImageProc. 1993.-V.2. -#2. - str. 160-175.

145. Rao K.R., Narasimhan M.A., Reviduri K. Obrada podataka slike Hadamard-Haar transformacijom // IEEE Trans. kompjuteri. 1975.-V.C-23. - Ne. 9. - P. 888-896.

146. Rao K.R., Yip P. Algoritmi diskretne kosinusne transformacije, prednosti, aplikacije. - London: Academic Press inc., 1990.

147. Roska T., Boros T., Radvânyi A., Thiran P. i ChuaL.O. Detekcija pokretnih i stojećih objekata pomoću Cellular Neural. Mreže // International Journal of Circuit Theory and Applications. Vol. 20. - 1992. - P.613-628.

148. Said A. i Pearlman W.A. Novi brzi i efikasni kodek za slike zasnovan na particionisanju skupa u hijerarhijskim stablima // IEEE Trans, o krugovima i sistemima za video tehnologiju. 1996. - Vol. 6. - №3, jun. - P. 243-250.

149. Shapiro J.M. Kodiranje ugrađene slike koristeći nulta stabla talasnih koeficijenata 11 IEEE Trans. Obrada signala, vol. 41, str. 3445-3462, decembar 1993.

150. Stefanoiu D. Uvod u obradu signala s talasima // Studije o informacijama i kontroli. -1994. V.3. - br. 1. - str. 97-110.

151 Storer J. A. Kompresija podataka: Metode i teorija. Rockville (Md): Computer science press, 1988. - X, 413 str.

152. Umnyashkin S. V. Kompresija slike zasnovana na mješovitom prediktivnom modeliranju stabala talasa // Izvještaji sa Univerziteta Vaxjo (Švedska) Matematika, prirodne nauke i tehnologija. - Ne. 11 (septembar), 2001. - 18 str

153. Umnyashkin S. V., Strelkov F. V. RD-optimizirana shema za video kompresiju u realnom vremenu // Reports from Vaxjo University (Sweden) Matematika, prirodne nauke i tehnologija. - Ne. 12 (septembar), 2001. - 15 str.

154. Van de Walle A., Spajanje fraktalne kompresije slike i metode talasne transformacije 11 Fraktali. 1997. - vol. 5 (Dopunsko izdanje), april. - P.3-15.

155 Vetterly M., Herley C., Wavelets and Filter Banks: Theory and Design, IEEE Trans. SignalProc. 1992. - V.40. - Ne. 9. - P.2207-2232.

156. Video kodek za audiovizuelne usluge pri p x 64 kbit/s. //Preporuka ITU-T H.261. -1993.

157. Video kodiranje za komunikaciju niske brzine prijenosa //Preporuka ITU-T H.263. Standard ISO/IEC 13818-2: 1998.

158. Wallace G.K. JPEG algoritam za standard kompresije slike // Communications of the ACM. 1991.-V.34. -#4. - P. 30-44.356

159. WeiD., PaiH.-T. i BovikA. C., Antisimetrični biortogonalni kofleti za kodiranje slike // Proceedings of IEEE International Conference on Image Processing. Chicago, 1998. - Vol. 2. - P. 282-286.

160. Witten I., Neal R.M., Cleary J.G. Aritmetičko kodiranje za kompresiju podataka // Comm. ACM. 1987. - Vol.30. - br. 6. - P. 520-540.

161. Woods J.W., Huang T.S. Kompresija propusnog opsega slike linearnom transformacijom i kvantizacijom blokova // Kompresija propusnog opsega slike / Ed.: Huang T.S., Tretiak O.J. -New York: Gordong and Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. i OrchardM.T. Kvantizacija prostorne frekvencije za kodiranje slike talasa // IEEE Trans. ImageProc. V.6 - maj 1997., str. 677693.

163. Xiong Z., Ramchandran K., i Orchard M. Wavelet paketi kodiranje slike koristeći prostorno-frekvencijsku kvantizaciju, IEEE Trans. ImageProc. 1998. - Vol. 7.-#6. - P. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. Komparativna studija DCT-a i kodiranja slike zasnovanog na talasima // IEEE Trans. O krugovima i sistemima za video tehnologiju. -1999. V.9 - br. 5. - P.692-695.

165. Zhang Z. i Wei V.K., On-line univerzalni algoritam za kompresiju podataka sa gubitkom putem kontinuiranog preciziranja šifrarnika. Dio I. Osnovni rezultati // IEEE Trans. informisati. teorija. Vol.42. - Maj 1996. - P.803-821.

Imajte na umu da se gore navedeni naučni tekstovi postavljaju na pregled i dobijaju putem prepoznavanja originalnog teksta disertacije (OCR). S tim u vezi, mogu sadržavati greške vezane za nesavršenost algoritama za prepoznavanje. Nema takvih grešaka u PDF datotekama disertacija i sažetaka koje dostavljamo.

Kontrola

Komunikacija, komunikacija, radio elektronika i digitalni uređaji

Algoritmi za transformaciju izvornih slika zasnovanih na ortogonalnim transformacijama U koje svrhe se mogu koristiti algoritmi transformacije izvornih slika zasnovanih na ortogonalnim transformacijama?Koje su sličnosti i razlike između diskretne Fourierove transformacije i drugih vrsta ortogonalnih transformacija. Jedna od vrsta ortogonalnih transformacija je diskretna Fourierova transformacija. U procesu ortogonalnih transformacija slike sa jakim korelacijama između susjednih elemenata, ...

2.4. Algoritmi za transformaciju izvornih slika zasnovanih na ortogonalnim transformacijama (U koju svrhu se mogu koristiti algoritmi za transformaciju izvornih slika na osnovu ortogonalnih transformacija? Koje su sličnosti i razlike između diskretne Fourierove transformacije i drugih vrsta ortogonalnih transformacija?).

U nekim slučajevima, kako bi se smanjila količina podataka ili olakšala procedura izdvajanja karakteristika objekata u narednim fazama prepoznavanja, preporučljivo je prvo transformirati originalni dvodimenzionalni niz [ E i , j ] u niz vrijednosti koeficijenata [ F u , v ], koji ima isti MxN format kao originalna slika.

Sekundarni niz ili inače matrica koeficijenata naziva se transformacija. Jedna od vrsta ortogonalnih transformacija je diskretna Fourierova transformacija. U slučaju Fourierove transformacije, transformant nije ništa drugo do dvodimenzionalni prostorni spektar slike.

U opštem slučaju, svaka transformacija originalne slike zasnovana na ortogonalnim operatorima može se smatrati operacijom dekomponovanja slike u generalizovani dvodimenzionalni spektar, a koeficijenti (tj. elementi transformacije) kao amplitude odgovarajućih spektralne komponente. Imajte na umu da ako se u ovom slučaju neharmonične funkcije koriste kao osnovne funkcije, onda koncept prostorne frekvencije treba generalizirati i koristiti koncept sekvence.

sekvenca naziva se vrijednost jednaka polovini prosječnog broja prelazaka nule po jedinici vremena ili po jedinici dužine.

U procesu ortogonalnih transformacija slike koja ima jake korelacije između susjednih elemenata, dolazi do dekorelacije (izbjeljivanja). Stoga se ispostavlja da su vrijednosti elemenata transformacije praktički nekorelirane. Za razliku od originalnog niza, koji se odlikuje prosječnom raspodjelom energije signala između elemenata, raspodjela energije signala u transformaciji je izuzetno neravnomjerna. Glavni udio energije otpada na elemente sa malim serijskim brojevima (tj. na niske prostorne sekvence), a samo mali dio na ostale (vidi sliku 2. 3).

Rice. 2. 3. Distribucija energije signala između pojedinih elemenata
u originalnom nizu (a) i u transformaciji (b).

Ova okolnost omogućava ili odbacivanje (tj. smatrati jednakim nuli) većine elemenata transformacije (što u suštini znači niskofrekventno prostorno filtriranje), ili ih kvantizirati u mali broj nivoa koristeći minimalni broj bitova binarnog koda.

Razmotrimo neke od najčešćih tipova ortogonalnih transformacija koje se koriste u digitalnoj obradi slike.

Evo koeficijenata F u općenito su kompleksni brojevi

Diskretna Fourierova transformacija

Svaki kompleksni koeficijent može se zamijeniti sa dvije realne komponente. Ove komponente karakteriziraju, odnosno, prostorne diskretne spektre amplituda i faza i definiraju se na sljedeći način:

Glavni nedostatak diskretne Fourierove transformacije je relativno velika količina proračuna, kao i potreba da se sačuva veliki broj komponenti transformacije u poređenju sa drugim ortogonalnim transformacijama sa istim greškama restauracije slike (tj. sa istim gubitkom informacija). Osim toga, za pohranjivanje pojedinačnih komponenti složenih koeficijenata potrebna je veća količina memorije nego za stvarne vrijednosti elemenata originalnog niza. Govoreći o diskretnoj Fourier transformaciji, treba spomenuti mogućnost korištenja posebno razvijenih algoritamaBrza Fourierova transformacija, kao i specijalizovane računarske uređaje za njihovu implementaciju tzvsistolni procesori.

Walsh transform(za M = N )

Zauzvrat, koeficijenti b k (Z) definisani su kako slijedi: b k (Z ) je jednako vrijednosti k -ta cifra binarnog koda broja Z koji se sastoji od l binarne cifre. ako npr. Z = 10, tj. 10 10 \u003d 1010 2, onda
b0 = 0; b1 = 1; b2 = 0; b 3 = 1.

b k određuju se u skladu sa pravilom njihove definicije u Walshovoj transformaciji.

Adamardova transformacija(za M = N )

Očigledno je da sve vrste ortogonalnih transformacija su reverzibilne, tj. pomoću postupka inverzne transformacije moguće je vratiti originalnu sliku iz transformacije.

Neka [E i , j ] niz izvornog formata slike NxN , gdje je j broj reda, tj broj kolona elemenata (broj elemenata u redu); [ F u , v ] transformacija slike koja ima isti format NxN , gdje je u i v broj reda i broj kolone elemenata transformacije, respektivno. Tada, u opštem slučaju, bez obzira na vrstu ortogonalne transformacije, pišemo

gdje je a (i, j, u, v) i b (i, j, u, v) bazne funkcije direktnih i inverznih transformacija, respektivno.

Sa praktične tačke gledišta, važno je napomenuti da su sve vrste ortogonalnih transformacija koje smo prethodno razmatrali odvojivi u varijablama. Dakle, proračun direktnih i inverznih dvodimenzionalnih ortogonalnih transformacija može se svesti na sekvencijalno izvršavanje jednodimenzionalnih transformacija

Ovdje a str(i, u), b(i, u) i a(j, v), b(j, v) bazne funkcije direktnih i inverznih transformacija, respektivno, duž pravca redova i kolona.

Za praktičnost snimanja i proračuna, preporučljivo je koristiti matrični aparat

Ovdje [A e] i [A str ] matrice izravne transformacije; [ V e ] i [ V str ] inverzne transformacijske matrice; [ALI str ] t i [V str ] t matrice dobivene transponiranjem matrica [ A str ] i [ V str ].

Naravno, bez obzira na oblik matematičke reprezentacije, direktne i inverzne ortogonalne transformacije dvodimenzionalnih nizova zahtevaju, u opštem slučaju, značajne računske troškove. Ovo treba uzeti u obzir prilikom projektovanja

ATSN radi u realnom vremenu. Međutim, prilikom digitalne obrade binarnih slika, procedure ortogonalnih transformacija su znatno pojednostavljene, posebno u slučaju korištenja binarnih baznih funkcija (Walsh, Hadamard, itd.).


Kao i ostali radovi koji bi vas mogli zanimati

72688. RAZVOJ EKSPERTSKOG SISTEMA RELACIJSKIM PRISTUPOM PRISTUPNOG DBMS-a I KORIŠTENJEM VIZUELNIH PROLOG ALATA 2.09MB
Sistem koji nameravamo da izgradimo pripada klasi identifikacionih (ili dijagnostičkih) sistema. Sistemi ove klase rješavaju problem određivanja, tj. identifikacija objekta po njegovim karakteristikama.
72690. LABORATORIJSKA DIJAGNOSTIKA POREMEĆAJA HEMOSTAZE 10.55MB
Procjena stanja sistema zgrušavanja krvi jedan je od najtežih dijagnostičkih zadataka. U ovom priručniku ovo pitanje se razmatra sa različitih gledišta: opšti biološki obrasci funkcionisanja višekomponentnih sistema organizma, patofiziološki mehanizmi...
72692. Ponovna provjera nivoa formiranosti glavnih vještina rada sa tabelama 104KB
Desni dio koji služi za kretanje po tablicama desno od ulice a lijevi dio za osvetu tagova lukova omogućava kretanje između lukova. Kreirajte tabele Kreirajte pripremljene tabele nezavisno zaustavljanjem sledećih koraka: pokretanje Excela; formatiranje reda zaglavlja.
72693. Doslídzhennya multivibrator na napívprovídnikovyh tranzistorima 2.58MB
Očigledno, parametri tranzistora su potpuno isti. I takva idealna shema neće biti praktična: tranzistori koji se vrijeđaju bit će pokvareni. Nemogućnost da se zaista osigura apsolutna simetrija i prisustvo dopunskog pokazivača skretanja da se dovede do tačke da nakon napajanja naponom života ...
72696. Razumijevanje funkcija Excel baze podataka 103KB
Postanite majstor male radnje. Potrebno je napraviti post-sliku dolaska i izlaganja robe, majčin dan pred očima pravog viška, majke da mogu imenovati robu prema njenim nazivima itd. Pomozite nekome sa Excelom.