biografieën Kenmerken Analyse

Algoritmen voor digitale beeldcompressie met behulp van orthogonale transformaties. orthogonale transformaties

De transformaties die worden gebruikt om afbeeldingen te comprimeren, moeten snel en, indien mogelijk, eenvoudig op een computer worden geïmplementeerd. Dit houdt in de eerste plaats in dat dergelijke transformaties lineair moeten zijn. Dat wil zeggen, de geconverteerde waarden zijn lineaire combinaties (sommen met enkele vermenigvuldigers of gewichten) van de oorspronkelijke waarden (pixels), waarbij een bepaald aantal (transformatiefactor) als de bijbehorende vermenigvuldiger of gewicht dient. Dus waar . Wanneer deze transformatie bijvoorbeeld in matrixvorm kan worden geschreven

,

die in het algemeen de volgende vorm zal aannemen: . Elke kolomvector van een matrix wordt een "basisvector" genoemd.

Een belangrijke taak is het bepalen van de conversiecoëfficiënten. De belangrijkste vereiste is dat na de transformatie de waarde groot zou zijn en alle andere waarden klein zouden worden. De basisratio gaat ervan uit dat deze groot zal zijn als de gewichten de corresponderende waarden versterken. Dit zal bijvoorbeeld gebeuren als de componenten van de vectoren en dezelfde waarden en dezelfde tekens hebben. Integendeel, het zal klein zijn als de gewichten klein zijn en de helft van hen het tegenovergestelde teken van het overeenkomstige getal heeft. Daarom, als grote worden verkregen, dan zijn de vectoren vergelijkbaar met de originele vector, en kleine betekenen dat de componenten heel anders zijn dan . Daarom kunnen basisvectoren worden geïnterpreteerd als een hulpmiddel om enkele kenmerken van de oorspronkelijke vector te extraheren.

In de praktijk zouden de gewichten niet afhankelijk moeten zijn van de oorspronkelijke gegevens. Anders moeten ze worden toegevoegd aan het gecomprimeerde bestand voor gebruik door de decoder. Deze overweging, evenals het feit dat de invoergegevens pixels zijn, dat wil zeggen niet-negatieve waarden, bepaalt de manier waarop de basisvectoren worden gekozen. De eerste vector, die genereert , moet uit dichte, mogelijk overeenkomende getallen bestaan. Het verhoogt niet-negatieve pixelwaarden. En alle andere vectoren van de basis moeten uit de helft van de positieve getallen bestaan, en de andere helft uit de negatieve. Na vermenigvuldiging met positieve waarden en ze bij elkaar op te tellen, is het resultaat een klein getal. (Dit is met name het geval wanneer de originele gegevens dichtbij zijn, en we weten dat aangrenzende pixels meestal dicht in grootte zijn.) Bedenk dat basisvectoren een hulpmiddel zijn om kenmerken uit de originele gegevens te extraheren. Daarom zou een goede keuze basisvectoren zijn die erg van elkaar verschillen en daarom verschillende kenmerken kunnen extraheren. Dit leidt tot het idee dat de basisvectoren onderling orthogonaal moeten zijn. Als de transformatiematrix uit orthogonale vectoren bestaat, wordt de transformatie orthogonaal genoemd. Een andere observatie die het mogelijk maakt om de basisvectoren correct te kiezen, is dat deze vectoren steeds hogere tekenomkeringsfrequenties moeten hebben om, om zo te zeggen, de hoogfrequente kenmerken van de samendrukbare gegevens te extraheren bij het berekenen van de getransformeerde waarden.

Aan deze eigenschappen wordt voldaan door de volgende orthogonale matrix:

. (3.5)

De eerste basisvector (bovenste rij) is allemaal enen, dus de frequentie is nul. Alle andere vectoren hebben twee +1's en twee -1's, dus ze geven kleine geconverteerde waarden en hun frequenties (gemeten door het aantal tekenwisselingen per regel) nemen toe. Deze matrix is ​​vergelijkbaar met de Hadamard Walsh-transformatiematrix (zie vergelijking (3.11)). Laten we bijvoorbeeld de initiële vector (4,6,5,2) transformeren:

.

Het resultaat is behoorlijk bemoedigend, aangezien het aantal groot is geworden (vergeleken met de oorspronkelijke gegevens) en de andere twee aantallen klein zijn geworden. Laten we de energieën van de originele en getransformeerde gegevens berekenen. De initiële energie is , en na de conversie werd de energie, die vier keer groter is. Energie kan worden bespaard door de transformatiematrix te vermenigvuldigen met een factor 1/2. Het nieuwe product zal gelijk zijn aan . Dus de energie is behouden en geconcentreerd in de eerste component, en het is nu van de totale energie van de initiële gegevens, waarbij de eerste component slechts 20% uitmaakte.

Een ander voordeel van een matrix is ​​dat deze ook de inverse transformatie doet. De originele gegevens (4,6,5,2) worden hersteld met behulp van het product .

We zijn nu in een positie om de verdiensten van deze transformatie te waarderen. We kwantiseren de getransformeerde vector (8.5,1.5,–2.5,0.5) door deze af te ronden op een geheel getal en krijgen (9.1,–3.0). We doen de omgekeerde transformatie en krijgen de vector (3.5,6.5,5.5,2.5). In een soortgelijk experiment verwijderen we eenvoudig de twee kleinste getallen en krijgen (8.5.0,–2.5.0), en dan doen we de inverse transformatie van deze grof gekwantiseerde vector. Dit resulteert in de gereconstrueerde gegevens (3,5.5,5.5,3) die ook vrij dicht bij het origineel liggen. Dus onze conclusie: zelfs deze eenvoudige en intuïtieve transformatie is een goed hulpmiddel om redundantie uit de originele gegevens te "knijpen". Meer geavanceerde transformaties produceren resultaten waarmee gegevens kunnen worden hersteld met een hoge mate van overeenkomst, zelfs met zeer grove kwantisering.

Sommige artiesten tonen de zon in het geel
vlek, en de andere gele vlek in de zon.
- Pablo Picasso

"Afbeelding in polygrafie" - Specificiteit van het beeld in polygrafie. De belangrijkste eigenschap van de afgedrukte afbeelding. Boek. Een onderscheidend kenmerk van de meeste picturale drukkerijen. Pluraliteit Massakarakter Publieke toegankelijkheid. Een afbeelding verbinden met tekst. De kunst van het boek. Lettertype.

"Vector- en rasterafbeeldingen" - Vectorprimitieven worden gedefinieerd met behulp van beschrijvingen. Principes voor het construeren van vector- en rasterafbeeldingen. Vectorafbeeldingen nemen relatief weinig geheugen in beslag. Soorten computergraphics. Vectorafbeeldingen worden beschreven door tientallen en soms duizenden commando's. Nadelen van rasterafbeeldingen.

"Computerafbeeldingen" - De belangrijkste problemen bij het werken met rasterafbeeldingen. Typen computergraphics verschillen in de principes van beeldvorming. Computer beelden. Fractale afbeeldingen. Soorten computergraphics. Grote hoeveelheden gegevens. Pixel. Vergelijkende kenmerken van raster- en vectorafbeeldingen. Elk punt van het scherm kan slechts twee toestanden hebben - "zwart" of "wit".

"Grafiek maken" - Randen van het canvas. Taak 4. Maak een tekening die bestaat uit autoshapes. Maak een tekening met de werkbalk Tekening. De positie van de grafische afbeelding in de tekst. Voeg een afbeelding uit de collectie in tekst in. Canvas. Vergelijkende kenmerken van raster- en vectorafbeeldingen. Functies voor het maken van een vectorafbeelding in Word 2003.

"Beeld van een menselijk hoofd" - Andere koude, dode gezichten Gesloten met tralies, als een kerker. Anderen zijn als torens waarin niemand leeft en lange tijd uit het raam kijkt. Wat zijn portretten? De verhoudingen van iemands gezicht. Afbeelding van gelaatstrekken. Het gezicht en de emoties van een persoon. N. Zabolotski. Wat zijn de gezichten? Tekening van een menselijk hoofd. Werkelijk, de wereld is zowel groots als wonderbaarlijk!

"Bitmaps" - Conclusies over het experiment. Rood. Welke primaire kleuren gebruikt de computer? Rastercodering van grafische informatie. Bitmap. Pixels van verschillende kleuren. Blauw (turkoois). Grijs. Roze. Palet van moderne computers. Alle kleuren kunnen worden genummerd en elk nummer kan worden omgezet in een binaire code.

  • Specialiteit HAC RF05.13.11
  • Aantal pagina's 382
Stelling Voeg toe aan winkelwagen 500p

BEGRIPPEN EN PROBLEMEN

1.1. Basisbenaderingen van het probleem van beeldcompressie

1.1.1. Wiskundig model van een discrete afbeelding

1.1.2. Afbeelding herstel fout maatregel:

1.1.3. Eerste ideeën voor compressietechnieken voor stilstaande beelden

1.1.4. JPEG-variant gebaseerd op het gebruik van DCT

1.1.5. Het probleem van het kiezen van uitbreidingsbases

1.2. Wavelet-transformaties gebruiken om stilstaande beelden te comprimeren

1.2.1. Basisconcepten, definities, bijzonderheden van wavelet-transformaties

1.2.2. 2D Wavelet-transformaties

1.2.3. Belangrijkste ideeën van moderne wavelet-beeldcompressie-algoritmen

1.3. Kenmerken van het verwerken van videosequenties

1.4. Algemene verklaring van het probleem met de optimalisatie van codering met verlies

Inleiding tot de scriptie (onderdeel van de samenvatting) over het onderwerp "Wiskundige methoden en algoritmen voor digitale beeldcompressie met behulp van orthogonale transformaties"

Problemen in verband met de opslag, verwerking en overdracht van visuele beelden (beelden) hebben de mensheid door de geschiedenis heen vergezeld. De komst van televisie bracht de taken van beeldverwerking rechtstreeks in verband met de taken van het verwerken van elektrische signalen, en de ontwikkeling van digitale elektronica leidde ertoe dat de wijdverbreide overgang van analoge vormen van signaalweergave naar digitaal een kenmerkend kenmerk werd van moderne elektronische systemen. In dit opzicht zijn de problemen van digitale beeldverwerking (DPI) tegenwoordig van bijzonder belang.

Een afzonderlijk zwart-wit halftoonbeeld kan worden gedefinieerd door een matrix, waarvan de elementen (beeldpunten, ook wel pixels genoemd) voorbeelden zijn van een functie die is verkregen als resultaat van enige ruimtelijke bemonstering, die de verdeling van helderheid op een continu beeld. Een digitaal beeld is een matrix die is verkregen als resultaat van element-voor-element kwantisering (met een eindig aantal niveaus) van monsterwaarden van een discrete afbeelding. Om een ​​kleurenafbeelding (discreet of digitaal) te beschrijven, zijn drie matrices nodig, die overeenkomen met drie helderheidscomponenten in de geselecteerde kleurruimte, bijvoorbeeld RGB (rood, groen, blauw). Beschrijving van het beeld in de vorm van matrix(en) van helderheid wordt directe weergave genoemd.

Voor het verwerken, opslaan en verzenden van digitale beelden met directe presentatie zijn enorme hoeveelheden gegevens nodig. Als u bijvoorbeeld slechts één frame van een kleurenafbeelding van hoge kwaliteit met een grootte van 1024x1024 pixels wilt opnemen, is bij het coderen van elk monster met 24 bits (8 bits per kleurcomponent) 3 megabyte aan gegevens nodig. Natuurlijk is bij het bekijken van video's een kleinere schermresolutie acceptabel, maar om digitale video in realtime weer te geven, is gegevensoverdracht met een snelheid van ongeveer 160 megabits / s vereist. Het voorgaande verklaart de enorme belangstelling die zich wereldwijd manifesteert bij het zoeken naar manieren om afbeeldingen efficiënt te coderen.

Reeds aan het begin van de ontwikkeling van digitale beeldverwerkingsmethoden (eind jaren vijftig - begin jaren zestig), lag de redundantie van de directe weergave van afbeeldingen voor de hand, maar de eenvoudigste methoden die werden gebruikt voor datacompressie, zoals differentiële pulscodemodulatie gevolgd door statistische codering , gaf meer dan bescheiden resultaten. De kwestie van het gebruik van frequentiemethoden voor beeldcompressie werd mogelijk door het verschijnen in 1965 van het werk van Cooley en Tukey, dat een beschrijving bevatte van het algoritme voor snelle berekening van de discrete Fourier-transformatie (DFT). Het idee om een ​​afbeelding als direct object van codering te vervangen door voorbeelden van zijn tweedimensionale DFT-spectrum werd in 1968 naar voren gebracht. DFT-codering is gebaseerd op het feit dat voor de meeste natuurlijke afbeeldingen de waarden van veel DFT-coëfficiënten relatief klein zijn. Dergelijke coëfficiënten kunnen vaak helemaal worden weggegooid, of een klein aantal bits kan worden toegewezen aan hun codering, zonder het risico van enige significante vervorming. In 1969 stelden Pratt, Andrews en Kane voor om de Hadamard-transformatie te gebruiken in plaats van de Fourier-transformatie om afbeeldingen te coderen, wat in veel praktische gevallen de hoeveelheid benodigde berekeningen aanzienlijk kan verminderen. Sindsdien is er onderzoek gedaan naar de toepassing van discrete Karhunen-Loeve en Haar-transformaties op beeldcodering. De Karhunen-Loeve-transformatie is optimaal in de zin dat deze de minimale rms-coderingsfout oplevert bij het weggooien van enkele van de transformatiecoëfficiënten, maar helaas vereist deze kennis van de statistische kenmerken van de verwerkte afbeeldingen en heeft deze geen snel berekeningsalgoritme; transformatie

Haar daarentegen wordt gekenmerkt door een zeer efficiënt rekenalgoritme, maar geeft in de regel een relatief grote codeerfout. In 1971 stelden Shibata en Enomoto de zogenaamde schuine transformatie van vectoren met 4 of 8 componenten voor, specifiek voor gebruik bij beeldcodering. Kort daarna ontwikkelden Pratt, Chen en Wilch een algemeen algoritme voor schuine transformatie voor lange vectoren en tweedimensionale arrays.

Alle voordelen van beeldcodering met behulp van orthogonale transformaties zijn uiteindelijk het gevolg van de eigenaardigheden van de energieverdeling tussen transformatie-elementen - hierdoor is het gegeneraliseerde tweedimensionale spectrum1 handiger voor codering dan het beeld in de oorspronkelijke weergave. Vanwege significante correlaties tussen beeldelementen van natuurlijke aard, heeft de hoofdenergie in het discrete spectrum de neiging om te worden geconcentreerd in een relatief klein aantal monsters dat overeenkomt met langzaam oscillerende basisfuncties. Daarom kunnen, zonder significante schade aan de daaropvolgende beeldreconstructie, kleine spectrale coëfficiënten op nul worden gezet en kunnen de resterende elementen van het spectrum worden gedigitaliseerd (gekwantiseerd en gecodeerd). Het is passend om hier op te merken dat het gebruik van datacompressiealgoritmen met verlies voor echte fotografische afbeeldingen (d.w.z. grijswaarden) van fundamentele aard is, aangezien, door aan te nemen dat er een fout in het gereconstrueerde beeld is, een veel hoger niveau van gegevenscompressie kan worden bereikt. De fout kan zo klein zijn dat deze niet door het menselijk oog wordt waargenomen. Daarnaast zijn de gemaakte foto's

1 Overal zullen we de term spectrum op een algemene manier begrijpen, als het resultaat van een unitaire transformatie (niet noodzakelijk door DFT) van een eendimensionale of tweedimensionale dataset. scanner of digitaal video-opnameapparaat, onvermijdelijk een ruiscomponent hebben, waarvan de exacte bewaring tijdens het coderen zinloos is.

Zoals aangetoond door Ahmed et al., wanneer toegepast op beeldcodering waarvoor een statistisch Markov-model geschikt is, benadert de discrete cosinustransformatie (DCT), die een snel rekenalgoritme heeft, de Karhunen-Loeve-transformatie in de efficiëntie van spectrale gegevensrepresentatie (zie ook). Dit feit was de reden waarom DCT als basis diende voor de ontwikkeling van de JPEG-compressiestandaard voor stilstaande beelden. Deze norm is het resultaat van jarenlange inspanning. een team van specialisten gevormd in 1987 uit vertegenwoordigers van twee gerenommeerde internationale organisaties: ISO en ITU. De opkomst van de gezamenlijke JPEG-groep werd veroorzaakt door de groei van het aantal ontwikkelaars en gebruikers van verschillende clearinghouse-systemen en de daaruit voortvloeiende noodzaak om het formaat voor gecomprimeerde weergave van digitale afbeeldingen te uniformeren. De resulterende specificatie was een document dat tegenwoordig wordt gevolgd door bijna alle ontwikkelaars van clearinghouse-softwaresystemen voor algemene doeleinden. Sinds 1994 worden gespecialiseerde microschakelingen geproduceerd die compressie en herstel over JPEG in hardware implementeren en realtime kleurenbeeldverwerking bieden (480x640 pixels, 30 frames / s). Vanuit het oogpunt van het haalbare compressieniveau is de JPEG-versie op basis van het gebruik van DCT niet de beste van de momenteel bestaande methoden voor efficiënte beeldcodering. Methoden die gebaseerd zijn op het gebruik van wavelet-transformaties2 kunnen dus aanzienlijk hogere compressieniveaus bieden - om deze reden, in de uitgebreide JPEG2000-standaard,

In de binnenlandse literatuur wordt in plaats van een directe vertaling van het woord wavelet ook vaak de term splash gebruikt. bestaande in de vorm van een voorlopige (concept)specificatie sinds 20003, is de mogelijkheid om wavelet-transformaties toe te passen al voorzien. Het is echter voorbarig om te zeggen dat beeldcompressie met behulp van DCT tegenwoordig achterhaald wordt, aangezien, vergeleken met wavelet-transformaties, de rekenkosten die nodig zijn om DCT te implementeren veel lager zijn. Een meer gedetailleerd overzicht van moderne beeldcompressiemethoden en verschillen in de gebruikte benaderingen zal worden gegeven in hoofdstuk 1 van dit artikel.

Het belang van het probleem van gegevenscompressie bij beeldverwerking kan moeilijk worden overschat - het volstaat om de groei van het aantal relevante publicaties in het afgelopen decennium te analyseren. Zo bestaat een aanzienlijk deel van de inhoud van het maandelijkse tijdschrift IEEE Transactions on Image Processing, dat sinds 1992 wordt gepubliceerd, uit artikelen die aan dit specifieke onderwerp zijn gewijd. Het is ook onmogelijk om niet op te merken dat algoritmen voor beeldcompressie en de onderliggende theorie voornamelijk in het buitenland zijn ontwikkeld, voornamelijk in de VS. Het is natuurlijk onmogelijk om te spreken over het ontbreken van huishoudelijk werk op dit gebied, maar de noodzaak van een aanzienlijke uitbreiding van het Russische onderzoeksfront staat buiten twijfel.

De complexiteit van de algoritmen die worden gebruikt voor beeldcompressie neemt gestaag toe - dit geldt niet alleen voor de hoeveelheid berekeningen, maar ook voor de ideologische grondslagen van de constructie van algoritmen: functionele analyse, kansrekening, informatietheorie, discrete wiskunde en algebra zijn met elkaar verweven in hun fundament op een complexe manier. Tegelijkertijd worden taken gesteld door oefening, wat een constante en constante aandacht vereist voor de mogelijkheden van echte apparatuur bij het oplossen ervan.

3 Op 2 januari 2001 werd deel 1 "JPEG 2000 Image Compression System: Part I Core Coding System" uiteindelijk goedgekeurd voor adoptie als de officiële internationale norm ISO / IEC 15444-1.

De taak van het proefschrift werd dus gedefinieerd als de studie van theoretische kwesties van efficiënte beeldcodering met behulp van orthogonale transformaties en de ontwikkeling van geschikte compressie-algoritmen die geschikt zijn voor praktisch gebruik op basis van universele computertools voor algemene doeleinden. De nieuwheid van het werk wordt bepaald door de algoritmen en methoden die voor het eerst worden voorgesteld om het probleem op te lossen, die ter verdediging worden ingediend (zie hieronder). De relevantie is te danken aan de toegepaste focus van het werk en het uitzonderlijke belang van het probleem van datacompressie in het Clearinghouse.

In het eerste hoofdstuk van het proefschrift wordt voorlopige informatie gegeven die nodig is voor verdere presentatie, een kort overzicht en classificatie van de belangrijkste benaderingen voor de implementatie van efficiënte beeldcodering. Het gebruik van lossy datacompressie-algoritmen voor grijswaardenafbeeldingen is alomtegenwoordig: door de aanwezigheid van een fout in het gereconstrueerde beeld aan te nemen, kunnen veel hogere niveaus van datacompressie worden bereikt. Meestal wordt de kwaliteit van beeldverwerking meestal geëvalueerd door de root mean square error (RMS):

RMS = X y)2 > waarbij ~ de matrix is ​​van het originele beeld, L

X = (x/y) is de matrix van de afbeelding die is verkregen na verwerking (compressie en gegevensherstel). Voor de logaritmische waarde van RMS wordt de algemeen aanvaarde maat PSNR (pieksignaal-ruisverhouding) gebruikt.

255 signaal-ruiswaarden), PSNR = 201g-[dB].

Het is handig om beeldcompressiemethoden te overwegen in de vorm van een algemeen schema dat uit drie hoofdfasen bestaat: vermindering van de gegevenscorrelatie tussen elementen, kwantisering van gegevenselementen, statistische codering. Kwantisering is de belangrijkste lossy-compressietechniek. Eigenlijk,

N-1M-1-kwantisatie is de extractie van een belangrijk stuk informatie uit de invoergegevens, wanneer het minder significante deel ervan wordt weggelaten. Zowel scalaire als vectorkwantisatie worden gebruikt. In het scalaire geval worden de elementen van de dataset die wordt verwerkt onafhankelijk van elkaar gekwantiseerd.

Het overbrengen van een afbeelding naar een gegeneraliseerd spectraal gebied met behulp van een lineaire transformatie ^ kan de correlatie tussen elementen in de transformatiematrix Y = 77 (X) aanzienlijk verminderen in vergelijking met de correlatie van elementen in de matrix van een discrete afbeelding X. Dan onafhankelijke component- door-component codering van de vector Y, en niet de vector X, wordt efficiënter. Je kunt ook een energetische interpretatie geven van het doel van het gebruik van transformaties, wat in deze zin is om het maximale deel van de energie van het originele discrete signaal (X-matrix) te concentreren in het minimale aantal spectrale coëfficiënten (Y-matrixelementen). Er is een zeker verband tussen de verdeling van energie in het gegeneraliseerde spectrum en de decorrelatieve eigenschappen van transformaties. Het bestuderen van de effectiviteit van decorrelaterende eigenschappen is dus een belangrijke taak bij het kiezen van een transformatie om toe te passen op een compressieschema.

Echte fotografische afbeeldingen zijn tweedimensionale signalen die inhomogeniteiten (kenmerken) hebben in de gebieden van objectcontouren, dus de basis van de functies die voor ontbinding worden gebruikt, moet een goede lokalisatie in het afbeeldingsgebied hebben. In de achtergrondgebieden kan het beeld echter worden beschouwd als een realisatie van een stationair signaal, waardoor het de voorkeur verdient om een ​​frequentiegelokaliseerde basis voor de ontbinding te gebruiken (het is algemeen bekend dat de coëfficiënten van de trigonometrische expansie van een stationair signaal ongecorreleerd). Vanwege het onzekerheidsprincipe van Heisenberg is het onmogelijk om zowel een hoge resolutie in het frequentie- als het tijddomein te bereiken.

Een mogelijke uitweg is het gebruik van functionele wavelet-bases (bursts), die een variabele tijd-frequentieresolutie hebben. Burst-gebaseerde benaderingen zijn momenteel dominant in de verwerking van stilstaande beelden en vervangen geleidelijk het traditionele decorrelatie-instrument, de discrete cosinustransformatie (DCT).

In het eerste hoofdstuk wordt opgemerkt dat om algoritmen voor datacompressie met verlies te optimaliseren, vaak een benadering wordt gebruikt die is gebaseerd op het minimaliseren van de Lagrange RD-functie. Laat X een invoergegevensset zijn, die als resultaat van de compressieherstelprocedure is gekoppeld aan:< выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU (0,1)

Het zoeken naar een oplossing voor probleem (0.1) reduceert in de meeste gevallen tot omslachtige numerieke procedures van iteratieve aard. Indien niet gegeven door de beperking R(X,u)

In het eerste hoofdstuk wordt ook kort ingegaan op de kenmerken die verband houden met de verwerking (compressie-herstel) van dynamische beelden. De belangrijkste transformatie die voor videocompressie wordt gebruikt, is nog steeds de DCT, omdat deze eenvoudiger is in termen van het aantal berekeningen in vergelijking met wavelet-transformaties. Net als bij statische compressie zijn videocoderingsalgoritmen vaak complexer dan decoderingsalgoritmen. De implementatie van software-videocompressie in realtime legt dus aanzienlijke beperkingen op aan de toelaatbare complexiteit van berekeningen.

Het tweede hoofdstuk is gewijd aan de studie van methoden voor theoretische analyse van de decorrelatie-efficiëntie van transformaties die bedoeld zijn voor gebruik bij datacompressie. Er wordt een nieuwe methode voorgesteld die gebaseerd is op een schatting van de waarde van de onvoorwaardelijke entropie van de transformatiecoëfficiënten en steunt op de volgende redenering. Laat de covariantiematrix Kx van de initiële gegevensvector bekend zijn

X = (x0,l;1,.,q:Dr1)r, het vectorspectrum Y wordt verkregen als resultaat van een orthogonale transformatie met de matrix Y=LX. Als we berekeningen weglaten, kunnen we de gemiddelde onvoorwaardelijke entropie voor de vectorspectrumcoëfficiënten schrijven:

ср = - X | /k (u, x) \ o% / k (tk, ok, x) 4x \u003d

0.3) Een k=0 k=0 kansdichtheidsfunctie for

1 Ar-1 1 1\-11 1

A°(x)loe/Ax>/x; waarbij /k(mkox) van de spectrale karakteristiek yk (Az-de component van de vector Y), /u^ is de wiskundige verwachting, ok is de standaarddeviatie, /k(x) = Hoe lager de gemiddelde entropie (0,3) , hoe effectiever de daaropvolgende onafhankelijke codering van spectrumcomponenten.

Als criterium voor de decorrelatie-efficiëntie wordt voorgesteld om de waarde van de gemiddelde overmaat entropie verkregen uit formule (0.3) te beschouwen als resultaat van bepaalde transformaties, uitgedrukt in termen van de elementen van de matrices:

1\ ^ ae1^x k=0 y-=0 ^

De waarde (0,4) is niet-negatief, en hoe groter de waarde, hoe lager de efficiëntie van de decorrelatietransformatie met de matrix Numerieke berekeningen van de waarde (0,4) voor verschillende transformaties en soorten covariantiematrices toonden resultaten die volledig consistent zijn met de bekende gegevens.

Van groot belang voor analyse is het model van een discreet signaal (vector X), dat de statistieken heeft van een discreet Markov-proces van de eerste orde, wanneer de covariantiematrix de volgende vorm heeft:

N-2 pK-1 pM-2

Dit model wordt ook vaak gebruikt om interline- en intercolumn-correlatie in discrete afbeeldingen te beschrijven. Bij p=1, wanneer alle componenten in de oorspronkelijke vector X hetzelfde zijn (voor twee willekeurige monsters van de vector is de correlatiecoëfficiënt gelijk aan één), is de berekening van het geïntroduceerde criterium (0,4) voor de matrix (0,5) onmogelijk, omdat in dit geval hebben we<ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. In hoofdstuk 2 wordt de volgende stelling bewezen.

Stelling 2.1. Voor elke orthogonale matrix (L/x/U) zodanig dat

V/ = OD,. ,LG -1: >y0 . = -(de basisfunctie met index nul is LA/U genormaliseerde constante component) en covariantiematrix (0,5) lm/ 2 N-1 N-1

1nDYA(\U,Kx) = - \o%

Verschillende studies, waaronder die uitgevoerd in Hoofdstuk 2, laten zien dat onder discrete transformaties die snelle rekenalgoritmen hebben (voor de dimensie van N rekenkundige bewerkingen geïmplementeerd in -Wo^N), de decorrelatiekenmerken voor het Markov-proces (0.5 ) het gebruik van DCT. Ondanks de aanwezigheid van goed ontwikkelde snelle berekeningsalgoritmen, vereist DCT fundamenteel vermenigvuldigingsbewerkingen voor de implementatie ervan en is het merkbaar inferieur in termen van het aantal berekeningen, bijvoorbeeld voor de Haar-, Walsh- en Chrestenson-Levy-transformaties. Een aparte kwestie, die in hoofdstuk 2 veel aandacht krijgt, is de constructie (synthese) van een nieuwe transformatie die zowel hoge decorrelatiekenmerken heeft voor het model (0.5) als veel snellere rekenalgoritmen dan voor DCT. De resulterende discrete pseudo-cosinustransformatie (DPCT) is gedefinieerd voor vectoren met een dergelijke afmeting А^, waarvoor expansie N=N1 ■ mogelijk is. -Yn, en Y tot (2,3,4). Vervolgens wordt de DPCT-matrix (in dit geval geeft het subscript de dimensie van de transformatie aan) geconstrueerd als een direct (tensor)product van de elementaire DPCT-matrices (\¥2,\¥3,\U4): = \¥Rr1 ® . ® \Ul,n en de elementaire matrices zijn orthogonaal en worden verkregen als resultaat van bepaalde modificaties van de DCT-matrix van de overeenkomstige dimensie4. Elementaire matrices kunnen worden weergegeven als een product van een diagonale matrix B en matrix C, en met de structuur C kunt u vermenigvuldiging met een willekeurige vector u, SI, alleen uitvoeren met behulp van optel- en aftrekbewerkingen.

De eigenschappen van het tensorproduct impliceren de weergave = OdgSd, waarbij de diagonale matrix ® is en de matrix

Cm \u003d Ssh ®.®Syp. De structuren van de matrices C2, C3, C4, C2, B3, B4 worden gegeven in hoofdstuk 2. De implementatie van de DPCT Y = \Ud,X = B^C^X bestaat dus uit de implementatie van de vermenigvuldiging van de matrix Cm door de vector, Y = C^X, en de daaropvolgende normalisatie van de resulterende vector Y: Y = S^Y. Om de DPCT te berekenen, is het handig om snelle algoritmen te gebruiken die gebaseerd zijn op een gefactoriseerde representatie voor de matrix Oy in de vorm van een product van dun gevulde matrices5: »1^ ,

1dg. - eenheidsmatrix van afmeting TS. xA/" -. Aangezien de matrices Tg /)

J J J bestaat op een bepaalde manier uit dunne matrices-blokken; vermenigvuldiging van de matrix Td/) met een vector reduceert ook alleen tot bewerkingen van optellen en aftrekken van getallen. Er zijn snelle inverse DPCT-algoritmen gebouwd

4 Onder het tensor (direct) product van de matrices (/=0,.,7]-1; m=0,.,A-1) en .,/¿-1) verstaan ​​we de matrix

8=B®C=K/))= . ,a=0X.,u-\,p=0X.,1ir\.

5 Om de geldigheid van deze opvatting te rechtvaardigen, zie pp. 84-85 uit de monografie. op dezelfde manier, omdat vanwege de orthogonaliteit van de DPCT:

We merken op dat de normalisatie (vermenigvuldiging met de matrix Dy) die nodig is voor het berekenen van de DHFT en inverse DPCT voor het compressieschema met scalaire kwantisering van de transformatiecoëfficiënten de berekeningen niet compliceert. De normalisatie kan bij datacompressie worden gecombineerd met de scalaire kwantisatiestap yj - goips1(y7 / c()) door voor elk element y de getransformeerde individuele kwantisatiestap qj=qldjj te kiezen (waarbij

Element van de diagonale normalisatiematrix B^). Wanneer A de vector Y ~ Y, y my ■ herstelt, moeten ook de factoren voor de elementen y ^ afzonderlijk worden gekozen, in de vorm

Zoals theoretische analyse heeft aangetoond, heeft de DPCT voor model (0.5) een hogere decorrelatie-efficiëntie in vergelijking met andere snelle transformaties, waarvan de implementatie zich ook beperkt tot bewerkingen van optellen en aftrekken van getallen.

Het derde hoofdstuk is gewijd aan de studie van de toepassing van de discrete Chrestenson-Levy transformatie (DLCT) voor beeldcompressie en is een ontwikkeling van het onderzoek van de auteur's Ph.D.

Het systeem van Chrestenson-Levy-functies (xm op het halve interval xx = u(L 0 op de diagonaal van de matrix met dimensie rpxrn er zijn p-matrices met de grootte rpLxrpL, de overige elementen van de matrix zijn nul). -1) heeft de volgende vorm: ™ = \ Met t ( . 0, met t. Ф 7

Discrete (digitale) halftoonbeelden worden beschreven in de vorm van een reële matrix X. Bij het verwerken van reële vectoren (matrices) wordt het DPCL-spectrum ontleed in paren van complexe geconjugeerde elementen, zodat sommige spectrumelementen niet kunnen worden berekend. Door deze functies in aanmerking te nemen, konden we DPCL- en inverse DPCL-algoritmen voorstellen met onvolledige berekening voor het verwerken van echte arrays. Bij het verwerken van echte datasets is het ook mogelijk om "gecombineerde" transformaties te gebruiken, vergelijkbaar met hoe het wordt gedaan bij het berekenen van de discrete Fourier-transformatie. Tegelijkertijd wordt een complexe vector X=X1+/X2 gevormd uit twee reële vectoren X en X2 en wordt een transformatie uitgevoerd.

Als we de representatie gebruiken in de basis voor complexe getallen r=xHy (1 r=a+Pd e~2n"/3), dan kan de berekening van de DPCL (voor p= 3) worden uitgevoerd zonder het gebruik van vermenigvuldigingsoperaties (de normaliserende factor)

1/4p ", zie (0.7) - wordt niet in aanmerking genomen), met behulp van de bewerkingen van optellen en aftrekken (dit feit is vastgesteld door A.V. Efimov). Het gebruik van algoritmen met onvolledige berekening van de basis (1, q) houdt in een aantal kenmerken, die in hoofdstuk 3 worden besproken. Wanneer de afmeting van de beeldmatrix 3x3r is, vereist de berekening van de DPCL of inverse DPCL door algoritmen met onvolledige berekening 7(n + r) -3 "+ r" 1 bewerkingen optellen (aftrekken), vermenigvuldigen en delen worden niet gebruikt basis (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

Voor de verwerking van stilstaande beelden in het doctoraatswerk van de auteur werd een compressie-algoritme voorgesteld waarbij het originele beeld voor verwerking wordt opgedeeld in elementaire fragmenten X, 9x9 punten, en elk matrixfragment wordt verwerkt met DPCL (volgens de algoritme met onvolledige berekening). Hoofdstuk 3 geeft een korte beschrijving van het compressie-algoritme, dat de validiteit van het gebruik van de discrete Chrestenson-Levy-transformatie voor beeldcompressie bevestigde. De aard van de fouten die in het compressie-decompressieproces worden geïntroduceerd, is verschillend voor de op DCT gebaseerde JPEG-methode en voor het voorgestelde schema: bij gebruik van JPEG treedt "vervaging" op, terwijl het nieuwe compressieschema leidt tot "karteligheid" van het beeld. Desalniettemin is de subjectieve kwaliteit van waarneming bij het gebruik van beide overwogen compressiemethoden ongeveer hetzelfde. Schattingen van de grootte van de vervormingen in termen van de PSNR-waarde, uitgevoerd voor een aantal testafbeeldingen met een afmeting van 720x504=362880 pixels, gaven ook vergelijkbare resultaten: voor sommige afbeeldingen kan een klein voordeel van de JPEG-standaard op basis van DCT worden waargenomen, is voor andere afbeeldingen een betere restauratiekwaliteit mogelijk met de nieuwe methode. De verschillen zijn klein, vooral bij lage compressieniveaus. Schattingen van de rekenkosten laten zien dat het op DPCL gebaseerde algoritme niet onderdoet voor JPEG in termen van de rekencomplexiteit van de implementatie. Een algoritme voor beeldcompressie dat DPCL gebruikt en eigenschappen heeft die vergelijkbaar zijn met JPEG, is een resultaat dat de auteur voor het eerst heeft verkregen.

Het vierde hoofdstuk behandelt de ontwikkeling van compressieschema's die gebruik maken van beeldverwerking per fragment. Gewoonlijk is voor dergelijke schema's het gebruik van DCT het meest effectief, daarom is een aanzienlijk deel van het vierde hoofdstuk gewijd aan de studie van de eigenschappen die nodig zijn voor de constructie van compressie-algoritmen. Omdat Aangezien de tweedimensionale DCT een scheidbare transformatie is (gereduceerd tot eendimensionale transformaties langs de rijen en langs de kolommen van de verwerkte matrix), volgen veel eigenschappen van de tweedimensionale DCT uit de eigenschappen van de eendimensionale.

Voor de coëfficiënten van de eendimensionale DCT, gedefinieerd door de formule, wordt de volgende relatie (b*10) verkregen: kk (0,8) w- #

2S waarbij A/=xy-Xy 1 - het eerste verschil tussen de uitlezingen van de oorspronkelijke gegevensvector X = (l;0,d:1,.,l:lg1)T. Uit formule (0.8) blijkt dat de verschillen A, - een ander karakter van invloed hebben op het DCT-spectrum. Dus het verschil Am-xm-x^/2-\ (wanneer IV even is) gaat in alle coëfficiënten y2m met maximale (eenheids)gewichten in modulus. Het verschil tussen de waarden x0 en is helemaal niet opgenomen in (0,8), wat de DCT fundamenteel onderscheidt van zijn "voorloper" - de discrete Fourier-transformatie, waarvan het amplitudespectrum invariant is voor cyclische verschuivingen (x0->x)- >.->Xl>-1- >*o) component van de datavector X.

Uitgaande van niet-gecorreleerde verschillen6 A; en gelijkheid tot nul van hun wiskundige verwachtingen Е(А/)=0, werden ook probabilistische schattingen bestudeerd, in het bijzonder de waarde van de totale variantie van de variabele componenten van het DCT-spectrum: Е - ¿,0(uk). Deze som kan als volgt worden weergegeven in termen van k = 1 van de spreiding van de eerste verschillen van de datavector:

Stelling 4.1: voor de coëfficiënten $(/) is de relatie waar: Deze stelling bevestigt opnieuw dat voor het gebruikte probabilistische model van de vector X het verschil Am (in dit geval zijn variantie) de grootste bijdrage levert. Hoe dichter het verschilgetal bij N/2 ligt, hoe groter de waarde van het gewicht £(/") en hoe groter de bijdrage van het verschil A aan de energie van de variabele componenten. Onderzoek van de DCT-spectra voor een bepaald kenmerk

6 Voor het Markov-model (0.5) is deze aanname niet waar. signalen bevestigden ook dat bij het gebruik van technieken voor het coderen van spectra van JPEG (in het bijzonder het coderen van nullen - run-length codering), de coderingsefficiëntie zal verslechteren wanneer de informatieverzadiging van een discreet signaal op de centrale monsters van de vector valt.

Naast het onderzoeken van de algemene eigenschappen van DCT, onderzoekt Hoofdstuk 4 de mogelijkheid om een ​​JPEG-codering te optimaliseren die het uitvoergegevensformaat behoudt. Bij het ontwikkelen van de ideeën van het werk van Crouse-Ramchandran werd een algoritme voorgesteld dat een aanvullende optimalisatie van de scalaire kwantisering van de DCT-coëfficiënten uitvoert, wat enige verbetering in de compressiekenmerken met zich meebrengt volgens de JPEG-standaard vanwege een verwaarloosbare complicatie van de optimalisatieprocedure.

Om stilstaande beelden te comprimeren met 8x8 DCT, werd in het vierde hoofdstuk een nieuw algoritme ontwikkeld, dat verschilt van JPEG in de entropiecoderingsfase, waarvoor verschillende statistische modellen en een multi-threaded rekenkundig coderingsalgoritme worden gebruikt. De keuze van het model wordt op een bepaalde manier gemaakt op basis van de context van reeds verwerkte gegevens. Het voorgestelde algoritme voor rekenkundige contextcodering van DCT-coëfficiënten verbetert de gegevenscompressie met 10% in vergelijking met het standaard JPEG-schema (JPEG Optimizer™ v.4.0 diende als referentie, zie http://xat.com).

In het vierde hoofdstuk wordt veel aandacht besteed aan de studie van algemene theoretische en praktische aspecten van de toepassing van vectorkwantisatie (VC) voor beeldcompressie in het transformatiedomein, waarbij niet noodzakelijk DCT wordt gebruikt. Om dit te doen, moeten de spectra van beeldfragmenten worden verdeeld in bepaalde zones, die elk overeenkomen met een afzonderlijke gegevensstroom die wordt onderworpen aan VC. Laten we het probleem formuleren van het partitioneren van een gecorreleerde dataset, die we voorstellen als een vector Y, in clusters (klassen). De initiële parameters zijn de covariantiematrix Ku van de vector Y en de beperking van de maximale onzekerheid (entropie) Hmax voor elk cluster in de partitie. Het is nodig om zo'n partitie van de verzameling willekeurige componenten Y=(70,., GLr1) in subsets te vinden

Y(A) = ^n. „Y^], k=1,.,M, zodat:

b*"^ . (0,) n(y^)quasi-optimale methoden: het "Cluster Growing"-algoritme en het "Isolation of Strong Links"-algoritme. Beide voorgestelde methoden voor het numeriek zoeken naar de oplossing (0.9) zijn gebaseerd over het minimaliseren van de entropie van interclusterlinks

Hsv(\a\.,\(m))=^H(\(k))-H(Y). Partities die dichter bij de optimale k=1 voldoen (0.9)) werden getoond door de tweede van de genoemde algoritmen.

Concluderend wordt in het vierde hoofdstuk een algemeen compressieschema voorgesteld dat gebruik maakt van een adaptieve NE-geoptimaliseerde VC in het gebied van beeldfragmentspectra. Die. het algemene schema van compressie van statische afbeeldingen met behulp van vectorkwantisatie op het gebied van orthogonale transformaties is geformaliseerd, dat is gericht op beeldverwerking per fragment.

Het vijfde hoofdstuk is gewijd aan de studie en ontwikkeling van algoritmen voor het comprimeren van stilstaande beelden op het gebied van wavelet-transformaties. Laat nu

W = geeft de discrete wavelet-spectrummatrix aan die is verkregen als resultaat van tweedimensionale n-stappen van de e wavelet-transformatie van de discrete-beeldmatrix. Het aantal wavelet-transformatiestappen bepaalt het aantal frequentieniveaus in het spectrum, voor n stappen hebben we n+1 niveaus. In dit geval kunnen de wavelet-expansiecoëfficiënten worden geordend in de vorm van een reeks boomstructuren (7), waarvan de wortels de elementen zijn die in het laagste frequentiebereik van het spectrum (subband) liggen, zie figuur. Een dergelijke ordening bepaalt voor de wavelet-coëfficiënten (knooppunten van de boom) ouder-kindrelaties. De ideologische fundamenten van het ontwikkelde compressiealgoritme zijn geworteld in het werk van Lewis-Knowles en Xiong-Ramchandran-Orchard; in dit geval is de hoofdtaak van het compressie-algoritme het vinden van een RD-optimale topologie (d.w.z. de structuur S, die wordt verkregen na het afsnijden van de takken van de oorspronkelijke boom T), waarbij de Lagrange-functie wordt geminimaliseerd voor een vaste waarde van H : J(S*) = m [A£) + R(S)].

Het idee, dat teruggaat tot het werk en in dezelfde vorm wordt gebruikt in , is als volgt: hoe groter de absolute waarde van de wavelet-coëfficiënt I wj (of energie, wf) van het bovenliggende knooppunt /, hoe kleiner de kans dat het dat dit knooppunt een nul (d.w.z. afgeknotte) vertakking zal hebben, die zou moeten worden gebruikt om de topologie van de boom S te coderen. Een nauwkeuriger voorspelling van het uiterlijk van de nultak kan worden gemaakt als we de voorspellende waarde P gebruiken, de som die, naast wf, ook de kwadraten omvat van de waarden van de wavelet-coëfficiënten die in de subband grenzen aan het knooppunt i. De experimentele studies van statistische afhankelijkheden die in Hoofdstuk 5 zijn uitgevoerd, toonden de doelmatigheid aan van het gebruik van de waarde P( voor de voorspellende waarde van de coëfficiënten-buren. fotografische afbeeldingen. Om de topologie van een "gesnoeide" boom te coderen, moet elk knooppunt z van de boom krijgt een teken van de aanwezigheid (n = 0) of afwezigheid (nr - 1) van een gesnoeide tak op een bepaald knooppunt. ) moet op een bepaalde manier worden gegroepeerd in nieuwe data-elementen (Tu), Deze laatste zijn onderworpen aan adaptieve rekenkundige codering, en er worden verschillende statistische modellen gebruikt, de context (d.w.z. volgens reeds gecodeerde gegevens) modelselectieregel wordt op een bepaalde manier ingesteld volgens de voorspellende waarden (T5, -).

Verschillende statistische modellen worden ook gebruikt om scalair gekwantiseerde wavelet-coëfficiënten te coderen die niet in de nul (afgeknotte) takken vallen. De voorgestelde regel voor de contextuele keuze van modellen houdt rekening met zowel de waarde van de voorspellende waarde P( van het bovenliggende knooppunt als de waarden van de wavelet-coëfficiënten van aangrenzende knooppunten die zich in dezelfde subband bevinden, naast de verwerkte, maar zijn al gecodeerd Het kiezen van een statistisch model voor het coderen van de scalair gekwantiseerde wavelet-coëfficiënt Wj=XQw\l^(Wjld), corresponderend met het knooppunt van de boom B, wordt uitgevoerd volgens de waarde l, =0,36P n-1,0 b( 1 U

M?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Vergelijking van de resultaten verkregen in echte beeldverwerkingsexperimenten met de resultaten van het toepassen van andere bekende wavelet-beeldcompressiealgoritmen laat zien dat het voorgestelde algoritme zeer hoge prestaties levert. Dus voor het bekende testbeeld Lena met een compressieniveau van 0,5 bits per pixel (16 keer) is de fout PSNR=37,66 dB.

De laatste studies van Hoofdstuk 5 hebben betrekking op de constructie van een hybride wavelet-spectrumcoderingsschema, wanneer, naast de hierboven beschreven methode om de takken van wavelet-coëfficiënten te knippen, de mogelijkheid van vector "zelfkwantisatie" van de takken ook is toegestaan , wat kan worden geïnterpreteerd als fractale codering in het domein van wavelet-transformaties (zie bijvoorbeeld ). Het resulterende hybride algoritme vereist een veel grotere hoeveelheid berekening, maar de fractale component van de codering in dit geval bleek bijna volledig te worden onderdrukt door het standaard wavelet-compressieschema op basis van vertakkingssnoei. Er moet echter worden opgemerkt dat de "koppeling" van benaderingen in het hybride algoritme op een eenvoudige manier is gemaakt, en de mogelijkheden voor verdere ontwikkeling laten hier een breed onderzoeksveld over.

Het zesde hoofdstuk is gewijd aan de studie van dynamische beeldcompressiealgoritmen om een ​​videocompressieschema te construeren dat geschikt is voor software-implementatie in realtime op basis van personal computers.

Een videosequentieframe is een matrix van pixels uit Mi-rijen en M2-kolommen: B=(bkj), A:=0.1,.,MG1, /=0.1,.,M2-1, en met de term videosequentie bedoelen we een bestelde kozijnset B0 ,!*one,. ,Vg,. Laten we het (y, x)-blok van het frame B (y, x-integer coördinaten) een submatrix BytX=(bkii) noemen, waarbij k=y,y+\,.y+Ni-\, 1=x>x+ \,.j+nrA. In het ontwikkelde algoritme wordt elk frame van de videosequentie tijdens de verwerking verdeeld in aangrenzende matrixblokken (BWjn) met de grootte 8x8, m,n=0,8,16. Als een blok van de videosequentie in zekere zin "vergelijkbaar" blijkt te zijn met het oorspronkelijke blok B"m, beschouwen we dat het blok B1m>n het verplaatste fragment B^J van het vorige frame is, en om het (m, n) afbeeldingsblok, het is voldoende om het coördinatenblok in het vorige frame, y hen, of wijzigingen in de coördinaten y-t en x-n op te geven. Een speciaal geval van het verplaatste blok is een vast blok, wanneer m = y, l = x als nieuw. Deze ideologie wordt gevolgd door moderne internationale videocompressiestandaarden MPEG, H.261-H263, en ze zijn allemaal ook gebaseerd op het gebruik van DCT voor het coderen van nieuwe blokken.

De ontwikkeling van een nieuw algoritme voor videocompressie werd uitgevoerd als onderdeel van een algemene benadering van RD-optimalisatie van compressie met verlies. In het ontwikkelde algoritme, om de coderingsmethode voor het volgende verwerkte blok B1m p te selecteren, laten we ons leiden door het criterium voor het minimum van de Lagrange-functie voor het blok: J(b)-D(b)+?iR(b) . Laten we aannemen dat het argument b=0 overeenkomt met de codering van het verplaatste (vaste) blok, en ¿=1 met het nieuwe. Als dan J(l)>/(0), dan wordt het blok gecodeerd als verplaatst en als nieuw - anders.

Bij gebruik van RD-optimalisatie wordt het probleem van het vinden van verplaatste blokken als volgt geformuleerd. Zoek voor een gegeven (m, n)-blok B1m van het n-de frame in het vorige gereconstrueerde frame zo'n (y, x)-blok l., zodat de Lagrange RD-functie de minimale waarde aanneemt

(0.10) tt,v)e£2 en " "

V -V t, p y, x

Hierbij wordt er rekening mee gehouden dat de coördinaten van het gevonden blok als relatief worden gecodeerd, d.w.z. verplaatsingsvector r = (y-m, x-n).) Het is gegarandeerd om het minimum (0.10) alleen te vinden met een volledige opsomming van de elementen (u, y) e £ 1, en om het zoekalgoritme in het echt te implementeren tijd , moeten alleen de punten (y, u) die voldoende dicht bij het punt (m, n) liggen, worden beschouwd als het gebied O. Het vergroten van de zoekefficiëntie door het gebied C2 uit te breiden, wordt bereikt door verschillende gerichte zoekalgoritmen te gebruiken, gericht op het minimaliseren van de representatiefout van het verplaatste blok | | in "ra> n, wat overeenkomt met het specifieke geval (0,11) met R = 0. Gerichte zoekalgoritmen vinden ongeveer een minimum (0,11), maar door een aanzienlijke uitbreiding van het zoekgebied is het meestal mogelijk om een ​​groter aantal verplaatste blokken te vinden, met een complexiteit vergelijkbaar met volledige opsomming.

In het zesde hoofdstuk wordt een nieuw gericht zoekalgoritme voor een verplaatst blok voorgesteld, dat is gericht op een benaderende oplossing van probleem (0.10) al voor een willekeurige waarde van X. Een onderscheidend kenmerk van het voorgestelde algoritme is dat kleine verplaatsingen van blokken worden nauwkeuriger doorzocht, omdat moet strikt worden gecontroleerd vanwege de specifieke kenmerken van visuele waarneming. Om de efficiëntie van het in hoofdstuk 6 verkregen zoekalgoritme voor de verplaatsingsvector (A, AX) van het verwerkte blok te verbeteren, zou men een voorspelling moeten bouwen op de verplaatsingsvectoren (d^A^) en (d * D) van twee reeds verwerkte "buren" (respectievelijk de verticale buurman en de horizontale buurman). De voorspelling zelf zijn de relatieve coördinaten (y0, * 0), die de overdracht van het midden van het zoekgebied bepalen: van het punt (t, p) naar het punt (w, p) \u003d (t + y0, p +x°). Experimenteel is bevestigd dat het aantal nieuwe afbeeldingsblokken met 5,25% wordt verminderd als de volgende voorspellingsregel wordt toegepast:

0,0), beide aangrenzende blokken zijn nieuw

D^D^), horizontaal - nieuw, verticaal - verplaatst (Anu, Akh), horizontaal - verplaatst, verticaal - nieuw ((d;, SPIRIT)+(DA, DAH),)/2, beide buren - verplaatste blokken

In navolging van de ideologie van de MPEG-standaard wordt in het ontwikkelde compressieschema ook de verwerking van nieuwe blokken uitgevoerd met behulp van kwantisering, gevolgd door statistische codering van de tweedimensionale DCT-coëfficiënten. Het resultaat van het DCT-blok Here> en geeft S, S=F(BW>„) aan. Laten we ook aangeven: Se=fe;/=round(5M/^i;))^=0, Q = qD/=0 - een van de JPEG-kwantiseringsmatrices. Voor statistische codering van de matrix S wordt het in hoofdstuk 4 voorgestelde contextcoderingsalgoritme gebruikt, dat een extra fase van RD-optimalisatie introduceert. Laat ZQ =(z0,.,z63)

De vector verkregen als resultaat van het zigzag lezen van gegevens uit de SQ-matrix volgens de regel gedefinieerd door de JPEG-standaard (S0<->ZQ). RDoptimalisatie van statistische codering is mogelijk vanwege de verlenging van de nulruns van de componenten in de vector ZQ door ze bovendien op nul te stellen. Om een ​​merkbare complicatie van het coderingsalgoritme als resultaat te voorkomen, wordt in de geoptimaliseerde versie van het contextuele coderingsalgoritme voor DCT-coëfficiënten alleen de mogelijkheid geanalyseerd om de uiteindelijke nulreeks te vergroten, wat de grootste bijdrage levert aan de extra minimalisering van de functie J(Zq)=D(Zq)+ÀR( Zq). In dit geval wordt aangenomen dat de matrix Q, die de kwantisering van de DCT-coëfficiënten bepaalt, wordt gegeven. Een universeel codeeralgoritme moet werken met een bepaalde set kwantisatiematrices (Q/), met de mogelijkheid om de vereiste matrix te selecteren voor specifieke kwaliteits- en compressieniveau-eisen. Als de verzameling matrices groot genoeg is, wordt de selectie van de kwantiseringsmatrix Q volgens het minimumprincipe van de functie J(Zq) een omslachtige procedure die niet in realtime met standaardmiddelen kan worden geïmplementeerd. Bovendien, met een groot bereik aan mogelijke waarden van de index j, brengt de codering ervan voor elk nieuw blok afzonderlijk onaanvaardbaar hoge extra bitkosten met zich mee. Daarom werden slechts enkele matrices uit de door JPEG aanbevolen set geselecteerd als de eerste set, die overeenkomen met de beste, slechtste en enkele tussenliggende kwaliteitsniveaus. Het aantal matrices |(Q/)|=4 werd gebruikt in de experimenten. Om de uitvoering van de delingsbewerkingen, die nodig zijn voor kwantisering, te versnellen, werden de elementen van de matrices (Q,) naar boven afgerond op de dichtstbijzijnde waarde 2k, k=G,\,. Deze benadering maakt het mogelijk om de bewerkingen van deling en vermenigvuldiging van gehele getallen te vervangen door bitverschuivingen van de binaire representatie van getallen, die gewoonlijk veel sneller worden uitgevoerd door echte hardware.

Naast het gebruik van het DCT-contextcoderingsalgoritme (uit Hoofdstuk 4), stelt Hoofdstuk 6 een alternatief entropiecoderingsalgoritme voor waarin de gekwantiseerde DCT-spectra worden opgesplitst in vaste regio's die afzonderlijke (onafhankelijke) gegevensstromen vormen voor rekenkundige codering, en een experimentele techniek voor het construeren van een partitiespectra voor dergelijke regio's. Ondanks het feit dat in het algemene schema van videocompressie gekozen is voor het eerste spectrumcoderingsalgoritme, kan het gebruik van rekenkundige codering met een vaste verdeling van spectra in regio's van onafhankelijke codering meer de voorkeur hebben bij gebruik van andere (andere dan DCT) transformaties, evenals in compressieschema's, met behulp van vectorkwantisatie van spectra. Bijvoorbeeld in de schakeling die in hoofdstuk 4 is besproken. (Het gebruik van vectorkwantisatie in realtime-algoritmen is moeilijk.)

Bij het bestuderen van de kenmerken van het uiteindelijke videocompressie-algoritme, om de omvang van de coderingsfout in de gereconstrueerde reeks В0,В1,.,ВЛ:~1 te schatten, werd de pieksignaal-ruisverhouding gebruikt, die als volgt werd bepaald :

PSNR = 101g (III)

dB], waarbij Mi en M2 de framegrootte in pixels instellen. De bekende testsequenties Nieuws, Containerschip, Hall-monitor, Akiyo, Claire werden gekozen voor de experimenten. De resultaten van numerieke experimenten verkregen door afgestudeerde student F.V. Strelkov toonden aan dat in alle tests het voorgestelde compressieschema goede resultaten geeft, die de kenmerken van de MPEG-2-encoder, ontwikkeld door de MSSG-groep, overtreffen (mpeg2encode, versie 1.1, zie http://www. .mpeg .org/MSSG). Softwarecompressie van videosequenties wordt in realtime uitgevoerd.

De resultaten van het onderzoek dat in het proefschrift is uitgevoerd, worden samengevat in de laatste sectie - "Belangrijkste conclusies en conclusies".

De volgende hoofdresultaten worden ingediend voor de verdediging van het proefschrift:

Methode voor het schatten van de decorrelerende efficiëntie van orthogonale transformaties en algoritmen voor het clusteren van gecorreleerde data op basis daarvan;

DPKP en een snel algoritme voor de berekening ervan;

Nieuw snel DPCL-algoritme en de wijziging ervan - algoritme met onvolledige berekening; Algoritme van gecombineerde berekeningen DPCL voor het verwerken van reële arrays in de basis (1,exp(-2to/3));

Een beeldcompressiemethode gebaseerd op een speciale methode voor rekenkundige codering van DPCL-spectra van beeldblokken;

Deterministische en probabilistische schattingen van DCT-coëfficiënten;

Algoritme voor contextuele codering van DCT-spectra van beelden;

Algemeen beeldcompressieschema op basis van adaptieve vectorkwantisatie op het gebied van orthogonale transformaties;

Wavelet-compressiealgoritmen voor statische afbeeldingen;

Algoritme voor het zoeken naar verplaatste beeldblokken;

Experimentele techniek voor het construeren van een verdeling van spectra in gebieden van onafhankelijke codering;

algoritme voor videocompressie.

De belangrijkste resultaten die in het proefschrift worden gepresenteerd, zijn gepubliceerd in 30 artikelen. Alle theoretische resultaten die in het proefschrift worden gepresenteerd van de 11 co-auteurlijke artikelen zijn persoonlijk door de auteur verkregen. In gevallen waarin de gegeven experimentele numerieke gegevens (tabellen, grafieken) van gezamenlijke werken werden verkregen door co-auteurs, wordt dit duidelijk aangegeven in de loop van de presentatie bij het citeren van de resultaten.

Het videocompressie-algoritme dat in het zesde hoofdstuk wordt voorgesteld, werd programmatisch geïmplementeerd als onderdeel van het werk dat werd uitgevoerd in het NPK "Technological Center" van het Moscow State Institute of Electronic Technology en bij de NPP "Technology". De implementatie van de ontwikkelde videocompressiebibliotheken is uitgevoerd in een aantal softwaresystemen die videobeelden (inclusief codering) in realtime verwerken, waaronder het videobewakings- en opnamesysteem van Visual Security van het grootste praktische belang (zie http: //www.tcen.ru /vs). Kopieën van documenten over het gebruik en de implementatie van de resultaten van het proefschrift zijn beschikbaar in bijlage 6.

Dissertatie conclusie over het onderwerp "Wiskundige en softwareondersteuning voor computers, complexen en computernetwerken", Umnyashkin, Sergey Vladimirovich

CONCLUSIES EN CONCLUSIE

In het gepresenteerde proefschrift worden verschillende aspecten van de toepassing van discrete orthogonale transformaties voor digitale beeldcompressie onderzocht, zowel vanuit een puur formele theoretische analyse als vanuit de kant van de eisen en beperkingen die de praktijk oplegt aan specifieke rekenschema's en algoritmen. In het algemeen wordt de inhoud van het werk toegepast, dus de meeste theoretische resultaten worden ondersteund door computationele experimenten, waarvan de resultaten op hun beurt niet alleen dienden als illustratie of test van de theorie, maar vaak een impuls gaven en de bronnenmateriaal voor verder onderzoek.

Op basis van de resultaten van het onderzoek dat in het proefschrift is uitgevoerd, kunnen de volgende conclusies worden getrokken.

1. Orthogonale transformaties zijn het belangrijkste hulpmiddel dat wordt gebruikt voor gegevensdecorrelatie tijdens beeldcompressie. In het geval dat het wiskundige model van een discreet signaal wordt gespecificeerd door een covariantiematrix, is het raadzaam om het in de paper voorgestelde gemiddelde overmatige entropiecriterium te gebruiken om de efficiëntie van decorrelerende verwerking te analyseren.

2. Specifiek voor de compressie van gecorreleerde gegevens werd voor het eerst een discrete pseudo-cosinustransformatie (DtSP) verkregen en geïntroduceerd. In het compressieschema, dat de aanwezigheid veronderstelt van een stadium van scalaire kwantisering van de transformatiecoëfficiënten, onder de beschouwde snelle transformaties, waarvan de implementatie alleen wordt beperkt tot optellen-aftrekken-bewerkingen (Walsh, Haar, pseudo-cosinus), geeft DPCT de beste decorrelatieresultaten voor een discreet signaal beschreven door het Markov-model.

3. Met behulp van de verkregen snelle DPCL-algoritmen die rekening houden met de specifieke kenmerken van het verwerken van echte arrays, bereikt het voorgestelde beeldcompressieschema op basis van de rekenkundige codering van DPCL-coëfficiënten kenmerken die qua verwerkingskwaliteit en rekenkundige complexiteit.

4. Bij gebruik van de statistische codering van de DCT-coëfficiënten volgens de JPEG-methode is de aanwezigheid van "sprongen" van het discrete signaal het minst wenselijk in het centrale gebied van de verwerkende fragmenten.

5. De methode van multi-model (multi-thread) rekenkundige codering heeft een hoge efficiëntie van toepassing in verschillende schema's en algoritmen voor datacompressie, en een van de belangrijkste punten bij de ontwikkeling van compressieschema's is de definitie van regels voor het kiezen van de huidige coderingsmodel in de context van reeds verwerkte gegevens. Dus het gebruik van het algoritme van multi-model contextuele rekenkundige codering van DCT-coëfficiënten voorgesteld in Hoofdstuk 4 in het JPEG-schema verhoogt de efficiëntie van datacompressie met 10%.

6. Bij het comprimeren van afbeeldingen met behulp van multi-modelcodering van boomstructuren van wavelet-spectra, moet de modelselectieregel worden gebouwd volgens de gecombineerde context, die rekening houdt met zowel de omgeving van de wavelet-coëfficiënt zelf in de subband als de omgeving van de "ouder" coëfficiënt. Het nieuwe efficiënte algoritme voor digitale beeldcompressie met verlies dat op deze basis is verkregen, dat is ontwikkeld op basis van de resultaten van het bestuderen van de statistische eigenschappen van de spectra van discrete wavelet-transformaties, vertoont hoge compressiekenmerken met een implementatiecomplexiteit die acceptabel is voor een breed scala aan toepassingen.

7. Om de inter-frame (tijdelijke) redundantie van videogegevens te elimineren, moet het voorgestelde hybride algoritme voor gericht zoeken, waarin kleine verplaatsingen nauwkeurig en grondig worden gezocht, en significante verplaatsingen ruwweg, worden erkend als de meest geprefereerde voor praktisch gebruik onder de bestudeerde algoritmen voor compensatie van blokverplaatsing.

8. Bij gebruik van het voorgestelde videocompressie-algoritme, dat is ontwikkeld op basis van de RD-optimalisatiebenadering, rekening houdend met de vereisten en bijzonderheden van de software-implementatie, wordt realtime videocompressie en -herstel bereikt op basis van moderne persoonlijke computers, met een hoge verwerkingskwaliteit.

De resultaten van het uitgevoerde onderzoek worden weerspiegeld in 30 publicaties, gerapporteerd en besproken op vele volledig Russische en internationale conferenties. In het algemeen werden nieuwe wetenschappelijke resultaten verkregen in het proefschrift, waarvan de theoretische bepalingen het mogelijk maakten om in grote mate de procedures te ontwikkelen en te formaliseren voor het analyseren en synthetiseren van digitale beeldcompressieschema's op basis van het gebruik van discrete orthogonale transformaties.

De ontwikkelde benaderingen en aanbevelingen leidden tot de constructie van specifieke compressieschema's en algoritmen, waarvan er vele in software werden geïmplementeerd en de effectiviteit van hun toepassing experimenteel bevestigden. De resultaten van onderzoek naar videocompressie, uitgevoerd in het kader van onderzoek onder leiding van de auteur en gefinancierd door het ministerie van Wetenschap en Industrie van de Russische Federatie, worden geïmplementeerd in de vorm van algoritmen in het hardware- en softwaresysteem voor visuele beveiliging (zie bijlage nr. 6).

Lijst met referenties voor proefschriftonderzoek Doctor in de fysische en wiskundige wetenschappen Umnyashkin, Sergey Vladimirovich, 2001

1. Abstracte algebraïsche systemen en digitale signaalverwerking / Varichenko L.V., Labunets V.G., Rakov M.A. Kiev: Naukova Dumka, 1986. -248 p.

2. Alekseev A.G. Clustering van een gecorreleerde dataset // "Micro-elektronica en informatica 99". VI All-Russisch interuniversitair n.-t. conf. Kunst. en asp.: Tez. doc. - M.: MIET, 1999. - P. 133.

3. Ahmed N., Pao K. Orthogonale transformaties in digitale signaalverwerking: Per. van Engels. M.: Communicatie, 1980. - 248 p.

4. Vatolin DS Hybride schema van fractale compressie en vectorkwantisatie voor kleine blokken // Proceedings van de internationale conferentie Graphicon-98. Moskou, 1998, blz. 205-212.

5. Vilenkin N. Ya. Op een klasse van complete orthogonale systemen // Izv. Academie van Wetenschappen van de USSR. ser. mat. 1947. - T.P. - S.363-400.

6. Vorobyov VI, Gribunin V.G. Theorie en praktijk van wavelettransformatie. -S.-Pb.: Militaire uitgeverij. Universiteit voor Communicatie, 1999. 204 p.

7. M. V. Gashnikov, N. K. Glumov en V. V. Sergeev, "Informatietechnologie voor beeldcompressie in operationele remote sensing-systemen", Izv. 1999. - Nr. 1. - S. 99-107.

8. Gold B., Reider C. Digitale signaalverwerking: TRANS. van Engels. M.: Sov. radio, 1973. - 368 p.

9. B. I. Goluboe, A. V. Efimov en V. A. Skvortsov, Walsh-reeksen en transformaties: theorie en toepassingen. M.: Nauka, 1987. - 344 d.

10. Gorlov SK, Korystin AV, Rodin V.A. Een implementatie van de mapping-compressiemethode met behulp van niet-lineaire benadering van Fourier-Haar-sommen// Teor. functies en ca.: Tr. 7e Saratov, winter. school (1994). Deel 2. Saratov: SSU Publishing House, 1995.

11. Dmitriev V.I. Toegepaste informatietheorie: Proc. voor stud. universiteiten. -M.: Hoger. school, 1989. 320 p.

12. Efimov A.V., Pospelov A.S., Umnyashkin C.V. Enkele eigenschappen van multiplicatieve orthonormale systemen die worden gebruikt bij digitale signaalverwerking // Proceedings of the Mathematical Institute. V.A. Steklov RAS. T.219. - 1997. - C 137-182.

13. Efimov A.V., Umnyashkin C.V. Snelle algoritmen voor het berekenen van de discrete Chrestenson-Levy-transformatie en het schatten van de spectrale. kenmerken// Teor. functies en ca.: Tr. 7e Saratov, winter. school (1994). Deel 2. - Saratov: Uitgeverij van SSU, 1995. S. 9-20.

14. Zhukov V.G. Onderzoek naar methoden voor het vergelijken van verplaatste beeldblokken in algoritmen voor het comprimeren van videosequenties. // Micro-elektronica en informatica-99. Vsero's. interuniversitair n.-t. conf. studenten en afgestudeerde studenten: samenvattingen van rapporten. M.: MYET, 1999. - S. 137.

15. Zhukov DM. Gelijkwaardigheid van eendimensionale en tweedimensionale Chrestenson-Levy-transformatie // Methoden voor digitale beeldverwerking: Sat. wetenschappelijk tr. MIET. M.: MIET, 1982 - S. 65-70.

16. Zadiraka V.K., Evtushenko V.N. Optimale zonecoderingsmethode met behulp van Slant-transformatie // Cybernetica en systeemanalyse. 1994. - Nr. 4. - Met. 56-60.

17. Onderzoek en ontwikkeling van lossy software datacompressie-algoritmen voor digitale videobeeldverwerking: onderzoeksrapport (definitief) / HI 111 "Technology"; handen -Umnyashkin CB "Horloge"; Nee staat. per. 01200004624; Inv. nr. 100704. - Moskou, 2000. - 48 d.

18. Kendal M. Rank-correlaties. M.: Statistiek, 1975. - 216 p.

19. Kovalenko KN., Filippova A.A. Kansrekening en wiskundige statistiek. M.: Hoger. school, 1982. - 256 p.

20. Korn G., Korn T. Handboek wiskunde voor wetenschappers en ingenieurs: Per. van Engels. M.: Nauka, 1970. - 720 d.

21. Kochetkov M.E. Digitale beeldcompressie met behulp van vectorkwantisatie in het domein van discrete orthogonale transformaties: Diss. kan. techniek. Wetenschappen. M., 1999. -191 d.

22. Kochetkov M.E., Umnyashkin C.V. Multithreaded implementatie van het rekenkundige coderingsalgoritme / M.: MGIET (TU), 1998. 21 p. Gedeponeerd bij VINITI op 25 december 1998, nr. 3884-B98.

23. Kochetkov M.E., Umnyashkin C.V. Over de vergelijking van criteria voor het evalueren van de effectiviteit van decorrelaterende transformaties / M.: MGIET (TU), 1998. 34 p. - Afd. in VINITI 13.04.98, nr. 1069-B98.

24. Lesin V.V., Lisovets Yu.P. Grondbeginselen van optimalisatiemethoden: Proc. zakgeld. - M.: Uitgeverij MAI, 1998. 344 p.

25. Lisovets Yu.P., Pospelov AS Multiplicatieve holografische transformaties voor beeldverwerking // Methoden voor digitale beeldverwerking: Sat. wetenschappelijk tr. M.: MIET, 1982 - S. 100-109.

26. Litosh IP Het combineren van algoritmen voor fractal- en wavelet-compressie van digitale afbeeldingen // "Microelectronics and Informatics -2001". U1P volledig Russisch. interuniversitair n.-t. conf. Kunst. en asp.: Tez. doc. - M.: MIET, 2001. - P. 147.

27. Markov AA Compressie van digitale beelden met behulp van \vavelet-transformations // "Microelectronics and Informatics 2000". VII All-Russische interuniversitair n.-t. conf. Kunst. en asp.: Tez. doc. -M.: MIET, 2000. -S. 114.

28. Wijze AE Numerieke methoden voor pc in BASIC, Fortran en Pascal. - Tomsk: MP "RASKO", 1991. -272p.

29. I. Ya. Novikov en S. B. Stechkin, "Basisconstructies van wavelets", in fundamentele en toegepaste wiskunde. 1997. - Deel 3. - Nr. 4. -blz.999-1028.

30. Nussbaumer G. Snelle Fourier-transformatie en algoritmen voor het berekenen van windingen: Per. van Engels. M.: Radio en communicatie, 1985. - 248 p.

31. Peev E., Boyanov K, Belcheva O. Methoden en hulpmiddelen voor beeldcompressie // Automatisering en informatica.-1994.-28, nr. 3.-p.3-14.

32. Petukhov A.P. Inleiding tot de theorie van wavelet-bases. St. Petersburg: Uitgeverij van de Technische Staatsuniversiteit van St. Petersburg, 1999. 132 p.

33. Pospelov A. S. Methoden voor het verwerken van digitale video-informatie met behulp van holografische typetransformaties // Sat. tr. int. conferentie door programmeur. en mat. methoden om fysiek op te lossen. taken (Dubna, 14-19 juni 1993). Communicatie OINIR11-94-100. - C, 71-73.

34. Pospelov A. S. Enkele wiskundige problemen en algoritmen voor digitale informatieverwerking met behulp van discrete transformaties: Diss. voor de competitie account stap, Dr. phys.-math. Wetenschappen. M., 1992. -398 p.

35. Toepassingen van digitale signaalverwerking: Per. van Engels. / red. E. Oppenheim. M: Mir, 1980. - 552 d.

36. Pratt W. Digitale beeldverwerking: TRANS. van Engels. M.: Mir, 1982. - Boeken 1 en 2. - 312 en 480 p.

37. Pratt W, Cash D., Andrews X. Beeldcodering met behulp van de Hadamard-transformatie // TIER. 1969. - T.57. - Nr. 1. - S.66-77.

38. Ptachek M. Digitale televisie. Theorie en technologie / Per. uit Tsjechen, uitg. LS Vilenchika. M.: Radio en communicatie, 1990. -528 p.

39. Rozanov Yu.A. willekeurige processen. M.: Nauka, 1971. - 288 d.

40. Sveshnikov AA Toegepaste methoden van de theorie van willekeurige functies. M. : Nauka, 1968.-463 d.

41. Trakhtman V.A. Spectrale analyse in de basis van Vilenkin-Chrestenson functies//Radio engineering en elektronica. -1975. -T. 20.-#1. -blz.130-138.

42. Trakhtman A.M., Trakhtman V.A. Grondbeginselen van de theorie van discrete signalen op eindige intervallen. M.: Sov. Radio, 1975.

43. Umnyashkin CB Algoritme voor het clusteren van gecorreleerde gegevens // VII Internationale conferentie. Wiskunde. Economie. Ecologie.

44. Onderwijs. Internationaal Symposium. Fourier-reeksen en hun toepassingen: abstracts. Rostov: Rost. staat. economie, acad., 1999. - S. 211-212.

45. Umnyashkin CB Algoritme voor het zoeken naar verplaatste blokken voor het coderen van digitale videobeelden. 38-41.

46. ​​​​Umnyashkin S. V. Algoritme voor fractale beeldcodering in het domein van wavelet-transformaties // Computer Mathematics. Optazzaschya calculus: Verzameling van wetenschappelijke werken. Deel 1. - Kshv: 1Instituut voor schbzrnetica ím. VM Glushkova, 2001. - S. 385-391.

47. Umnyashkin CB Snelle algoritmen voor het berekenen van een discrete multiplicatieve transformatie / M.: MGIET (TU), 1995. 15 p. - Afd. in VINITI 16.02.95, nr. 442-B95.

48. Umnyashkin CB Een snel algoritme voor het berekenen van de discrete Chrestenson-Levy-transformatie voor het verwerken van reële arrays / M.: MGIET (TU), 1995. 19 p. - Afd. in VINITI 05.12.95, nr. 3212-B95.

49. Umnyashkin S. V. Contextuele rekenkundige codering gebruiken om de gegevenscompressie te verhogen volgens het JPECj-schema Izvestiya vuzov. Elektronica. Nummer 3. - 2001. - S. 96-98.

50. Umnyashkin CB Compensatie voor de beweging van objecten tijdens compressie van videogegevens // "Electronics and Informatics XXI Century" Derde internationale wetenschappelijke en technische conferentie: procedures. doc. - M.: MIET, 2000.-S. 365-366.

51. Umnyashkin S. V. Wavelet-compressie van digitale afbeeldingen met voorspelling van statistische modellen Izvestiya vuzov. Elektronica. Nummer 5. - 2001. - S.86-94.

52. Umnyashkin CB Discrete beeldcoderingsmethode op basis van de Chrestenson-Levy-transformatie // Micro-elektronica en informatica -96: procedures. rapport interuniversitair wetenschap.-tech. conf. M.: MGIET (TU), 1996. - P.167.

53. Umnyashkin CB Over het clusteren van gecorreleerde gegevens. // Informatietechnologieën in innovatieve projecten. Internationale conferentie (Izhevsk, 20-22 april 1999): Materiaal van rapporten. -Izhevsk, IzhGTU, 1999. S. 59-65.

54. Umnyashkin CB Over kwantisering van de elementen van het spectrum van de discrete Chrestenson-Levy-transformatie / M.: MGIET (TU), 1995. 12 p. - Afd. in VINITI 16.02.95, nr. 441-B95.

55. Umnyashkin CB Over de wijziging van de discrete cosinustransformatie // Benaderingstheorie en harmonische analyse: Proc. rapport int. conf. (Tula, 26-29 mei 1998). Tula: TulGU, 1998. - S.264-265.

56. Umnyashkin CB Over de wijziging van de discrete cosinustransformatie // Izv. Tul. staat. Universiteit ser. Wiskunde. Mechanica. Informatica. Tula: TulGU, 1998. T. 4. Uitgave. 1. S. 143-147.

57. Umnyashkin CB Over schatting van decorrelatie-eigenschappen van discrete transformaties // Micro-elektronica en informatica 97: samenvattingen van rapporten. interuniversitaire wetenschappelijke en technische conferentie. Deel 2. - M. MGIET (TU), 1997.-S. 110:

58. Umnyashkin CB Eigenaardigheden van het gebruik van de discrete Chrestenson-Levy-transformatie bij de verwerking van echte arrays // Micro-elektronica en informatica: procedures. rapport interuniversitair wetenschap.-tech. conf. 1214 apr. 1995. M.: MGIET (TU), 1995. - S. 188-189.

59. Umnyashkin CB Evaluatie van de efficiëntie van het gebruik van unitaire transformaties voor het coderen van discrete signalen // Computerwetenschappen en communicatie: za. wetenschappelijk tr. red. VA Barkhotkina. M.: MIET - 1997. S.73-78.

60. Umnyashkin CB Toepassing van de discrete Chrestenson-Levy-transformatie in digitale beeldverwerking. Dis. kan. techniek. Wetenschappen. - Moskou, 1997. - 198 d.

61. Umnyashkin CB Pseudo-cosinustransformatie voor compressie van discrete signalen // Informatietechnologieën en problemen van micro-elektronica. Za. wetenschappelijk tr. -M.: MIET. -1999. blz. 158-170.

62. Umnyashkin SV Schema van RD-geoptimaliseerde compressie voor het verwerken van videogegevens in realtime // Geaccepteerd voor publicatie in het tijdschrift Izvestiya vuzov. Elektronica". Nummer 6. - 2001.

63. Umnyashkin CB Digitale beeldcompressie met behulp van discrete Chrestenson-Levy-transformatie // Interbranch Scientific and Technical Journal "Defence Complex - to the Scientific and Technical Progress of Russia", nr. 2,2000. blz. 28-39.

64. Umnyashkin C.V., Kosmach M.V. Optimalisatie van digitale beeldcodering met behulp van de JPEG-methode // Izvestiya vuzov. Elektronica. Nr. 4-5. -2000. - S. 139-141.

65. Umnyashkin C.V., Kochetkov M.E. Analyse van de efficiëntie van het gebruik van discrete orthogonale transformaties voor digitale codering van gecorreleerde gegevens Izvestiya vuzov. Elektronica. Nummer 6. - 1998. - S. 79-84.

66. Umnyashkin C.V., Strelkov F.V., Zhukov V.G. Zoekalgoritmen in drie stappen voor verplaatste beeldblokken // Informatietechnologieën en controlesystemen. Za. wetenschappelijk tr. red. VA Barkhotkina.- M: MIET, 2000. S. 47-55.

67. Harmut X. Theorie van sequentieanalyse. Grondbeginselen en toepassingen: Per. uit het Engels - M.: Mir, 1980. 574 p.

68. Digitale verwerking van televisie- en computerbeelden / Ed. Yu.B.Zubarev en V.PDvorkovich. Moskou: Internationaal Centrum voor Wetenschappelijke en Technische Informatie, 1997. - 212 p.

69. Chen Sh.-K. Ontwerpprincipes van visuele informatiesystemen. -M.: Mir, 1994. 408 d.

70. Andrews G. Het gebruik van computers voor beeldverwerking / Per. van Engels. red. B.F. Kuryanova. M.: Energie. - 1977. -161 d.

71. Yavorsky BM, Detlaf AA Handboek natuurkunde voor ingenieurs en universiteitsstudenten.-editie 7e, gecorrigeerd.-M.: Nauka, 1977.-944 p.

72. Jaroslavski JI.II. Inleiding tot digitale beeldverwerking. M.: Sov. radio, 1979.-312 p.

73. Yaroslavsky L.P. Digitale signaalverwerking in optica en holografie. Inleiding tot digitale optica. M.: Radio en communicatie. - 1987. -296 d.

74. Ahmed N., Natarajan T., Rao K.R. Over beeldverwerking en een discrete cosinustransformatie // IEEE Trans. computers. -1974. V. C-23 - Nr. 1. - P.90-93.

75. Allen JB andRabiner L.R. Een uniforme benadering van korte-time Fourier-analyse, synthese//Proc. IEEE 1977.-Vol. 65.-Nee Iyu-R. 1558-1564.

76. Anderson J.B., Huang T.S. Stuksgewijze Fourier-transformatie voor beeldbandbreedtecompressie // IEEE Trans. gemeenschappelijk -1972.- V. COM-20 nr. 3. -P.488-491.

77. Andrews HC, Hunt BR. Digitale beeldrestauratie.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

78. Andrews HC, Pratt WK Fourier-transformatiecodering van afbeeldingen // Hawaii International Conference on System Science, januari 1968. P. 677-679.

79. Andrews HC, Pratt WK Transformeer beeldcodering // Proc. Computerverwerking in communicatie. New York: Polytechnische Pers, 1969. -P. 63-84.

80. Antonini M., Barlaud M., Mathieu P. en Daubechies I., Beeldcodering met behulp van wavelet-transformatie // IEEE Trans. AfbeeldingProc. Vol. 1. - Nr. 2, 1992. -P. 205-220.

81. Barnsley F., Jacquin A. Toepassing van terugkerende herhaalde functiesystemen op afbeeldingen//Proc. SPIE.- 1988.-Vol. 1001.-blz. 122-131.

82. Berger T. Rate vervormingstheorie. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Verplaatsingsschatting door hiërarchische blokvergelijking // Proc. SPIE Conf. Op Vis. gemeenschappelijk En beeldproc. Cambrige, 1988. - P. 942-951.

84. Bilgin A., Sementilli.P. en Marcellin M. Progressieve beeldcodering met behulp van trellis-kwantisatie // IEEE Trans. AfbeeldingProc. 1999.-V.8.-№11.-P. 1638-1643.

85. Chernov VM, Dmitriyev AG Beeldcompressie met behulp van discrete orthogonale transformaties met de "ruisachtige" basisfuncties // Computeroptica. 1999. - Uitgave. 19. - S. 184-187.

86. Cheung SK, Ro L.M. Een hybride adaptief zoekalgoritme voor snelle schatting van blokbewegingen // Proc. IEEE Internationaal Symp. op Signal Proc. en zijn app. (augustus 1996). Vol.1. 1996 - P.365-368.

87Chrestenson H.E. Een klasse van gegeneraliseerde Walsh-functies // Pacific. J Wiskunde. -1955.-V.5.-Nr.l.-P. 17-32.

88. Chrysafis C. Wavelet-beeldcompressie, vervormingsoptimalisaties en complexiteitsreducties: PhD (Electrical Engineering) Thesis. University of Southern California, Los Angeles, 2000. - 144 pagina's.

89. Chrysafis C., Ortega A. Efficiënte op context gebaseerde entropiecodering voor compressie van wavelet-beelden met verlies // Proc. Conferentie over datacompressie. -Snowbird (Utah), 1997. P. 241-250.

90. C ho N., Lee S. Snel algoritme en implementatie van 2-D discrete cosinustransformatie // IEEE Trans. circuits en systemen. 1991.-V.38. - P.297-305.

91. ChouPA., Lookabaugh T., GrayR.M. Entropie-beperkte vector-kwantisatie 11 IEEE Trans. ASSP. 1989. - Vol. 37. -#1. -P.31-42.

92. Codering van bewegende beelden en audio (MPEG-4). Standaard ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., Feauveau J.-C., Biorthogonal bases van compact ondersteunde wavelets, Comm. Puur Appel. Wiskunde. 1992. - V. 45. - Nr. 5. - P. 485560.

94. Coifman R., en Wickerhauser M.V., op entropie gebaseerde algoritmen voor beste basisselectie, IEEE Trans. informatie theorie. 1992. - Vol. 38. - Nr. 2 - P. 713718.

95. Cooley JW, Tukey JW. Een algoritme voor machinale berekening van complexe Fourier-reeksen // Mach. Berekenen. 1965. - V. 19. - P. 297-301.

96. Cosman PC, GrayRM. en VetterliM. Vectorkwantisatie van beeldsubbanden: een onderzoek // IEEE Trans. AfbeeldingProc. 1996. - V. 5. - Nr. 5. - P. 202225.

97. Costantini R. et al. Een videocoder met lage complexiteit op basis van de discrete Walsh Hadamard-transformatie //Proc. European Signal Processing Conference 2000 (Tampere, Finland, 5-8 september). -2000. -P.1217-1221.

98. Crouse M. en Ramchandran K. Gezamenlijke drempel- en kwantiseringsselectie voor transformatie van beeldcodering: entropie-beperkte analyse en toepassingen op baseline JPEG // IEEE Trans, op beeldverwerking. 1997. - Vol. 6. -№2 - P. 285-297.

99. Davis G.M., Een op wavelet gebaseerde analyse van fractale beeldcompressie, IEEE Trans. AfbeeldingProc. 1998. - V.7-№2. -P.141-154.

100. Davis G., Nosratinia A. Wavelet-gebaseerde beeldcodering: een overzicht // Toegepaste en computationele controle, signalen en circuits. -1998. -V.l. -#1. -P. 205269.

101. Deever A. en Hemami S. Wat is uw teken?: Efficiënte tekencodering voor ingebedde wavelet-beeldcodering 11 Proc. van Data Compression Conference, 2000.-P. 273-282.

102. Duhamel P., Guillemont C. Polynomiale transformatieberekening van 2-D DCT, Proc. ASSP "90. 1990. - P.1515-1518.

103. EfimovA. V. Multiplicatieve functiesystemen en hun toepassingen in discrete informatieverwerking // Approximation and function spaces/ Banach centre publicaties (Warschau). 1989. - V.22. - P. 111-117.

104. Eflmov VM, Kolesnikov A.N. Beeldcompressie met voorlopige interpolatie van het signaal // Patroonherkenning en beeldanalyse. 1996. - Vol. 6. - Nr. 1.

105. Eliott DF, Rao KR. Snelle transformaties: algoritmen, analyses, toepassingen. - Londen: Academic Press inc., 1982. 488 p.

106. Enomoto II, Shibata K. Orthogonaal transformatiecoderingssysteem voor televisiesignalen, IEEE Trans. Elektromagnetische compabiliteit. 1971. - Speciale uitgave over Walsh-functies. -V. EMC-13. - Nummer 3. - P. 11-17.

107. Feig E. Een snel geschaald DCT-algoritme, Proc. SPIE Int. soc. opt. Ing. 1990.-Vol. 1244.-blz. 2-13.

108. Fischer TR en WangM. Entropie-beperkte trellis-gecodeerde kwantisering// IEEE Trans. inf. theorie. 1992. - Vol. 38 - Nr. 2 - P. 415-426.

109. Fisher Y. Fractal-compressie: theorie en toepassing op digitale afbeeldingen. -New York: Spinger Verlag, 1994. 341 p.

110. Goed J. Het interactie-algoritme en praktische Fourier-analyse // J. Royal Stat. soc. (Londen). 1958.-V.B-20. - P. 361-372.

111. Grijs R.M. Vectorkwantisatie // IEEE ASSP Magazine. -april 1984.-p.4-29

112. Gray R, Neuhoff D. Kwantisering //IEEE Trans. inf. theorie. okt. 1998. - Vol. 44.-Nee. 6.-P. 2325-2383.

113. HabibiA., WintzPA. Beeldcodering door lineaire transformatie en blokkwantisering//IEEE Trans. Comm. techniek. -1971. -V. COM-19. Nr. 1. -P.50-63.

114. Hamidi M., Pearl J. Vergelijking van de cosinus- en Fourier-transformaties van Markov-I-signalen 11 IEEE Trans. ASSP. V.24. - 1976. - P.428-429.

115. Hauque MA Een tweedimensionale snelle cosinustransformatie // IEEE Trans. ASSP. -1985. V. 33. - Nr. 6. - P.1532-1538.

116. Huang J.Y., Schultheiss. Blokkwantisatie van gecorreleerde Gaussiaanse willekeurige variabelen// IEEE Trans. Communicatie. -1963. -V. CS-11(sept.)-P. 289296.

117. Informatietechnologie Generieke codering van bewegende beelden en bijbehorende audio-informatie: Video. //Aanbeveling ITU-T H.262. - Standaard ISO/IEC 13818-2-2000.

118. ISO/IEC JTC1 Comité ontwerp 10918-1. Digitale compressie en codering van stilstaande beelden met continue toon. Deel 1. Eisen en richtlijnen. -1991.

119. ISO/IEC JTC1 Comité ontwerp 10918-2. Digitale compressie en codering van stilstaande beelden met continue toon. Deel 2. Nalevingstesten. 1991.

120. Jacquin A. Fractal beeldcodering gebaseerd op een theorie van herhaalde contractieve beeldtransformaties // Proc. SPIE Visuele Comm. En beeldproc. 1990. - P.227-239.

121. Jacquin A. Beeldcodering gebaseerd op een fractaltheorie van herhaalde contractieve beeldtransformaties // IEEE Trans. AfbeeldingProc. 1992. - Vol.1. - Nr. 1. -P. 18-30.

122. Jafarkhani H., Farvardin N., en Lee C.-C., Adaptieve beeldcodering op basis van de discrete wavelet-transformatie 11 Proc. IEEE Int. Conf. AfbeeldingProc. Vol. 3 - Austin (TX), 1994. - P. 343-347.

123. Jain J.R. en Jain AK Verplaatsingsmeting en de toepassing ervan in interframe-beeldcodering // IEEE Trans. Comm. 1981. - Vol. 29. - Nr. 12. -P.1799-1806.

124. JoshiR.L., Fischer T.R. en Bamberger R.H. Optimale classificatie in subbandcodering van afbeeldingen // Proc. IEEE Int. Conf. AfbeeldingProc. Vol. 2 - Austin (TX), 1994.-P. 883-887.

125. Joshi R.L. et al., Vergelijking van verschillende classificatiemethoden in subbandcodering van afbeeldingen// IEEE Trans. afbeelding verwerken. 1997. - Vol. 6. - nov. - blz. 1473-1486, 1997.

126JPEG2000. Deel 1. Eindcommissie Conceptversie 1.0. ISO/IEC JTC1/SC29 WG1.-205 pagina's.

127. Kasner J.H., Marcellin M.W. Adaptieve wavelet-codering van afbeeldingen // Proc. IEEE Int. Conf. AfbeeldingProc. Vol. 3 - Austin (TX), 1994. - P. 358-362.

128. Koga T. et al, Bewegingsgecompenseerde interframecodering voor videoconferenties, Proceedings of the National Telecommunications Conference, New Orleans, Louisiana, nov. 29 dec. 3. - 1981. - Vol. 4.-Blz. G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C. en Smith M.J.T. Subbandvideocodering met snelheidsbeperking. // IEEE-transacties op beeldverwerking. -1999. -Vol. 8.-№2.-P. 145-154.

130. Kurosaki M., WakiH. Een JPEG-compatibele compressie/decompressie van kleurenafbeeldingen LSI // Mitsubishi Elec. Adv. -1994. -V.68, sept. -P.17-18.

131. Levy P. Sur une generalization des fonctions orthogonales de M. Rademacher II Commentaar, wiskunde. hel. 1944. - V.16. - P. 146-152.

132. Lewis A.S., Knowles G. Beeldcompressie met behulp van de 2-D Wavelet-transformatie. II IEEE Trans. AfbeeldingProc. 1992. - Vol. 1. - Nr. 2. - P.244-250.

133. Linde Y., Buzo A., Gray R.M. Een algoritme voor vectorkwantiseerderontwerp // IEEE Trans. OpComm. - 1980. - V.28. Nr. 1. - P.8^95.

134. LoPresto SM, Ramchandran K., OrchardM.T. Beeldcodering op basis van mengselmodellering van wavelet-coëfficiënten en Fast Estimation-Quantization Framework // Proc. Conferentie over datacompressie. Snowbird (Utah), 1997. - P. 221-230.

135. Mallat S., Multiresolutiebenadering en wavelet-orthonormale basen van L2(R), Trans. AMS. 1989. - V.315. -P.69-87.

136. Marcellin M. et al. Een overzicht van JPEG-2000 // Proc. Data Compression Conference, J.A. Storer en M. Cohn, red. Snowbird, Utah, maart. 28 mrt. 30, 2000. Snowbird, 2000. - P. 523-541.

137. MarchallX. Bewegingsschatting en compensatie voor videocodering met zeer lage bitrate: Doctor of Sciences Appliquées. Université Catholique de Louvalin. -Louvalin-la-Neuve, 1998. - 228 pagina's.

138. Nasrabadi N.M., koning R.A. Beeldcodering met behulp van vectorkwantisatie: een recensie // IEEE Trans, over communicatie. 1988. - V. 36. - Nr. 8. - P. 957-971.

139. Nelson M., Gailly JA. The Data Compression Book (tweede editie). New York: M&T Boeken, 1995. - 541 p.

140. Pearl J. Over het coderen en filteren van stationaire signalen door discrete Fourier-transformaties // IEEE Trans. inf. theorie. 1973. - Vol. IT-19. - P. 229-232.

141 Pratt WK, Andrews HC Toepassing van Fourier-Hadamard-transformatie op bandbreedtecompressie // Beeldbandbreedtecompressie / Ed.: Huang T.S., Tretiak O.J. New York: Gordong en Breach, 1972. - P. 515-554.

142 Pratt W.K, Chen W.H., Welch L.R. Slant transformatie beeldcodering // IEEE Trans. gemeenschappelijk -1974. -V. COM-22. P.1075-1093.

143. Queluz M.P., Bewegingsschatting voor videocodering: een recensie // HF Magazine - december 1995. Speciale uitgave over videocodering. - Nee. 4.-pp. 5-28.

144. Ramachandran K, Vetteri M. Beste wavelet-pakketbases in de zin van snelheidsvervorming, IEEE Trans. AfbeeldingProc. 1993.-V.2. -#2. - P. 160-175.

145. Rao KR, Narasimhan MA, Reviduri K. Beeldgegevensverwerking door Hadamard-Haar-transformatie // IEEE Trans. computers. 1975.-VC-23. - Nr. 9. - P. 888-896.

146. Rao KR, Yip P. Discrete cosinustransformatiealgoritmen, voordelen, toepassingen. - Londen: Academic Press Inc., 1990.

147. Roska T., Boros T., Radvânyi A., Thiran P. en ChuaL.O. Bewegende en staande objecten detecteren met behulp van cellulair neuraal. Netwerken // International Journal of Circuit Theory and Applications. Vol. 20. - 1992. - P.613-628.

148. Said A. en Pearlman W.A. Een nieuwe snelle en efficiënte afbeeldingscodec op basis van setpartitionering in hiërarchische bomen // IEEE Trans, op circuits en systemen voor videotechnologie. 1996. - Vol. 6. - №3, juni. - P. 243-250.

149. Shapiro J.M. Ingebedde beeldcodering met behulp van nulbomen van wavelet-coëfficiënten 11 IEEE Trans. Signaalverwerking, vol. 41, blz. 3445-3462, december 1993.

150. Stefanoiu D. Inleiding tot signaalverwerking met wavelets // Studies over informatie en controle. -1994. V.3. - Nr. 1. - P. 97-110.

151 Storer J.A. Datacompressie: methoden en theorie. Rockville (MD): Informatica pers, 1988. - X, 413 p.

152. Umnyashkin S. V. Beeldcompressie op basis van gemengde voorspellende modellering van wavelet-bomen // Rapporten van Vaxjo University (Zweden) Wiskunde, natuurwetenschappen en technologie. - Nee. 11 (september), 2001. - 18 pagina's

153. Umnyashkin S.V., Strelkov F.V. Een RD-geoptimaliseerd schema voor realtime videocompressie // Rapporten van Vaxjo University (Zweden) Wiskunde, natuurwetenschappen en technologie. - Nee. 12 (september), 2001. - 15 pagina's.

154. Van de Walle A., Samenvoegen van fractal-beeldcompressie en wavelet-transformatiemethoden 11 Fractals. 1997.-vol. 5 (aanvullend nummer), april. - P.3-15.

155 Vetterly M., Herley C., Wavelets en filterbanken: theorie en ontwerp, IEEE Trans. SignaalProc. 1992. - V.40. - Nr. 9. - P.2207-2232.

156. Videocodec voor audiovisuele diensten bij p x 64 kbit/s. //Aanbeveling ITU-T H.261. -1993.

157. Videocodering voor communicatie met lage bitsnelheid //Aanbeveling ITU-T H.263. Standaard ISO/IEC 13818-2: 1998.

158. Wallace G.K. Het JPEG-algoritme voor beeldcompressiestandaard // Communicatie van de ACM. 1991.-V.34. -#4. - P. 30-44.356

159. WeiD., PaiH.-T. en BovikA. C., antisymmetrische biorthogonale coiflets voor beeldcodering // Proceedings van IEEE International Conference on Image Processing. Chicago, 1998. - Vol. 2. - P. 282-286.

160. Witten I., Neal R.M., Cleary J.G. Rekenkundige codering voor datacompressie // Comm. ACM. 1987. - Vol.30. - Nummer 6. - P. 520-540.

161. Woods JW, Huang TS Beeldbandbreedtecompressie door lineaire transformatie en blokkwantisatie // Beeldbandbreedtecompressie / Ed.: Huang T.S., Tretiak O.J. -New York: Gordong en Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. en OrchardM.T. Ruimte-frequentiekwantisatie voor Wavelet-beeldcodering // IEEE Trans. AfbeeldingProc. V.6 - mei 1997, blz. 677693.

163. Xiong Z., Ramchandran K. en Orchard M. Wavelet-pakketten beeldcodering met behulp van ruimtefrequentiekwantisatie, IEEE Trans. AfbeeldingProc. 1998. - Vol. 7.-#6. - P. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. Een vergelijkende studie van DCT- en Wavelet-gebaseerde beeldcodering // IEEE Trans. Over circuits en systemen voor videotechnologie. -1999. V.9 - Nr. 5. - P.692-695.

165. Zhang Z. en Wei V.K., Een on-line universeel lossy datacompressie-algoritme via continue codeboekverfijning. Deel I. Basisresultaten // IEEE Trans. informeren. theorie. Vol.42. - Mei 1996. - P.803-821.

Houd er rekening mee dat de wetenschappelijke teksten die hierboven worden gepresenteerd, ter beoordeling zijn geplaatst en zijn verkregen door middel van originele tekstherkenning (OCR) van proefschriften. In dit verband kunnen ze fouten bevatten die verband houden met de imperfectie van herkenningsalgoritmen. Dergelijke fouten komen niet voor in de pdf-bestanden van proefschriften en abstracts die wij aanleveren.

Controle

Communicatie, communicatie, radio-elektronica en digitale apparaten

Algoritmen voor het transformeren van originele afbeeldingen op basis van orthogonale transformaties Waarvoor kunnen algoritmen voor het transformeren van originele afbeeldingen op basis van orthogonale transformaties worden gebruikt Wat zijn de overeenkomsten en verschillen tussen de discrete Fourier-transformatie en andere soorten orthogonale transformaties. Een van de soorten orthogonale transformaties is de discrete Fourier-transformatie. In het proces van orthogonale transformaties van een afbeelding met sterke correlaties tussen aangrenzende elementen, ...

2.4. Algoritmen voor het transformeren van bronafbeeldingen op basis van orthogonale transformaties (Waarvoor kunnen algoritmen voor het transformeren van bronafbeeldingen op basis van orthogonale transformaties worden gebruikt? Wat zijn de overeenkomsten en verschillen tussen de discrete Fourier-transformatie en andere soorten orthogonale transformaties?).

Om de hoeveelheid gegevens te verminderen of de procedure voor het extraheren van kenmerken van objecten in latere stadia van herkenning te vergemakkelijken, is het in sommige gevallen raadzaam om eerst de oorspronkelijke tweedimensionale array te transformeren [ ik, ik ] in de reeks coëfficiëntwaarden [ F u, v ], die hetzelfde MxN-formaat heeft als de originele afbeelding.

De secundaire array of anders de matrix van coëfficiënten wordt de transformatie genoemd. Een van de soorten orthogonale transformaties is de discrete Fourier-transformatie. In het geval van de Fourier-transformatie is de transformant niets anders dan het tweedimensionale ruimtelijke spectrum van het beeld.

In het algemene geval kan elke transformatie van het originele beeld op basis van orthogonale operatoren worden beschouwd als een bewerking van het ontbinden van het beeld in een algemeen tweedimensionaal spectrum, en de coëfficiënten (d.w.z. elementen van de transformatie) als de amplituden van de overeenkomstige spectrale componenten. Merk op dat als in dit geval niet-harmonische functies als basisfuncties worden gebruikt, het concept van ruimtelijke frequentie moet worden veralgemeend en het concept van sequentie moet worden gebruikt.

reeks een waarde genoemd gelijk aan de helft van het gemiddelde aantal nuldoorgangen per tijdseenheid of per lengte-eenheid.

In het proces van orthogonale transformaties van een afbeelding die sterke correlaties heeft tussen aangrenzende elementen, treedt decorrelatie (whitening) op. De waarden van de elementen van de transformatie blijken dus praktisch ongecorreleerd te zijn. In tegenstelling tot de originele array, die wordt gekenmerkt door een gemiddelde verdeling van signaalenergie tussen elementen, is de verdeling van signaalenergie in de transformatie extreem ongelijk. Het grootste deel van de energie valt op elementen met kleine serienummers (d.w.z. op lage ruimtelijke reeksen) en slechts een klein deel op andere (zie figuur 2. 3).

Rijst. 2. 3. Verdeling van signaalenergie tussen afzonderlijke elementen
in de originele array (a) en in de transformatie (b).

Deze omstandigheid maakt het mogelijk om ofwel de meeste elementen van de transformatie weg te gooien (d.w.z. gelijk aan nul te beschouwen) (wat in wezen laagfrequente ruimtelijke filtering betekent), of ze te kwantiseren in een klein aantal niveaus met behulp van het minimum aantal bits van de binaire code.

Laten we eens kijken naar enkele van de meest voorkomende soorten orthogonale transformaties die worden gebruikt bij digitale beeldverwerking.

Hier de coëfficiënten Fu zijn over het algemeen complexe getallen

Discrete Fourier-transformatie

Elke complexe coëfficiënt kan worden vervangen door twee reële componenten. Deze componenten karakteriseren respectievelijk de ruimtelijke discrete spectra van amplituden en fasen en worden als volgt gedefinieerd:

Het belangrijkste nadeel van de discrete Fourier-transformatie is een relatief grote hoeveelheid berekeningen, evenals de noodzaak om een ​​groot aantal transformatiecomponenten op te slaan in vergelijking met andere orthogonale transformaties met dezelfde beeldherstelfouten (d.w.z. met hetzelfde informatieverlies). Om de afzonderlijke componenten van de complexe coëfficiënten op te slaan, is bovendien een grotere hoeveelheid geheugen vereist dan voor de werkelijke waarden van de elementen van de originele array. Sprekend over de discrete Fourier-transformatie, moeten we de mogelijkheid vermelden om speciaal ontwikkelde algoritmen te gebruikenSnelle Fourier-transformatie, evenals gespecialiseerde computerapparatuur voor hun implementatie, de zogenaamdesystolische processors.

Walsh-transformatie(voor M = N )

Op hun beurt zijn de coëfficiënten bk (Z ) worden als volgt gedefinieerd: b k (Z ) is gelijk aan de waarde van k -de cijfer van de binaire code van het getal Z bestaande uit l binaire cijfers. Als bijvoorbeeld Z = 10, d.w.z. 10 10 \u003d 1010 2, dan
b0 = 0; b1 = 1; b2 = 0; b3 = 1.

b k worden bepaald in overeenstemming met de regel van hun definitie in de Walsh-transformatie.

Hadamard-transformatie(voor M = N )

Het is duidelijk dat alle soorten orthogonale transformaties zijn omkeerbaar, d.w.z. met behulp van de inverse transformatieprocedure is het mogelijk om het oorspronkelijke beeld van de transformatie te herstellen.

Laat [E i , j ] array van bronafbeeldingsindeling NxN , waarbij j rijnummer, i kolom aantal elementen (aantal elementen op een rij); [ F u, v ] afbeeldingstransformatie die hetzelfde formaat heeft NxN , waarbij u en v respectievelijk het rijnummer en het kolomnummer van de elementen van de transformatie. Dan, in het algemene geval, ongeacht het type orthogonale transformatie, schrijven we

waarbij a (i , j , u , v ) en b (i , j , u , v ) basisfuncties van respectievelijk directe en inverse transformaties.

Vanuit praktisch oogpunt is het belangrijk op te merken dat alle soorten orthogonale transformaties die hierboven zijn beschouwd, scheidbaar zijn in variabelen. Zo kan de berekening van directe en inverse tweedimensionale orthogonale transformaties worden teruggebracht tot de sequentiële uitvoering van eendimensionale transformaties

Hier a str(i, u), b(i, u) en a(j, v), b(j, v) basisfuncties van respectievelijk directe en inverse transformaties in de richting van rijen en kolommen.

Voor het gemak van registratie en berekeningen is het raadzaam om een ​​matrixapparaat te gebruiken

Hier [A e] en [A str ] directe transformatiematrices; [ V e ] en [ V str ] inverse transformatiematrices; [MAAR str ] t en [V str ] t matrices verkregen als resultaat van transpositie van matrices [ A str ] en [ V str ].

Natuurlijk, ongeacht de vorm van wiskundige representatie, vereisen directe en inverse orthogonale transformaties van tweedimensionale arrays in het algemene geval aanzienlijke rekenkosten. Hiermee moet rekening worden gehouden bij het ontwerpen

ATSN werkt in realtime. Bij het digitaal verwerken van binaire afbeeldingen worden de procedures van orthogonale transformaties echter sterk vereenvoudigd, vooral in het geval van het gebruik van binaire basisfuncties (Walsh, Hadamard, enz.).


Evenals andere werken die u mogelijk interesseren

72688. ONTWIKKELING VAN HET DESKUNDIGE SYSTEEM MET GEBRUIK VAN DE RELATIONELE AANPAK VAN DE ACCESS DBMS EN MET BEHULP VAN VISUELE PROLOG TOOLS 2.09MB
Het systeem dat we willen bouwen behoort tot de klasse van identificatie- (of diagnostische) systemen. Systemen van deze klasse lossen het probleem van het bepalen, d.w.z. identificatie van een object door zijn kenmerken.
72690. LABORATORIUMDIAGNOSE VAN HEMOSTASE-STOORNISSEN 10,55 MB
Beoordeling van de toestand van het bloedstollingssysteem is een van de moeilijkste diagnostische taken. In deze handleiding wordt deze kwestie vanuit verschillende gezichtspunten bekeken: algemene biologische patronen van het functioneren van multicomponentsystemen van het lichaam, pathofysiologische mechanismen ...
72692. Het niveau van vorming van de belangrijkste vaardigheden van het werken met spreadsheets opnieuw controleren 104KB
Het rechterdeel om te dienen om te bewegen volgens de tabellen aan de rechterkant van de straat, en het linkerdeel om de tags van de bogen te wreken, zodat je tussen de bogen kunt bewegen. Tabel maken Maak tafelvoorbereidingen onafhankelijk zastosovuyuchi volgende bewerkingen: start Excel; koprij opmaak.
72693. Doslіdzhennya multivibrator op napіvprovіdnikovyh transistors 2,58 MB
Blijkbaar zijn de parameters van de transistors precies hetzelfde. En zo'n ideaal schema zal niet praktisch zijn: beledigende transistors zullen worden verbroken. De onmogelijkheid om daadwerkelijk absolute symmetrie te waarborgen en de aanwezigheid van een aanvullend keerpunt leiden ertoe dat na de levering van een levensspanning ...
72696. Excel-databasefuncties begrijpen 103KB
Word een meester van een kleine winkel. Het is noodzakelijk om een ​​postbeeld bij te houden voor de aankomst en uitstalling van goederen, een moederdag voor de ogen van een echt overschot, moeders om goederen naar hun naam te kunnen noemen, enz. Help iemand met Excel.