Биографии Характеристики Анализ

Алгоритми за компресиране на цифрово изображение чрез ортогонални трансформации. Ортогонални трансформации

Трансформациите, които се използват за компресиране на изображения, трябва да бъдат бързи и, ако е възможно, лесно реализирани на компютър. Това на първо място означава, че такива трансформации трябва да бъдат линейни. Тоест преобразуваните стойности са линейни комбинации (суми с някои множители или тегла) на оригиналните стойности (пиксели), с определено число (фактор на трансформация), служещо като съответен множител или тегло. И така, къде. Например, когато тази трансформация може да бъде записана в матрична форма

,

който в общия случай ще приеме следния вид: . Всеки колонен вектор на матрица се нарича "базисен вектор".

Важна задача е определянето на коефициентите на преобразуване. Основното изискване е след трансформацията стойността да бъде голяма, а всички други стойности да станат малки. Основното съотношение предполага, че то ще бъде голямо, ако теглата подсилват съответните стойности. Това ще се случи, например, ако компонентите на векторите и имат близки стойности и идентични знаци. Напротив, малко ще е, ако тежестите са малки и половината от тях са със знак, противоположен знаксъответния номер. Следователно, ако се получат големи, тогава векторите са подобни на оригиналния вектор, а малките означават, че компонентите са много различни от . Следователно базисните вектори могат да се интерпретират като инструмент за извличане на някои от характеристиките на оригиналния вектор.

На практика теглата не трябва да зависят от оригиналните данни. В противен случай те ще трябва да бъдат добавени към компресирания файл за използване от декодера. Това съображение, както и фактът, че входните данни са пиксели, тоест неотрицателни стойности, определя начина, по който се избират базисните вектори. Първият вектор, този, който генерира , трябва да се състои от близки, евентуално съвпадащи числа. Това ще увеличи неотрицателните стойности на пикселите. И всички останали вектори на основата трябва да се състоят от половината от положителните числа, а другата половина - от отрицателните. След умножаване по положителни стойности и добавянето им заедно, резултатът ще бъде малко число. (Това е особено вярно, когато оригиналните данни са близки и ние знаем, че съседните пиксели обикновено са близки по големина.) Спомнете си, че базисните вектори са някакъв инструмент за извличане на характеристики от оригиналните данни. Следователно добър избор биха били базисни вектори, които са много различни един от друг и следователно могат да извличат различни характеристики. Това води до идеята, че базисните вектори трябва да са взаимно ортогонални. Ако трансформационната матрица се състои от ортогонални вектори, тогава трансформацията се нарича ортогонална. Друго наблюдение, което позволява изборът на базисни вектори да бъде правилен е, че тези вектори трябва да имат все по-големи честоти на обръщане, за да извлекат, така да се каже, високочестотни характеристики на компресируемите данни при изчисляване на трансформираните стойности.

Тези свойства се удовлетворяват от следната ортогонална матрица:

. (3.5)

Първият базисен вектор (горния ред) е всички единици, така че неговата честота е нула. Всички други вектори имат две +1 и две -1, така че ще дадат малки преобразувани стойности и техните честоти (измерени чрез броя на промените на знаците на ред) се увеличават. Тази матрица е подобна на матрицата на трансформация на Адамард Уолш (вижте уравнение (3.11)). Например, нека трансформираме началния вектор (4,6,5,2):

.

Резултатът е доста обнадеждаващ, тъй като числото стана голямо (в сравнение с първоначалните данни), а другите две числа станаха малки. Нека изчислим енергиите на оригиналните и трансформираните данни. Първоначалната енергия е , а след преобразуването енергията стана четири пъти по-голяма. Енергията може да бъде спестена чрез умножаване на матрицата на трансформация с коефициент 1/2. Новият продукт ще бъде равен на . Така че енергията е запазена и концентрирана в първия компонент и сега е така от общата енергия на първоначалните данни, в които първият компонент представлява само 20%.

Друго предимство на матрицата е, че тя също така прави обратното преобразуване. Оригиналните данни (4,6,5,2) се възстановяват с помощта на продукта.

Сега сме в състояние да оценим достойнствата на тази трансформация. Квантуваме трансформирания вектор (8.5,1.5,–2.5,0.5), като го закръгляме до цяло число и получаваме (9.1,–3.0). Правим обратната трансформация и получаваме вектора (3.5,6.5,5.5,2.5). В подобен експеримент ние просто премахваме двете най-малки числа и получаваме (8.5.0,–2.5.0) и след това правим обратната трансформация на този грубо квантован вектор. Това води до реконструираните данни (3,5.5,5.5,3), които също са доста близки до оригинала. И така, нашето заключение: дори тази проста и интуитивна трансформация е добър инструмент за "изстискване" на излишък от оригиналните данни. По-сложните трансформации дават резултати, които позволяват възстановяването на данни с висока степен на сходство дори при много грубо квантуване.

Някои художници показват слънцето в жълто
петно, а другото жълто петно ​​на слънце.
- Пабло Пикасо

„Изображение в полиграфията” – Специфика на изображението в полиграфията. Основното свойство на отпечатаното изображение. Книга. Отличителна чертаповечето от визуалните изкуства. Множество Масов характер Обществена достъпност. Свързване на изображение с текст. Изкуството на книгата. Шрифт.

„Векторна и растерна графика“ – Векторните примитиви се дефинират с помощта на описания. Принципи на конструиране на векторни и растерни изображения. Векторните изображения заемат относително малко количество памет. Видове компютърна графика. Векторните изображения се описват с десетки, а понякога и хиляди команди. Недостатъци на растерната графика.

„Компютърна графика” – Основните проблеми при работа с растерна графика. Видовете компютърна графика се различават по принципите на формиране на изображението. Компютърна графика. Фрактална графика. Видове компютърна графика. Големи количества данни. пиксел. Сравнителна характеристикарастерна и векторна графика. Всяка точка от екрана може да има само две състояния - "черно" или "бяло".

„Създаване на графики“ – Граници на платното. Задача 4. Създайте чертеж, състоящ се от автофигури. Създайте чертеж с помощта на лентата с инструменти за рисуване. Позицията на графичното изображение в текста. Вмъкване на картина от колекцията в текст. Платно. Сравнителна характеристика на растерна и векторна графика. Характеристики на създаване на векторно изображение в Word 2003.

„Изображение на човешка глава“ - Други студени, мъртви лица Затворени с решетки, като тъмница. Други са като кули, в които никой не живее и дълго време гледа през прозореца. Какво представляват портретите? Пропорциите на лицето на човек. Изображение на черти на лицето. Лицето и емоциите на човек. Н. Заболотски. Какви са лицата? Рисунка на човешка глава. Наистина светът е едновременно велик и прекрасен!

"Bitmaps" - Изводи от експеримента. Червен. Какви основни цветове използва компютърът? Растерно кодиране на графична информация. Bitmap. Пиксели с различни цветове. Син (тюркоаз). Сив. Розово. Палитра от съвременни компютри. Всички цветове могат да бъдат номерирани и всяко число може да бъде преобразувано в двоичен код.

  • Специалност HAC RF05.13.11
  • Брой страници 382
Теза Добави в кошницата 500p

ПОНЯТИЯ И ПРОБЛЕМИ

1.1. Основни подходи към проблема с компресията на изображения

1.1.1. Математически модел на дискретно изображение

1.1.2. Мярка за грешка при възстановяване на изображение

1.1.3. Първоначални идеи за техники за компресиране на неподвижни изображения

1.1.4. JPEG вариант, базиран на използването на DCT

1.1.5. Проблемът с избора на разширителни основи

1.2. Използване на Wavelet Transforms за компресиране на неподвижни изображения

1.2.1. Основни понятия, дефиниции, специфика на вълновите трансформации

1.2.2. 2D вълнови трансформации

1.2.3. Основни идеи на съвременните алгоритми за компресиране на изображения с вейвлет

1.3. Характеристики на обработка на видео последователности

1.4. Обща постановка на проблема за оптимизиране на кодирането със загуби

Въведение в дипломната работа (част от резюмето) на тема "Математически методи и алгоритми за компресиране на цифрови изображения с помощта на ортогонални трансформации"

Проблеми, свързани със съхранението, обработката и предаването на визуални образи (изображения) са съпътствали човечеството през цялата му история. Появата на телевизията пряко свързва задачите за обработка на изображения със задачите за обработка на електрически сигнали, а развитието на цифровата електроника доведе до факта, че широко разпространеният преход от аналогови форми на представяне на сигнала към цифрови стана особеностмодерни електронни системи. В тази връзка въпросите за цифровата обработка на изображения (DPI) са от особено значение днес.

Дискретно черно-бяло полутоново изображение може да бъде дефинирано от някаква матрица, чиито елементи (точки на изображението, наричани още пиксели) са образци на функция, получена в резултат на някакво пространствено вземане на проби, което описва разпределението на яркостта върху непрекъснато изображение. Цифрово изображение ще наричаме матрица, получена в резултат на поелементно квантуване (с крайно числонива) примерни стойности на дискретното изображение. За описание на цветно изображение (дискретно или цифрово) са необходими три матрици, съответстващи на три яркостни компонента в избраното цветово пространство, например RGB (червено, зелено, синьо). Описанието на изображението под формата на матрица(и) на яркостта ще се нарича директно представяне.

Обработката, съхранението, предаването на цифрови изображения с директно представяне изискват огромни количества данни. Така например, за да запишете само един кадър от висококачествено цветно изображение с размер 1024x1024 пиксела, при кодиране на всяка проба с 24 бита (8 бита на цветен компонент), ще са необходими 3 мегабайта данни. Разбира се, когато гледате видеоклипове, по-малка разделителна способност на екрана е приемлива, но за показване на цифрово видео в реално време е необходим трансфер на данни със скорост от около 160 мегабита / s. Гореизложеното обяснява огромния интерес, който се проявява по целия свят към търсенето на начини за ефективно кодиране на изображения.

Още в зората на развитието на методите за обработка на цифрови изображения (края на петдесетте - началото на шейсетте години), излишъкът на директното представяне на изображения беше очевиден, но най-простите методи, използвани за компресиране на данни, като диференциална импулсна кодова модулация, последвана от статистическа кодиране, даде повече от скромни резултати. Въпросът за използването на честотни методи за компресиране на изображения стана възможен поради появата през 1965 г. на работата на Cooley и Tukey, която съдържаше описание на алгоритъма за бързо изчисляване на дискретното преобразуване на Фурие (DFT). Идеята за замяна на изображението като директен обект на кодиране с проби от неговия двуизмерен DFT спектър беше представена през 1968 г. DFT кодирането се основава на факта, че за повечето естествени изображения стойностите на много DFT коефициенти са относително малки. Такива коефициенти често могат да бъдат отхвърлени напълно или малък брой битове могат да бъдат присвоени на тяхното кодиране, без риск от въвеждане на някакво значително изкривяване. През 1969 г. Прат, Андрюс и Кейн предлагат да се използва трансформацията на Адамар вместо трансформацията на Фурие за кодиране на изображения, което в много практически случаи може значително да намали необходимото количество изчисления. Оттогава са предприети изследвания за прилагането на дискретни трансформации Karhunen-Loeve и Haar за кодиране на изображения. Трансформацията Karhunen-Loeve е оптимална в смисъл, че осигурява минималната средноквадратична грешка при кодиране, когато се отхвърлят някои от коефициентите на трансформация, но, за съжаление, изисква познаване на статистическите характеристики на обработените изображения и няма бърз алгоритъм за изчисление; трансформация

Haar, напротив, се характеризира с високоефективен алгоритъм за изчисление, но като правило дава относително голяма грешка при кодиране. През 1971 г. Шибата и Еномото предложиха така наречената наклонена трансформация на вектори от 4 или 8 компонента специално за използване при кодиране на изображения. Малко след това Прат, Чен и Уилч разработиха алгоритъм за обобщена наклонена трансформация за дълги вектори и двумерни масиви.

Всички предимства на кодирането на изображение с помощта на ортогонални трансформации в крайна сметка произтичат от особеностите на разпределението на енергията между трансформиращите елементи - поради това обобщеният двуизмерен спектър1 е по-удобен за кодиране от изображението в оригиналното представяне. Поради значителни корелации между елементите на изображението от естествена природа, основната енергия в дискретния спектър има тенденция да се концентрира в относително малък брой проби, съответстващи на бавно осцилиращи базисни функции. Следователно, без значително увреждане на последващото възстановяване на изображението, малките спектрални коефициенти обикновено могат да бъдат зададени на нула, а останалите елементи от спектъра могат да бъдат дигитализирани (квантувани и кодирани). Тук е уместно да се отбележи, че използването на алгоритми за компресиране на данни със загуба за реални фотографски изображения (т.е. скала на сивото) е от фундаментално естество, тъй като, като се приеме наличието на някаква грешка в реконструираното изображение, може да се постигне много по-високо ниво на компресия на данни постигнати. Грешката може да е толкова малка, че да не се възприема от човешкото око. В допълнение, направените изображения

1 Навсякъде ще разбираме термина спектър по обобщен начин, като резултат от единна трансформация (не непременно чрез DFT) на едномерен или двумерен набор от данни. скенер или устройство за цифрово видеозаснемане, неизбежно имат шумова компонента, чието точно запазване при кодирането е безсмислено.

Както е показано от Ahmed et al., когато се прилага за кодиране на изображение, за което е подходящ статистически модел на Марков, дискретното косинусово преобразуване (DCT), което има бърз изчислителен алгоритъм, се доближава до преобразуването на Karhunen-Loeve по ефективност на представяне на спектрални данни (вижте също). Този факт беше причината DCT да послужи като основа за разработването на стандарта за компресиране на неподвижни изображения JPEG. Този стандарт е резултат от години усилия. екип от специалисти, сформиран през 1987 г. от представители на два авторитетни международни организации: ISO и ITU. Появата на съвместната JPEG група беше причинена от нарастването на броя на разработчиците и потребителите на различни клирингови системи и произтичащата от това необходимост от унифициране на формата за компресирано представяне на цифрови изображения. Получената спецификация беше документ, който днес се следва от почти всички разработчици на софтуерни системи за клирингова къща с общо предназначение. От 1994 г. се произвеждат специализирани микросхеми, които прилагат компресия и възстановяване върху JPEG в хардуера и осигуряват обработка на цветни изображения в реално време (480x640 пиксела, 30 кадъра / s). От гледна точка на постижимото ниво на компресия, JPEG версията, базирана на използването на DCT, не е най-добрата сред съществуващите в момента методи за ефективно кодиране на изображения. По този начин методите, базирани на използването на вълнови трансформации2, могат да осигурят значително по-високи нива на компресия - поради тази причина в разширения стандарт JPEG2000,

В местната литература, вместо директен превод на думата вълна, често се използва и терминът пръскане. съществуваща под формата на предварителна (чернова) спецификация от 2000 г.3, вече е осигурена възможност за прилагане на вълнови трансформации. Въпреки това е преждевременно да се каже, че компресията на изображения с помощта на DCT става остаряла днес, тъй като в сравнение с вълновите трансформации, изчислителните разходи, необходими за прилагане на DCT, са много по-малко. По-подробен преглед на съвременните методи за компресиране на изображения и разликите в използваните подходи ще бъде даден в глава 1 на тази статия.

Трудно е да се надцени значението на проблема с компресирането на данни при обработката на изображения - достатъчно е да се анализира нарастването на броя на съответните публикации, наблюдавани през последното десетилетие. По този начин значителна част от съдържанието на месечното списание IEEE Transactions on Image Processing, публикувано от 1992 г., се състои от статии, посветени на тази конкретна тема. Невъзможно е също така да не се забележи фактът, че алгоритмите за компресиране на изображения и теорията, която ги основава, се разработват главно в чужбина, предимно в САЩ. Разбира се, не може да се говори за липса на домашна работа в тази област, но необходимостта от значително разширяване на руския фронт на изследвания е извън съмнение.

Сложността на алгоритмите, използвани за компресиране на изображения, непрекъснато нараства - това се отнася не само за количеството изчисления, но и за идеологическите основи на изграждането на алгоритми: в основата им сложен начинпреплетен функционален анализ, теория на вероятностите, теория на информацията, дискретна математика и алгебра. В същото време задачите се поставят от практиката, което изисква постоянно и постоянно внимание към възможностите на реалното оборудване при решаването им.

3 На 2 януари 2001 г. част 1 „JPEG 2000 Система за компресиране на изображения: Част I Основна система за кодиране“ беше окончателно одобрена за приемане като официален международен стандарт ISO/IEC 15444-1.

По този начин задачата на дисертационния труд беше определена като изследване на теоретичните въпроси на ефективното кодиране на изображения с помощта на ортогонални трансформации и разработването на подходящи алгоритми за компресиране, подходящи за практическа употреба на базата на универсални изчислителни инструменти с общо предназначение. Новостта на работата се определя от предложените за първи път алгоритми и методи за решаване на проблема, които са представени за защита (виж по-долу). Актуалността се дължи на приложната насоченост на работата и изключителната важност на проблема с компресирането на данни в Clearinghouse.

В първата глава на дисертацията е дадена предварителна информация, необходима за по-нататъшно изложение, даден е кратък преглед и класификация на основните подходи за прилагане на ефективно кодиране на изображения. Използването на алгоритми за компресиране на данни със загуба за изображения в сива скала е повсеместно: като се приеме наличието на грешка в реконструираното изображение, може да се постигне много по-високо ниво на компресия на данни. Най-често качеството на обработка на изображението обикновено се оценява чрез средна квадратична грешка (RMS):

RMS = X y)2 > където ~ е матрицата на оригиналното изображение, L

X = (x/y) е матрицата на изображението, получено след обработка (компресия и възстановяване на данни). За логаритмичната стойност на RMS се използва общоприетата мярка PSNR (пиково съотношение сигнал/шум).

255 стойности сигнал/шум), PSNR = 201g-[dB].

Удобно е да се разглеждат методите за компресиране на изображения под формата на обща схема, състояща се от три основни етапа: намаляване на междуелементната корелация на данните, квантуване на елементи от данни, статистическо кодиране. Квантуването е основната техника за компресия със загуби. В интерес на истината,

Квантуването N-1M-1 е извличането на някаква основна част от информацията от входните данни, когато по-малко значимата й част е пропусната. Използват се както скаларно, така и векторно квантуване. В скаларния случай елементите на масива от данни, който се обработва, се квантуват независимо един от друг.

Прехвърлянето на изображение към обобщена спектрална област с помощта на някаква линейна трансформация ^ може значително да намали междуелементната корелация в трансформиращата матрица Y=77(X) в сравнение с корелацията на елементи в матрицата на дискретно изображение X. Тогава независим компонент- по-компонентното кодиране на вектора Y, а не на вектора X, става по-ефективно. Можете също така да дадете енергийна интерпретация на целта на използването на трансформации, която в този смисъл е да се концентрира максималната част от енергията на оригиналния дискретен сигнал (X матрица) в минималния брой спектрални коефициенти (Y матрични елементи). Съществува известна връзка между разпределението на енергията в обобщения спектър и декорелиращите свойства на трансформациите. Следователно изучаването на ефективността на свойствата на декорелиране е важна задача при избора на трансформация, която да се приложи към схема за компресия.

Реалните фотографски изображения са двуизмерни сигнали, които имат нехомогенности (характеристики) в зоните на контурите на обекта, така че основата на функциите, използвани за декомпозиция, трябва да има добра локализация в областта на изображението. Във фоновите области обаче изображението може да се разглежда като реализация на стационарен сигнал, което прави за предпочитане използването на честотно локализирана база за разлагане (добре известно е, че коефициентите на тригонометричното разширение на стационарен сигнал са некорелирани). Постигайте едновременно с висока резолюцияв честотната и времевата област е невъзможно поради принципа на неопределеността на Хайзенберг.

Възможен изход е използването на функционални уейвлет бази (избухвания), които имат променлива разделителна способност време-честота. Базираните на серия подходи понастоящем са доминиращи в обработката на неподвижни изображения, като постепенно заменят традиционния инструмент за декорелация, дискретната косинусова трансформация (DCT).

В първата глава се отбелязва, че за да се оптимизират алгоритмите за компресиране на данни със загуба, често се използва подход, базиран на минимизиране на функцията Lagrange RD. Нека X е някакъв входен набор от данни, който в резултат на процедурата за компресиране-възстановяване е свързан с< выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU (0,1)

Търсенето на решение на задача (0.1) в повечето случаи се свежда до тромави числени процедури от итеративен характер. Ако не е дадено от ограничението R(X,u)

Първата глава също отбелязва накратко характеристиките, свързани с обработката (компресия-възстановяване) на динамични изображения. Основната трансформация, използвана за компресиране на видео, все още е DCT, тъй като е по-проста по отношение на количеството изчисления в сравнение с вълновите трансформации. Както при статичната компресия, алгоритмите за кодиране на видео често са по-сложни от алгоритмите за декодиране. По този начин прилагането на софтуерна компресия на видео в реално време налага значителни ограничения върху допустимата сложност на изчисленията.

Втората глава е посветена на изучаването на методите теоретичен анализдекорелираща ефективност на трансформации, предназначени за използване при компресиране на данни. Предложено нов метод, който се основава на оценка на стойността на безусловната ентропия на коефициентите на трансформация и се основава на следното разсъждение. Нека е известна ковариационната матрица Kx на началния вектор от данни

X = (x0,l;1,.,q:Dr1)r, векторният спектър Y се получава в резултат на някаква ортогонална трансформация с матрицата Y=LX. Пропускайки изчисленията, можем да запишем средната безусловна ентропия за коефициентите на векторния спектър:

Нср = - X | /k (u, x) \ o% / k (tk, ok, x) 4x \u003d

0.3) A k=0 k=0 функция на плътност на вероятността за

1 Ar-1 1 1\-11 1

A°(x)loe/Ax>/x; където /k(mkox) на спектралната характеристика yk (Az-тият компонент на вектора Y), /u^ е математическото очакване, ok е стандартното отклонение, /k(x) = Колкото по-ниска е средната ентропия (0,3) толкова по-ефективно е последващото независимо кодиране на компонентите на спектъра.

Като критерий за ефективността на декорелиране се предлага да се разглежда стойността на средната излишна ентропия, получена от формула (0.3) в резултат на определени трансформации, която се изразява в елементите на матриците:

1\ ^ ae1^x k=0 y-=0 ^

Стойността (0,4) е неотрицателна и колкото по-голяма е стойността й, толкова по-ниска е ефективността на декорелиращата трансформация с матрицата Числените изчисления на стойността (0,4) за различни трансформации и видове ковариационни матрици показаха резултати, които са напълно съвместими с известните данни.

Голям интерес за анализ представлява моделът на дискретен сигнал (вектор X), който има статистиката на дискретния марковски процес от първи ред, когато ковариационната матрица има следния вид:

N-2 pK-1 pM-2

Този модел също често се използва за описание на междуредова и междуколонна корелация в отделни изображения. При p=1, когато всички компоненти в оригиналния вектор X са еднакви (за всеки две проби от вектора коефициентът на корелация е равен на единица), изчисляването на въведения критерий (0.4) за матрицата (0.5) е невъзможно, защото в този случай имаме<ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. В глава 2 е доказана следната теорема.

Теорема 2.1. За всяка ортогонална матрица (L/x/U), такава че

V/ = OD,. ,LG -1: >y0 . = -(базисната функция с индекс нула е LA/U нормализиран постоянен компонент) и ковариационна матрица (0,5) lm/ 2 N-1 N-1

1nDYA(\U,Kx) = - \o%

Различни изследвания, включително тези, проведени в Глава 2, показват, че сред дискретните трансформации, които имат бързи изчислителни алгоритми (за измерението на N аритметични операции, реализирани в -Wo^N), декорелационните характеристики за процеса на Марков (0.5 ) дават използването на DCT. Въпреки наличието на добре разработени алгоритми за бързо изчисление, DCT фундаментално изисква операции за умножение за неговото прилагане и е значително по-нисък по отношение на количеството изчисления, например, на трансформациите на Haar, Walsh и Chrestenson-Levy. Отделен въпрос, на който се обръща значително внимание в Глава 2, е конструирането (синтез) на нова трансформация, която има както високи декорелационни характеристики за модела (0,5), така и много по-бързи алгоритми за изчисление, отколкото за DCT. Резултантното дискретно псевдокосинусово преобразуване (DPCT) се определя за вектори с такава размерност А^, за която е възможно разширение N=N1 ■. -Yn и Y към (2,3,4). Тогава DPCT матрицата (в този случай долният индекс показва размерността на трансформацията) се конструира като директно (тензорно) произведение на елементарните DPCT матрици (\¥2,\¥3,\U4): = \¥Rr1 ® . ® \Ul,n, а елементарните матрици са ортогонални и се получават в резултат на определени модификации на DCT матрицата на съответната размерност4. Елементарните матрици могат да бъдат представени като произведение на някаква диагонална матрица B и матрица C, а структурата C ви позволява да реализирате умножение с произволен вектор u, SI само с помощта на операции за събиране и изваждане.

Свойствата на тензорния продукт предполагат представянето = OdgSd, където диагоналната матрица е ​​® и ​​матрицата

Cm \u003d Ssh®.®Syp. Структурите на матриците C2, C3, C4, C2, B3, B4 са дадени в глава 2. По този начин изпълнението на DPCT Y = \Ud,X = B^C^X се състои в изпълнението на умножението на матрица Cm от вектора, Y = C^X, и последващата нормализация на резултантния вектор Y: Y = S^Y. За изчисляване на DPCT е удобно да се използват бързи алгоритми, базирани на факторизирано представяне на матрицата Oy под формата на произведение от слабо запълнени матрици5: »1^ ,

1dg. - единична матрица с размерност TS. xA/" -. Тъй като матриците Tg /)

J J J се състоят от разредени матрици-блокове по определен начин; умножаването на матрицата Td/) с вектор също се свежда само до операции за събиране и изваждане на числа. Изградени са бързи обратни DPCT алгоритми

4 Под тензорно (пряко) произведение на матриците (/=0,.,7]-1; m=0,.,A-1) и .,/¿-1) разбираме матрицата

8=B®C=K/))= . ,a=0X.,u-\,p=0X.,1ir\.

5 За да обосновете валидността на това мнение, вижте стр. 84-85 от монографията. по същия начин, защото поради ортогоналността на DPCT:

Отбелязваме, че нормализирането (умножение по матрицата Dy), необходимо за изчисляване на DHFT и обратния DPCT за схемата на компресия със скаларно квантуване на коефициентите на трансформация, не усложнява изчисленията. Нормализацията може да се комбинира при компресиране на данни с етапа на скаларно квантуване yj - goips1(y7 / c()), като за всеки елемент y се избере трансформираната индивидуална стъпка на квантуване qj=qldjj (където

Елемент от диагоналната нормализационна матрица B^). Когато A възстановява вектора Y ~ Y, y my ■, факторите за елементите y ^ също трябва да бъдат избрани индивидуално във формата

Както показа теоретичният анализ, за ​​модел (0.5) DPCT има по-висока ефективност на декорелация в сравнение с други бързи трансформации, чието изпълнение също се свежда само до операции за събиране и изваждане на числа.

Третата глава е посветена на изследването на приложението на дискретното преобразуване на Крестенсон-Леви (DLCT) за компресиране на изображения и е развитието на изследванията Докторска работаавтор .

Системата от функции на Крестенсън-Леви (xm на полуинтервала xx = u(L 0 на диагонала на матрицата с размерност rpxrn има p матрици с размер rpLxrpL, останалите елементи на матрицата са нула). -1) има следния вид: ™ = \ С t ( . 0, с t. Ф 7

Дискретните (цифрови) полутонови изображения се описват под формата на реална матрица X. При обработката на реални вектори (матрици), DPCL спектърът се разлага на двойки комплексно спрегнати елементи, така че някои от елементите на спектъра не могат да бъдат изчислени. Вземането под внимание на тези характеристики ни позволи да предложим DPCL и обратни DPCL алгоритми с непълно изчисление за обработка на реални масиви. При обработка реални комплектиданни, също е възможно да се използват "комбинирани" трансформации, подобно на начина, по който се прави при изчисляване на дискретното преобразуване на Фурие. В същото време от два реални вектора X и X2 се образува комплексен вектор X=X1+/X2 и се извършва трансформация.

Ако използваме представянето в основата за комплексни числа r=xHy (1 r=a+Pd e~2n"/3), тогава изчисляването на DPCL (за p= 3) може да се извърши без използването на операции за умножение (нормализиращ фактор

1/4р" , виж (0.7) - не се взема предвид), използвайки операции събиране и изваждане ( даден фактустановено от А. В. Ефимов). Използването на основата (1, q) в алгоритми с непълно изчисление на основата (1, q) води до редица характеристики, които са разгледани в глава 3. Когато размерът на матрицата на изображението е 3px3r, изчислението на DPCL или обратен DPCL, използващ алгоритми с непълно изчисление, изисква извършване на 7(n+r)-3" +r"1 операции събиране (изваждане), операциите на умножение и деление не се използват. Използвайки основата (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

За обработката на неподвижни изображения в докторската работа на автора е предложен алгоритъм за компресиране, при който оригиналното изображение се разделя за обработка на елементарни фрагменти X, 9x9 точки, и всеки матричен фрагмент се обработва с помощта на DPCL (съгласно алгоритъм с непълно изчисление). Глава 3 предоставя кратко описание на алгоритъма за компресиране, който потвърждава валидността на използването на дискретната трансформация на Chrestenson-Levy за компресиране на изображение. Естеството на грешките, въведени в процеса на компресия-декомпресия, е различно за базирания на DCT JPEG метод и за предложената схема: при използване на JPEG се получава "размазване", докато новата схема за компресиране води до "назъбеност" на изображението. Независимо от това, субективното качество на възприятието при използване на двата разглеждани метода на компресия е приблизително еднакво. Оценките на големината на изкривяванията по отношение на стойността на PSNR, извършени за редица тестови изображения с размери 720x504=362880 пиксела, също дадоха близки резултати: за някои изображения може да бъде леко предимство на стандарта JPEG, базиран на DCT наблюдавано, за други изображения е възможно по-добро качество на възстановяване с помощта на новия метод. Разликите са малки, особено при ниски нива на компресия. Оценките на изчислителните разходи показват, че алгоритъмът, базиран на DPCL, не отстъпва на JPEG по отношение на изчислителната сложност на изпълнение. Алгоритъм за компресиране на изображения, който използва DPCL и има характеристики, сравними с JPEG, е резултат, получен от автора за първи път.

Четвъртата глава се занимава с разработването на схеми за компресиране, използващи обработка на изображения на фрагмент. Обикновено за такива схеми използването на DCT е най-ефективно, следователно значителна част от четвъртата глава е посветена на изучаването на неговите свойства, които са необходими за изграждането на алгоритми за компресия. защото Тъй като двумерната DCT е сепарируема трансформация (сведена до едномерни трансформации по редовете и по протежение на колоните на обработваната матрица), много свойства на двумерната DCT следват от свойствата на едномерната.

За коефициентите на едномерния DCT, определени по формулата, се получава следната зависимост (b*10): kk (0.8) w- #

2S където A/=xy-Xy 1 - първата разлика между показанията на оригиналния вектор на данни X = (l;0,d:1,.,l:lg1)T. Формула (0.8) показва, че разликите A, - имат различен характер на влияние върху DCT спектъра. Така разликата Am-xm-x^/2-\ (когато IV е четно) влиза във всички коефициенти y2m с максимални (единични) тегла в модул. Разликата между показанията x0 и изобщо не е включена в (0.8), което фундаментално отличава DCT от неговия "прародител" - дискретното преобразуване на Фурие, чийто амплитуден спектър е инвариантен към цикличните смени (x0->x)- >.->Xl>-1- >*o) компонент на вектора на данните X.

Приемане на некорелирани разлики6 A; и равенство на нула на техните математически очаквания Е(А/)=0, изследвани са и вероятностни оценки, по-специално стойността на общата дисперсия на променливите компоненти на DCT спектъра: Е - ¿,0(uk). Тази сумае представимо по отношение на k= 1 на дисперсията на първите разлики на вектора на данните, както следва:

Теорема 4.1: за коефициентите $(/) връзката е вярна: Тази теорема отново потвърждава, че за използвания вероятностен модел на вектора X разликата Am (в този случай нейната дисперсия) има най-голям принос. Колкото по-близо е числото на разликата до N/2, толкова по-голяма е стойността на теглото £(/") и толкова по-голям е приносът на разликата A към енергията на променливите компоненти. Изследване на DCT спектрите за някои характеристики

6 За модела на Марков (0,5) това предположение не е вярно. сигнали също потвърдиха, че при използване на техники за кодиране на спектри от JPEG (по-специално, кодиране на серии от нули - кодиране по дължина на цикъла), ефективността на кодиране ще се влоши, когато информационното насищане на дискретен сигнал падне върху централните проби на вектора.

В допълнение към разглеждането на общите свойства на DCT, глава 4 изследва възможността за оптимизиране на JPEG кодиране, което запазва формата на изходните данни. В развитието на идеите на работата на Crouse-Ramchandran беше предложен алгоритъм, който извършва допълнителна оптимизация на скаларното квантуване на DCT коефициентите, което води до известно подобрение на характеристиките на компресия според стандарта JPEG поради незначително усложняване на процедурата за оптимизация.

За компресиране на неподвижни изображения с помощта на 8x8 DCT, в четвъртата глава е разработен нов алгоритъм, който се различава от JPEG в етапа на ентропийно кодиране, за който се използват няколко статистически модела и алгоритъм за многопоточно аритметично кодиране. Изборът на модел се извършва по определен начин според контекста на вече обработени данни. Предложеният алгоритъм за аритметично контекстно кодиране на DCT коефициентите подобрява компресията на данните с 10% в сравнение със стандартната JPEG схема (JPEG Optimizer™ v.4.0 служи като референция, вижте http://xat.com).

Значително внимание в четвърта глава се отделя на изучаването на общите теоретични и практически аспекти на прилагането на векторно квантуване (VC) за компресиране на изображения в домейна на трансформация, без непременно използване на DCT. За да направите това, спектрите на фрагментите от изображението трябва да бъдат разделени на определени зони, всяка от които съответства на отделен поток от данни, подложен на VC. Нека формулираме проблема за разделянето на корелиран набор от данни, който представяме като вектор Y, на клъстери (класове). Първоначалните параметри са ковариационната матрица Ku на вектора Y и ограничението върху максималната несигурност (ентропия) Hmax за всеки клъстер в дяла. Изисква се да се намери такова разделяне на набора от произволни компоненти Y=(70,., GLr1) на подмножества

Y(A) = ^n. „Y^], k=1,.,M, така че:

b*"^ . (0,) n(y^)квазиоптимални методи: алгоритъмът "Растеж на клъстер" и алгоритъмът "Изолиране на силни връзки". И двата предложени метода за числено търсене на решението (0.9) се основават за минимизиране на ентропията на междуклъстерните връзки

Hsv(\a\.,\(m))=^H(\(k))-H(Y). Разделения, по-близки до оптималното k=1, удовлетворяващо (0.9)), бяха показани от втория от посочените алгоритми.

В заключение, в четвърта глава е предложена обща схема за компресиране, която използва адаптивен NE-оптимизиран VC в областта на спектрите на фрагменти от изображения. Тези. формализирана е общата схема за компресиране на статични изображения с помощта на векторно квантуване в областта на ортогоналните трансформации, която е ориентирана към обработка на изображения фрагмент по фрагмент.

Петата глава е посветена на изучаването и разработването на алгоритми за компресиране на неподвижни изображения в областта на вълновите трансформации. Нека сега

W = обозначава матрицата на дискретния уейвлет спектър, получена в резултат на двумерни n-стъпки на тито уейвлет преобразуване на дискретната матрица на изображението. Броят на стъпките на уейвлет трансформация определя броя на честотните нива в спектъра, за n стъпки имаме n+1 нива. В този случай коефициентите на вълново разширение могат да бъдат подредени под формата на набор от дървовидни структури (7), чиито корени са елементите, разположени в най-ниския честотен диапазон на спектъра (сублента), вижте фигурата. Такова подреждане определя за уейвлет коефициентите (възлите на дървото) отношенията родител-дете. Идеологическите основи на разработения алгоритъм за компресиране се коренят в работата на Люис-Ноулс и Ксионг-Рамчандран-Орчард; в този случай основната задача, пред която е изправен алгоритъмът за компресиране, е да намери RD-оптимална топология (т.е. структурата S, която се получава след подрязване на клоните на оригиналното дърво T), минимизирайки функцията на Лагранж за фиксирана стойност на H : J(S*) = m [A£) + R(S)].

Идеята, която се връща към работата и се използва в същата форма в , е следната: колкото по-голяма е абсолютната стойност на вълновия коефициент I wj (или енергия, wf) на родителския възел /, толкова по-малко вероятно е че този възел ще има нулеви (т.е. пресечени) клонове, които трябва да се използват за кодиране на топологията на дървото S. По-точно предсказване на появата на нулевия клон може да се направи, ако използваме като прогнозна стойност Р, сумата, която включва, в допълнение към wf, също и квадратите на стойностите на уейвлет коефициентите, съседни в подлентата на възела i. Експерименталните изследвания на статистическите зависимости, проведени в Глава 5, показаха целесъобразността на използването на стойността P( за прогнозната стойност на коефициентите-съседи. фотографски изображения. За кодиране на топологията на "подрязано" дърво ξ, всеки възел z на на дървото е присвоен знак за присъствие (n, ) трябва да се групира по определен начин в нови елементи от данни (Tu), Последните се подлагат на адаптивно аритметично кодиране и се използват няколко статистически модела, контекстът (т.е. според вече кодирани данни) правилото за избор на модел е зададено по определен начин според прогнозните стойности (T5, -).

Няколко статистически модела също се използват за кодиране на скаларно квантувани вълнови коефициенти, които не попадат в нулевите (скъсени) клонове. Предложеното правило за контекстуален избор на модели взема предвид както стойността на прогнозната стойност P( на родителския възел, така и стойностите на уейвлет коефициентите на съседни възли, които са в същия поддиапазон, до обработения, но вече са кодирани Изборът на статистически модел за кодиране на скаларно квантования уейвлет коефициент Wj=XQw\l^(Wjld), съответстващ на възела на дървото B, се извършва според стойността l, =0.36P n-1.0 b(1 U

M?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Сравнението на резултатите, получени в експерименти за обработка на реални изображения с резултатите от прилагането на други добре известни алгоритми за компресиране на изображения с вълни, показва, че предложеният алгоритъм има много висока производителност. И така, за добре познатото тестово изображение Lena с ниво на компресия от 0,5 бита на пиксел (16 пъти), грешката PSNR=37,66 dB.

Последните проучвания на Глава 5 се отнасят до изграждането на хибридна схема за кодиране на спектъра на вълните, когато в допълнение към метода за рязане на клоните на коефициентите на вълните, описан по-горе, е също така възможността за векторно „самоквантуване“ на клоните позволено, което може да се тълкува като фрактално кодиране в областта на вълновите трансформации (вижте например, ). Полученият в резултат на това хибриден алгоритъм изисква много по-голямо количество изчисления, но фракталната компонента на кодирането в този случай се оказа почти напълно потисната от основната схема на уейвлет компресия, базирана на подрязване на разклонения. Трябва да се отбележи обаче, че "връзката" от подходи в хибридния алгоритъм е направена по прост начин, а възможностите за по-нататъшно развитие оставят широко поле за изследване тук.

Шестата глава е посветена на изучаването на алгоритми за динамично компресиране на изображения с цел изграждане на схема за компресиране на видео, подходяща за софтуерно внедряване в реално време на базата на персонални компютри.

Рамката на видео поредица е матрица от пиксели от Mi редове и M2 колони: B=(bkj), A:=0.1,.,MG1, /=0.1,.,M2-1, а под термина видео поредица имаме предвид подреден набор от рамки B0 ,!*one,. ,Vg,. Нека наречем (y, x)-блока на рамката B (y, x-цяло число координати) някаква подматрица BytX=(bkii), където k=y,y+\,.y+Ni-\, 1=x>x+ \,. y+nrA. В разработения алгоритъм всеки кадър от видеопоследователността се разделя по време на обработка на съседни матрици-блокове (BWjn) с размер 8x8, m,n=0.8.16. Ако някой блок от видео последователността се оказа в определен смисъл "подобен" на оригиналния блок B"m, ние считаме, че блокът B1m>n е преместен фрагмент B^J от предишния кадър и за да кодираме (m, n) блок изображение, достатъчно е да посочите блока с координати в предишния кадър, да ги имате или да промените координати у-ти h-p. Специален случай на преместен блок е фиксиран блок, когато m=y, l=x всички те също разчитат на използването на DCT за кодиране на нови блокове.

Разработването на нов алгоритъм за компресиране на видео е извършено в рамките на общ подходкъм RD оптимизация на компресия със загуби. В разработения алгоритъм, за да изберем метода на кодиране за следващия обработен блок B1m p, се ръководим от критерия за минимум на функцията на Лагранж за блока: J(b)-D(b)+?iR(b) . Да приемем, че аргументът b=0 съответства на кодирането на преместения (фиксиран) блок, а ¿=1 на новия. Тогава ако J(l)>/(0), то блокът се кодира като преместен, а в противен случай като нов.

Когато се използва RD-оптимизация, проблемът за намиране на изместени блокове се формулира по следния начин. За даден (m, n)-блок B1m от n-тия кадър, намерете в предишния реконструиран кадър такъв (y, x)-блок l., така че RD-функцията на Лагранж да приеме минималната стойност

(0.10) tt,v)e£2 и " "

V -V t, p y, x

Тук се взема предвид, че координатите на намерения блок ще бъдат кодирани като относителни, т.е. вектор на изместване r = (y-m, x-n).) Гарантирано е да се намери минимумът (0.10) само с пълно изброяване на елементите (u, y) e £ 1 и за да може алгоритъмът за търсене да бъде реализиран в реални време , само точките (y, u), достатъчно близки до точката (m, n), трябва да се считат за област O. Повишаването на ефективността на търсенето чрез разширяване на региона C2 се постига чрез използване на различни алгоритми за насочено търсене, ориентирани към минимизиране на грешката на представяне на преместения блок | | в "ra> n, което съответства на частния случай (0.11) с R = 0. Насочен алгоритмите за търсене намират минимум (0,11) приблизително, но поради значителното разширяване на областта за търсене обикновено е възможно да се намери по-голям брой преместени блокове със сложност, подобна на пълното изброяване.

В шеста глава е предложен нов алгоритъм за насочено търсене на изместен блок, който е фокусиран върху приблизително решение на задача (0.10) вече за произволна стойност на X. Отличителна черта на предложения алгоритъм е, че малките измествания на изображението блоковете се търсят по-точно, т.к трябва да се следи стриктно поради спецификата на зрителното възприятие. За да се повиши ефективността на алгоритъма за търсене, получен в глава 6 за вектора на изместване (A, AX) на обработения блок, трябва да се изгради прогноза върху векторите на изместване (d^A^) и (d * D) на два вече обработени "съседи" (съответно, съсед по вертикала и съсед по хоризонтала). Самата прогноза е относителните координати (y0, * 0), които определят прехвърлянето на центъра на зоната на търсене: от точката (t, p) до точката (w, p) \u003d (t + y0, p + x °). Експериментално е потвърдено, че броят на новите блокове с изображения се намалява с 5,25%, ако се приеме следното правило за прогнозиране:

0,0), и двата съседни блока са нови

D^D^), хоризонтално - нов, вертикално - изместен (Anu, Akh), хоризонтално - изместен, вертикално - нов ((d;, SPIRIT)+(DA, DAH),)/2, двата съседа - преместени блокове

Следвайки идеологията на стандарта MPEG, в разработената схема за компресиране обработката на нови блокове също се извършва чрез квантуване, последвано от статистическо кодиране на двумерните DCT коефициенти. Резултатът от блока DCT Тук> и означават S, S=F(BW>„). Нека също да обозначим: Se=fe;/=round(5M/^i;))^=0, Q = qD/=0 - една от JPEG матриците за квантуване. За статистическото кодиране на матрицата S се използва алгоритъмът за контекстно кодиране, предложен в глава 4, в който е въведен допълнителен етап на RD оптимизация. Нека ZQ =(z0,.,z63)

Векторът, получен в резултат на зигзагообразно четене на данни от SQ матрицата съгласно правилото, определено от стандарта JPEG (S0<->ZQ). RОптимизирането на статистическото кодиране е възможно поради удължаването на нулевите серии на компонентите във вектора ZQ чрез допълнителното им нулиране. За да се избегне забележимо усложняване на алгоритъма за кодиране в резултат на това, в оптимизираната версия на алгоритъма за контекстно кодиране за DCT коефициенти се анализира само възможността за увеличаване на крайната нулева серия, което има най-голям принос за допълнителното минимизиране на функцията J(Zq)=D(Zq)+ÀR( Zq). В този случай се приема, че е дадена матрицата Q, която определя квантуването на DCT коефициентите. Един универсален алгоритъм за кодиране трябва да работи с определен набор от матрици за квантуване (Q/), с възможност за избор на необходимата матрица за специфични изисквания за качество и ниво на компресия. Ако наборът от матрици е достатъчно голям, тогава изборът на матрицата за квантуване Q според минималния принцип на функцията J(Zq) се превръща в тромава процедура, която не може да бъде реализирана в реално време със стандартни средства. В допълнение, с голям диапазон от възможни стойности на индекса j, неговото кодиране за всеки нов блок поотделно води до неприемливо високи допълнителни битови разходи. Следователно само няколко матрици от набора, препоръчан от JPEG, бяха избрани като първоначален набор, които съответстват на най-добрите, най-лошите и някои междинни нива на качество. Броят на матриците |(Q/)|=4 беше използван в експериментите. За да се ускори изпълнението на операциите деление, които са необходими за квантуване, елементите на матриците (Q,) бяха закръглени до най-близката стойност 2k, k=G,\,. Този подход дава възможност да се заменят операциите на целочисленото деление и умножение с битови смени на двоичното представяне на числата, които обикновено се извършват много по-бързо от реалния хардуер.

В допълнение към използването на алгоритъма за контекстно кодиране на DCT (от глава 4), глава 6 предлага алтернативен алгоритъм за кодиране на ентропия, при който квантуваните DCT спектри се разделят на фиксирани области, които образуват отделни (независими) потоци от данни за аритметично кодиране, и експериментална техника за изграждане на дял се предлага спектри за такива региони. Въпреки факта, че в общата схема за компресиране на видео изборът е направен в полза на първия алгоритъм за кодиране на спектъра, използването на аритметично кодиране с фиксирано разделяне на спектрите в региони на независимо кодиране може да бъде по-предпочитано при използване на други (различни от DCT ) трансформации, както и в схеми за компресиране. , използвайки векторно квантуване на спектри. Например във веригата, обсъдена в глава 4. (Използването на векторно квантуване в алгоритми в реално време е трудно.)

При изследване на характеристиките на крайния алгоритъм за компресиране на видео, за да се оцени големината на кодиращата грешка в реконструираната последователност В0,В1,.,ВЛ:~1, беше използвано пиковото съотношение сигнал/шум, което беше определено както следва :

PSNR = 101g ¿III

dB], където Mi и M2 задават размера на рамката в пиксели. За експериментите бяха избрани добре познатите тестови поредици News, Container ship, Hall monitor, Akiyo, Claire. Резултатите от числените експерименти, получени от аспиранта Ф. В. Стрелков, показаха, че във всички тестове предложената схема на компресия дава високи резултати, превъзхождайки MPEG-2 енкодера, разработен от MSSG (mpeg2encode версия 1.1, вижте http://www.mpeg.org/MSSG). Софтуерното компресиране на видео последователности се извършва в реално време.

Резултатите от проведеното в дисертационния труд изследване са обобщени в заключителния раздел – „Основни изводи и изводи”.

За защита на дисертационния труд се представят следните основни резултати:

Метод за оценка на декорелиращата ефективност на ортогонални трансформации и базирани на него алгоритми за групиране на корелирани данни;

DPKP и бърз алгоритъм за неговото изчисляване;

Нов бърз DPCL алгоритъм и неговата модификация - алгоритъм с непълно изчисление; Алгоритъм на комбинирани изчисления DPCL за обработка на реални масиви в базиса (1,exp(-2to/3));

Метод за компресиране на изображение, базиран на специален метод за аритметично кодиране на DPCL спектри на блокове от изображения;

Детерминистични и вероятностни оценки на DCT коефициентите;

Алгоритъм за контекстно кодиране на DCT спектри на изображения;

Обща схемакомпресиране на изображение на базата на адаптивно векторно квантуване в областта на ортогоналните трансформации;

Алгоритми за уейвлет компресия за статични изображения;

Алгоритъм за търсене на разместени блокове на изображението;

Експериментална техника за конструиране на разделяне на спектри в области на независимо кодиране;

алгоритъм за видео компресия.

Основните резултати, представени в дисертацията, са публикувани в 30 статии. Всички теоретични резултати, представени в дисертацията от 11 статии в съавторство, са получени лично от автора. В случаите, когато дадените експериментални числени данни (таблици, графики) от съвместни работи са получени от съавтори, това е ясно посочено в хода на изложението при цитиране на резултатите.

Алгоритъмът за компресиране на видео, предложен в шеста глава, е внедрен в софтуер като част от работата, извършена в Държавната институция Научно-производствен комплекс "Технологичен център" на Москва държавен институтелектронна техника и в НПП „Технология”. Внедряването на разработените библиотеки за компресиране на видео е извършено в редица софтуерни системи, които обработват видео изображения (включително кодиране) в реално време, сред които най-голям практически интерес представлява системата за видеонаблюдение и запис на Visual Security (виж http:/ /www.tcen.ru /vs). Копия от документи за използване и прилагане на резултатите от дисертационния труд са налични в Приложение 6.

Заключение за дисертация на тема "Математическа и софтуерна поддръжка на компютри, комплекси и компютърни мрежи", Умняшкин, Сергей Владимирович

ИЗВОДИ И ЗАКЛЮЧЕНИЕ

В представената дисертация са изследвани различни аспекти на приложението на дискретни ортогонални трансформации за компресиране на цифрови изображения, както от гледна точка на чисто формален теоретичен анализ, така и от гледна точка на изискванията и ограниченията, които практиката налага на конкретни изчислителни схеми и алгоритми. Като цяло съдържанието на работата е приложено, така че повечето от теоретичните резултати са подкрепени от изчислителни експерименти, резултатите от които от своя страна не само служат като илюстрация или проверка на теорията, но често дават тласък и са били изходен материал за по-нататъшни изследвания.

Въз основа на резултатите от проведените в дисертационния труд изследвания могат да се направят следните изводи.

1. Ортогоналните трансформации са основният инструмент, използван за декорелация на данни по време на компресиране на изображението. В случай, че математическият модел на дискретен сигнал е специфициран от ковариационна матрица, препоръчително е да се използва средният критерий за излишна ентропия, предложен в статията, за да се анализира ефективността на обработката на декорелация.

2. Специално за компресирането на корелирани данни беше получено и въведено за първи път дискретно псевдокосинусово преобразуване (DtSP). В схемата за компресиране, която предполага наличието на етап на скаларно квантуване на коефициентите на трансформация, сред разглежданите бързи трансформации, чието изпълнение се свежда само до операции за събиране и изваждане (Уолш, Хаар, псевдокосинус), DPCT дава най-добрите резултати от декорелация за дискретен сигнал, описан от модела на Марков.

3. Използвайки получените бързи DPCL алгоритми, които отчитат спецификата на обработка на реални масиви, предложената схема за компресиране на изображения, базирана на аритметичното кодиране на DPCL коефициентите, постига характеристики, близки до JPEG варианта, базиран на DCT, по отношение на качеството на обработка и изчислителна сложност.

4. При използване на статистическото кодиране на DCT коефициентите по метода JPEG най-малко е желателно наличието на "скокове" на дискретния сигнал в централната област на обработваните фрагменти.

5. Методът на многомоделното (многопоточно) аритметично кодиране има висока ефективност на приложение в различни схеми и алгоритми за компресиране на данни, а един от ключовите моменти в разработването на схеми за компресиране е дефинирането на правила за избор на текущия модел на кодиране в контекста на вече обработени данни. По този начин използването на алгоритъма за многомоделно контекстно аритметично кодиране на DCT коефициентите, предложен в глава 4 в схемата JPEG, повишава ефективността на компресиране на данни с 10%.

6. Когато се компресират изображения, като се използва многомоделно кодиране на дървовидни структури на вълнови спектри, правилото за избор на модел трябва да бъде изградено според комбинирания контекст, който взема предвид както средата на самия вълнов коефициент в поддиапазона, така и средата на коефициент “родител”. Нов ефективен алгоритъм за компресиране на цифрово изображение със загуби, получен на тази основа, който е разработен въз основа на резултатите от изследването статистически свойстваспектри на дискретни уейвлет трансформации, показва високи характеристики на компресия със сложност на изпълнение, приемлива за широк спектър от приложения.

7. За да се елиминира междукадровото (времево) излишък на видео данни, предложеният алгоритъм за хибридно насочено търсене, при който малките измествания се търсят точно и задълбочено, а значителните измествания по-грубо, трябва да се признае за най-предпочитан за практическа употреба сред изследваните алгоритми за компенсация на преместване на блок.

8. При използване на предложения алгоритъм за компресиране на видео, който е разработен на базата на подхода за RD-оптимизация, като се вземат предвид изискванията и спецификата на софтуерната реализация, се постига компресиране и възстановяване на видео в реално време на базата на съвременни персонални компютри , с високо качество на обработка.

Резултатите от проведените изследвания са отразени в 30 публикации, докладвани и обсъждани на много общоруски и международни конференции. Като цяло в дисертационния труд са получени нови научни резултати, теоретични положениякоето направи възможно разработването и формализирането до голяма степен на процедури за анализ и синтез на схеми за компресиране на цифрови изображения, базирани на използването на дискретни ортогонални трансформации.

Разработените подходи и препоръки доведоха до изграждането на специфични схеми и алгоритми за компресиране, много от които бяха внедрени в софтуер и експериментално потвърдиха ефективността на тяхното приложение. Резултатите от изследването на видеокомпресията, проведено като част от изследване, ръководено от автора и финансирано от Министерството на науката и промишлеността на Руската федерация, са внедрени под формата на алгоритми в хардуерната и софтуерна система Visual Security ( вижте Приложение № 6).

Списък с литература за дисертационно изследване Доктор на физико-математическите науки Умняшкин, Сергей Владимирович, 2001 г.

1. Абстрактни алгебрични системи и цифрова обработка на сигнали / Вариченко Л.В., Лабунец В.Г., Раков М.А. Киев: Наукова думка, 1986. -248 с.

2. Алексеев А.Г. Клъстеризиране на корелиран набор от данни // "Микроелектроника и информатика 99". VI Всеруски междууниверситетски н.-т. конф. Изкуство. и асп.: Tez. док. - М.: МИЭТ, 1999. - С. 133.

3. Ахмед Н., Пао К. Ортогонални трансформации в цифровата обработка на сигнали: Пер. от английски. М.: Съобщение, 1980. - 248 с.

4. Vatolin D. S. Хибридна схема на фрактална компресия и векторно квантуване за малки блокове // Доклади на международната конференция Graphicon-98. Москва, 1998, с. 205-212.

5. Виленкин Н. Я. За един клас пълни ортогонални системи // Изв. Академия на науките на СССР. сер. мат. 1947. - T.P. - С. 363-400.

6. Воробьов В.И., Грибунин В.Г. Теория и практика на вълновото преобразуване. -С.-Пб.: Военно издателство. Университет по съобщения, 1999. 204 с.

7. М. В. Гашников, Н. К. Глумов и В. В. Сергеев, “Информационна технология за компресиране на изображения в оперативни системи за дистанционно наблюдение”, Изв. 1999. - № 1. - С. 99-107.

8. Gold B., Reider C. Цифрова обработка на сигнала: TRANS. от английски. М.: Сов. радио, 1973. - 368 с.

9. Б. И. Голубое, А. В. Ефимов и В. А. Скворцов, Серии и трансформации на Уолш: теория и приложения. М.: Наука, 1987. - 344 с.

10. Горлов С.К., Користин А.В., Роден В.А. За една реализация на метода за компресиране на картографиране, използвайки нелинейна апроксимация на суми на Фурие-Хаар// Теор. функции и прибл.: Тр. 7-ми Саратов, зима. училище (1994). Част 2. Саратов: Издателство на SSU, 1995.

11. Дмитриев В.И. Приложна теория на информацията: Proc. за студ. университети. -М.: По-високо. училище, 1989. 320 с.

12. Ефимов A.V., Поспелов A.S., Умняшкин C.V. Някои свойства на мултипликативни ортонормални системи, използвани в цифровата обработка на сигнали // Известия на Математическия институт. V.A. Steklov RAS. Т.219. - 1997. - С 137-182.

13. Ефимов A.V., Umnyashkin C.V. Бързи алгоритми за изчисляване на дискретното преобразуване на Крестенсон-Леви и оценка на неговите спектрални. характеристики// Теор. функции и прибл.: Тр. 7-ми Саратов, зима. училище (1994). Част 2. - Саратов: Издателство на SSU, 1995. S. 9-20.

14. Жуков В.Г. Изследване на методи за сравняване на изместени блокове от изображения в алгоритми за компресиране на видео последователност. //Микроелектроника и информатика-99. Всерос. междууниверситетски н.-т. конф. студенти и докторанти: резюмета на доклади. М.: MYET, 1999. - С. 137.

15. Жуков DM. Еквивалентност на едномерна и двумерна трансформация на Крестенсън-Леви // Методи за цифрова обработка на изображения: Sat. научен тр. МИЕТ. М.: МИЭТ, 1982 - С. 65-70.

16. Задирака В.К., Евтушенко В.Н. Метод за оптимално зоново кодиране с помощта на наклонена трансформация // Кибернетика и системен анализ. 1994. - № 4. - С. 56-60.

17. Изследване и разработване на софтуерни алгоритми за компресиране на данни със загуби за обработка на цифрово видео: Изследователски доклад (окончателен) / HI 111 "Технологии"; ръце -Умняшкин Ц.Б. "Гледам"; № държавна. пер. 01200004624; инв. No 100704. - Москва, 2000. - 48 с.

18. Kendal M. Ранг корелации. М.: Статистика, 1975. - 216 с.

19. Коваленко К.Н., Филипова А.А. Теория на вероятностите и математическа статистика. М.: По-високо. училище, 1982. - 256 с.

20. Корн Г., Корн Т. Наръчник по математика за учени и инженери: Пер. от английски. М.: Наука, 1970. - 720 с.

21. Кочетков М.Е. Компресия на цифрово изображение с помощта на векторно квантуване в областта на дискретните ортогонални трансформации: дис. канд. техн. науки. М., 1999. -191 с.

22. Кочетков M.E., Umnyashkin C.V. Многонишкова реализация на алгоритъма за аритметично кодиране / М.: MGIET (TU), 1998. 21 p. Депозиран във ВИНИТИ на 25 декември 1998 г., № 3884-B98.

23. Кочетков M.E., Umnyashkin C.V. Относно сравнението на критериите за оценка на ефективността на декорелиращите трансформации / М.: MGIET (TU), 1998. 34 с. - Деп. във ВИНИТИ 13.04.98, No 1069-B98.

24. Лесин В.В., Лисовец Ю.П. Основи на методите за оптимизация: учеб. надбавка. - М .: Издателска къща MAI, 1998. 344 с.

25. Лисовец Ю.П., Поспелов А.С. Мултипликативни холографски трансформации за обработка на изображения // Методи за цифрова обработка на изображения: Сб. научен тр. М.: МИЕТ, 1982 - С. 100-109.

26. Литош И.П. Комбиниране на алгоритми за фрактална и вълнова компресия на цифрови изображения // "Микроелектроника и информатика -2001". U1P общоруски междууниверситетски н.-т. конф. Изкуство. и асп.: Tez. док. - М.: МИЕТ, 2001. - С. 147.

27. Марков А.А. Компресиране на цифрови изображения с помощта на \vavelet-трансформации // "Микроелектроника и информатика 2000". VII Всеруски междууниверситетски н.-т. конф. Изкуство. и асп.: Tez. док. -М .: МИЕТ, 2000. -С. 114.

28. Wise A.E. Числени методи за PC в BASIC, Fortran и Pascal. - Томск: МП "РАСКО", 1991. -272с.

29. И. Я. Новиков и С. Б. Стечкин, "Основни конструкции на вълни", Фундаментална и приложна математика. 1997. - Том 3. - № 4. -стр.999-1028.

30. Nussbaumer G. Бързо преобразуване на Фурие и алгоритми за изчисляване на навивки: Per. от английски. М .: Радио и комуникация, 1985. - 248 с.

31. Пеев Е., Боянов К., Белчева О. Методи и средства за компресиране на изображения // Автоматика и информатика.-1994.-28, No3.-с.3-14.

32. Петухов А.П. Въведение в теорията на уейвлет базисите. Санкт Петербург: Издателство на Санкт Петербургския държавен технически университет, 1999. 132 с.

33. Поспелов А. С. Методи за обработка на цифрова видео информация с помощта на трансформации на холографски тип // Sat. тр. междун. среща от програмист. и мат. методи за решаване на физически. проблеми (Дубна, 14-19 юни 1993 г.). Съобщение OINIR11-94-100. - С, 71-73.

34. Поспелов А. С. Някои задачи по математикаи алгоритми за обработка на цифрова информация с помощта на дискретни трансформации: дис. за състезанието уч. стъпка, д-р физ.-мат. науки. М., 1992. -398 с.

35. Приложения на цифровата обработка на сигнали: пер. от английски. / Ед. Е. Опенхайм. М: Мир, 1980. - 552 с.

36. Pratt W. Цифрова обработка на изображения: TRANS. от английски. М.: Мир, 1982. - Книги 1 и 2. - 312 и 480 с.

37. Pratt W, Cash D., Andrews X. Кодиране на изображения с помощта на трансформацията на Адамар // TIER. 1969. - Т.57. - № 1. - С. 66-77.

38. Птачек М. Цифрова телевизия. Теория и технология / Пер. от чехи, изд. Л. С. Виленчика. М .: Радио и комуникация, 1990. -528 с.

39. Розанов Ю.А. случайни процеси. М.: Наука, 1971. - 288 с.

40. Свешников А.А. Приложни методи на теорията на случайните функции. М.: Наука, 1968.-463 с.

41. Трахтман V.A. Спектрален анализ в основата на функциите на Виленкин-Крестенсон // Радиотехника и електроника. -1975 г. -T. 20.-№1. -с.130-138.

42. Трахтман А.М., Трахтман В.А. Основи на теорията на дискретните сигнали на крайни интервали. М.: Сов. Радио, 1975 г.

43. Умняшкин C.B. Алгоритъм за групиране на корелирани данни // VII международенконференция. Математика. Икономика. Екология.

44. Образование. Международен симпозиум. Редици на Фурие и техните приложения: резюмета. Ростов: Рост. състояние икономика, акад., 1999. - С. 211-212.

45. Умняшкин C.B. Алгоритъм за търсене на изместени блокове за кодиране на цифрови видео изображения // Междуотраслово научно-техническо списание "Отбранителен комплекс" научно-техническия прогресРусия”, № 3, 2001.-С. 38-41.

46. ​​​​Umnyashkin S. V. Алгоритъм за кодиране на фрактално изображение в областта на вълновите трансформации // Компютърна математика. Optazzaschya смятане: Сборник от научни трудове. Том 1. - Кшв: 1Институт по схбзрнетика им. В. М. Глушкова, 2001. - С. 385-391.

47. Умняшкин C.B. Бързи алгоритми за изчисляване на дискретна мултипликативна трансформация / М.: MGIET (TU), 1995. 15 p. - Деп. във ВИНИТИ 16.02.95 г., No 442-B95.

48. Умняшкин C.B. Бърз алгоритъм за изчисляване на дискретното преобразуване на Крестенсон-Леви за обработка на реални масиви / М.: MGIET (TU), 1995. 19 p. - Деп. във ВИНИТИ 05.12.95 г., № 3212-B95.

49. Umnyashkin S. V. Използване на контекстно аритметично кодиране за увеличаване на компресията на данни съгласно схемата JPECj Известия вузов. електроника. Номер 3. - 2001. - С. 96-98.

50. Умняшкин C.B. Компенсация на движението на обекти по време на компресиране на видео данни // Трета международна научно-техническа конференция "Електроника и информатика XXI век": Сборник доклади. док. - М.: МИЕТ, 2000.-С. 365-366.

51. Umnyashkin S. V. Wavelet компресия на цифрови изображения с предсказване на статистически модели Известия вузов. електроника. номер 5. - 2001. - С.86-94.

52. Умняшкин C.B. Метод за кодиране на дискретно изображение, базиран на трансформацията на Chrestenson-Levy // Микроелектроника и информатика -96: Сборник. отчет междууниверситетски наук.-техн. конф. М.: MGIET (TU), 1996. - P.167.

53. Умняшкин C.B. При групиране на корелирани данни. // Информационни технологии в иновативни проекти. Международна конференция (Ижевск, 20-22 април 1999 г.): Материали на докладите. -Ижевск, ИжГТУ, 1999. С. 59-65.

54. Умняшкин C.B. За квантуване на елементите на спектъра на дискретната трансформация на Крестенсон-Леви / М.: MGIET (TU), 1995. 12 с. - Деп. във ВИНИТИ 16.02.95 г., No 441-B95.

55. Умняшкин C.B. Относно модификацията на дискретното косинусово преобразуване // Теория на приближението и хармоничен анализ: Proc. отчет междун. конф. (Тула, 26-29 май 1998 г.). Тула: ТулГУ, 1998. - С.264-265.

56. Умняшкин C.B. Относно модификацията на дискретното косинусово преобразуване // Изв. Тул. състояние университет сер. Математика. Механика. Информатика. Тула: ТулГУ, 1998. Т. 4. Бр. 1. С. 143-147.

57. Умняшкин C.B. Относно оценката на декорелиращите свойства на дискретни трансформации // Микроелектроника и информатика 97: Резюмета на доклади. междууниверситетска научно-техническа конференция. Част 2. - M. MGIET (TU), 1997.-S. 110:

58. Умняшкин C.B. Особености на използването на дискретното преобразуване на Крестенсон-Леви при обработката на реални масиви // Микроелектроника и информатика: Сборник. отчет междууниверситетски наук.-техн. конф. 1214 апр. 1995. М.: MGIET (TU), 1995. - S. 188-189.

59. Умняшкин C.B. Оценка на ефективността на използването на унитарни трансформации за кодиране на дискретни сигнали // Информатика и комуникация: Сб. научен тр. изд. В. А. Бархоткина. М.: МИЕТ - 1997. С.73-78.

60. Умняшкин C.B. Приложение на дискретното преобразуване на Крестенсон-Леви в цифровата обработка на изображения. дис. канд. техн. науки. - Москва, 1997. - 198 с.

61. Умняшкин C.B. Псевдокосинусово преобразуване за компресиране на дискретни сигнали // Информационни технологии и проблеми на микроелектрониката. сб. научен тр. -М .: МИЕТ. -1999. стр.158-170.

62. Umnyashkin SV Схема на RD-оптимизирана компресия за обработка на видео данни в реално време // Прието за публикуване в списание Известия вузов. Електроника“. номер 6. - 2001 г.

63. Умняшкин C.B. Компресия на цифрово изображение с помощта на дискретна трансформация на Крестенсон-Леви // Междуотрасъл научно-техническо списание "Отбранителен комплекс - към научно-техническия прогрес на Русия", № 2, 2000 г. стр.28-39.

64. Умняшкин C.V., Космач M.V. Оптимизиране на кодирането на цифрово изображение по метода JPEG // Известия вузов. електроника. No 4-5. -2000. - С. 139-141.

65. Умняшкин C.V., Кочетков M.E. Анализ на ефективността на използването на дискретни ортогонални трансформации за цифрово кодиране на корелирани данни Известия вузов. електроника. номер 6. - 1998. - С. 79-84.

66. Умняшкин C.V., Стрелков F.V., Жуков V.G. Триетапни алгоритми за търсене на изместени блокове от изображения // Информационни технологии и системи за управление. сб. научен тр. изд. В. А. Бархоткина.- М: МИЕТ, 2000. С. 47-55.

67. Harmut X. Теория на анализа на последователността. Основи и приложения: пер. от английски - М.: Мир, 1980. 574 с.

68. Цифрова обработка на телевизионни и компютърни изображения / Ed. Ю.Б.Зубарев и В.П.Дворкович. М .: Международен център за научна и техническа информация, 1997. - 212 с.

69. Чен Ш.-К. Принципи на проектиране на визуални информационни системи. -М .: Мир, 1994. 408 с.

70. Андрюс Г. Използването на компютри за обработка на изображения / Пер. от английски. изд. Б. Ф. Курянова. М.: Енергия. - 1977. -161 с.

71. Яворски B.M., Detlaf A.A. Ръководство по физика за инженери и студенти.-Издание 7-мо, коригирано.-М.: Наука, 1977.-944 с.

72. Ярославски JI.II. Въведение в цифровата обработка на изображения. М.: Сов. радио, 1979.-312 с.

73. Ярославски L.P. Цифрова обработка на сигнали в оптиката и холографията. Въведение в цифровата оптика. М.: Радио и комуникация. - 1987. -296 с.

74. Ахмед Н., Натараджан Т., Рао К.Р. За обработка на изображения и дискретно косинусово преобразуване // IEEE Trans. компютри. -1974 г. В. С-23 - No1. - С.90-93.

75. Алън Дж.Б. и Рабинер Л. Р. Единен подход към краткосрочен анализ на Фурие, синтез // Proc. IEEE 1977.-том. 65.-No Iyu-R. 1558-1564.

76. Anderson J.B., Huang T.S. Частична трансформация на Фурие за компресиране на честотната лента на картина // IEEE Trans. общ. -1972.- Т. КОМ-20 №3. -С.488-491.

77. Андрюс Х.К., Хънт Б.Р. Възстановяване на цифрово изображение.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

78. Андрюс Х.К., Прат У.К. Кодиране с преобразуване на Фурие на изображения // Хавайска международна конференция по системни науки, януари 1968 г. P. 677-679.

79. Андрюс Х.К., Прат У.К. Трансформиране на кодиране на изображения // Proc. Компютърна обработка в комуникациите. New York: Polytechnic Press, 1969. -P. 63-84.

80. Antonini M., Barlaud M., Mathieu P. и Daubechies I., Кодиране на изображения с използване на вълнова трансформация // IEEE Trans. ImageProc. Vol. 1. - № 2, 1992. -С. 205-220.

81. Barnsley F., Jacquin A. Приложение на повтарящи се итерирани функционални системи към изображения // Proc. SPIE.- 1988.-Кн. 1001.-стр. 122-131.

82. Бергер Т. Теория за изкривяване на скоростта. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Оценка на изместването чрез йерархично блоково съвпадение // Proc. SPIE Conf. На Вис. общ. И Image Proc. Кеймбридж, 1988. - С. 942-951.

84. Билгин А., Сементили.П. и Marcellin M. Прогресивно кодиране на изображения с помощта на квантуване на пергола // IEEE Trans. ImageProc. 1999.-Т.8.-№11.-С. 1638-1643.

85. Чернов В. М., Дмитриев А. Г. Компресия на изображение с помощта на дискретни ортогонални трансформации с „шумоподобни“ базови функции // Компютърна оптика. 1999. - бр. 19. - С. 184-187.

86. Cheung S.K., Ro L.M. Хибриден адаптивен алгоритъм за търсене за бърза оценка на движението на блока // Proc. IEEE International Symp. на Signal Proc. и неговото приложение. (август 1996 г.). Том 1. 1996 - С.365-368.

87Chrestenson H.E. Клас обобщени функции на Walsh // Pacific. J Math. -1955.-Т.5.-Бр.л.-С. 17-32.

88. Chrysafis C. Оптимизация на степента на изкривяване на компресия на вълново изображение и намаляване на сложността: докторска дисертация (електроинженерство). Университет на Южна Калифорния, Лос Анджелис, 2000. - 144 стр.

89. Chrysafis C., Ortega A. Ефективно контекстно-базирано ентропийно кодиране за компресиране на изображения със загуба на вейвлет // Proc. Конференция за компресиране на данни. -Snowbird (Юта), 1997. P. 241-250.

90. Cho N., Lee S. Бърз алгоритъм и реализация на 2-D дискретна косинусова трансформация, IEEE Trans. вериги и системи. 1991.-Т.38. - С.297-305.

91. ChouP.A., Lookabaugh T., GrayR.M. Ентропийно-ограничено векторно квантуване 11 IEEE Trans. АССП. 1989. - кн. 37.-№1. -С.31-42.

92. Кодиране на движещи се изображения и аудио (MPEG-4). Стандарт ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., Feauveau J.-C., Biorthogonal bases of compactly supported wavelets, Comm. Чиста ябълка. математика 1992. - Т. 45. - № 5. - С. 485560.

94. Coifman R. и Wickerhauser M. V. Алгоритми, базирани на ентропия за най-доброИзбор на основа // IEEE Trans. теория на информацията. 1992. - кн. 38. - № 2 - С. 713718.

95. Cooley J.W., Tukey J.W. Алгоритъм за машинно изчисляване на сложни редове на Фурие // Mach. Изчисл. 1965. - Т. 19. - С. 297-301.

96. Cosman P.C., GrayRM. и VetterliM. Векторно квантуване на поддиапазони на изображението: Проучване // IEEE Trans. ImageProc. 1996. - Т. 5. - № 5. - С. 202225.

97. Costantini R. et al. Видео кодер с ниска сложност, базиран на дискретната трансформация на Walsh Hadamard // Proc. Европейска конференция за обработка на сигнали 2000 (Тампере, Финландия, 5-8 септември). -2000. -P.1217-1221.

98. Crouse M. и Ramchandran K. Съвместно прагово определяне и избор на квантовател за трансформиране на кодиране на изображения: ентропийно ограничен анализ и приложения към базов JPEG // IEEE Trans, относно обработката на изображения. 1997. - кн. 6. -№2 - С. 285-297.

99. Davis GM, Уейвлет-базиран анализ на компресиране на фрактално изображение, IEEE Trans. ImageProc. 1998. - Т.7-№2. -С.141-154.

100. Davis G., Nosratinia A. Wavelet-базирано кодиране на изображения: преглед // Приложен и изчислителен контрол, сигнали и схеми. -1998. -В.л. -#1. -П. 205269.

101. Deever A. и Hemami S. Какъв е вашият знак?: Ефективно кодиране на знаци за кодиране на вградено вълново изображение 11 Протокол от конференцията за компресиране на данни, 2000 г.-Стр.273-282.

102. Duhamel P., Guillemont C. Изчисление на полиномиална трансформация на 2-D DCT, Proc. АССП "90. 1990. - С.1515-1518.

103. ЕфимовА. V. Мултипликативни функционални системи и техните приложения при обработка на дискретна информация // Приближение и функционални пространства/ Публикации на центъра на Банах (Варшава). 1989. - Т.22. - С. 111-117.

104. Ефлмов В.М., Колесников А.Н. Компресия на изображение с предварителна интерполация на сигнала // Разпознаване на образи и анализ на изображения. 1996. - кн. 6. - № 1.

105. Елиът Д.Ф., Рао К.Р. Бързи трансформации: алгоритми, анализи, приложения. - Лондон: Academic Press inc., 1982. 488 p.

106. Enomoto II, Shibata K. Кодираща система за ортогонална трансформация за телевизионни сигнали, IEEE Trans. Електромагнитна съвместимост. 1971. - Специален брой за функциите на Уолш. -В. EMC-13. - Номер 3. - С. 11-17.

107. Feig E. Бърз мащабиран DCT алгоритъм, Proc. SPIE Int. соц. Избирам. инж. 1990.-кн. 1244.-стр. 2-13.

108. Fischer T.R. и WangM. Ентропийно ограничено решетъчно кодирано квантуване//IEEE Trans. инф. теория. 1992. - кн. 38 - № 2 - С. 415-426.

109. Фишър Ю. Фрактална компресия: теория и приложение към цифрови изображения. -Ню Йорк: Spinger Verlag, 1994. 341 p.

110. Good J. Алгоритъмът на взаимодействие и практически анализ на Фурие // J. Royal Stat. соц. (Лондон). 1958.-V.B-20. - С. 361-372.

111. Грей Р.М. Векторно квантуване // IEEE ASSP Magazine. -април 1984.-С.4-29

112. Грей R, Neuhoff D. Квантуване //IEEE Trans. инф. теория. окт. 1998. - кн. 44.-бр. 6.-P. 2325-2383.

113. HabibiA., WintzP.A. Кодиране на изображение чрез линейна трансформация и блоково квантуване // IEEE Trans. Комуник. техн. -1971. -В. COM-19. номер 1. -С.50-63.

114. Хамиди М., Пърл Дж. Сравнение на косинус и трансформации на Фурие на сигнали на Марков-I 11 IEEE Trans. АССП. V.24. - 1976. - С.428-429.

115. Hauque M.A. Двуизмерно бързо косинусово преобразуване // IEEE Trans. АССП. -1985 г. Т. 33. - № 6. - P.1532-1538.

116. Huang J. Y., Schultheiss. Блоково квантуване на корелирани Гаусови случайни променливи// IEEE Trans. Комуникации. -1963. -В. CS-11 (септ.)-P. 289296.

117. Информационни технологии Генерично кодиране на движещи се изображения и свързана аудио информация: Видео. //Препоръка ITU-T H.262. - Стандарт ISO/IEC 13818-2-2000.

118. Проект на Комитета ISO/IEC JTC1 10918-1. Цифрово компресиране и кодиране на неподвижни изображения с непрекъснат тон. Част 1. Изисквания и насоки. -1991.

119. Проект на Комитета ISO/IEC JTC1 10918-2. Цифрово компресиране и кодиране на неподвижни изображения с непрекъснат тон. Част 2. Тестване за съответствие. 1991 г.

120. Jacquin A. Фрактално кодиране на изображения, базирано на теория за повтарящи се свиващи трансформации на изображения // Proc. SPIE Visual Comm. И Image Proc. 1990. - С.227-239.

121. Jacquin A. Кодиране на изображения, базирано на фрактална теория на повтарящи се свиващи трансформации на изображения // IEEE Trans. ImageProc. 1992. - Т.1. - № 1. -П. 18-30.

122. Jafarkhani H., Farvardin N. и Lee C.-C., Адаптивно кодиране на изображения на базата на дискретна вълнова трансформация 11 Proc. IEEE Int. конф. ImageProc. Vol. 3 - Остин (Тексас), 1994. - С. 343-347.

123. Джейн Дж.Р. и Джейн А.К. Измерване на изместване и приложението му в междукадрово кодиране на изображения // IEEE Trans. Комуник. 1981. - кн. 29. - № 12. -P.1799-1806.

124. JoshiR.L., Fischer T.R. и Bamberger R.H. Оптимална класификация при кодиране на субленти на изображения // Proc. IEEE Int. конф. ImageProc. Vol. 2 - Остин (Тексас), 1994.-Стр. 883-887.

125. Джоши Р.Л. et al., Сравнение на различни методи за класификация при кодиране на сублента на изображения// IEEE Trans. обработка на изображение. 1997. - кн. 6. - ноем. - С. 1473-1486, 1997.

126JPEG2000. Част 1. Окончателна версия на проекта на комитета 1.0. ISO/IEC JTC1/SC29 WG1.-205 страници.

127. Kasner J.H., Marcellin M.W. Адаптивно вълново кодиране на изображения // Proc. IEEE Int. конф. ImageProc. Vol. 3 - Остин (Тексас), 1994. - С. 358-362.

128. Koga T. et al, Междукадрово кодиране с компенсация на движението за видеоконференции, Сборник на Националната телекомуникационна конференция, Ню Орлиънс, Луизиана, ноем. 29 дек. 3. - 1981. - Кн. 4.-С. G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C. и Smith M.J.T. Видео кодиране на сублента с ограничение на скоростта на изкривяване. // IEEE транзакции при обработка на изображения. -1999. -Vol. 8.-№2.-С. 145-154.

130. Kurosaki M., WakiH. JPEG-съвместим LSI за компресия/декомпресия на цветни изображения // Mitsubishi Elec. адв. -1994. -V.68, септ. -С.17-18.

131. Levy P. Sur une generalization des fonctions orthogonales de M. Rademacher II Comment, math. хелв. 1944. - Т.16. - С. 146-152.

132. Lewis A.S., Knowles G. Компресиране на изображение с помощта на 2-D Wavelet Transform. II IEEE Trans. ImageProc. 1992. - кн. 1. - № 2. - С.244-250.

133. Линде Й., Бузо А., Грей Р.М. Алгоритъм за проектиране на векторен квантовач // IEEE Trans. OnComm. - 1980. - Т.28. номер 1. - С.8^95.

134. LoPresto S.M., Ramchandran K., Orchard M.T. Кодиране на изображения, базирано на смесено моделиране на Wavelet коефициенти и рамка за бързо оценяване-квантуване // Proc. Конференция за компресиране на данни. Snowbird (Юта), 1997. - С. 221-230.

135. Mallat S., Апроксимация с много разделителна способност и вълнови ортонормални бази на L2(R), Trans. AMS. 1989. - V.315. -С.69-87.

136. Марцелин М. и др. Преглед на JPEG-2000 // Proc. Конференция за компресиране на данни, J. A. Storer и M. Кон, изд. Snowbird, Юта, март 28 март 30, 2000. Снежна птица, 2000. - С. 523-541.

137. MarchallX. Оценка на движение и компенсация за кодиране на видео с много нисък битрейт: Доктор на науките Appliqués. Католически университет в Лувалин. -Louvalin-la-Neuve, 1998. - 228стр.

138. Nasrabadi N.M., King R.A. Кодиране на изображение с помощта на векторно квантуване: Преглед // IEEE Trans, относно комуникацията. 1988. - Т. 36. - № 8. - С. 957-971.

139. Нелсън М., Гейли Дж. А. Книгата за компресиране на данни (второ издание). Ню Йорк: M&T Books, 1995. - 541 с.

140. Pearl J. За кодиране и филтриране на стационарни сигнали чрез дискретни преобразувания на Фурие // IEEE Trans. инф. теория. 1973. - кн. ИТ-19. - С. 229-232.

141 Pratt W.K, Andrews H.C. Приложение на трансформацията на Фурие-Адамар за компресия на честотната лента // Компресия на честотната лента на картината / Ред.: Huang T.S., Tretiak O.J. Ню Йорк: Gordong and Breach, 1972. - P. 515-554.

142 Pratt W.K, Chen W.H., Welch L.R. Кодиране на изображения с наклонена трансформация // IEEE Trans. общ. -1974 г. -В. COM-22. P.1075-1093.

143. Queluz M.P., Оценка на движението за видео кодиране: преглед // HF Magazine - декември 1995 г. Специален брой за видео кодиране. - Не. 4.-стр. 5-28.

144. Ramachandran K, Vetteri M. Най-добри уейвлет пакетни бази в смисъл на скорост-изкривяване, IEEE Trans. ImageProc. 1993.-Т.2. -#2. - С. 160-175.

145. Rao K.R., Narasimhan M.A., Reviduri K. Обработка на данни за изображения чрез трансформация на Hadamard-Haar // IEEE Trans. компютри. 1975.-V.C-23. - № 9. - С. 888-896.

146. Rao K.R., Yip P. Алгоритми за дискретно косинусово преобразуване, предимства, приложения. - Лондон: Academic Press inc., 1990.

147. Roska T., Boros T., Radvânyi A., Thiran P. и ChuaL.O. Откриване на движещи се и стоящи обекти с помощта на Cellular Neural. Мрежи // Международен журнал за теория на вериги и приложения. Vol. 20. - 1992. - P.613-628.

148. Said A. и Pearlman W.A. Нов бърз и ефективен кодек за изображения, базиран на разделяне на набори в йерархични дървета // IEEE Trans, относно схеми и системи за видео технологии. 1996. - кн. 6. - №3, юни. - С. 243-250.

149. Шапиро Дж.М. Кодиране на вградено изображение с помощта на нулеви дървета на вълнови коефициенти 11 IEEE Trans. Обработка на сигнали, том. 41, стр. 3445-3462, декември 1993 г.

150. Stefanoiu D. Въведение в обработката на сигнали с вълнички // Изследвания върху информацията и контрола. -1994. V.3. - № 1. - С. 97-110.

151 Storer J. A. Компресиране на данни: Методи и теория. Rockville (Md): Computer science Press, 1988. - X, 413 p.

152. Umnyashkin S. V. Компресия на изображение въз основа на смесено прогнозно моделиране на вълнови дървета // Доклади от университета Vaxjo (Швеция) Математика, естествени науки и технологии. - Не. 11 (септември), 2001. - 18 с

153. Umnyashkin S. V., Strelkov F. V. RD-оптимизирана схема за видео компресия в реално време // Доклади от университета Vaxjo (Швеция) Математика, природни науки и технологии. - Не. 12 (септември), 2001. - 15 с.

154. Van de Walle A., Обединяване на методите за компресиране на фрактално изображение и уейвлет трансформация 11 фрактали. 1997. - кн. 5 (допълнителен брой), април. - С.3-15.

155 Vetterly M., Herley C. Wavelets and Filter Banks: Theory and Design, IEEE Trans. SignalProc. 1992. - Т.40. - № 9. - P.2207-2232.

156. Видео кодек за аудиовизуални услуги при p x 64 kbit/s. //Препоръка ITU-T H.261. -1993.

157. Видео кодиране за комуникация с нисък битрейт //Препоръка ITU-T H.263. Стандарт ISO/IEC 13818-2: 1998.

158. Уолъс Г.К. JPEG алгоритъмът за стандарт за компресиране на изображения // Комуникации на ACM. 1991.-Т.34. -#4. - С. 30-44.356

159. WeiD., PaiH.-T. и BovikA. C., Антисиметрични биортогонални коифлети за кодиране на изображения // Сборник на Международната конференция на IEEE за обработка на изображения. Чикаго, 1998. - том. 2. - С. 282-286.

160. Witten I., Neal R.M., Cleary J. G. Аритметично кодиране за компресиране на данни // Comm. ACM. 1987. - Т.30. - № 6. - С. 520-540.

161. Woods J.W., Huang T.S. Компресия на честотната лента на картина чрез линейна трансформация и блоково квантуване // Компресия на честотна лента на картина / Ед.: Huang T.S., Tretiak O.J. -Ню Йорк: Gordong and Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. и Orchard M.T. Пространствено-честотно квантуване за кодиране на вълнови изображения // IEEE Trans. ImageProc. V.6 - май 1997 г., стр. 677693.

163. Xiong Z., Ramchandran K. и Orchard M. Wavelet пакети кодиране на изображение с помощта на пространствено-честотно квантуване, IEEE Trans. ImageProc. 1998. - кн. 7.-№6. - С. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. Сравнително изследване на DCT- и Wavelet-базирано кодиране на изображения // IEEE Trans. За схеми и системи за видео технология. -1999. Т.9 - № 5. - С.692-695.

165. Zhang Z. и Wei V.K., Онлайн универсален алгоритъм за компресиране на данни със загуба чрез непрекъснато усъвършенстване на кодовата книга. Част I. Основни резултати // IEEE Trans. информирам. теория. Том 42. - Май 1996. - P.803-821.

Моля, имайте предвид, че научните текстове, представени по-горе, са публикувани за преглед и са получени чрез разпознаване на текст на оригинална дисертация (OCR). В тази връзка те могат да съдържат грешки, свързани с несъвършенството на алгоритмите за разпознаване. В PDF файловете на дисертациите и резюметата, които предоставяме, няма такива грешки.

контрол

Комуникация, комуникация, радиоелектроника и цифрови устройства

Алгоритми за преобразуване на изходни изображения, базирани на ортогонални трансформации За каква цел могат да се използват алгоритми за трансформация на изходни изображения, базирани на ортогонални трансформации Какви са приликите и разликите между дискретното преобразуване на Фурие и другите видове ортогонални трансформации. Един от видовете ортогонални трансформации е дискретното преобразуване на Фурие. В процеса на ортогонални трансформации на изображение със силни корелации между съседни елементи, ...

2.4. Алгоритми за трансформиране на изходни изображения, базирани на ортогонални трансформации (За каква цел могат да се използват алгоритми за трансформиране на изходни изображения, базирани на ортогонални трансформации? Какви са приликите и разликите между дискретното преобразуване на Фурие и другите видове ортогонални трансформации?).

В някои случаи, за да се намали количеството данни или да се улесни процедурата за извличане на характеристики на обекти на следващите етапи на разпознаване, е препоръчително първо да се трансформира оригиналният двуизмерен масив [Е i , j ] в масива от стойности на коефициента [ F u , v ], който има същия формат MxN като оригиналното изображение.

Вторичният масив или по друг начин матрицата от коефициенти се нарича трансформация. Един от видовете ортогонални трансформации е дискретното преобразуване на Фурие. В случая на преобразуването на Фурие трансформантът не е нищо друго освен двуизмерният пространствен спектър на изображението.

В общия случай всяка трансформация на оригиналното изображение, базирана на ортогонални оператори, може да се разглежда като операция за разлагане на изображението в обобщен двуизмерен спектър, а коефициентите (т.е. елементи на трансформацията) като амплитуди на съответните спектрални компоненти. Имайте предвид, че ако в този случай нехармоничните функции се използват като базисни функции, тогава концепцията за пространствена честота трябва да се обобщи и трябва да се използва концепцията за последователност.

последователност нарича стойност, равна на половината от средния брой пресичания на нулата за единица време или за единица дължина.

В процеса на ортогонални трансформации на изображение, което има силни корелации между съседни елементи, възниква декорелация (избелване). По този начин стойностите на елементите на трансформацията се оказват практически некорелирани. За разлика от оригиналния масив, който се характеризира със средно разпределение на енергията на сигнала между елементите, разпределението на енергията на сигнала в трансформацията е изключително неравномерно. Основният дял от енергията се пада на елементи с малки серийни номера (т.е. на ниски пространствени последователности) и само малка част на други (виж фиг. 2. 3).

Ориз. 2. 3. Разпределение на енергията на сигнала между отделните елементи
в оригиналния масив (a) и в трансформацията (b).

Това обстоятелство ни позволява или да отхвърлим (т.е. да считаме за равно на нула) повечетоелементи на трансформацията (което по същество означава нискочестотно пространствено филтриране) или да ги квантувате в малък брой нива, като използвате минималния брой битове от двоичния код.

Нека разгледаме някои от най-често срещаните типове ортогонални трансформации, използвани при обработката на цифрови изображения.

Ето коефициентите F u като цяло са комплексни числа

Дискретно преобразуване на Фурие

Всеки комплексен коефициент може да бъде заменен с два реални компонента. Тези компоненти характеризират съответно пространствените дискретни спектри на амплитудите и фазите и се дефинират, както следва:

Основният недостатък на дискретното преобразуване на Фурие е сравнително голямото количество изчисления, както и необходимостта от запазване на голям брой компоненти на трансформация в сравнение с други ортогонални трансформации със същите грешки при възстановяване на изображението (т.е. със същата загуба на информация). В допълнение, за съхраняване на отделните компоненти на комплексните коефициенти е необходимо по-голямо количество памет, отколкото за действителните стойности на елементите на оригиналния масив. Говорейки за дискретното преобразуване на Фурие, трябва да споменем възможността за използване на специално разработени алгоритмиБързо преобразуване на Фурие, както и специализирани изчислителни устройства за реализирането им т.нарсистолни процесори.

Трансформация на Уолш(за M = N )

От своя страна коефициентите b k (Z ) се определят, както следва: b k (Z ) е равно на стойността на k -та цифра от двоичния код на числото Z, състоящ се от l двоични цифри. ако напр. Z = 10, т.е. 10 10 \u003d 1010 2, тогава
b0 = 0; b1 = 1; b2 = 0; b 3 = 1.

b k се определят в съответствие с правилото за дефинирането им в трансформацията на Уолш.

Трансформация на Адамар(за M = N )

Очевидно е, че всички видове ортогонални трансформации са обратими, т.е., като се използва процедурата за обратна трансформация, е възможно да се възстанови оригиналното изображение от трансформацията.

Нека [E i , j ] масив от изходен формат на изображението NxN, където j номер на ред, т.е колона брой елементи (брой елементи в ред); [ F u , v ] преобразува изображение, което има същия формат NxN, където u и v съответно номера на реда и номера на колоната на елементите на трансформацията. Тогава в общия случай, независимо от вида на ортогоналната трансформация, пишем

където a (i, j, u, v) и b (i, j, u, v) базисни функции съответно на преки и обратни трансформации.

От практическа гледна точка е важно да се отбележи, че всички видове ортогонални трансформации, разгледани по-горе, са разделими в променливи. По този начин изчисляването на директни и обратни двумерни ортогонални трансформации може да се сведе до последователно изпълнение на едномерни трансформации

Тук a str(i, u), b(i, u) и a(j, v), b(j, v) базисни функции на директни и обратни трансформации, съответно, по посока на редове и колони.

За удобство на записване и изчисления е препоръчително да използвате матричен апарат

Тук [A e] и [A str ] матрици на директно преобразуване; [ V e ] и [ V str ] матрици за обратно преобразуване; [НО str ] t и [V str ] t матрици, получени чрез транспониране на матриците [ A str ] и [ V str ].

Разбира се, независимо от формата на математическото представяне, директните и обратните ортогонални трансформации на двумерни масиви изискват в общия случай значителни изчислителни разходи. Това трябва да се вземе предвид при проектирането

ATSN работи в реално време. Въпреки това, при цифрова обработка на двоични изображения, процедурите на ортогоналните трансформации са значително опростени, особено в случай на използване на двоични базисни функции (Walsh, Hadamard и др.).


Както и други произведения, които може да ви заинтересуват

72688. РАЗРАБОТВАНЕ НА ЕКСПЕРТНА СИСТЕМА С ИЗПОЛЗВАНЕ НА РЕЛАЦИОННИЯ ПОДХОД НА СУБД ЗА ДОСТЪП И ИЗПОЛЗВАНЕ НА ИНСТРУМЕНТИ НА VISUAL PROLOG 2,09 МБ
Системата, която възнамеряваме да изградим, принадлежи към класа на идентификационните (или диагностичните) системи. Системите от този клас решават проблема за определяне, т.е. идентифициране на обект по неговите характеристики.
72690. ЛАБОРАТОРНА ДИАГНОСТИКА НА НАРУШЕНИЯТА НА ХЕМОСТАЗАТА 10,55MB
Оценката на състоянието на системата за коагулация на кръвта е една от най-трудните диагностични задачи. В това ръководство този въпрос се разглежда от различни гледни точки: общи биологични модели на функциониране на многокомпонентни системи на тялото, патофизиологични механизми ...
72692. Повторна проверка на нивото на формиране на основните умения за работа с електронни таблици 104KB
Дясната част, която служи за придвижване според масите вдясно от улицата, и лявата част, за да отмъсти за етикетите на арките, ви позволява да се движите между арките. Създаване на таблици Създайте самостоятелно подготвени таблици, като спрете следващите стъпки: стартиране на Excel; форматиране на заглавен ред.
72693. Doslіdzhennya мултивибратор на napіvprovіdnikovyh транзистори 2,58MB
Очевидно параметрите на транзисторите са абсолютно еднакви. И такава идеална схема няма да бъде практична: неправилните транзистори ще бъдат счупени. Невъзможността наистина да се осигури абсолютна симетрия и наличието на допълнителен мигач, който да го доведе до степен, че след подаване на жизнено напрежение ...
72696. Разбиране на функциите на базата данни на Excel 103KB
Станете майстор на малък магазин. Необходимо е да се проведе пост-изображение на пристигането и излагането на стоки, ден на майката пред очите на истински излишък, майките да могат да назовават стоки според имената си и др. Помогнете на някого с Excel.