Изображение и его ортогональные преобразования

21.09.2019

Специальность ВАК РФ05.13.11
Количество страниц 382

Диссертация добавить в корзину 500p

ПОНЯТИЯ И ПРОБЛЕМЫ

1.1. Основные подходы к проблеме компрессии изображений

1.1.1. Математическая модель дискретного изображения

1.1.2. Мера ошибки восстановления изображений

1.1.3. Исходные идеи методов компрессии статических изображений

1.1.4. Вариант JPEG, основанный на применении ДКП

1.1.5. Проблема выбора базисов разложения

1.2. Использование вейвлет-преобразований для компрессии статических изображений

1.2.1. Основные понятия, определения, специфика вейвлет-преобразований

1.2.2. Двумерные вейвлет-преобразования

1.2.3. Основные идеи современных алгоритмов вейвлет-компрессии изображений

1.3. Особенности обработки видеопоследовательностей

1.4. Общая постановка задачи оптимизации кодирования с потерями

Введение диссертации (часть автореферата) на тему "Математические методы и алгоритмы цифровой компрессии изображений с использованием ортогональных преобразований"

Проблемы, связанные с хранением, обработкой и передачей зрительных образов (изображений), сопровождали человечество на протяжении всей его истории. Появление телевидения напрямую связало задачи обработки изображений с задачами обработки электрических сигналов, а развитие цифровой электроники привело к тому, что повсеместный переход от аналоговых форм представления сигналов к цифровым стал характерной чертой современных электронных систем. В этой связи вопросы цифровой обработки изображений (ЦОИ) приобретают сегодня особую актуальность.

Дискретное черно-белое полутоновое изображение можно задать некоторой матрицей, элементы которой (точки изображения, называемые также пикселями) представляют собой полученные в результате некоторой пространственной дискретизации отсчеты функции, описывающей распределение яркости на непрерывном изображении. Цифровым изображением будем называть матрицу, полученную в результате поэлементного квантования (с конечным числом уровней) значений отсчетов дискретного изображения. Для описания цветного изображения (дискретного или цифрового) требуется уже три матрицы, соответствующие трем яркостным компонентам в выбранном цветовом пространстве, например RGB (red, green, blue). Описание изображения в виде матриц(ы) яркости будем называть непосредственным представлением.

Обработка, хранение, передача цифровых изображений при непосредственном представлении требуют колоссальных объемов данных. Так, например, для записи одного только кадра высококачественного цветного изображения размером 1024x1024 точки, при кодировании каждого отсчета 24 битами (8 бит на цветовую компоненту), потребуется 3 мегабайта данных. Конечно, при просмотре видеороликов допустимо меньшее разрешение экрана, тем не менее, для демонстрации цифрового видеофильма в реальном масштабе времени необходима передача данных со скоростью около 160 мегабит/с . Сказанное объясняет тот громадный интерес, который проявляется во всем мире к поискам путей эффективного кодирования изображений.

Уже на заре развития цифровых методов обработки изображений (конец пятидесятых - начало шестидесятых годов) избыточность непосредственного представления изображений была очевидной, однако простейшие способы, применявшиеся для сжатия данных, такие как дифференциальная импульсно-кодовая модуляция с последующим статистическим кодированием, давали более чем скромные результаты. Постановка вопроса о применении частотных методов для сжатия изображений стала возможной благодаря появлению в 1965 году работы Кули и Тьюки , содержавшей описание алгоритма быстрого вычисления дискретного преобразования Фурье (ДПФ). Идея замены изображения как непосредственного объекта кодирования отсчетами его двумерного спектра ДПФ была выдвинута в 1968 году . Кодирование посредством использования ДПФ основано на том, что для большинства изображений естественного происхождения значения многих коэффициентов ДПФ сравнительно малы. Такие коэффициенты можно часто вообще отбросить, или отвести на их кодирование малое число бит, без риска внести сколь либо значимые искажения. В 1969 году Прэтт, Эндрюс и Кэйн предложили использовать для кодирования изображений вместо преобразования Фурье преобразование Адамара , что во многих практических случаях позволяет значительно уменьшить объем необходимых вычислений. После этого были предприняты исследования по применению для кодирования изображений дискретных преобразований Карунена-Лоэва и Хаара . Преобразование Карунена-Лоэва является оптимальным в том смысле, что обеспечивает минимальную среднеквадратическую ошибку кодирования при отбрасывании части коэффициентов-трансформант, однако требует, к сожалению, знания статистических характеристик обрабатываемых изображений и не имеет быстрого алгоритма вычисления ; преобразование

Хаара, напротив, характеризуется в высшей степени эффективным алгоритмом вычисления, но дает, как правило, сравнительно большую погрешность кодирования . В 1971 году Шибата и Эномото предложили специально для использования в кодировании изображений так называемое наклонное преобразование векторов из 4-х или 8-ми компонент. Вскоре после этого Прэтт, Чен и Уилч разработали обобщенный алгоритм наклонного преобразования векторов большой длины и двумерных массивов .

Все преимущества кодирования изображений с использованием ортогональных преобразований вытекают в конечном счете из особенностей распределения энергии среди элементов-трансформант - благодаря этому обобщенный двумерный спектр1 более удобен для кодирования, чем изображение в исходном представлении . Вследствие значительных корреляционных связей между элементами изображения естественной природы основная энергия в дискретном спектре имеет тенденцию концентрироваться в относительно небольшом числе отсчетов, соответствующих медленно осциллирующим базисным функциям. Поэтому, без существенного ущерба для последующего восстановления изображения, малые по величине спектральные коэффициенты можно вообще обнулить, а оставшиеся элементы спектра оцифровать (проквантовать и закодировать). Здесь уместно отметить, что использование алгоритмов сжатия с потерями данных для реальных изображений фотографического характера (т.е. полутоновых) носит принципиальный характер, поскольку, допустив наличие некоторой ошибки в восстановленном изображении, можно добиться намного более высокого уровня сжатия данных. Ошибка может быть столь мала, что не будет восприниматься человеческим глазом. Кроме того, изображения, полученные

1 Везде термин спектр мы будем понимать обобщенно, как результат унитарного преобразования (не обязательно по ДПФ) одномерного или двумерного набора данных. сканером или цифровым устройством видеоввода, неизбежно имеют шумовую составляющую, точное сохранение которой при кодировании лишено смысла.

Как показано Ахмедом и др. , в применении к кодированию изображений, для которых подходит марковская статистическая модель, дискретное косинусное преобразование (ДКП), имеющее быстрый алгоритм вычислений, приближается по эффективности спектрального представления данных к преобразованию Карунена-Лоэва (см. также ). Данный факт явился причиной того, что именно ДКП послужило основой при разработке стандарта сжатия неподвижных изображений JPEG . Указанный стандарт явился плодом многолетних усилий. коллектива специалистов, образованного в 1987 году из представителей двух авторитетных международных организаций: ISO и ITU. Появление объединенной группы JPEG было вызвано ростом числа разработчиков и пользователей различных систем ЦОИ и вытекавшей из этого необходимостью унификации формата сжатого представления цифровых изображений. Выработанная в итоге спецификация явилась документом, которого сегодня придерживаются практически все разработчики программных систем ЦОИ общего назначения. С 1994 года производятся специализированные микросхемы, реализующие сжатие и восстановление по JPEG аппаратно и обеспечивающие обработку цветных изображений в реальном масштабе времени (480x640 точек, 30 кадров/с ). С точки зрения достижимого уровня сжатия, вариант JPEG, основанный на использовании ДКП, не является лучшим среди существующих ныне методов эффективного кодирования изображений. Так, методы, базирующиеся на использовании вейвлет-преобразований2 , могут обеспечить значительно более высокие уровни сжатия - по этой причине в расширенном стандарте JPEG2000 ,

В отечественной литературе вместо прямого перевода слова wavelet часто используется также термин всплеск. существующем в виде предварительной (draft) спецификации с 2000 года3 , уже предусмотрена возможность применения вейвлет-преобразований. Однако говорить о том, что сжатие изображений с использованием ДКП себя полностью изживает, на сегодняшний день преждевременно, поскольку по сравнению с вейвлет-преобразованиями вычислительные затраты, необходимые для реализации ДКП, намного меньше . Более подробный обзор современных методов компрессии изображений и различий в используемых подходах будет дан в главе 1 настоящей работы.

Важность проблемы компрессии данных при обработке изображений трудно переоценить - достаточно проанализировать наблюдаемый в последнее десятилетие рост числа соответствующих публикаций. Так, значительную часть содержания ежемесячного журнала IEEE Transactions on Image Processing, издаваемого с 1992 года, составляют статьи, посвященные именно этой теме. Нельзя не заметить также и тот факт, что алгоритмы сжатия изображений и лежащая в их основе теория разрабатываются в основном за рубежом, прежде всего, в США. Конечно, говорить об отсутствии отечественных работ в данной области нельзя , однако необходимость значительного расширения российского фронта исследований не вызывает никаких сомнений.

Сложность алгоритмов, используемых для компрессии изображений, неуклонно растет - сказанное касается не только объема вычислений, но и идейных основ построения алгоритмов: в их фундаменте сложным образом переплетаются функциональный анализ, теория вероятностей, теория информации, дискретная математика и алгебра. Вместе с тем задачи ставятся практикой, что требует при их решении неуклонного и постоянного внимания к возможностям реальной аппаратуры.

3 2 января 2001 года часть 1 «JPEG 2000 Image Compression System: Part I Core Coding System» окончательно утверждена для принятия в качестве официального международного стандарта ISO/IEC 15444-1.

Таким образом, задача диссертационной работы была определена как исследование теоретических вопросов эффективного кодирования изображений с использованием ортогональных преобразований и разработка соответствующих алгоритмов сжатия, пригодных для практического применения на базе универсальных вычислительных средств общего назначения. Новизна работы определяется впервые предложенными для решения поставленной задачи алгоритмами и методами, которые выносятся на защиту (см. ниже). Актуальность обусловлена прикладной направленностью работы и исключительной важностью проблемы сжатия данных в ЦОИ.

В первой главе диссертации приводятся необходимые для дальнейшего изложения предварительные сведения, дается краткий обзор и классификация основных подходов к реализации эффективного кодирования изображений. Использование алгоритмов сжатия с потерями данных для полутоновых изображений носит повсеместный характер: допустив наличие ошибки в восстановленном изображении, можно добиться намного более высокого уровня компрессии данных. Чаще всего качество обработки изображений принято оценивать по среднеквадратичной ошибке (СКО):

СКО = X у)2 > где ~ матрица исходного изображения, Л

Х = (х/ у) - матрица изображения, полученного после обработки (сжатия и восстановления данных). Для логарифмической величины СКО используется общепринятая мера PSNR (peak signal to noise ratio - отношение пикового

255 значения сигнала к шуму), PSNR = 201g-[дБ].

Методы сжатия изображений удобно рассматривать в виде общей схемы, состоящей из трех основных этапов: снижение межэлементной корреляции данных, квантование элементов данных, статистическое кодирование. Квантование является основным приемом сжатия с потерями. По сути дела,

N-1M-1 квантование есть выделение из входных данных некоторой основной части информации, когда ее менее значимая часть опускается. Применяется как скалярное, так и векторное квантование. В скалярном случае элементы обрабатываемого набора данных квантуются независимо друг от друга.

Перевод изображения в обобщенную спектральную область при помощи некоторого линейного преобразования ^ может значительно снизить межэлементную корреляцию в матрице-трансформанте У=77(Х) по сравнению с корреляцией элементов в матрице дискретного изображения X. Тогда независимое покомпонентное кодирование вектора У, а не вектора X, становится более эффективным. Можно также дать энергетическую трактовку цели использования преобразований, которая в таком понимании заключается в концентрации максимальной части энергии исходного дискретного сигнала (матрицы X) в минимальном количестве спектральных коэффициентов (элементов матрицы У). Между распределением энергии в обобщенном спектре и декоррелирующими свойствами преобразований имеется определенная связь. Изучение эффективности декоррелирующих свойств, таким образом, является важной задачей при выборе преобразования для применения в схеме компрессии.

Реальные фотографические изображения представляют собой двумерные сигналы, имеющие неоднородности (особенности) на областях контуров объектов, поэтому базис функций, используемых для разложения, должен обладать хорошей локализацией в области изображения. Однако в фоновых областях изображение может рассматриваться как реализация стационарного сигнала, что делает предпочтительным использование для разложения частотно-локализованного базиса (хорошо известно, что коэффициенты тригонометрического разложения стационарного сигнала некоррелированы). Добиться одновременно высокого разрешения в частотной и во временной областях невозможно в силу принципа неопределенности Гейзенберга.

Возможным выходом является использование функциональных базисов вейвлетов (всплесков) , которые обладают переменным время-частотным разрешением. Подходы, связанные с использованием всплесков, на сегодняшний день являются доминирующими в обработке неподвижных изображений, постепенно вытесняя традиционный инструмент декорреляции -дискретное косинусное преобразование (ДКП).

В первой главе отмечается, что для оптимизации алгоритмов сжатия данных с потерями часто используется подход, основанный на минимизации RD-функции Лагранжа . Пусть X - некоторый входной набор данных, которому в результате выполнения процедуры сжатия-восстановления ставится в соответствие < выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU (0.1)

Поиск решения задачи (0.1) в большинстве случаев сводится к громоздким численным процедурам итерационного характера. Если не задаваться ограничением R(X,u)

В первой главе также кратко отмечаются особенности, связанные с обработкой (сжатием-восстановлением) динамических изображений. Основным используемым преобразованием для видеокомпрессии пока остается ДКП, как более простое в плане объема вычислений по сравнению с вейвлет-преобразованиями . Так же как и для статической компрессии, алгоритмы кодирования видео чаще всего являются более сложными по сравнению с алгоритмами декодирования. Реализация программной компрессии видео в реальном масштабе времени, таким образом, накладывает существенные ограничения на допустимую сложность вычислений.

Вторая глава посвящена изучению методов теоретического анализа декоррелирующей эффективности преобразований , предназначенных для использования в сжатии данных. Предложен новый метод, который основан на оценке величины безусловной энтропии коэффициентов преобразования и опирается на следующие рассуждения. Пусть известна ковариационная матрица Кх исходного вектора данных

Х = (х0,л;1,.,д:Дг1)г, вектор-спектр У получен в результате некоторого ортогонального преобразования с матрицей У=ЛУХ. Опуская выкладки, среднюю безусловную энтропию для коэффициентов вектор-спектра можем записать:

Нср = - X | /к (щ, х)\о%/к (тк,ок,х)4х =

0.3) Л к=0 к=0 функция плотности распределения вероятностей для

1 Аг-1 1 1\-11 1

Л°(х)1оё/Лх>/х; 1 лг где /к(ткоьх) спектральной характеристики ук (Аг-ой компоненты вектора У), /и^ -математическое ожидание, ок - среднеквадратичное отклонение, /к(х) = Чем меньше средняя энтропия (0.3), тем эффективнее будет последующее независимое кодирование компонент спектра.

В качестве критерия декоррелирующей эффективности предлагается рассматривать полученную из формулы (0.3) в результате определенных преобразований величину средней избыточной энтропии, которая выражается через элементы матриц Кх = (соу(хг., г и = (и;,. , ^Т1,. следующим образом:

1\ ^ ае1^х к=0 у-=0 ^

Величина (0.4) неотрицательна, причем чем больше ее значение, тем ниже эффективность декоррелирующего преобразования с матрицей Численные расчеты величины (0.4) для различных преобразований и видов ковариационных матриц показали результаты, полностью согласующиеся с известными данными .

Большой интерес для анализа представляет модель дискретного сигнала (вектора X), имеющего статистику дискретного марковского процесса первого порядка, когда ковариационная матрица имеет следующий вид:

N-2 рК-1 рМ-2

Данная модель часто используется и для описания межстрочной и межстолбцовой корреляции в дискретных изображениях . При р=1, когда все компоненты в исходном векторе X одинаковы (для любых двух отсчетов вектора коэффициент корреляции равен единице), расчет введенного критерия (0.4) для матрицы (0.5) невозможен, т.к. в этом случае имеем <ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. В главе 2 доказывается следующая теорема .

Теорема 2.1. Для любой ортогональной матрицы (Л/х/У) такой, что

V/ = ОД,. ,ЛГ -1: >у0 . = -(базисная функция с нулевым индексом есть лА/У нормированная постоянная составляющая) и ковариационной матрицы (0.5) лм/ 2 N-1 N-1

1ипДЯ(\У,Кх)= - \о%

Различные исследования , в том числе проведенные в главе 2, показывают, что среди дискретных преобразований, имеющих быстрые алгоритмы вычислений (для размерности N реализуемых за -Шо^Ы арифметических операций) наиболее близкие к оптимальному преобразованию Карунена-Лоэва характеристики декорреляции для марковского процесса (0.5) дает использование ДКП. Несмотря на наличие хорошо проработанных быстрых алгоритмов вычисления, ДКП принципиально требует для своей реализации выполнения операций умножения и по объему вычислений заметно уступает, например, преобразованиям Хаара, Уолша, Крестенсона-Леви. Отдельным вопросом, рассмотрению которого уделено значительное внимание в главе 2, является построение (синтез) нового преобразования, имеющего как высокие характеристики декорреляции для модели (0.5), так и значительно более быстрые, чем для ДКП, алгоритмы вычисления. Полученное в результате дискретное псевдокосинусное преобразование (ДПКП) определено для векторов такой размерности А^, для которой возможно разложение N=N1 ■. -Ып, причем У к {2,3,4}. Тогда матрица ДПКП (в данном случае нижний индекс указывает на размерность преобразования) строится как прямое (тензорное) произведение элементарных матриц ДПКП {\¥2,\¥з,\У4}: = \¥Лг1 ®. ® \Ул,п, причем элементарные матрицы ортогональны и представляют собой полученные в результате определенных модификаций матрицы ДКП соответствующей размерности4. Элементарные матрицы представимы в виде произведения некоторой диагональной матрицы Б на матрицу С, а структура С позволяет реализовать умножение на произвольный вектор и, СИ, только при помощи операций сложения и вычитания чисел.

Из свойств тензорного произведения следует представление = ОдгСд, где диагональная матрица ®, а матрица

См =Сщ ®.®СЫп. Структуры матриц С2, С3, С4, В2, Б3, Б4 приводятся в главе 2. Таким образом, реализация ДПКП У = \Уд,Х = Б^С^Х заключается в реализации умножения матрицы См на вектор, У = С^Х, и последующей нормировке полученного вектора У: У = Б^У. Для вычисления ДПКП удобно использовать быстрые алгоритмы, основанные на факторизованном представлении для матрицы Оу в виде произведения слабозаполненных мат-риц5: Сдг = ТдГ] ТдГ~1) ■.■ ТдР, где Т#> =1^ ^ ®1„м «.»1^ ,

1дг. - единичная матрица размерности ТУ. хА/" -. Поскольку матрицы Тд/}

J J J состоят из определенным образом разреженных матриц-блоков, умножение матрицы Тд/} на вектор также сводится только к операциям сложения и вычитания чисел. Быстрые алгоритмы обратного ДПКП строятся

4 Под тензорным (прямым) произведением матриц (/=0,.,7]-1; т= 0,.,А-1) и О^^} (к-0,., у-1; 7=0, .,/¿-1) понимаем матрицу

8=В®С=К/}}= . ,а=0Х.,щ-\,р=0Х.,1йг\.

5 Для обоснования справедливости данного представления см. с.84-85 из монографии . аналогично, т.к. в силу ортогональности ДПКП:

Отметим, что необходимая при вычислении ДГШП и обратного ДПКП нормировка (умножение на матрицу Ду) для схемы сжатия со скалярным квантованием коэффициентов преобразования не влечет усложнения вычислений . Нормировка может быть объединена при сжатии данных с этапом скалярного квантования у^ - гоипс1(у7 / с() путем выбора для каждого элемента у. преобразованного индивидуального шага квантования qj=qldjj (где

Элемент диагональной нормировочной матрицы Б^). При А восстановлении вектора У~ У, у ту ■, множители для элементов у ^ следует выбирать также индивидуально, в виде

Как показал теоретический анализ, для модели (0.5) ДПКП обладает большей эффективностью декорреляции по сравнению с другими быстрыми преобразованиями, реализация которых также сводится только к операциям сложения и вычитания чисел.

Третья глава посвящена изучению вопросов применения для сжатия изображений дискретного преобразования Крестенсона-Леви (ДПКЛ) и является развитием исследований кандидатской работы автора .

Система функций Крестенсона-Леви {хт на полуинтервале хе = и(Л О на диагонали матрицы размерности рпхрп находятся р матриц размера рпЛхрпЛь остальные элементы матрицы - нулевые). Матрица п) ={Щк) (,Д=0,1,.,/-1) имеет следующий вид: м>м = ч ди"к~1, где кх=к{то&р), ]п =[¡1 рп~1\то&р), ^=ехр(-2т/р), 8™ = \ ПрИ т { . 0, при т. Ф 7

Дискретные (цифровые) полутоновые изображения описываются в виде вещественной матрицы X. При обработке вещественных векторов (матриц) спектр ДПКЛ распадается на пары комплексно сопряженных элементов, поэтому часть элементов спектра можно не вычислять. Учет этих особенностей позволил предложить для обработки вещественных массивов алгоритмы ДПКЛ и обратного ДПКЛ с неполным вычислением. При обработке вещественных наборов данных возможно также применение «совмещённых» преобразований, аналогично тому, как это делается при вычислениях дискретного преобразования Фурье. При этом из двух вещественных векторов X и X2 формируют комплексный вектор Х=Х1+/Х2 и выполняют преобразование.

Если использовать для комплексных чисел г=хНу представление в базисе (1 г=а+Рд е~2л"/3), то вычисление ДПКЛ (при р= 3) может быть выполнено без использования операций умножения (нормирующий множитель

1/4р" , см. (0.7) - не учитывается), при помощи операций сложения и вычитания (данный факт установлен А.В.Ефимовым). Использование в алгоритмах с неполным вычислением базиса (1 ,д) влечет за собой ряд особенностей, которые рассматриваются в главе 3. При размерности матрицы изображения ЗпхЗг вычисление ДПКЛ или обратного ДПКЛ по алгоритмам с неполным вычислением требует выполнения 7(п+г)-3"+г"1 операций сложения (вычитания), операции умножения и деления не используются. Использование базиса (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

Для обработки неподвижных изображений в кандидатской работе автора был предложен алгоритм компрессии, в котором исходное изображение разбивается для обработки на элементарные фрагменты X, 9x9 точек, и каждая матрица-фрагмент обрабатывается при помощи ДПКЛ (по алгоритму с неполным вычислением). В главе 3 приводится краткое описание алгоритма компрессии , который подтвердил обоснованность использования дискретного преобразования Крестенсона-Леви для сжатия изображений. Характер вносимых в процессе сжатия-восстановления ошибок различен для основанного на ДКП метода JPEG и для предложенной схемы: при использовании JPEG имеет место "размывание", в то время как новая схема сжатия приводит к "зубчатости" изображения. Тем не менее, субъективное качество восприятия при использовании обоих рассмотренных способов сжатия примерно одинаково. Оценки величины искажений по величине PSNR, выполненные для ряда тестовых изображений размерности 720x504=362880 точек, также дали близкие результаты: для одних изображений может наблюдаться незначительное преимущество основанного на ДКП стандарта JPEG, для других изображений лучшее качество восстановления возможно при использовании нового метода. Различия невелики, особенно при невысоких уровнях сжатия. Оценки вычислительных затрат показывают, что алгоритм на основе ДПКЛ не уступает JPEG и в части, касающейся вычислительной сложности реализации. Алгоритм компрессии изображений , использующий ДПКЛ и имеющий сравнимые с JPEG характеристики, представляет собой результат, впервые полученный автором.

В четвертой главе рассматриваются вопросы разработки схем сжатия, использующих пофрагментную обработку изображений. Обычно для подобных схем наиболее эффективным является использование ДКП, поэтому изучению его свойств, необходимых для построения алгоритмов компрессии, посвящена значительная часть четвертой главы. Т.к. двумерное ДКП является разделимым преобразованием (сводится к одномерным преобразованиям вдоль строк и вдоль столбцов обрабатываемой матрицы), то многие свойства двумерного ДКП вытекают из свойств одномерного.

Для коэффициентов одномерного ДКП, определяемого формулой получено следующее соотношение (Ь*Ю): кк (0.8) вт- #

2Ы где А/=ху-Ху 1 - первые разности отсчетов исходного вектора данных Х = (л;0,д:1,.,л:лг1)Т. Формула (0.8) показывает, что разности А,- имеют различный характер влияния на спектр ДКП. Так, разность Аш-хш-х^/2-\ (при четном IV) входит во все коэффициенты у2ш с максимальными по модулю (единичными) весами. Разность между отсчётами х0 и вообще не входит в (0.8), что принципиально отличает ДКП от его «прародителя» - дискретного преобразования Фурье, амплитудный спектр которого инвариантен к циклическим сдвигам (х0->х}->.->Хл>-1->*о) компонент вектора данных X.

В предположении некоррелированности разностей6 А; и равенства нулю их математических ожиданий Е(А/)=0 исследовались также вероятностные оценки, в частности, величина суммарной дисперсии переменных составляющих спектра ДКП: Е - ¿,0{ук). Данная сумма пред ставима через к= 1 дисперсии первых разностей вектора данных следующим образом: Е=-^|S(j)D{Aj), где ¿"(у) - некоторый весовой коэффициент. Доказана

Теорема 4.1: для коэффициентов $(/) верно соотношение: Данная теорема вновь подтверждает, что и для использовавшейся вероятностной модели вектора X разность Ат (в данном случае, ее дисперсия) вносит наибольший вклад. Чем ближе номер разности к N/2, тем больше значение веса £(/") и тем больший вклад вносит разность А, в энергию переменных составляющих. Исследование спектров ДКП для некоторых характерных

6 Для марковской модели (0.5) данное допущение не верно. сигналов также подтвердило, что при использовании приемов кодирования спектров из JPEG (в частности, кодирование серий нулей - run-length encoding) эффективность кодирования будет ухудшаться в случае, когда информационная насыщенность дискретного сигнала будет приходиться на центральные отсчеты вектора.

Помимо изучения общих свойств ДКП, в четвертой главе исследуется возможность оптимизации кодирования по схеме JPEG, сохраняющей формат выходных данных. В развитие идей работы Crouse-Ramchandran предложен алгоритм , осуществляющий дополнительную оптимизацию скалярного квантования коэффициентов ДКП, что влечет некоторое повышение характеристик сжатия по стандарту JPEG за счет пренебрежимо малого усложнения процедуры оптимизации.

Для сжатия статических изображений с использованием ДКП 8x8 в четвертой главе разработан новый алгоритм , отличающийся от JPEG этапом энтропийного кодирования, для которого используется несколько статистических моделей и алгоритм многопотокового арифметического кодирования . Выбор модели производится определенным образом по контексту уже обработанных данных. Предложенный алгоритм арифметического контекстного кодирования коэффициентов ДКП повышает сжатие данных на 10% по сравнению со стандартной схемой JPEG (эталоном служила программа JPEG Optimizer™ v.4.0, см. http://xat.com).

Значительное внимание в четвертой главе уделено изучению общих теоретических и практических аспектов применения векторного квантования (ВК) для компрессии изображений в области преобразований, не обязательно с использованием ДКП. Для этого спектры фрагментов изображения необходимо разбить на определенные зоны, каждая из которых соответствует отдельному потоку данных, подвергаемому ВК. Сформулируем зад^ту разбиения коррелированного набора данных, который представим в виде вектора Y, на кластеры (классы) . Исходными параметрами являются ковариационная матрица Ку вектора У и ограничение на максимальную неопределённость (энтропию) НтаХ для каждого кластера в разбиении. Требуется найти такое разбиение множества случайных компонент У={70,.,ГЛг1} на подмножества

У(А) = ^„.„У^], к=1,.,М, чтобы:

Ъ*"^ . (О,) я(у^)квазиоптимальных способа : алгоритм «Выращивания кластеров» и алгоритм «Выделения сильных связей». Оба предложенных способа численного поиска решения (0.9) основаны на минимизации энтропии межкластерных связей

Нсв(\а\.,\(м))=^Н{\{к))-Н(У). Более близкие к оптимальному к=1 удовлетворяющему (0.9)) разбиению показал второй из названных алгоритмов.

В заключение, в четвертой главе предложена общая схема компрессии, использующая адаптивное ЫЭ-оптимизированное ВК в области спектров фрагментов изображения. Т.е. формализована общая схема сжатия статических изображений с использованием векторного квантования в области ортогональных преобразований, ориентированная на пофрагментную обработку изображения.

Пятая глава посвящена изучению и разработке алгоритмов компрессии неподвижных изображений в области вейвлет-преобразований. Пусть теперь

W = обозначает матрицу дискретного вейвлет-спектра, полученную в результате двумерного л-шагов о го вейвлет-преобразования матрицы дискретного изображения. Количество шагов вейвлет-преобразования определяет число частотных уровней в спектре, для п шагов имеем л+1 уровень. При этом коэффициенты вейвлет-разложения можно упорядочить в виде совокупности древовидных структур {7}, корнями которых являются элементы, лежащие в самом низкочастотном диапазоне спектра (саббэнде), см. рисунок. Подобное упорядочивание определяет для вейвлет-коэффициентов (узлов дерева) связи вида «родитель-потомки». Идейные основы разработанного алгоритма сжатия уходят корнями в работы Lewis-Knowles и Xiong-Ramchandran-Orchard ; при этом основная задача, стоящая перед алгоритмом компрессии, состоит в поиске RD-оптимальной топологии (т.е. структуры S, которая получается после подрезания ветвей исходного дерева Т), минимизирующей функцию Лагранжа для фиксированного значения Я: J(S*) = тт[Д£) + ЯR(S)].

Идея, которая восходит к работе и в том же виде используется в , заключается в следующем: чем больше абсолютная величина вейвлеткоэффициента I wj (или энергия, wf) узла-родителя /, тем менее вероятно появление у данного узла нулевой (т.е. подрезанной) ветви, что следует использовать для кодирования топологии дерева S. Более точное предсказание появления нулевой ветви можно составить, если использовать в качестве прогнозной величины Р, сумму, включающую в себя, помимо wf, также квадраты значений вейвлет-коэффициентов, соседних в саббэнде к узлу i. Проведенные в главе 5 экспериментальные исследования статистических зависимостей показали целесообразность использования для прогнозной к ев-------- ЕВ величины Р{ взвешенной суммы из абсолютных значений коэффициентов-соседей. Необходимые значения весовых множителей были установлены в результате статистической обработки вейвлет-спектров реальных фотографических изображений. Для кодирования топологии «подрезанного» дерева £ каждому узлу г дерева приписывается признак наличия (гц= 0) или отсутствия (пг- 1) в данном узле подрезанной ветви. Установлено, что для повышения эффективности статистического кодирования топологии 5 признаки {я,} следует определенным образом группировать в новые элементы данных {Ту,}. Последние подвергаются адаптивному арифметическому кодированию, причем используется несколько статистических моделей, контекстное (т.е. по уже закодированным данным) правило выбора модели задается определенным образом по прогнозным величинам {Т5,-}.

Для кодирования скалярно проквантованных вейвлет-коэффициентов, не попавших в нулевые (подрезанные) ветви, также используется несколько статистических моделей. Предложенное правило контекстного выбора моделей учитывает как значение прогнозной величины Р{ узла-родителя, так и значения вейвлет-коэффициентов соседних узлов, которые находятся в том же саббэнде, рядом с обрабатываемым, но уже закодированы. Выбор статистической модели для кодирования скалярно проквантованного вейвлет-коэффициента Wj=XQш\l^{Wjlд), соответствующего узлу у дерева Б, осуществляется по величине л, =0.36Р н-1.0б{ 1 У

М?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Сравнение результатов, полученных в экспериментах по обработке реальных изображений, с результатами применения других известных алгоритмов вейвлет-компрессии изображений показывает, что предложенный алгоритм имеет весьма высокие показатели. Так, для известного тестового изображения Lena при уровне сжатия 0.5 бит на пиксель (16 раз) ошибка PSNR=37.66 дБ.

Завершающие исследования главы 5 относятся к построению гибридной схемы кодирования вейвлет-спектра, когда в дополнение к описанному выше способу подрезания ветвей вейвлет-коэффициентов допускается также возможность векторного «самоквантования» ветвей, которое может трактоваться как фрактальное кодирование в области вейвлет-преобразований (см., например, ). Полученный в результате гибридный алгоритм требует существенно большего объема вычислений, однако фрактальная составляющая кодирования при этом оказалась практически полностью подавленной базовой схемой вейвлет-компрессии, основанной на подрезании ветвей. Необходимо отметить, однако, что «смычка» подходов в гибридном алгоритме была произведена несложным способом и возможности дальнейшего развития оставляют здесь обширное поле для исследований.

Шестая глава посвящена исследованию алгоритмов сжатия динамических изображений, с целью построения схемы видеокомпрессии, пригодной для программной реализации в реальном масштабе времени на базе персональных компьютеров.

Кадром видеопоследовательности называем матрицу пикселей из Mi строк и М2 столбцов: B=(bkj), А:=0,1,.,МГ1, /=0,1,.,М2-1, а под термином видеопоследовательность понимаем упорядоченный набор кадров В0,!*1,. ,Вг,. Назовем (у, х)-блоком кадра В (у, х- целочисленные координаты) некоторую подматрицу BytX=(bkii), где k=y,y+\,.y+Ni-\, 1=х>х+\,.у+ЫгА. В разработанном алгоритме каждый кадр видеопоследовательности разбивается при обработке на смежные матрицы-блоки {BWj„} размером 8x8, т,п=0,8,16. Если какой-либо блок видеопоследовательности оказался в определенном смысле «похож» на оригинальный блок В"тп, считаем, что блок В1т>п - это перемещенный фрагмент B^J предыдущего кадра, и для кодирования (т,п)блока изображения достаточно задать координаты блока в предыдущем кадре, у их, либо изменения координат у-т и х-п. Частным случаем перемещенного блока является неподвижный блок, когда т=у, л=х Если блоку В"тп нельзя найти похожий в предыдущем кадре, блок должен кодироваться как новый. Такой идеологии следуют современные международные стандарты видеокомпрессии MPEG , Н.261-Н263 , причем все они опираются также на использование ДКП для кодирования новых блоков.

Разработка нового алгоритма видеокомпрессии проводилась в рамках общего подхода к RD-оптимизации сжатия с потерями. В разработанном алгоритме для выбора способа кодирования очередного обрабатываемого блока В1т п руководствуемся критерием минимума функции Лагранжа для блока: J(b)-D(b)+?iR(b). Положим, что аргумент Ъ=0 соответствует кодированию перемещенного (неподвижного) блока, а ¿=1 - нового. Тогда если J(l)>/(0), то блок кодируется как перемещенный, и как новый - в противном случае.

При использовании RD-оптимизации задача поиска перемещенных блоков формулируется следующим образом . Для заданного (т, я)-блока В1т п ¿-ого кадра найти в предыдущем восстановленном кадре такой (у,х)-блок л., чтобы минимальное значение принимала RD-функция Лагранжа

Щу-т,х-п)= mintein-B^ +AK(w-m,v-n)l (0.10) tt,v)e£2 и " "

В -В т,п у,х

Здесь учтено, что координаты найденного блока будут кодироваться как относительные, т.е. вектором перемещений г={у-т,х-п).) Гарантированно найти минимум (0.10) возможно лишь при полном переборе элементов (и,у)е£1, а для того, чтобы алгоритм поиска можно было реализовать в реальном масштабе времени, в качестве области О необходимо рассматривать лишь точки (у, и), достаточно близко расположенные к точке (т,п). Повышение эффективности поиска за счет расширения области С2 достигается применением различных алгоритмов направленного поиска , ориентированных на минимизацию ошибки представления перемещенного блока ||в"га>п, что соответствует частному случаю (0.11) при Я=0. Алгоритмы направленного поиска находят минимум (0.11) приближенно, однако за счет существенного расширения области поиска обычно позволяют найти большее количество перемещенных блоков, при аналогичной полному перебору сложности.

В шестой главе предложен новый алгоритм направленного поиска перемещенного блока , ориентированный на приближенное решение задачи (0.10) уже для произвольного значения X. Отличительной особенностью предложенного алгоритма является также то, что малые перемещения блоков изображения ищутся более точно , т.к. должны строго отслеживаться в силу специфики визуального восприятия. Для повышения эффективности полученного в главе 6 алгоритма поиска для вектора перемещения (А,АХ) обрабатываемого блока следует строить прогноз по векторам перемещения (д^Л^) и (д*Д) двух уже обработанных «соседей» (соответственно соседа по вертикали и соседа по горизонтали). Собственно прогноз - это относительные координаты (у0,*0), которые определяют перенос центра области поиска: из точки (т,п) в точку (ш,п)={т + у0,п + х°). Экспериментально подтверждено, что число новых блоков изображения сокращается на 5.25%, если принять следующее правило составления прогноза :

0,0), оба соседних блока - новые

Д^Д^), по горизонтали- новый, по вертикали- перемещенный (Ану,Акх), по горизонтали - перемещенный, по вертикали - новый ((д; ,ДУХ)+(ДА, ДАХ),)/2, оба соседа - перемещенные блоки

Следуя идеологии стандарта MPEG, в разработанной схеме компрессии обработка новых блоков также осуществляется при помощи квантования с последующим статистическим кодированием коэффициентов двумерного ДКП. Результат ДКП блока Вот>и обозначим S, S=F(BW>„). Также обозначим: Se=fe;/=round(5M/^i;)}^=0, Q = кД/=0 - одна из матриц квантования JPEG. Для статистического кодирования матрицы S применен алгоритм контекстного кодирования, предложенный в главе 4, в который введен дополнительный этап RD-оптимизации. Пусть ZQ =(z0,.,z63)

Вектор, полученный в результате зигзагообразного считывания данных из матрицы SQ по правилу, определяемому стандартом JPEG (S0 <->ZQ). RDоптимизация статистического кодирования возможна за счет удлинения нулевых серий компонент в векторе ZQ путем их дополнительного обнуления . Для того, чтобы в результате не произошло заметного усложнения алгоритма кодирования, в оптимизированном варианте алгоритма контекстного кодирования ДКП-коэффициентов анализируется лишь возможность увеличения финальной нулевой серии, что дает наибольший вклад в дополнительную минимизацию функции J(Zq)=D(Zq)+ÀR(Zq). При этом считается, что матрица Q, определяющая квантование коэффициентов ДКП, задана. Универсальный алгоритм кодирования должен оперировать некоторым набором матриц квантования {Q/}, с возможностью выбора необходимой матрицы для конкретных требований к качеству и уровню сжатия. Если набор матриц достаточно большой, то подбор матрицы квантования Q по принципу минимума функции J(Zq) превращается в громоздкую процедуру, нереализуемую в реальном масштабе времени стандартными средствами. Кроме того, при большом диапазоне возможных значений индекса j его кодирование для каждого нового блока по отдельности влечет недопустимо высокие дополнительные битовые затраты. Поэтому в качестве исходного набора были выбраны лишь несколько матриц из множества, рекомендуемого JPEG, которые соответствуют наилучшему, наихудшему и некоторым промежуточным уровням качества. В экспериментах использовалось число матриц |{Q/}|=4. Для ускорения выполнения операций деления, которые необходимы при квантовании, элементы матриц {Q,} были округлены до ближайшего значения 2к, k=G,\,. Такой подход позволяет заменить операции целочисленного деления и умножения сдвигами разрядов двоичного представления чисел, которые обычно выполняются реальной аппаратурой намного быстрее.

Помимо использования алгоритма контекстного кодирования коэффициентов ДКП (из главы 4), в шестой главе предложен альтернативный алгоритм статистического кодирования, в котором проквантованные спектры ДКП разбиваются на фиксированные области, формирующие отдельные (независимые) потоки данных для арифметического кодирования, и предложена экспериментальная методика для построения разбиения спектров на такие области. Несмотря на то, что в общей схеме компрессии видео выбор был сделан в пользу первого алгоритма кодирования спектров, применение арифметического кодирования с фиксированным разбиением спектров на области независимого кодирования может оказаться более предпочтительным при использовании других (отличных от ДКП) преобразований, а также в схемах компрессии, использующих векторное квантование спектров. Например, в схеме, которая рассмотрена в главе 4. (Использование векторного квантования в алгоритмах реального масштаба времени затруднительно.)

При исследовании характеристик итогового алгоритма видеокомпрессии для оценки величины ошибки кодирования в восстановленной последовательности В0,В1,.,ВЛ:~1 использовалась отношение пикового значения сигнала к шуму, которое определялось следующим образом:

PSNR = 101g ¿III

ДБ], где Mi и M2 задают размер кадра в пикселях. Для экспериментов были выбраны широко известные тестовые последовательности News, Container ship, Hall monitor, Akiyo, Claire. Результаты численных экспериментов, полученные аспирантом Ф.В.Стрелковым , показали, что во всех тестах предложенная схема компрессии дает высокие результаты, превосходя характеристики кодера MPEG-2, разработанного группой MSSG (mpeg2encode, версия 1.1, см. http://www.mpeg.org/MSSG). Программное сжатие видеопоследовательностей при этом осуществляется в реальном масштабе времени.

Итог исследованиям, проведенным в диссертационной работе, подводится в заключительном разделе - «Основные выводы и заключение».

На защиту диссертации выносятся следующие основные результаты:

Метод оценки декоррелирующей эффективности ортогональных преобразований и основанные на нем алгоритмы кластеризации коррелированных данных;

ДПКП и быстрый алгоритм его вычисления;

Новый быстрый алгоритм ДПКЛ и его модификация - алгоритм с неполным вычислением; алгоритм совмещенных вычислений ДПКЛ для обработки вещественных массивов в базисе (1,ехр(-2то/3));

Метод компрессии изображений, основанный на специальном способе арифметического кодирования спектров ДПКЛ блоков изображения;

Детерминированные и вероятностные оценки коэффициентов ДКП;

Алгоритм контекстного кодирования спектров ДКП изображений;

Общая схема компрессии изображений на основе адаптивного векторного квантования в области ортогональных преобразований;

Алгоритмы вейвлет-компрессии статических изображений;

Алгоритм поиска перемещенных блоков изображения;

Экспериментальная методика построения разбиения спектров на области независимого кодирования;

Алгоритм видеокомпрессии.

Основные результаты, изложенные в диссертации, опубликованы в 30 работах . Все приводимые в диссертации теоретические результаты из 11 написанных в соавторстве работ получены лично автором. В тех случаях, когда приводимые экспериментальные численные данные (таблицы, графики) из совместных работ были получены соавторами , на это явно указано по ходу изложения при цитировании результатов.

Предложенный в шестой главе алгоритм видеокомпрессии был реализован программно в рамках работ, проводившихся в ГУ НПК «Технологический Центр» Московского государственного института электронной техники и в НПП «Технология» . Внедрение разработанных библиотек видеокомпрессии осуществлено в ряде программных систем, производящих обработку видеоизображений (в том числе, кодирование) в реальном масштабе времени, среди которых наибольший практический интерес представляет система видео контроля и регистрации Visual Security (см. http://www.tcen.ru/vs). Копии документов об использовании и внедрении результатов диссертационной работы имеются в приложении 6.

Заключение диссертации по теме "Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей", Умняшкин, Сергей Владимирович

ВЫВОДЫ И ЗАКЛЮЧЕНИЕ

В представленной диссертационной работе исследованы различные аспекты применения дискретных ортогональных преобразований для цифровой компрессии изображений, как со стороны сугубо формального теоретического анализа, так и со стороны тех требований и ограничений, которые практика налагает на конкретные вычислительные схемы и алгоритмы. В целом содержание работы носит прикладную направленность, поэтому большинство теоретических результатов подкреплено вычислительными экспериментами, результаты которых, в свою очередь, не только служили иллюстрацией или проверкой теории, но часто давали толчок и представляли собой исходный материал для дальнейших изысканий.

По результатам проведенных в диссертационной работе исследований можно сделать следующие выводы.

1. Ортогональные преобразования являются основным инструментом, используемым для декорреляции данных при компрессии изображений. В случае, когда математическая модель дискретного сигнала задается ковариционной матрицей, для анализа эффективности декоррелирующей обработки целесообразно применение предложенного в работе критерия средней избыточной энтропии.

2. Специально для сжатия коррелированных данных получено и впервые введено в рассмотрение дискретное псевдокосинусное преобразование (ДтСП). В схеме компрессии, предполагающей наличие этапа скалярного квантования коэффициентов преобразования, среди рассмотренных быстрых преобразований, реализация которых сводится только к операциям сложения-вычитания (Уолша, Хаара, псевдокосинусное), ДПКП дает наилучшие результаты декорреляции для дискретного сигнала, описываемого марковской моделью.

3. С использованием полученных быстрых алгоритмов ДПКЛ, учитывающих специфику обработки вещественных массивов, предложенная схема компрессии изображений на основе арифметического кодирования коэффициентов ДПКЛ достигает характеристик, которые по качеству обработки и вычислительной сложности близки к варианту JPEG на основе ДКП.

4. При использовании статистического кодирования коэффициентов ДКП по методу JPEG наличие «скачков» дискретного сигнала наименее желательно в центральной области фрагментов обработки.

5. Высокую эффективность применения в различных схемах и алгоритмах сжатия данных имеет метод многомодельного (многопотокового) арифметического кодирования, а одним из ключевых моментов в разработке схем компрессии является определение правил для выбора текущей модели кодирования по контексту уже обработанных данных. Так, применение в схеме JPEG предложенного в главе 4 алгоритма многомодельного контекстного арифметического кодирования коэффициентов ДКП повышает эффективность сжатия данных на 10%.

6. При сжатии изображений с использованием многомодельного кодирования древовидных структур вейвлет-спектров правило выбора моделей следует строить по комбинированному контексту, который учитывает как окружение самого вейвлет-коэффициента в саббэнде, так и окружение коэффициента-«родителя». Полученный на этой основе новый эффективный алгоритм компрессии цифровых изображений с потерями, который разработан по результатам изучения статистических свойств спектров дискретных вейвлет-преобразований, показывает высокие характеристики сжатия при сложности реализации, приемлемой для широкого круга приложений.

7. Для устранения межкадровой (временной) избыточности видеоданных наиболее предпочтительным для практического применения среди исследованных алгоритмов блочной компенсации перемещений следует признать предложенный гибридный алгоритм направленного поиска, при котором малые перемещения ищутся точно и тщательно, а значительные перемещения - более грубо.

8. При использовании предложенного алгоритма видеокомпрессии, который был разработан на основе RD-оптимизационного подхода с учетом требований и специфики программной реализации, достигается сжатие и восстановление видео в реальном масштабе времени на базе современных персональных компьютеров, при высоком качестве обработки.

Результаты проведенных исследований отражены в 30 печатных работах, докладывались и обсуждались на многих всероссийских и международных конференциях. В целом, в диссертационной работе получены новые научные результаты, теоретические положения которых позволили в значительной степени развить и формализовать процедуры анализа и синтеза схем компрессии цифровых изображений, основанных на использовании дискретных ортогональных преобразований.

Выработанные подходы и рекомендации привели к построению конкретных схем и алгоритмов компрессии, многие из которых были реализованы программно и экспериментально подтвердили эффективность своего применения. Результаты исследований по видеокомпрессии, которые проводились в рамках возглавлявшихся автором НИР и финансировались Министерством науки и промышленности РФ, внедрены в виде алгоритмов в программно-аппаратной системе Visual Security (см. приложение №6).

Список литературы диссертационного исследования доктор физико-математических наук Умняшкин, Сергей Владимирович, 2001 год

1. Абстрактные алгебраические системы и цифровая обработка сигналов / Вариченко Л.В., Лабунец В.Г., Раков М.А. Киев: Наукова думка, 1986. -248 с.

2. Алексеев А.Г. Кластеризация коррелированного набора данных // «Микроэлектроника и информатика 99». VI всерос. межвуз. н.-т. конф. ст. и асп.: Тез. док. - М.: МИЭТ, 1999. - С.133.

3. Ахмед Н., Pao К. Ортогональные преобразования при обработке цифровых сигналов: Пер. с англ. М.: Связь, 1980. - 248 с.

4. Ватолин Д. С. Гибридная схема фрактальной компрессии и квантования векторов для малых блоков // Труды международной конференции Graphicon-98. Москва, 1998, стр. 205-212.

5. Виленкин Н.Я. Об одном классе полных ортогональных систем // Изв. АН СССР. Сер. мат. 1947. - Т.П. - С. 363-400.

6. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. -С.-Пб.: Изд-во воен. ун-та связи, 1999. 204 с.

7. Гашников М. В., Глумов Н. К, Сергеев В. В. Информационная технология компрессии изображений в системах оперативного дистанционного зондирования // Изв Самарского центра РАН. 1999. - № 1. - С. 99-107.

8. Голд Б., Рейдер Ч. Цифровая обработка сигналов: Пер. с англ. М.: Сов. радио, 1973. - 368 с.

9. Голубое Б.И., Ефимов A.B., Скворцов В. А. Ряды и преобразования Уолша: Теория и применения. М.: Наука, 1987. - 344 с.

10. Горлов С.К., Корыстин A.B., Родин В.А. Об одной реализации метода сжатия отображений с помощью нелинейной аппроксимации сумм Фурье-Хаара// Теор. функций и прибл.: Тр. 7-й Саратов, зим. шк. (1994 г.). Ч. 2.-Саратов: Изд.-во СГУ, 1995.

11. Дмитриев В.И. Прикладная теория информации: Учеб. для студ. вузов. -М.: Высш. шк., 1989. 320 с.

12. Ефимов A.B., Поспелов A.C., Умняшкин C.B. Некоторые свойства мультипликативных ортонормированных систем, используемые в цифровой обработке сигналов // Труды математического института им. В.А.Стеклова РАН. Т.219. - 1997. - С 137-182.

13. Ефимов A.B., Умняшкин C.B. Быстрые алгоритмы вычисления дискретного преобразования Крестенсона-Леви и оценки его спектральных. характеристик// Теор. функций и прибл.: Тр. 7-й Саратов, зим. шк. (1994 г.). Ч. 2.- Саратов: Изд.-во СГУ, 1995. С. 9-20.

14. Жуков В.Г. Исследование методов сравнения перемещенных блоков изображений в алгоритмах сжатия видеопоследовательностей. //Микроэлектроника и информатика-99. Всерос. межвуз. н.-т. конф. студентов и аспирантов: Тезисы докладов. М.:МЙЭТ,1999. - С. 137.

15. Жуков ДМ. Эквивалентность одномерного и двумерного преобразования Крестенсона-Леви // Методы цифровой обработки изображений: Сб. науч. тр. МИЭТ. М.: МИЭТ, 1982 - С. 65-70.

16. Задирака В.К., Евтушенко В.Н. Оптимальный способ зонного кодирования с использованием Слэнт-преобразования // Кибернетика и системный анализ. 1994. - №4. - с. 56-60.

17. Исследование и разработка алгоритмов программного сжатия данных с потерями для цифровой обработки видеоизображений: Отчет о НИР (закл.) / HI 111 «Технология»; рук. -Умняшкин C.B. «Дозор»; № гос. per. 01200004624; Инв. №100704. - Москва, 2000. - 48 с.

18. Кендэл М. Ранговые корреляции. М.: Статистика, 1975. - 216 с.

19. Коваленко КН., Филиппова А.А. Теория вероятностей и математическая статистика. М.: Высш. школа, 1982. - 256 с.

20. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров: Пер. с англ. М.: Наука, 1970. - 720 с.

21. Кочетков М.Е. Компрессия цифровых изображений с использованием векторного квантования в области дискретных ортогональных преобразований: Дисс. канд. техн. наук. М., 1999. -191 с.

22. Кочетков М.Е., Умняшкин C.B. Многопотоковая реализация алгоритма арифметического кодирования / М.: МГИЭТ (ТУ), 1998. 21 с. Депонировано в ВИНИТИ 25.12.98 № 3884-В98.

23. Кочетков М.Е., Умняшкин C.B. О сравнении критериев для оценки эффективности декоррелирующих преобразований / М.: МГИЭТ (ТУ), 1998. 34 с. - Деп. в ВИНИТИ 13.04.98, № 1069-В98.

24. Лесин В.В., Лисовец Ю.П. Основы методов оптимизации: Учеб. пособие. - М.: Изд-во МАИ, 1998. 344 с.

25. Лисовец Ю.П., Поспелов А. С. Мультипликативные голографические преобразования для обработки изображений // Методы цифровой обработки изображений: Сб. науч. тр. М.: МИЭТ, 1982 - С. 100-109.

26. Литош И.П. Объединение алгоритмов фрактальной и вейвлет-компрессии цифровых изображений// «Микроэлектроника и информатика -2001». У1П всерос. межвуз. н.-т. конф. ст. и асп.: Тез. док. -М.:МИЭТ, 2001. -С.147.

27. Марков А.А. Сжатие цифровых изображений с использованием \vavelet-преобразований // «Микроэлектроника и информатика 2000». VII всерос. межвуз. н.-т. конф. ст. и асп.: Тез. док. -М.:МИЭТ, 2000. -С. 114.

28. Мудрое А.Е. Численные методы для ПЭВМ на языках Бейсик, Фортран и Паскаль. - Томск: МП «РАСКО», 1991. -272с.

29. Новиков И.Я., Стечкин С.Б., Основные конструкции всплесков // Фундаментальная и прикладная математика. 1997. - Том 3. - №4. -С.999-1028.

30. Нуссбаумер Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток: Пер. с англ. М.: Радио и связь, 1985. - 248 с.

31. Пеев Е., Боянов К, Белчева О. Методи и средства за компрессия на изображения // Автоматика и информатика.-1994.-28, №3.-стр.3-14.

32. Петухов А.П. Введение в теорию базисов всплесков. СПб.: Изд-во СПбГТУ, 1999. 132 с.

33. Поспелов А. С. Методы обработки цифровой видеоинформации с использованием преобразований голографического типа// Сб. тр. междунар. совещ. по програмир. и мат. методам решения физ. задач (Дубна, 14-19 июня 1993). Сообщение ОИЯИР11-94-100. - С, 71-73.

34. Поспелов А. С. Некоторые математические задачи и алгоритмы цифровой обработки информации с использованием дискретных преобразований: Дисс. на соиск. уч. степ, д-ра физ.-мат. наук. М., 1992. -398 с.

35. Применения цифровой обработки сигналов: Пер. с англ. / Под ред. Э.Оппенгейма. М: Мир, 1980. - 552 с.

36. Прэтт У. Цифровая обработка изображений: Пер. с англ. М.: Мир, 1982. -Кн.1 и 2.-312 и 480 с.

37. Прэтт У, Кэш Д., Эндрюс X. Кодирование изображений посредством преобразования Адамара // ТИИЭР. 1969. - Т.57. - №1. - С. 66-77.

38. Птачек М. Цифровое телевидение. Теория и техника / Пер. с чешек, под ред. Л.С.Виленчика. М.: Радио и связь, 1990. -528 с.

39. Розанов Ю.А. Случайные процессы. М.: Наука, 1971. - 288 с.

40. Свешников A.A. Прикладные методы теории случайных функций. М. : Наука, 1968.-463 с.

41. Трахтман В.А. Спектральный анализ в базисе функций Виленкина-Крестенсона//Радиотехника и электроника. -1975. -Т. 20. -№1. -С.130-138.

42. Трахтман A.M., Трахтман В.А. Основы теории дискретных сигналов на конечных интервалах. М.: Сов. Радио, 1975.

43. Умняшкин C.B. Алгоритм кластеризации коррелированных данных // VII Международная конференция. Математика. Экономика. Экология.

44. Образование. Международный симпозиум. Ряды Фурье и их приложения: Тезисы докладов. Ростов: Рост. гос. эконом, акад., 1999. - С. 211-212.

45. Умняшкин C.B. Алгоритм поиска перемещенных блоков для кодирования цифровых видеоизображений // Межотраслевой научно-технический журнал «Оборонный комплекс научно-техническому прогрессу России», №3,2001.-С. 38-41.

46. Умняшкин С. В. Алгоритм фрактального кодирования изображений в области вейвлет-преобразований // Компьютерна математика. Оптажзащя обчислень: Зб1рник наукових праць. Том 1. - Кшв: 1нститут шбсрнетики ím. В.М.Глушкова, 2001. - С. 385-391.

47. Умняшкин C.B. Быстрые алгоритмы вычисления дискретного мультипликативного преобразования / М.: МГИЭТ (ТУ), 1995. 15 с. - Деп. в ВИНИТИ 16.02.95, № 442-В95.

48. Умняшкин C.B. Быстрый алгоритм вычисления дискретного преобразования Крестенсона-Леви для обработки вещественных массивов / М.: МГИЭТ (ТУ), 1995. 19 с. - Деп. в ВИНИТИ 05.12.95, № 3212-В95.

49. Умняшкин С. В. Использование контекстного арифметического кодирования для повышения сжатия данных по схеме JPECj // Известия вузов. Электроника. №3. - 2001. - С. 96-98.

50. Умняшкин C.B. Компенсация перемещения объектов при сжатии видеоданных // «Электроника и информатика XXI век» Третья международная научно-техническая конференция: Тез. док. - М.: МИЭТ, 2000.-С. 365-366.

51. Умняшкин С. В. Вейвлет-компрессия цифровых изображений с прогнозированием статистических моделей //Известия вузов. Электроника. №5. - 2001. - С.86-94.

52. Умняшкин C.B. Метод кодирования дискретных изображений на основе преобразования Крестенсона-Леви // Микроэлектроника и информатика -96: Тез. докл. межвуз. науч.-тех. конф. М.: МГИЭТ (ТУ), 1996. - С.167.

53. Умняшкин C.B. О кластеризации коррелированных данных. // Информационные технологии в инновационных проектах. Международная конференция (г.Ижевск, 20-22 апреля 1999г.): Материалы докладов. -Ижевск, ИжГТУ, 1999. С. 59-65.

54. Умняшкин C.B. О квантовании элементов спектра дискретного преобразования Крестенсона-Леви/ М.: МГИЭТ (ТУ), 1995. 12 с. - Деп. в ВИНИТИ 16.02.95, № 441-В95.

55. Умняшкин C.B. О модификации дискретного косинусного преобразования // Теория приближений и гармонический анализ: Тез. докл. междунар. конф. (Тула, 26-29 мая 1998 г.). Тула: ТулГУ, 1998. - С.264-265.

56. Умняшкин C.B. О модификации дискретного косинусного преобразования // Изв. Тул. гос. ун-та. Сер. Математика. Механика. Информатика. Тула: ТулГУ, 1998. Т. 4. Вып. 1. С. 143-147.

57. Умняшкин C.B. Об оценке декоррелирующих свойств дискретных преобразований // Микроэлектроника и информатика 97: Тезисы докл. межвузовской научно-технической конференции. Часть 2. - М. МГИЭТ (ТУ), 1997.-С. 110:

58. Умняшкин C.B. Особенности использования дискретного преобразования Крестенсона-Леви при обработке вещественных массивов // Микроэлектроника и информатика: Тез. докл. межвуз. науч.-тех. конф. 1214 апр. 1995 г. М.: МГИЭТ (ТУ), 1995. - С. 188-189.

59. Умняшкин C.B. Оценка эффективности использования унитарных преобразований для кодирования дискретных сигналов //Информатика и связь: Сб. научн. тр. под ред. В.А.Бархоткина. М.: МИЭТ.- 1997. С.73-78.

60. Умняшкин C.B. Применение дискретного преобразования Крестенсона-Леви в цифровой обработке изображений. Дис. канд. техн. наук. -Москва, 1997. - 198 с.

61. Умняшкин C.B. Псевдокосинусное преобразование для сжатия дискретных сигналов // Информационные технологии и проблемы микроэлектроники. Сб. науч. тр. -М.: МИЭТ. -1999. С.158-170.

62. Умняшкин С. В. Схема RD-оптимизированной компрессии для обработки видеоданных в реальном масштабе времени// Принято к публикации в журнал «Известия вузов. Электроника». №6. - 2001.

63. Умняшкин C.B. Цифровая компрессия изображений с использованием дискретного преобразования Крестенсона-Леви // Межотраслевой научнотехнический журнал «Оборонный комплекс - научно-техническому прогрессу России», №2,2000. С.28-39.

64. Умняшкин C.B., Космач М.В. Оптимизация кодирования цифровых изображений по методу JPEG //Известия вузов. Электроника. №4-5. -2000. - С. 139-141.

65. Умняшкин C.B., Кочетков М.Е. Анализ эффективности использования дискретных ортогональных преобразований для цифрового кодирования коррелированных данных // Известия вузов. Электроника. №6. - 1998. - С. 79-84.

66. Умняшкин C.B., Стрелков Ф.В., Жуков В.Г. Трехшаговые алгоритмы поиска перемещенных блоков изображения // Информационные технологии и системы управления. Сб. научн. тр. под ред. В.А.Бархоткина.- М: МИЭТ, 2000. С. 47-55.

67. Хармут X. Теория секвентного анализа. Основы и применения: Пер. с англ.- М.: Мир, 1980. 574 с.

68. Цифровая обработка телевизионных и компьютерных изображений / Под ред. Ю.Б.Зубарева и В.ПДворковича. М.: Международный Центр научной и технической информации, 1997. - 212 с.

69. Чен Ш.-К. Принципы проектирования систем визуальной информации. -М.: Мир, 1994. 408 с.

70. Эндрюс Г. Применение вычислительных машин для обработки изображений / Пер. с англ. под ред. Б.Ф.Курьянова. М.: Энергия. - 1977. -161 с.

71. Яворский Б.М., Детлаф А.А. Справочник по физике для инженеров и студентов вузов.-Издание 7-е, исправленное.-М.:Наука, 1977.-944 с.

72. Ярославский JI.II. Введение в цифровую обработку изображений. М.: Сов. радио, 1979.-312 с.

73. Ярославский Л.П. Цифровая обработка сигналов в оптике и голографии. Введение в цифровую оптику. М.: Радио и связь. - 1987. -296 с.

74. Ahmed N., Natarajan Т., Rao K.R. On image processing and a discrete cosine transform // IEEE Trans. Computers. -1974. V. C-23 - №1. - P.90-93.

75. Allen J.B. andRabiner L. R. A unified approach to short-time Fourier analysis, synthesis//Proc. IEEE 1977.-Vol. 65. -№ Ию-Р. 1558-1564.

76. Anderson J.В., Huang T.S. Piecewise Fourier transformation for picture bandwidth compression // IEEE Trans. Commun. -1972.- V. COM-20 №3. -P.488-491.

77. Andrews H. C., Hunt B.R. Digital Image Restoration.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

78. Andrews H. C., Pratt W.K. Fourier transform coding of images // Hawaii International Conference on System Science, January 1968. P. 677-679.

79. Andrews H.C., Pratt W.K. Transform image coding // Proc. Computer processing in communications. New York: Polytechnic Press, 1969. -P. 63-84.

80. Antonini M., BarlaudM., Mathieu P., andDaubechies I., Image coding using wavelet transform// IEEE Trans. Image Proc. Vol. 1. - №2, 1992. -P. 205-220.

81. Barnsley F., Jacquin A. Application of recurrent iterated function systems to images//Proc. SPIE.- 1988.-Vol. 1001.-P. 122-131.

82. Berger T. Rate Distortion Theory. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Displacement estimation by hierarchical block-matching // Proc. SPIE Conf. On Vis. Commun. And Image Proc. Cambrige, 1988. - P. 942-951.

84. Bilgin A., Sementilli.P. and Marcellin M. Progressive image coding using trellis quantization // IEEE Trans. Image Proc. 1999.-V.8.-№11.-P. 1638-1643.

85. Chernov V.M., Dmitriyev A. G. Image Compression Using Discrete Orthogonal Transforms with the «noise-like» Basis Functions // Компьютерная оптика. 1999. - Вып. 19. - С. 184-187.

86. Cheung С.К., Ро L.M. A hybrid adaptive search algorithm for fast block motion estimation // Proc. IEEE International Symp. on Signal Proc. and its App. (Aug.1996). Vol.1. 1996 - P.365-368.

87. Chrestenson H.E. A class of generalized Walsh functions // Pacific. J. Math. -1955.-V.5.-№l.-P. 17-32.

88. Chrysafis C. Wavelet image compression rate distortion optimizations and complexity reductions: PhD (Electrical Engineering) Thesis. University of Southern California, Los Angeles, 2000. - 144 pages.

89. Chrysafis C., Ortega A. Efficient Context-Based Entropy Coding for Lossy Wavelet Image Compression // Proc. Data Compression Conference. -Snowbird (Utah), 1997. P. 241-250.

90. С ho N., Lee S. Fast algorithm and implementation of 2-D discrete cosine transform // IEEE Trans. Circuits and Systems. 1991. -V.38. - P.297-305.

91. ChouP.A., Lookabaugh Т., GrayR.M. Entropy-constrained vector-quantization 11 IEEE Trans. ASSP. 1989. - Vol. 37. -№1. -P.31-42.

92. Coding of moving pictures and audio (MPEG-4). Standard ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., FeauveauJ.-C., Biorthogonal bases of compactly supported wavelets // Comm. Pure Appl. Math. 1992. - V. 45. - №5. - P. 485560.

94. Coifman R., and Wickerhauser M. V., Entropy-based Algorithms for Best Basis Selection // IEEE Trans. Information Theory. 1992. - Vol. 38. - №2 - P. 713718.

95. Cooley J. W., Tukey J.W. An algorithm for machine computation of complex Fourier series // Mach. Comput. 1965. - V. 19. - P. 297-301.

96. Cosman P.C., GrayRM., and VetterliM. Vector Quantization of Image Subbands: A survey // IEEE Trans. Image Proc. 1996. - V. 5. - №5. - P. 202225.

97. Costantini R. et al. A Low-Complexity Video Coder Based on the Discrete Walsh Hadamard Transform //Proc. European Signal Processing Conference 2000 (Tampere, Finland, September 5-8). -2000. -P.1217-1221.

98. Crouse M. and Ramchandran K. Joint thresholding and quantizer selection for transform image-coding: entropy-constrained analysis and applications to baseline JPEG // IEEE Trans, on Image Processing. 1997. - Vol. 6. -№2 - P. 285-297.

99. Davis G.M., A wavelet-based analysis of fractal image compression // IEEE Trans. Image Proc. 1998. - V.7-№2. -P.141-154.

100. Davis G., Nosratinia A. Wavelet-based Image Coding: An Overview // Applied and Computational Control, Signals and Circuits. -1998. -V.l. -№1. -P. 205269.

101. Deever A. and Hemami S. What"s your sign?: Efficient sign coding for embedded wavelet image coding 11 Proc. of Data Compression Conference, 2000.-P. 273-282.

102. Duhamel P., Guillemont C. Polynomial transform computation of 2-D DCT // Proc. ASSP"90. 1990. - P.1515-1518.

103. EfimovA. V. Multiplicative function systems and their applications in discrete information processing // Approximation and function spaces/ Banach center publications (Warsaw). 1989. - V.22. - P. 111-117.

104. Eflmov V.M., Kolesnikov A.N. Image compression with preliminary interpolation of the signal // Pattern Recognition and Image Analysis. 1996. - Vol. 6. - №1.

105. EliottD.F., Rao K.R. Fast transforms: algorithms, analyses, applications. -London: Academic Press inc., 1982. 488 p.

106. Enomoto II, Shibata K. Orthogonal transform coding system for television signals // IEEE Trans. Electromagnetic Compatibility. 1971. - Special issue on Walsh functions. -V. EMC-13. - №3. - P. 11-17.

107. Feig E. A fast scaled DCT algorithm // Proc. SPIE Int. Soc. Opt. Eng. 1990. -Vol. 1244.-P. 2-13.

108. Fischer T.R., and WangM. Entropy-constrained trellis coded quantization// IEEE Trans. Inf. Theory. 1992. - Vol. 38 - №2 - P. 415-426.

109. Fisher Y. Fractal Compression: Theory and Application to Digital Images. -New York: Spinger Verlag, 1994. 341 p.

110. Good J. The interaction algorithm and practical Fourier analysis // J. Royal Stat. Soc. (London). 1958. - V. B-20. - P. 361-372.

111. Gray R.M. Vector Quantization //IEEE ASSP Magazine. -Apr. 1984. -P.4-29

112. Gray R„ Neuhoff D. Quantization //IEEE Trans. Inf. Theory. Oct. 1998. - Vol. 44.-No. 6.-P. 2325-2383.

113. HabibiA., WintzP.A. Image coding by linear transformation and block quantization//IEEE Trans. Comm. Tech. -1971. -V. COM-19. №1. -P.50-63.

114. Hamidi M., Pearl J. Comparison of the cosine and Fourier transforms of Markov-I signals 11 IEEE Trans. ASSP. V.24. - 1976. - P.428-429.

115. Hauque M.A. A two-dimensional fast cosine transform // IEEE Trans. ASSP. -1985. V. 33. - №6. - P.1532-1538.

116. Huang J. Y., Schultheiss. Block quantization of correlated Gaussian random variables// IEEE Trans. Commumications. -1963. -V. CS-11 (Sept.) -P. 289296.

117. Information technology Generic coding of moving pictures and associated audio information: Video. //Recommendation ITU-T H.262. - Standard ISO/IEC 13818-2-2000.

118. ISO/IEC JTC1 Committee Draft 10918-1. Digital compression and coding of continuous-tone still images. Part 1. Requirements and guidelines. -1991.

119. ISO/IEC JTC1 Committee Draft 10918-2. Digital compression and coding of continuous-tone still images. Part 2. Compliance Testing. 1991.

120. Jacquin A. Fractal image coding based on a theory of iterated contractive image transformations // Proc. SPIE Visual Comm. And Image Proc. 1990. - P.227-239.

121. Jacquin A. Image coding based on a fractal theory of iterated contractive image transformations // IEEE Trans. Image Proc. 1992. - Vol.1. - №1. -P. 18-30.

122. Jafarkhani H., Farvardin N., and Lee C.-C., Adaptive image coding based on the discrete wavelet transform 11 Proc. IEEE Int. Conf. Image Proc. Vol. 3 -Austin (TX), 1994. - P. 343-347.

123. Jain J.R. and Jain A.K. Displacement measurement and its application in interframe image coding // IEEE Trans. Comm. 1981. - Vol. 29. - №12. -P.1799-1806.

124. JoshiR.L., Fischer T.R., and Bamberger R.H. Optimum classification in subband coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 2 - Austin (TX), 1994.-P. 883-887.

125. Joshi R.L. et al., Comparison of different methods of classification in subband coding of images// IEEE Trans. Image Processing. 1997. - Vol. 6. - Nov. - P. 1473-1486,1997.

126. JPEG2000. Part 1. Final Committee Draft Version 1.0. ISO/IEC JTC1/SC29 WG1.-205 pages.

127. Kasner J.H., Marcellin M. W. Adaptive wavelet coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 3 - Austin (TX), 1994. - P. 358-362.

128. Koga T. et al, Motion compensated interframe coding for video conferencing // Proceedings of the National Telecommunications Conference, New Orleans, Louisiana, Nov. 29 Dec. 3. - 1981. - Vol. 4. - P. G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C., and Smith M. J. T. Rate-Distortion-Constrained Subband Video Coding. // IEEE Transactions on Image Processing. -1999. -Vol. 8.-№2.-P. 145-154.

130. Kurosaki M., WakiH. A JPEG-compliant colorimage compression/decompression LSI // Mitshubisi Elec. Adv. -1994. -V.68, Sept. -P.17-18.

131. Levy P. Sur une generalization des fonctions orthogonales de M.Rademacher II Comment, math. helv. 1944. - V.16. - P. 146-152.

132. Lewis A.S., Knowles G. Image Compression Using the 2-D Wavelet Transform . II IEEE Trans. Image Proc. 1992. - Vol. 1. - №2. - P.244-250.

133. Linde Y., Buzo A., Gray R.M. An algorithm for vector quantizer design // IEEE Trans. On Comm. - 1980. - V.28. №1. - P.8^95.

134. LoPresto S.M., Ramchandran K., OrchardM.T. Image Coding based on Mixture Modeling of Wavelet Coefficients and Fast Estimation-Quantization Framework // Proc. Data Compression Conference. Snowbird (Utah), 1997. - P. 221-230.

135. MallatS., Multiresolution approximation and wavelet orthonormal bases of L2(R) // Trans. AMS. 1989. - V.315. -P.69-87.

136. Marcellin M. et ail. An Overview of JPEG-2000 // Proc. Data Compression Conference, J. A. Storer andM. Cohn, eds. Snowbird, Utah, Mar. 28-Mar. 30, 2000. Snowbird, 2000. - P. 523-541.

137. MarchallX. Motion estimation and compensation for very low bitrate video coding: Docteur of Sciences Appliquées. Université Catholique de Louvalin. -Louvalin-la-Neuve, 1998. - 228 pages.

138. Nasrabadi N.M., King R.A. Image coding using vector quantization: A review // IEEE Trans, on Communication. 1988. - V. 36. -No.8. - P. 957-971.

139. Nelson M., Gailly J A. The Data Compression Book (Second Edition). New York: M&T Books, 1995. - 541 p.

140. Pearl J. On coding and filtering stationary signals by discrete Fourier transforms // IEEE Trans. Inf. Theory. 1973. - Vol. IT-19. - P. 229-232.

141. Pratt W.K, Andrews H.C. Application of Fourier-Hadamard transformation to bandwidth compression // Picture bandwidth compression / Ed.: Huang T.S., Tretiak O.J. New York: Gordong and Breach, 1972. - P. 515-554.

142. Pratt W.K, Chen W.H., Welch L.R. Slant transform image coding // IEEE Trans. Commun. -1974. -V. COM-22. P.1075-1093.

143. Queluz M.P., Motion estimation for video coding: a review // HF Magazine -December 1995. Special Issue on Video Coding. - No. 4. - pp. 5-28.

144. Ramachandran K, Vetteri M. Best wavelet packet bases in a rate-distortion sense // IEEE Trans. Image Proc. 1993. -V.2. -№2. - P. 160-175.

145. Rao K.R., Narasimhan M.A., Reviduri K. Image data processing by Hadamard-Haar transform// IEEE Trans. Computers. 1975. - V. C-23. - №9. - P. 888-896.

146. Rao K.R., Yip P. Discrete cosine transform algorithms, advantages, applications. - London: Academic Press inc., 1990.

147. Roska T., Boros T., Radvânyi A., Thiran P. and ChuaL.O. Detecting Moving and Standing Objects Using Cellular Neural. Networks // International Journal of Circuit Theory and Applications. Vol. 20. - 1992. - P.613-628.

148. Said A. and Pearlman W.A. A new fast and efficient image codec based on set partitioning in hierarchical trees // IEEE Trans, on Circuits and Systems for Video Technology. 1996. - Vol. 6. - №3, June. - P. 243-250.

149. Shapiro J.M. Embedded image coding using zerotrees of wavelet coefficients 11 IEEE Trans. Signal Processing, vol. 41, pp. 3445-3462, Dec 1993.

150. Stefanoiu D. Introduction to signal processing with wavelets // Studies on Information and Control. -1994. V.3. - №1. - P. 97-110.

151. Storer J. A. Data compression: Methods and theory. Rockville (Md): Computer science press, 1988. - X, 413 p.

152. Umnyashkin S. V. Image compression based on mixed predictive modeling of wavelet trees // Reports from Vaxjo University (Sweden) Mathematics, natural sciences and technology. - Nr. 11 (September), 2001. - 18 pages

153. Umnyashkin S. V., Strelkov F. V. An RD-optimized scheme for real-time video compression // Reports from Vaxjo University (Sweden) Mathematics, natural sciences and technology. - Nr. 12 (September), 2001. - 15 pages.

154. Van de Walle A., Merging fractal image compression and wavelet transform methods 11 Fractals. 1997. - vol. 5 (Supplementary Issue), April. - P.3-15.

155. Vetterly M., Herley C., Wavelets and Filter Banks: Theory and Design // IEEE Trans. Signal Proc. 1992. - V.40. - №9. - P.2207-2232.

156. Video codec for audiovisual services at p x 64 kbit/s. //Recommendation ITU-T H.261. -1993.

157. Video coding for low bit rate communication //Recommendation ITU-T H.263. Standard ISO/IEC 13818-2: 1998.

158. Wallace G.K. The JPEG algorithm for image compression standard // Communications of the ACM. 1991. -V.34. -№4. - P. 30-44.356

159. WeiD., PaiH.-T., andBovikA. C., Antisymmetric Biorthogonal Coiflets for Image Coding // Proceedings of IEEE International Conference on Image Processing. Chicago, 1998. - Vol. 2. - P. 282-286.

160. Witten I., Neal R.M., Cleary J. G. Arithmetic coding for data compression // Comm. ACM. 1987. - Vol.30. - №6. - P. 520-540.

161. Woods J. W., Huang T.S. Picture bandwidth compression by linear transformation and block quantization // Picture bandwidth compression / Ed.: Huang T.S., Tretiak O.J. -New York: Gordong and Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. and OrchardM.T. Space-frequency Quantization for Wavelet Image Coding // IEEE Trans. Image Proc. V.6 - May 1997, P. 677693.

163. Xiong Z., Ramchandran K., and Orchard M. Wavelet packets image coding using space-frequency quantization // IEEE Trans. Image Proc. 1998. - Vol. 7 .-№6. - P. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. A comparative Study of DCT- and Wavelet-Based Image Coding // IEEE Trans. On Circuits and Systems for Video Technology. -1999. V.9 - №5. - P.692-695.

165. Zhang Z. and Wei V.K., An on-line universal lossy data compression algorithm via continious codebook refinement. Part I. Basic results // IEEE Trans. Inform. Theory. Vol.42. - May 1996. - P.803-821.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Преобразования, которые используются для сжатия изображений должны быть быстрыми, и, по возможности, легко реализуемыми на компьютере. Это прежде всего предполагает, что такие преобразования должны быть линейными. То есть, преобразованные величины С{ являются линейными комбинациями (суммами с некоторыми множителями или весами) исходных величин (пикселов) dj, причем соответствующим множителем или весом служит некоторое число Wij (коэффициент преобразования). Значит, С{ - ]Г\- djWij, где г, j = 1,2,..., п. Например, при п = 4 это преобразование можно записать в матричной форме которая в общем случае примет следующий вид: С = W D. Каждый вектор-столбец матрицы W называется «базисным вектором».

Важной задачей является определение коэффициентов преобразования wij. Основное требование заключается в том, чтобы после преобразования величина с\ была бы большой, а все остальные величины С2,сз,... стали бы малыми. Основное соотношение С{ = Ylj djWij предполагает, что С{ будет большим, если веса Wij будут усиливать соответствующие величины dj. Это произойдет, например, если компоненты векторов wij и dj имеют близкие значения и одинаковые знаки. Наоборот, С{ будет малым, если веса избудут малыми, и половина из них будет иметь знак, противоположный знаку соответствующего числа dj. Поэтому, если получаются большие с*, то векторы W{j имеют сходство с исходным вектором dj, а малые С{ означают, что компоненты wij сильно отличаются от dj. Следовательно, базисные векторы wij можно интерпретировать как инструмент для извлечения некоторых характерных признаков исходного вектора.

На практике веса Wij не должны зависеть от исходных данных. В противном случае, их придется добавлять в сжатый файл для использования декодером. Это соображение, а также тот факт, что исходные данные являются пикселами, то есть, неотрицательными величинами, определяет способ выбора базисных векторов. Первый вектор, тот, который, порождает с\, должен состоять из близких, возможно, совпадающих чисел. Он будет усиливать неотрицательные величины пикселов. А все остальные векторы базиса должны наполовину состоять из положительных чисел, а на другую половину - из отрицательных. После умножения на положительные величины и их сложения, результат будет малым числом. (Это особенно верно, когда исходные данные близки, а мы знаем, что соседние пикселы имеют, обычно, близкие величины.) Напомним, что базисные векторы представляют собой некоторый инструмент для извлечения особенностей из исходных данных. Поэтому хорошим выбором будут базисные векторы, которые сильно различаются друг от друга и, поэтому, могут извлекать разные особенности. Это приводит к мысли, что базисные векторы должны быть взаимно ортогональными. Если матрица преобразования W состоит из ортогональных векторов, то преобразование называется ортогональным. Другое наблюдение, позволяющее правильно выбирать базисные векторы, состоит в том, что эти векторы должны иметь все большие частоты изменения знака, чтобы извлекать, так сказать, высокочастотные характеристики сжимаемых данных при вычислении преобразованных величин.

Первый базисный вектор (верхняя строка W) состоит из одних единиц, поэтому его частота равна нулю. Все остальные векторы имеют две +1 и две -1, поэтому они дадут маленькие преобразованные величины, а их частоты (измеренные количеством смен знаков в строке) возрастают. Эта матрица подобна матрице преобразования Адамара-Уолша (см. уравнение (3.11)). Для примера, преобразуем начальный вектор (4,6,5,2)

Результат вполне ободряющий, поскольку число с\ стало большим (по сравнению с исходными данными), а два других числа стали малыми. Вычислим энергии исходных и преобразованных данных. Начальная энергия равна 4 2 + б 2 + 5 2 + 2 2 = 81, а после преобразования энергия стала 17 2 + З 2 + (-5) 2 + I 2 - 324, что в четыре раза больше. Энергию можно сохранить, если умножить матрицу преобразования W на коэффициент 1/2. Новое произведение W-(4,6,5,2) т будет равно (17/2,3/2, -5/2,1/2). Итак, энергия сохраняется и концентрируется в первой компоненте, и она теперь составляет 8.5 2 /81 = 89% от общей энергии исходных данных, в которых на долю первой компоненты приходилось всего 20%.

Другое преимущество матрицы W состоит в том, что она же делает обратное преобразование. Исходные данные (4,6,5,2) восстанавливаются с помощью произведения W-(17/2,3/2, -5/2,1/2) т.

Теперь мы в состоянии оценить достоинства этого преобразования. Квантуем преобразованный вектор (8.5,1.5,-2.5,0.5) с помощью его округления до целого и получаем (9,1,-3,0). Делаем обратное преобразование и получаем вектор (3.5,6.5,5.5,2.5). В аналогичном эксперименте мы просто удалим два наименьших числа и получим (8. 5,0, -2.5,0), а потом сделаем обратное преобразование этого грубо квантованного вектора. Это приводит к восстановленным данным (3,5.5,5.5,3), которые также весьма близки к исходным. Итак, наш вывод: даже это простое и интуитивное преобразование является хорошим инструментом для «выжимания» избыточности из исходных данных. Более изощренные преобразования дают результаты, которые позволяют восстанавливать данные с высокой степенью схожести даже при весьма грубом квантовании.

Контрольная

Коммуникация, связь, радиоэлектроника и цифровые приборы

Алгоритмы трансформирования исходных изображений на основе ортогональных преобразований С какой целью могут использоваться алгоритмы трансформирования исходных изображений на основе ортогональных преобразований Что общего и в чём различия между дискретным преобразованием Фурье и другими видами ортогональных преобразований. Один из видов ортогональных преобразований дискретное преобразование Фурье. В процессе ортогональных преобразований изображения имеющего сильные корреляционные связи между соседними элементами происходит...

2.4. Алгоритмы трансформирования исходных изображений на основе ортогональных преобразований (С какой целью могут использоваться алгоритмы трансформирования исходных изображений на основе ортогональных преобразований? Что общего и в чём различия между дискретным преобразованием Фурье и другими видами ортогональных преобразований?).

В некоторых случаях, для сокращения объёма данных или облегчения процедуры выделения признаков объектов на последующих этапах распознавания, целесообразно предварительно преобразовывать исходный двумерный массив [ Е i , j ] в массив значений коэффициентов [ F u , v ], имеющий такой же формат MxN, как и исходное изображение.

Вторичный массив или иначе матрица коэффициентов называется трансформантой. Один из видов ортогональных преобразований дискретное преобразование Фурье. В случае преобразования Фурье трансформанта является ничем иным, как двумерным пространственным спектром изображения.

В общем случае любое преобразование исходного изображения на основе ортогональных операторов можно рассматривать как операцию разложения изображения в обобщенный двумерный спектр, а коэффициенты (т.е. элементы трансформанты) как амплитуды соответствующих спектральных составляющих. Отметим, что если при этом в качестве базисных функций используются негармонические функции, то понятие пространственной частоты следует обобщить и использовать понятие секвенты.

Секвентой называется величина, равная половине среднего числа пересечений нуля в единицу времени или на единицу длины.

В процессе ортогональных преобразований изображения, имеющего сильные корреляционные связи между соседними элементами, происходит декорреляция (отбеливание). Таким образом, значения элементов трансформанты оказываются практически некоррелированными. В отличие от исходного массива, для которого характерно в среднем равномерное распределение энергии сигнала между элементами, распределение энергии сигнала в трансформанте крайне неравномерно. Основная доля энергии приходится на элементы с малыми порядковыми номерами (т.е. на низкие пространственные секвенты) и лишь небольшая доля на прочие (см. рис 2. 3).

Рис. 2. 3. Распределение энергии сигнала между отдельными элементами
в исходном массиве (а) и в трансформанте (б).

Это обстоятельство позволяет либо вообще отбросить (т.е. считать равными нулю) большую часть элементов трансформанты (что означает, по существу, низкочастотную пространственную фильтрацию), либо квантовать их на малое число уровней с использованием минимального числа разрядов двоичного кода.

Рассмотрим некоторые наиболее распространённые виды ортогональных преобразований, применяемых при цифровой обработке изображений.

Здесь коэффициенты F u в общем случае являются комплексными числами

Дискретное преобразование Фурье

Каждый комплексный коэффициент можно заменить двумя действительными составляющими. Эти составляющие характеризуют, соответственно, пространственные дискретные спектры амплитуд и фаз и определяются следующим образом:

Основной недостаток дискретного преобразования Фурье сравнительно большой объём вычислений, а также необходимость сохранения большого числа составляющих трансформанты по сравнению с другими ортогональными преобразованиями при одинаковых ошибках восстановления изображения (т.е. при одинаковых потерях информации). Кроме того, для хранения отдельных составляющих комплексных коэффициентов, требуется больший объём памяти, чем для действительных значений элементов исходного массива. Говоря о дискретном преобразовании Фурье, следует упомянуть о возможности применения специально разработанных алгоритмов быстрого преобразования Фурье , а также о специализированных вычислительных устройствах для их реализации так называемых систолических процессорах .

Преобразование Уолша (при M = N )

В свою очередь, коэффициенты b k (Z ) определяются следующим образом: b k (Z ) равен значению k -того разряда двоичного кода числа Z , состоящего из l двоичных разрядов. Если, например, Z = 10, т.е. 10 10 =1010 2 , то
b 0 = 0; b 1 = 1; b 2 = 0; b 3 = 1.

b k определяются в соответствии с правилом их определения в преобразовании Уолша.

Преобразование Адамара (при M = N )

Очевидно, что все виды ортогональных преобразований являются обратимыми, т.е., используя процедуру обратного преобразования, можно из трансформанты восстановить исходное изображение.

Пусть [Е i , j ] массив исходного изображения форматом NxN , где j номер строки, i номер столбца элементов (номер элементов в строке); [ F u , v ] трансформанта изображения, которая имеет тот же формат NxN , где u и v соответственно номер строки и номер столбца элементов трансформанты. Тогда, в общем случае, независимо от вида ортогонального преобразования, запишем

где a (i , j , u , v ) и b (i , j , u , v ) базисные функции прямого и обратного преобразований соответственно.

С практической точки зрения важно отметить, что все рассмотренные выше виды ортогональных преобразований являются разделимыми по переменным. Таким образом, вычисление прямых и обратных двумерных ортогональных преобразований удаётся свести к последовательному выполнению одномерных преобразований

Здесь а стр (i , u ), b (i , u ) и a (j , v ), b (j , v ) базисные функции прямого и обратного преобразований, соответственно вдоль направления строк и столбцов.

Для удобства записи и вычислений целесообразно использовать матричный аппарат

Здесь [А э ] и [ А стр ] матрицы прямого преобразования; [ В э ] и [ В стр ] матрицы обратного преобразования; [А стр ] т и [В стр ] т матрицы, полученные в результате транспонирования матриц [ А стр ] и [ В стр ].

Разумеется, независимо от формы математического представления, прямое и обратное ортогональные преобразования двумерных массивов требуют, в общем случае, значительных вычислительных затрат. Это следует учитывать при проектировании

АТСН, работающих в реальном масштабе времени. Однако, при цифровой обработке бинарных изображений, процедуры ортогональных преобразований существенно упрощаются, особенно в случае использования бинарных базисных функций (преобразования Уолша, Адамара и др.).

А также другие работы, которые могут Вас заинтересовать
72688.		РАЗРАБОТКА ЭКСПЕРТНОЙ СИСТЕМЫ С ПРИМЕНЕНИЕМ РЕЛЯЦИОННОГО ПОДХОДА СУБД ACCESS И С ИСПОЛЬЗОВАНИЕМ СРЕДСТВ VISUAL PROLOG	2.09 MB
	Систему, которую намерены построить мы, относится к классу идентификационных (или диагностических) систем. Системы этого класса решают задачу определения, т.е. идентификации, объекта по его признакам.
72690.		ЛАБОРАТОРНАЯ ДИАГНОСТИКА НАРУШЕНИЙ ГЕМОСТАЗА	10.55 MB
	Оценка состояния свертывающей системы крови одна из самых сложных диагностических задач. В настоящем пособии этот вопрос рассматривается с различных точек зрения: общих биологических закономерностей функционирования многокомпонентных систем организма патофизиологических механизмов...
72692.		Перевірка рівня сформованості основних навичок роботи з електронними таблицями	104 KB
	Права частина служить для переміщення по таблиці вправо уліво а ліва частина що містить ярлички аркушів дозволяє переміщатися між аркушами. Створення таблиці Створіть заготівлі таблиці самостійно застосовуючи наступні операції: запуск Excel; форматування рядка заголовка.
72693.		Дослідження мультивібратора на напівпровідникових транзисторах	2.58 MB
	Відповідно, параметри транзисторів повинні бути повністю ідентичні. І така ідеальна схема буде непрацездатною: обидва транзистори будуть відкриті. Неможливість реально забезпечити абсолютну симетрію і наявність додатного зворотного зв’язку призводять до того, що після подачі напруги живлення...
72696.		Знайомство з можливостями баз даних Excel	103 KB
	Уявіть себе власником невеличкого магазину. Необхідно вести постійний облік приходу і витрати товарів, щодня мати перед очима реальний залишок, мати можливість роздрукувати найменування товарів по відділах і т.д. Допомогти у цьому може Excel.

Алгоритмы цифровой компрессии изображений с использованием ортогональных преобразований

На правах рукописи

Умняшкин Сергей Владимирович

УДК 004.932: 004.421: 519.722

Математические методы и алгоритмы цифровой

компрессии изображений с использованием

ортогональных преобразований

Специальность 05.13.11 - “Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей”

Москва – 2001 2

Работа выполнена в Московском государственном институте электронной техники (техническом университете)

Научный консультант : доктор физико-математических наук, профессор Поспелов А.С.

Официальные оппоненты :

Доктор физико-математических наук, профессор Ососков Г.А.

Доктор физико-математических наук, профессор Селищев С.В.

Доктор технических наук профессор Коекин А.И.

Ведущая организация : ФГУП НИИ Радио (г.Москва)

Защита состоится 19 февраля 2002 года в 1430 на заседании диссертационного совета Д.212.134.02 в Московском государственном институте электронной техники по адресу: 103498, Москва, г. Зеленоград, МИЭТ (ТУ).

С диссертацией можно ознакомиться в библиотеке МИЭТ (ТУ).

Ученый секретарь диссертационного /Воробьев Н.В./ совета профессор

Общая характеристика работы

Актуальность темы. Хранение и передача изображений при непосредственном цифровом представлении в виде матрицы пикселей (точек изображения) вызывает необходимость обработки колоссальных объемов данных.

Однако непосредственное представление изображения является неэффективным: вследствие значительной коррелированности элементов матрицы независимое кодирование пикселей порождает избыточные коды. Поэтому особую актуальность среди прочих задач цифровой обработки изображений приобретает задача сжатия изображений, которая заключается в поиске путей реализации эффективного кодирования визуальных данных.

Цель работы . Сложность алгоритмов, используемых для компрессии изображений, неуклонно растет – сказанное касается не только объема вычислений, но и идейных основ построения алгоритмов, большинство которых основано на использовании дискретных ортогональных преобразований для предварительной обработки данных. Вместе с тем, задача сжатия изображений ставится практикой, что требует при ее решении постоянного внимания к возможностям реальной аппаратуры. Целью работы являлись исследование теоретических вопросов эффективного кодирования изображений с использованием ортогональных преобразований, а также разработка соответствующих алгоритмов сжатия, пригодных для практического применения на базе универсальных вычислительных средств общего назначения.

Направление исследований. Проведенные в диссертационной работе исследования включали в себя рассмотрение следующих вопросов:

1. Исследование и разработка методов теоретического анализа и синтеза дискретных преобразований для схем компрессии коррелированных данных;

2. Разработка новых быстрых алгоритмов вычисления дискретного преобразования Крестенсона-Леви (ДПКЛ) и алгоритма сжатия полутоновых изображений, основанного на статистическом кодировании спектров ДПКЛ;

3. Исследование специфики и формализация общей схемы компрессии, использующей поблочную обработку фрагментов изображения при помощи ортогонального преобразования с последующим квантованием и статистическим кодированием коэффициентов-трансформант;

4. Разработка алгоритмов вейвлет-компрессии изображений и изучение возможностей фрактального кодирования в области вейвлет-спектра;

5. Разработка алгоритма сжатия видеопоследовательностей (динамических изображений), пригодного для использования в виде программной реализации на базе универсальных вычислительных средств общего назначения (мультимедийных персональных компьютеров).

Методы исследования. В качестве основного теоретического инструмента исследований использовались методы математического и функционального анализа, линейной алгебры, теории вероятностей и математической статистики, теории информации. Значительную часть исследований представляли собой также компьютерные эксперименты по обработке реальных неподвижных и динамических изображений, направленные на получение необходимых статистических данных и определение характеристик итоговых алгоритмов сжатия. Проведенные эксперименты подтвердили верность теоретических решений и эффективность предложенных алгоритмов компрессии.

Научная новизна . В результате выполнения диссертационной работы получены новые методы анализа эффективности ортогональных преобразований, предназначенных для сжатия коррелированных данных; специально для сжатия данных введено в рассмотрение (впервые построено) дискретное псевдокосинусное преобразование (ДПКП). Разработаны новые быстрые алгоритмы вычисления ДПКЛ, на базе которого впервые получена схема компрессии статических изображений, имеющая аналогичные методу JPEG характеристики.

Для обработки неподвижных и динамических изображений предложены как новые алгоритмы, так и общие теоретические подходы, формализующие процедуры анализа и синтеза схем компрессии цифровых изображений на основе дискретных ортогональных преобразований.

На защиту диссертации выносятся следующие основные результаты:

Метод оценки декоррелирующей эффективности ортогональных преобразований и основанные на нем алгоритмы кластеризации коррелированных ДПКП и быстрый алгоритм его вычисления;

Новый быстрый алгоритм ДПКЛ и его модификация – алгоритм с неполным вычислением; алгоритм совмещенных вычислений ДПКЛ для обработки вещественных массивов в базисе (1,exp(-2i/3));

Детерминированные и вероятностные оценки коэффициентов дискретного косинусного преобразования (ДКП);

Алгоритм контекстного кодирования спектров ДКП изображений;

Алгоритмы вейвлет-компрессии статических изображений;

Алгоритм поиска перемещенных блоков изображения;

Экспериментальная методика построения разбиения спектров на области независимого кодирования;

Алгоритм видеокомпрессии.

Практическая ценность . В целом содержание работы носит прикладную направленность, поэтому полученные теоретические результаты также служат достижению целей, связанных с разработкой конкретных алгоритмов и схем компрессии цифровых изображений. Применение полученных алгоритмов сжатия изображений возможно для широкого класса систем хранения и передачи визуальной информации, прежде всего, в мультимедийных и сетевых компьютерных приложениях. Разработанные алгоритмы, как подтверждают эксперименты, обладают высокими характеристиками по скорости, качеству обработки и сжатию данных, которые соответствуют современному мировому уровню.

Реализация результатов работы. Теоретические результаты работы и алгоритмы сжатия видеоизображений внедрены в ГУ НПК «Технологический Центр» МИЭТ (http://www.tcen.ru) и использованы в научно-производственной деятельности НПП «Технология» (Москва) .

Апробация работы . Основные результаты работы докладывались и обсуждались на следующих научных конференциях и совещаниях:

1. VII саратовская зимняя школа по теории функций и приближений (СГУ, январь 1994 г.) .

2. Междунар. конференция по теории функций и приближений, посвященная 90-летию акад. С.М.Никольского (Москва, МИ РАН, май 1995 г.) .

3. Всероссийские научно-технические конференции “Электроника и информатика” (Москва, МИЭТ, 1995-2000 г.) .

4. Междунар. конференция по теории приближения функций, посвященная памяти проф. П.П.Коровкина (Калуга, КГПУ, 26-29 июня 1996 г.) .

5. Международные конференции «Методы оптимизации вычислений» (Киев, 1997, 2001 г.) .

6. Международная конференция «Проблемы математического образования», посв. 75-летию чл.-корр. РАН проф. Л.Д.Кудрявцева (1998 г.) .

7. Международная конференция «Теория приближений и гармонический анализ» (Тула, 26-29 мая 1998 г.) .

8. Международная конференция «Информационные технологии в инновационных проектах» (Ижевск, 20-22 апреля 1999 г.) .

9. VII Международная конференция «Математика. Экономика. Экология. Образование» – Международный симпозиум «Ряды Фурье и их приложения»

(Новороссийск, 1999 г.) .

10. VII Международная конференция «Математика. Компьютер. Образование»

11. Международная конференция, посвященная 80-летию со дня рождения С.Б.Стечкина (Екатеринбург, 28 февраля – 3 марта 2000 г.) .

Публикации . Основное содержание диссертации отражено в 30 работах.

Структура и объем диссертации . Диссертационная работа содержит страницы (из которых 26 страниц – приложения) и состоит из введения, шести глав, заключения и 6 приложений. Библиографический список включает в себя 178 наименований. В приложениях приведены численные результаты ряда экспериментов по обработке изображений, а также справочная информация и копии документов об использовании результатов диссертационной работы.

Во введении (28 страниц) обосновываются актуальность, научная новизна, практическая ценность исследований. Кратко излагается содержание глав.

В первой главе (35 страниц) приводятся необходимые для дальнейшего изложения предварительные сведения, дается краткий обзор и классификация основных подходов к реализации эффективного кодирования изображений.

Использование алгоритмов сжатия с потерями данных для полутоновых изображений носит повсеместный характер: допустив наличие ошибки в восстановленном изображении, можно добиться намного более высокого уровня компрессии данных. Чаще всего качество обработки изображений оценивают X=(xi,j) – матрица исходного изображения, X = (xi, j) – матрица изображения, полученного после обработки (сжатия и восстановления данных). Для логарифмической величины СКО используется общепринятая мера PSNR (peak signal to noise ratio – отношение пикового значения сигнала к шуму), Методы сжатия изображений удобно рассматривать в виде общей схемы, состоящей из трех основных этапов: снижение межэлементной корреляции данных, квантование элементов данных, статистическое кодирование. Квантование является основным инструментом, используемым при сжатии с потерями данных. По сути дела, квантование есть выделение из входных данных некоторой основной части информации, когда ее менее значимая часть опускается.

Применяется как скалярное, так и векторное квантование.

Перевод изображения в обобщенную спектральную область при помощи линейного преобразования F может значительно снизить межэлементную корреляцию в матрице-трансформанте Y=F(X) по сравнению с корреляцией элементов в матрице дискретного изображения Тогда независимое покомпонентное кодирование матрицы Y, а не матрицы X, становится более эффективным. Можно также дать энергетическую трактовку цели использования преобразований, которая в таком понимании заключается в концентрации максимальной части энергии исходного дискретного сигнала (матрицы X) в минимальном количестве спектральных коэффициентов (элементов матрицы Y). Между распределением энергии в обобщенном спектре и декоррелирующими свойствами преобразований имеется определенная связь. Изучение эффективности декоррелирующих свойств, таким образом, является важной задачей при выборе преобразования для применения в схеме компрессии.

Реальные фотографические изображения представляют собой двумерные сигналы, имеющие неоднородности (особенности) в областях контуров объектов, поэтому базис функций, используемых для разложения, должен обладать на исходном изображении хорошей локализацией. Однако в фоновых областях изображение может рассматриваться как реализация стационарного сигнала, что делает предпочтительным использование для разложения частотнолокализованного базиса (хорошо известно, что коэффициенты Фурье разложения по тригонометрической системе стационарного сигнала некоррелированы).

Добиться одновременно высокого разрешения в частотной и во временной областях невозможно в силу принципа неопределенности Гейзенберга. Выходом является использование функциональных базисов вейвлетов (всплесков), которые обладают переменным время-частотным разрешением. Подходы, связанные с использованием всплесков, на сегодняшний день являются доминирующими в обработке неподвижных изображений, постепенно вытесняя традиционный инструмент декорреляции – дискретное косинусное преобразование.

В первой главе отмечается, что для оптимизации алгоритмов сжатия данных с потерями часто используется подход, основанный на минимизации RDфункции Лагранжа. Пусть X – некоторый входной набор данных, которому в результате выполнения процедуры сжатия-восстановления ставится в соответствие выходной набор данных той же природы, Y=F(X,u), где u=(u1,…,un) – набор управляющих параметров алгоритма сжатия F. Считаем X, Y элементами некоторого пространства с метрикой D(X,Y), множество всех возможных значений управляющего вектора u обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры u* = u1,..., un алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,u)) принимала бы минимальное значение. То есть где R(X,u) – число бит, необходимое для кодирования набора данных X с параметрами u.

Поиск решения задачи (1) в большинстве случаев сводится к громоздким численным процедурам итерационного характера. Если не задаваться ограничением R(X,u)Rb, то для определения оптимальных параметров кодирования u*, соответствующих решению задачи (1) для некоторого (заранее неизвестного) значения Rb, используется упрощенный вариант минимизации RD-функции Лагранжа:

где – неотрицательный параметр, задаваемый внешне. Параметр в функции J(u) устанавливает баланс между качеством и уровнем сжатия данных. Значение =0 соответствует наименьшей ошибке кодирования, увеличивая значение, получаем при оптимизации параметров алгоритма F по (2) меньшую длину кода, но большую ошибку. Тем самым можно настраивать алгоритм кодирования F на необходимые характеристики. Для поиска решения задачи (1) минимизация (2) повторяется итерационно, с различными значениями – данная процедура носит название RD-оптимизации1.

Так же как и для статической компрессии, алгоритмы кодирования видео чаще всего являются более сложными по сравнению с алгоритмами декодирования.

Реализация программной компрессии видео в реальном масштабе времени, таBerger T. Rate Distortion Theory. – Endlewood Cliffs, NJ: Prentice Hall, 1971.

ким образом, накладывает существенные ограничения на допустимую сложность вычислений.

Вторая глава (52 страницы) посвящена изучению эффективности и синтезу ортогональных преобразований, предназначенных для использования в сжатии данных. Предложенный новый метод анализа эффективности основан на следующих рассуждениях. Пусть известна ковариационная матрица KX исходного вектора данных X = (x0, x1,…, x N 1)T, вектор-спектр Y получен в результате некоторого ортогонального преобразования с матрицей W: Y=WX.

Средняя безусловная энтропия коэффициента вектор-спектра может быть записана в виде :

где fk(mk,k,x) – функция плотности распределения вероятностей для спектральной характеристики yk (k-ой компоненты вектора Y), mk – математическое ожидание, k – среднеквадратичное отклонение, f k0 (x) = f k (0,1, x). Чем меньше средняя энтропия (3), тем эффективнее будет последующее независимое кодирование компонент спектра. Наложив ограничение, при котором для класса что для оптимального преобразования Карунена-Лоэва (когда матрица W=Wopt составлена из собственных векторов KX и матрица KY=WKXWT имеет диагоN 1 N нальный вид) декоррелирующей эффективности будем рассматривать величину средней избыточной энтропии H (W, K X) = H cp (W, K X) H cp (Wopt, K X), которая выражается через элементы матриц K X = (cov(xi, x j))i, j = 0 и W = (wi, j)i, j =0 следующим образом :

Чем больше значение H(W,KX), тем меньше эффективность декоррелирующего преобразования с матрицей W. Численные расчеты величины (4) для различных преобразований и видов ковариационных матриц показали результаты, полностью согласующиеся с известными данными, которые получены другими методами, например, по Пэрл (Pearl J. On coding and filtering stationary signals by discrete Fourier transforms // IEEE Trans. Inf. Theory. - 1973. - Vol. ITP. 229-232.).

Данная модель часто используется для описания межстрочной и межстолбцовой корреляции в дискретных изображениях. При =1, когда все компоненты в исходном векторе X одинаковы (для любых двух отсчетов вектора коэффициент корреляции равен единице), расчет введенного критерия (4) для матрицы (5) невозможен, т.к. в этом случае имеем det K X = 0. Вместе с тем, на фоновых областях изображения 1. В главе 2 доказана следующая теорема.

Теорема 2.1. Для любой ортогональной матрицы W (NN) такой, что j = 0,1,… N 1: w0, j = (базисная функция с нулевым индексом есть нормиN рованная постоянная составляющая) и ковариационной матрицы (5) Различные исследования, в том числе проведенные в главе 2, показывают, что среди дискретных преобразований, имеющих быстрые алгоритмы вычислений (для размерности N реализуемых за ~NlogN арифметических операций) наиболее близкие к оптимальному преобразованию Карунена-Лоэва характеристики декорреляции для марковского процесса (5) дает использование ДКП.

Однако несмотря на наличие хорошо проработанных быстрых алгоритмов вычисления, ДКП принципиально требует для своей реализации выполнения операций умножения и по объему вычислений заметно уступает, например, преобразованиям Хаара, Уолша, Крестенсона-Леви. Отдельным вопросом, рассмотрению которого уделено значительное внимание в главе 2, является построение нового преобразования, имеющего как высокие характеристики декорреляции для модели (5), так и значительно более быстрые, чем для ДКП, алгоритмы вычисления. Полученное в результате дискретное псевдокосинусное преобразование определено для векторов размерности N, которая допускает разложение N=N1…Nn, причем k Nk{2,3,4}. Представление N=N1…Nn необходимо записать минимальным количеством множителей Nk, располагая их без убывания, т.е. k, m>k: NkNm. Например, для N=8 имеем N1=2, N2=4 (но не N1=4, N2=2 и не N1=N2=N2=2). Тогда матрица ДПКП WN (в данном случае нижний индекс указывает на размерность преобразования) строится как прямое произведение2 WN = WN 1 … WN n элементарных матриц ДПКП WN k {W2,W3,W4}, k=1,…,n, где элементарные матрицы ортогональны Под тензорным (прямым) произведением матриц D={dl,m} (l=0,…,-1; m=0,…,-1) и и получены в результате определенных модификаций из матриц ДКП соответствующей размерности. Элементарные матрицы представимы в виде произведения некоторой диагональной матрицы D на матрицу С, а структура С позволяет реализовать умножение на произвольный вектор U только при помощи операций сложения и вычитания чисел (умножение на 2 эквивалентно сложению, 2x=x+x). Именно:

Из свойств тензорного произведения следует представление WN = D N C N, C N = C N 1 … C N n. Матрицы C2, C3, C4, D2, D3, D4 приведены выше. Таким образом, реализация ДПКП Y = WN X = D N C N X заключается в реализации умножения матрицы CN на вектор, Y = C N X, и последующей нормировке полученного вектора Y, Y = D N Y. Для вычисления ДПКП удобно использовать быстрые алгоритмы, основанные на факторизованном представлении для матматриц3:

единичная матрица размерности N j N j. Поскольку матрицы TN j) состоят из определенным образом разреженных матриц-блоков C N j, умножение матрицы TN j) на вектор также сводится только к операциям сложения и вычитания чисел. Быстрые алгоритмы обратного ДПКП строятся аналогично, т.к. в силу орT) () Отметим, что необходимая при вычислении ДПКП и обратного ДПКП нормировка (умножение на матрицу DN) для схемы сжатия со скалярным квантованием коэффициентов преобразования не влечет усложнения вычислений.

Нормировка может быть объединена при сжатии данных с этапом скалярного зованного вектора Y индивидуального шага квантования qj=q/djj (где d jj – элемент диагональной нормировочной матрицы D N). При деквантовании y j = m~ j множитель для элемента y j следует выбирать в виде mj=qdjj.

Как показали расчеты величины средней избыточной энтропии (4) и остаточной корреляции по Пэрл, для данных, имеющих статистику марковского процесса первого порядка (5), ДПКП обладает большей эффективностью в декорреляции по сравнению с другими быстрыми преобразованиями, реализация которых также сводится только к операциям сложения и вычитания чисел.

Третья глава (48 стр.) посвящена изучению вопросов применения для сжатия изображений дискретного преобразования Крестенсона-Леви (ДПКЛ) и является развитием исследований кандидатской работы автора.

Для обоснования справедливости данного представления см. с.84-85 из монографии «Абстрактные алгебраические системы и цифровая обработка сигналов» / Вариченко Л.В., Лабунец В.Г., Раков М.А. - Киев: Наукова думка, 1986. – 248 с.

Идея предложенного в пятой главе алгоритма сжатия основана на работах Lewis-Knowles6 (LK) и Xiong-Ramchandran-Orchard7 (XRO). При кодиLewis A.S., Knowles G. Image Compression Using the 2-D Wavelet Transform // IEEE Trans.

Image Proc. – 1992. – Vol. 1. - №2. – P.244-250.

ровании топологии S в XRO для всех узлов дерева, кроме листьев, использовалась бинарная карта {ni}: если ni=0, то дерево в данном узле подрезается, а если ni=1, то по крайней мере непосредственные потомки сохраняются. Сказанное иллюстрируется рис. 2А. Статистическое кодирование признаков {ni} в алгоритме XRO не используется. Вместе с тем, признаки {ni} соседних (по положению внутри саббэнда) узлов являются коррелированными величинами. Чтобы учесть эту корреляцию, в разработанном алгоритме признаки для соседних узлов {ni }iC j предлагается группировать в единый элемент данных, так что карта подрезания ветвей (топология дерева) описывается новым алфавитом данных с символами Ni=(ni1,ni2,ni3,ni4)=ni1+2ni2+4ni3+8ni4, которые, кроме того, кодируются статистически. Новый расширенный признак Nj оказывается связанным уже с узлом j более высокого уровня, см. рис. 2Б.

Подрезание ветвей Рисунок 2. Способ подрезания ветвей при послойном просмотре узлов: А – алгоритм XRO, Б – предлагаемое кодирование топологии. Ci={i1,i2,i3,i4} Идея, которая восходит к работе LK и в том же виде используется в XRO, заключается в следующем: чем больше абсолютная величина вейвлеткоэффициента wi (или энергия, wi2) узла-родителя i, тем менее вероятно появление у данного узла нулевой (т.е. подрезанной) ветви. Более точное предсказание появления нулевой ветви можно составить, если использовать в качестве Xiong Z., Ramchandran K. and Orchard M.T. Space-frequency Quantization for Wavelet Image Coding // IEEE Trans. Image Proc. – V.6 – May 1997, P. 677-693.

прогнозной величины Pi сумму, включающую в себя, помимо wi2, также квадраты значений к узлу i. Для прогнозной величины узла i предлагается использовать следующую сумму абсолютных величин вейвлет-коэффициентов:

где множества для индексов суммирования определяются среди соседей узла i в саббэнде в соответствии с рис. 3. Весовые коэффициенты, входящие в сумму, были получены в результате статистической обработки ряда тестовых изображений с целью выявления максимума выборочного значения для коэффициента корреляции между прогнозной величиной (10) и энергией проквантованных вейвлет-коэффициентов непосредственных потомков Сi: Pi, w2 max.

Предлагаемый алгоритм вейвлет-компрессии использует несколько статистических моделей. Функцию арифметического кодера, которая оценивает по внутренним статистическим моделям количество бит, необходимое для кодирования символа с в k-ом потоке, обозначим H(k,c). Обозначение Hspec относится к потокам, в которых кодируются проквантованные вейвлет-коэффициенты, Hmap – к потокам, в которых кодируются признаки начала нулевой ветви. Деревья спектра обрабатываются последовательно; после оптимизации топологии очередного дерева его необходимо закодировать, и тем самым произвести адаптацию статистических моделей арифметического кодера.

Шаг 0. /* инициализация */ i Ln1: /* просматриваются все узлы предпоследнего уровня */ /*корректировка проквантованных коэффициентов*/ /* расчет RD-функций сохранения и подрезания листьев */ Шаг 2. i Ll: /*просмотр текущего уровня с попыткой подрезания ветвей */ Если i0 то /* не достигли начала дерева */ /* определение оптимальной топологии ветвей */ /*корректировка проквантованных коэффициентов*/ /* подготовка для просмотра следующего уровня */ иначе /* i=0, достигли начала дерева */ /* определение оптимальной топологии дерева */ Шаг 3. /* формирование и выдача результата */ Конец Просмотр узлов дерева проводится от листьев к корню. На первом (подготовительном) шаге просматриваются те узлы i, которые имеют только непосредственных потомков (Ci=Ui), формируются массивы из значений RDфункций, соответствующих вариантам подрезания (J U i) и сохранения (J U i) листьев. Предварительно, на шаге 1.1, для каждого узла-листа анализируется возможность дополнительной минимизации Лагранжа, характеризующей скалярное квантование вейвлет-коэффициентов. Данная процедура основана на известных свойствах распределения вероятностей вейвлеткоэффициентов, в соответствии с которыми битовые затраты R на кодирование коэффициента априори тем меньше, чем меньше его абсолютное значение (по этой причине для случая w = 0 процедура дополнительной минимизации не применяется). На втором шаге, который выполняется для всех узлов i следующих уровней, iLl (l=n-2,…,0), производится выбор RD-оптимального способа подрезания ветвей (шаги 2.1-2.2), начинающихся из узлов jCi. Шаги 2.3 и 2. несут тот же смысл, что и шаги 1.1, 1.2. Отметим, что введение дополнительной оптимизации скалярного квантования (шаги 1.1 и 2.3) позволяет при том же уровне сжатия дополнительно повысить PSNR на 0,02-0,03 дБ.

Для всех узлов, за исключением корневого, выбор модели для кодирования признаков Ni (на шаге 2.1) производится с использованием правила, определяемого функцией IndMap(i). Для кодирования признака N0, связанного с корнем дерева, используется отдельный поток данных, которому условно присвоен номер 0 (см. шаг 2.6).

Как следует из приведенного описания алгоритма оптимизации, важнейшую роль в его работе играют функции IndMap(Pi) и IndSpec(i), которые задают правила выбора потоков для кодирования данных. Первая функция производит выбор модели кодирования признака Ni=(ni1,ni2,ni3,ni4) по среднему значению прогнозных величин Pi (10), i=i1,i2,i3,i4, и имеет следующий вид:

Пороги (t1,t2,t3)=(0.3;1.1;4.0) для выбора моделей находились в результате минимизации длины выходного битового кода R(t1,t2,t3) при обработке известных тестовых изображений Lena, Barbara, Goldhill. Эксперименты показали также, что введение большего числа моделей для признаков лишено смысла.

Вторая ключевая функция алгоритма вейвлет-сжатия, IndSpec(i), представляет собой правило выбора модели для кодирования не попавших в нулевые ветви вейвлет-коэффициентов. Для кодирования спектральных коэффициентов более эффективным оказывается использование прогнозной величины, полученной не только по родительскому узлу, но и по вейвлеткоэффициентам узлов, которые находятся в том же саббэнде, рядом с обрабатываемым8. В рассматриваемом алгоритме последовательность кодирования и декодирования узлов вейвлет-спектра определяется схемой рисунка 4 (цифры обозначают порядок обработки саббэндов). Для использования в функции IndSpec(j) прогнозная величина текущего узла j (помечен черным) формируется s j = 0.36 Pi + 1.06 w j y + w jx + 0.4 w jd, где jy – узел-сосед по вертикали, jx – Идея использования контекста соседних вейвлет-коэффициентов предложена в работе Chrysafis С., Ortega A. Efficient Context-Based Entropy Coding for Lossy Wavelet Image Compression // Proc. Data Compression Conference. – Snowbird (Utah), 1997. – P. 241-250.

узел-сосед по горизонталии, jd – узел-сосед по диагонали (которые уже обработаны, см. рис. 4), Pi определяется для узла-родителя i (jCi) по (10). При этом результатам обработки тестовых изображений.

Нулевая модель относится к кодированию спектральных коэффициентов при масштабирующих функциях и вновь обособлена. Первая модель включает в себя самые низкочастотные вейвлет-коэффициенты (уровня L1), а также коэффициенты, для которых прогноз sj – наибольший.

Характеристики, которые дает Таблица. 1. Величина PSNR (в дБ), попредложенный алгоритм компрессии лученная при сжатии тестовых изобрадля стандартных тестовых изображе- жений по предложенному алгоритму ний, приведены в табл. 1. В экспериLena Barbara Goldhill ментах применялись пятишаговые вейвлет-преобразования из работы Wei D., Pai H.-T., and Bovik A. C., Antisymmetric Biorthogonal Coiflets for Image Coding // Proc. IEEE International Conference on Image Processing. – Chicago, 1998. – V. 2. – P. 282-286. Сравнение достигнутых характеристик с результатами применения других известных алгоритмов показывает, что предложенный алгоритм имеет весьма высокие показатели.

Завершающие исследования главы 5 относятся к построению гибридной схемы кодирования вейвлет-спектра, когда в дополнение к описанному выше способу подрезания ветвей вейвлет-коэффициентов допускается также возможность векторного «самоквантования» ветвей, которое может трактоваться как фрактальное кодирование в области вейвлет-преобразований9. Полученный в результате гибридный алгоритм требует существенно больших вычислений, однако фрактальная составляющая кодирования при этом оказалась практически полностью подавленой базовой схемой вейвлет-компрессии, основанной на подрезании ветвей. Необходимо отметить, однако, что соединение двух подходов в гибридном алгоритме было произведено несложным способом, и возможности дальнейшего развития оставляют здесь обширное поле для исследований.

Шестая глава (45 стр.) посвящена исследованию алгоритмов сжатия динамических изображений с целью построения схемы видеокомпрессии, пригодной для программной реализации, которая обеспечивает обработку в реальном масштабе времени на базе персональных компьютеров.

Кадром видеопоследовательности назовем матрицу пикселей из M1 строк и M2 столбцов: B=(bk,l), k=0,1,…,M1-1, l=0,1,…,M2-1, а под видеопоследовательностью будем понимать упорядоченный набор кадров B0,B1,…,Bi,…. Назовем (y,x)-блоком кадра B (y, x – целочисленные координаты) некоторую подматрицу By,x=(bk,l), где k=y,y+1,…,y+N1-1, l=x,x+1,…,y+N2-1. В разработанном алгоритме каждый кадр видеопоследовательности разбивается при обработке на смежные матрицы-блоки {Bm,n} размером 88, m,n=0,8,16… Если какой-либо блок Biy,x видеопоследовательности оказался в определенном смысле «похож» на оригинальный блок Bim, n, считаем, что блок Bim,n – это перемещенный фрагмент Biy,x См., например, Davis G.M., A wavelet-based analysis of fractal image compression // IEEE Trans. Image Proc. – 1998. – V.7 – №2. – P.141-154.

предыдущего кадра, и для кодирования (m,n)-блока изображения достаточно задать координаты блока в предыдущем кадре, y и x, либо изменения координат y-m и x-n. Частным случаем перемещенного блока является неподвижный блок, когда m=y, n=x. Если блоку Bim, n нельзя найти похожий в предыдущем кадре, блок должен кодироваться как новый. Для выбора способа кодирования очередного обрабатываемого блока Bim, n вновь руководствуемся критерием минимума функции Лагранжа J(b)=D(b)+R(b). Положим, что аргумент b= соответствует кодированию перемещенного (неподвижного) блока, а b=1 – нового. Т.е. если J(1)>J(0), то блок кодируется как перемещенный, и как новый – в противном случае.

При использовании RD-оптимизации задача поиска перемещенных блоков формулируется следующим образом. Для заданного (m,n)-блока Bim, n i-ого кадра найти в предыдущем восстановленном кадре такой (y,x)-блок B iy,x, чтобы минимальное значение принимала RD-функция Лагранжа Здесь учтено, что координаты найденного блока будут кодироваться как относительные, т.е. вектором перемещений r=(y-m,x-n). Для того чтобы поиск можно было осуществить в реальном масштабе времени, в качестве области необходимо рассматривать лишь точки (v,u), достаточно близко расположенные к точке (m,n). Повышение эффективности поиска за счет расширения области достигается применением различных алгоритмов направленного поиска, ориентированных на минимизацию ошибки представления перемещенного блока Bim, n Biy,1, что соответствует частному случаю (11) при =0. Для того, чтобы учесть вклад битовых затрат в RD-функцию J*, будем проводить минимизацию (11) поэтапно, на каждом из этапов приближенно полагая, что рассматриваемые векторы перемещений влекут одинаковые затраты на статистическое кодирование. Кроме того, для повышения универсальности итерационных алгоритмов поиска малые перемещения будем искать более точно. Действительно, если некоторый блок изображения переместился на значительное расстояние по сравнению с предыдущим кадром, то соответствующий фрагмент изображения воспринимается человеческим глазом смазано, и в точном определении вектора перемещения нет необходимости. Малые же перемещения блоков не только являются преобладающими, но и должны точно отслеживаться в силу специфики визуального восприятия. Предлагаемый алгоритм RD-поиска имеет следующий вид.

Шаг 0. Вычисление значения RD-функции неподвижного блока, r=(0,0):

Шаг 1. Близкий к перебору точный поиск небольших перемещений.

1.1. Среди девяти (y,x)-блоков предыдущего кадра, 1.2. Среди девяти (y,x)-блоков предыдущего кадра, 1.3. Вычисление значения RD-функции Шаг 2. Грубый поиск больших перемещений.

2.1. Среди восьми (y,x)-блоков предыдущего кадра, 2.2. Среди девяти (y,x)-блоков предыдущего кадра, (y 4, x 4) {(0,0), (2,2), (2,2), (2,2), (2,2), (3,0), (0,3), (3,0), (0,3)} 2.3. Вычисление значения RD-функции Шаг 3. Выбор наилучшего варианта перемещения блока.

Конец Для вычисления значения функции J0 необходимо учесть битовые затраты на кодирование признака перемещенного блока: J 0 = J * log2 (mov), где mov – частота появления перемещенных блоков в уже обработанных данных.

Основной объем вычислений в приведенном алгоритме связан с подсчетом отклонений B im, n Biy,x. При вычислениях одна пробная точка переходит с шага 0 на шаг 1.1, одна – с шага 1.1 на 1.2, одна – с шага 2.1 на 2.2. В итоге вычисление отклонения требуется выполнить 33 раза.

Для повышения эффективности приведенного алгоритма поиска для вектора (y, x) обрабатываемого блока следует строить прогноз по векторам () и () двух уже обработанных соседних блоков (соответственно соседа по вертикали и соседа по горизонтали). Собственно прогноз – это относительные координаты y 0, x 0, которые определяют перенос центра области поиска: из точки (m,n) в точку (m, n) = m + y 0, n + x 0. Эксперименты показывают, что число новых блоков изображения сокращается на 5…25%, если принять следующее правило составления прогноза:

Следуя идеологии стандарта MPEG, обработку новых блоков также осуществляем при помощи квантования с последующим статистическим кодированием коэффициентов двумерного ДКП. Пусть S=F(Вm,n) – результат ДКП блока Вm,n. Обозначим SQ = {~k,l = round(sk,l / qk,l)}k,l =0, SQ = {sk,l = qk,l ~k,l }k,l =0, где Q = {qk,l }k,l =0 – одна из матриц квантования JPEG. Для статистического кодирования матрицы S применен алгоритм контекстного кодирования, рассмотренный в главе 4, в который введен дополнительный этап RD-оптимизации. Пусть вновь ZQ = (z0,…, z63) – вектор, полученный в результате зигзагообразного считывания данных из матрицы SQ по правилу, определяемому стандартом JPEG (SQ ZQ), G (ZQ) = {g k }C=1 {0,…,63} – множество индексов ненулевых элементов вектора ZQ, т.е. z g k 0, если gkG; gkG: z g k = 0. RD-оптимизация статистического кодирования возможна за счет удлинения нулевых серий путем сокращения количества элементов во множестве G (дополнительного обнуления компонент вектора ZQ). Для того, чтобы в результате не произошло заметного усложнения алгоритма кодирования, будем анализировать лишь возможность увеличения финальной нулевой серии, что дает наибольший вклад в минимизацию функции J(ZQ)=D(ZQ)+R(ZQ). Пусть ZQ – вектор, полученный из вектора ZQ в результате обнуления последних компонент {zk }k = g m +1, т.е.

G (ZQ) = {g k }m=1 G (ZQ), m=1,…,C. Тогда простейшая RD-оптимизация состоm ит в поиске такого индекса g m * G (ZQ), что Рассмотренная выше процедура кодирования нового блока изображения предполагает использование заданной матрицы квантования Q. Универсальный же алгоритм кодирования должен оперировать некоторым набором матриц квантования {Qj} с возможностью выбора требуемой для конкретных условий.

Если набор достаточно большой, то подбор матрицы квантования Q по принципу минимума функции JQ (12) превращается в громоздкую процедуру, нереализуемую в реальном масштабе времени стандартными средствами. Кроме того, при большом диапазоне возможных значений индекса j его кодирование для каждого нового блока по отдельности влечет недопустимо высокие дополнительные битовые затраты. Поэтому в качестве исходного набора были выбраны лишь несколько матриц из множества, рекомендуемого JPEG, которые соответствуют наилучшему, наихудшему и некоторым промежуточным уровням качества. В экспериментах выбиралось число матриц |{Qj}|=4. Для ускорения выполнения операций деления, которые необходимы при квантовании, элементы матриц {Qj} были округлены до ближайшего значения 2k, k=0,1,… Такой подход позволяет заменить операции целочисленного деления и умножения сдвигами разрядов двоичного представления чисел, которые обычно выполняются реальной аппаратурой намного быстрее.

С учетом битовых затрат, которые необходимы для кодирования индекса матрицы квантования, функция Лагранжа, соответствующая кодированию нового блока изображения, определяется следующим образом:

J = min (J Q log 2 Q) log 2 new, где JQ находится в соответствии с (12), Q – частота появления матрицы Q, new – частота появления новых блоков в ходе предшествовавшей обработки.

При исследовании характеристик итогового алгоритма видеокомпрессии для оценки величины ошибки кодирования в восстановленной последовательности B0, B1,…, B K 1 использовалось отношение пикового значения сигнала к шуму, которое определялось следующим образом:

где M1 и M2 задают размер кадра в пикселях. Для экспериментов были выбраны широко известные тестовые последовательности News, Container ship, Hall monitor, Akiyo, Claire. Все они имеют размер кадра 144176 пикселей. Перед проведением экспериментов оригинальные последовательности были прорежены: только каждый третий кадр, B3k (k=0,…,24), использовался для формирования тех 25-кадровых видеопоследовательностей, которые затем и были подвергнуты обработке. Данное временное прореживание было призвано смоделировать скорость видеозахвата 10 кадров в секунду, вместо оригинальных (для всех вышеназванных последовательностей) 30 кадров в секунду. Обработке подвергалась только яркостная Y-составляющая, и только по яркостной составляющей анализировалась ошибка Программное сжатие видеопоследовательностей при этом удалось осуществить в реальном масштабе времени.

Результаты численных экспериментов, полученные аспирантом Ф.В.Стрелковым , отражены в таблице 2. В скобках приведено значение PSNR (13), достигнутое на тех же самых прореженных 25-кадровых тестовых видеопоследовательностях с использованием общедоступного кодера MPEG- http://www.mpeg.org/MSSG. Длина файла сжатых данных, полученного в каждом эксперименте, в точности равна произведению величины битового потока данных (приведена в таблице) на множитель 2.5. Во всех тестах предложенная схема компрессии дает высокие результаты, превосходя характеристики указанного кодера MPEG-2, несмотря на то, что кодек mpeg2encode использовал для поиска перемещенных блоков изображения полный перебор в области из 2323 пикселей.

Таблица 2. Характеристики сжатия предложенного алгоритма Описанный алгоритм видеокомпрессии был реализован программно в рамках работ, проводившихся в ГУ НПК «Технологический Центр» Московского государственного института электронной техники и в НПП «Технология»

Внедрение разработанных библиотек видеокомпрессии осуществлено в ряде программных систем, среди которых наибольший практический интерес представляет система видео контроля и регистрации Visual Security (см.

http://www.tcen.ru/vs).

Итог исследованиям, проведенным в диссертационной работе, подводится в заключительном разделе – «Основные выводы и заключение» (3 стр.).

1. Ортогональные преобразования являются основным инструментом, используемым для декорреляции данных при компрессии изображений. В случае, когда математическая модель дискретного сигнала задается ковариационной матрицей, для анализа эффективности декоррелирующей обработки целесообразно применение предложенного в работе критерия средней избыточной энтропии.

2. Специально для сжатия коррелированных данных получено и впервые введено в рассмотрение дискретное псевдокосинусное преобразование (ДПКП). В схеме компрессии, предполагающей наличие этапа скалярного квантования коэффициентов преобразования, среди рассмотренных быстрых преобразований, реализация которых сводится только к операциям сложения-вычитания (Уолша, Хаара, псевдокосинусное), ДПКП дает наилучшие результаты декорреляции для дискретного сигнала, описываемого марковской моделью.

6. При сжатии изображений с использованием многомодельного кодирования древовидных структур вейвлет-спектров правило выбора моделей следует строить по комбинированному контексту, который учитывает как окружение самого вейвлет-коэффициента в саббэнде, так и окружение коэффициента-«родителя». Полученный на этой основе новый эффективный алгоритм компрессии цифровых изображений с потерями, который разработан по результатам изучения статистических свойств спектров дискретных вейвлетпреобразований, показывает высокие характеристики сжатия при сложности реализации, приемлемой для широкого круга приложений.

В целом, в диссертационной работе получены новые научные результаты, теоретические положения которых позволили в значительной степени развить и формализовать процедуры анализа и синтеза схем компрессии цифровых изображений, основанных на использовании дискретных ортогональных преобразований. Выработанные подходы и рекомендации привели к построению конкретных схем и алгоритмов компрессии, многие из которых были реализованы программно и экспериментально подтвердили эффективность своего применения.

Список основных работ по теме диссертации 1. Ефимов А.В., Умняшкин С.В. Быстрые алгоритмы вычисления дискретного преобразования Крестенсона-Леви и оценки его спектральных характеристик // Теор. функций и прибл.: Тр. 7-й саратов. зим. шк. (1994 г.). Ч. 2.- Саратов: Изд.-во СГУ, 1995. - С. 9-20.

2. Ефимов А.В., Поспелов А.С., Умняшкин С.В. Применение преобразования Крестенсона-Леви в задачах цифровой обработки информации // Междунар.

конф. "Функциональные пространства, теория приближений, нелинейный анализ", посв. 90-летию акад. С.М.Никольского (27 апр. - 3 мая 1995 г.): Тез.

докл. - М.: Изд-во МФТИ, 1995. - С.124-125.

3. Умняшкин С.В. Применение дискретного преобразования Крестенсона-Леви (ДПКЛ) для кодирования изображений: сравнение с дискретным преобразованием Фурье (ДПФ) // Всерос. науч.-тех. конф. “Электроника и информатика” 15-17 нояб. 1995 г.: Тез. докл. - М.: МГИЭТ (ТУ), 1995. - С. 265-266.

4. Умняшкин С.В. Оценка дисперсии элементов спектра дискретного косинусного преобразования стационарного марковского процесса первого порядка // Междун. конф. по теор. прибл. функ., посв. памяти проф. П.П.Коровкина (Калуга, 26-29 июня 1996 г.): Тез. докл. -Т.2.-Тверь: ТГУ, 1996. - С. 217-218.

5. Умняшкин С.В. Оценка эффективности использования унитарных преобразований для кодирования дискретных сигналов // Информатика и связь: Сб.

Научных трудов под ред. В.А.Бархоткина. М.: МИЭТ.- 1997. С.73-78.

6. Умняшкин С.В. Оценка эффективности применения дискретных преобразований для сжатия данных // «Электроника и информатика – 97». Вторая всероссийская научно-техническая конференция с международным участием (Зеленоград, 25-26 ноября 1997г.): Тез. док. Часть 2. - С.79.

7. Ефимов А.В., Поспелов А.С., Умняшкин С.В. Теоретические основы и некоторые особенности применения дискретных мультипликативных преобразований в задачах сжатия цифровых изображений // Працi мiжнародноi коференцii “Питання оптимизацii обчислень” (6-8 жовтня 1997 р., м. Киiв) Киiв: Iнститут кiбернетики iменi В.М.Глушкова, 1997. - С. 108-112.

8. Ефимов А.В., Поспелов А.С., Умняшкин С.В. Некоторые свойства мультипликативных ортонормированных систем, используемые в цифровой обработке сигналов // Труды математического института им. В.А.Стеклова РАН.

- Т.219. - 1997. - С 137-182.

9. Ефимов А.В., Умняшкин С.В. О некоторых свойствах обобщенной системы Хаара и оценке эффективности применения ортогональных преобразований для сжатия данных // Функциональные пространства. Дифференциальные операторы. Проблемы математического образования: Труды междун. конф., посв. 75-летию чл.-корр. РАН проф. Л.Д.Кудрявцева. - Том 1. - М.: Рос. ун-т дружбы народов, 1998. - С. 70-73.

10. Умняшкин С.В. О модификации дискретного косинусного преобразования // Теория приближений и гармонический анализ: Тез. докл. междунар. конф.

11. Умняшкин С.В. О модификации дискретного косинусного преобразования // Изв. Тул. гос. ун-та. Сер. Математика. Механика. Информатика. Тула: ТулГУ, 1998. Т. 4. Вып. 1. С. 143-147.

12. Умняшкин С.В., Кочетков М.Е. Анализ эффективности использования дискретных ортогональных преобразований для цифрового кодирования коррелированных данных // Известия вузов. Электроника. - №6. - 1998. - С. 79-84.

13. Умняшкин С.В. О кластеризации коррелированных данных. // Информационные технологии в инновационных проектах. Междунар. конф. (г.Ижевск, 20-22 апр. 1999г.): Материалы докладов. - Ижевск, ИжГТУ, 1999. - С. 59-65.

14. Умняшкин С.В. Алгоритм кластеризации коррелированных данных // VII Междунар. конф. Математика. Экономика. Экология. Образование. Междунар. симп. Ряды Фурье и их приложения: Тез. док. – Ростов: Рост. гос. эконом. акад., 1999. – С. 211-212.

15. Ефимов А.В., Поспелов А.С., Умняшкин С.В. Некоторые вопросы применения мультипликативных систем и преобразований в задачах цифровой обработки изображений // VII Междунар. конф. Математика. Экономика.

Экология. Образование. Междунар. симп. Ряды Фурье и их приложения: Тез.

док. – Ростов: Рост. гос. эконом. акад., 1999. – С. 154-155.

16. Умняшкин С.В. Псевдокосинусное преобразование для сжатия дискретных сигналов // Информационные технологии и проблемы микроэлектроники.

Сб. науч. тр. – М.: МИЭТ. – 1999. – С.158-170.

17. Умняшкин С.В. Алгоритм компрессии неподвижных изображений на основе дискретного вэйвлет-преобразования // VII международная конференция «Математика. Компьютер. Образование» (Дубна, ОИЯИ, 24-29 янв. 2000):

Тез. док. – Москва: Прогресс-Традиция, 2000. – С.327.

18. Ефимов А.В., Умняшкин С.В. О структуре некоторых прямых и обратных вэйвлет-преобразований // Теория приближений функций и операторов: Тез.

докл. Междунар. конф., посв. 80-лет. со дня рожд. С.Б.Стечкина (Екатеринбург, 28 фев. – 3 мар. 2000). -Екатеринб.: УрГУ, 2000. – С.74-75.

19. Умняшкин С.В., Стрелков Ф.В., Жуков В.Г. Трехшаговые алгоритмы поиска перемещенных блоков изображения // Информационные технологии и системы управления. Сб. научн. тр. под ред. В.А.Бархоткина. – М: МИЭТ, 2000.

– С. 47-55.

20. Умняшкин С.В. Цифровая компрессия изображений с использованием дискретного преобразования Крестенсона-Леви // Межотраслевой научнотехнический журнал «Оборонный комплекс – научно-техническому прогрессу России», №2, 2000. С.28-39.

21. Умняшкин С.В., Космач М.В. Оптимизация кодирования цифровых изображений по методу JPEG //Изв. вуз. Электроника. -№4-5. -2000. -С.139-141.

22. Умняшкин С.В. Компенсация перемещения объектов при сжатии видеоданных // «Электроника и информатика – XXI век» Третья международная научно-техническая конференция: Тез. док. – М.: МИЭТ, 2000. – С. 365-366.

23. Умняшкин С.В. Алгоритм поиска перемещенных блоков для кодирования цифровых видеоизображений // Межотрасл. н.-т. журнал «Оборонный комплекс – научно-техническому прогрессу России», №3, 2001. – C. 38-41.

24. Умняшкин С. В. Использование контекстного арифметического кодирования для повышения сжатия данных по схеме JPEG // Известия вузов. Электроника. - №3. - 2001. – С. 96-99.

25. Умняшкин С. В. Вейвлет-компрессия цифровых изображений с прогнозированием статистических моделей //Изв. вузов. Электроника. - №5. - 2001. С.86-94.

26. Умняшкин С. В. Алгоритм фрактального кодирования изображений в области вейвлет-преобразований // Комп`ютерна математика. Оптимiзацiя обчислень: Збiрник наукових праць. – Том 1. – Кив: Iнститут кiбернетики iм.

В.М.Глушкова, 2001. – С. 385-391.

27. Umnyashkin S.V. Image compression based on mixed predictive modeling of wavelet trees // Reports from Vxj University (Sweden) – Mathematics, natural sciences and technology. – Nr.11 (September), 2001. – 18 pages.

28. Umnyashkin S.V., Strelkov F.V. An RD-optimized scheme for real-time video compression // Reports from Vxj University (Sweden) – Mathematics, natural sciences and technology. – Nr.12 (September), 2001. – 15 pages.

29. Разработка алгоритмов и программного обеспечения для реализации цифрового анализа и компрессии видеоизображений в реальном масштабе времени на базе программно-аппаратного комплекса общего назначения: Отчет о НИР (закл.) / НПП «Технология»; рук. – Умняшкин С.В. – «Страж»; № гос.

рег. 01990011697; Инв. №01077. – Москва, 1999. – 74 с.

30. Исследование и разработка алгоритмов программного сжатия данных с потерями для цифровой обработки видеоизображений: Отчет о НИР (закл.) / НПП «Технология»; рук. – Умняшкин С.В. – «Дозор»; № гос. рег.

01200004624; Инв. №100704. – Москва, 2000. – 48 с.

Подписано в печать: 25 декабря 2001 года Заказ №332. Тираж 100 экз. Уч.-изд.л. 2,4. Формат 6084 1/
уравнения Автореферат диссертации на соискание ученой степени доктора физико-математических наук Москва 2007 Работа выполнена в Научно-исследовательском институте прикладной математики и автоматизации...»

«КОРНИЛОВ Дмитрий Александрович ИССЛЕДОВАНИЕ СВОЙСТВ ФУЛЛЕРЕНОВ И НАНОТРУБОК МЕТОДОМ МОЛЕКУЛЯРНОЙ ДИНАМИКИ Специальность 01.04.07 – Физика конденсированного состояния Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Санкт-Петербург 2003 г. Работа выполнена в государственном образовательном учреждение высшего профессионального образования Санкт-Петербургский государственный политехнический университет Научный руководитель: доктор...»

«ЧИРИКОВ АНТОН МИХАЙЛОВИЧ НОВЫЕ ТЕОРЕМЫ ЕДИНСТВЕННОСТИ ДЛЯ СТЕПЕННЫХ РЯДОВ 01.01.01 - вещественный, комплексный и функциональный анализ Автореферат диссертации на соискание учной степени е кандидата физико-математических наук САНКТ-ПЕТЕРБУРГ 2011 Работа выполнена на кафедре математического анализа математического факультета Российского Государственного Педагогического Университета им. Герцена Научный руководитель доктор физико-математических наук, профессор Широков Николай...»

«Сидоров Евгений Николаевич ОСОБЕННОСТИ ОПТИЧЕСКИХ СВОЙСТВ СИЛЬНО ЛЕГИРОВАННОГО GaAs:Te В УСЛОВИЯХ КОРРЕЛИРОВАННОГО РАСПРЕДЕЛЕНИЯ ПРИМЕСИ Специальность 01.04.10 – физика полупроводников АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико–математических наук Томск – 2010 Работа выполнена в Омском филиале Института физики полупроводников им. А.В. Ржанова СО РАН Научный руководитель: кандидат физико–математических наук Давлеткильдеев Надим Анварович Официальные...»

«ЛЯШЕДЬКО АНДРЕЙ ДМИТРИЕВИЧ Термооптические искажения в неодимовых лазерах на основе пластинчатых активных элементов с продольной диодной накачкой Специальность: 01.04.21 – лазерная физика АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2012 Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте общей физики им. А.М. Прохорова РАН Научный руководитель: доктор физико-математических наук Цветков...»

«УДК: 535.326, 534.18 Пятакова Зоя Александровна АКУСТООПТИЧЕСКОЕ ВЗАИМОДЕЙСТВИЕ В ДВУМЕРНЫХ ФОТОННЫХ КРИСТАЛЛАХ Специальность 01.04.03 – радиофизика Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2011 Работа выполнена на физическом факультете Московского государственного университета им. М.В. Ломоносова Научный руководитель: кандидат...»

«КРУТИКОВА Алла Александровна СПЕКТРАЛЬНЫЙ АНАЛИЗ КОМПОЗИТНЫХ МАТЕРИАЛОВ НА ОСНОВЕ НАНОКРИСТАЛЛИЧЕСКОГО КРЕМНИЯ Специальность: 02.00.02 – Аналитическая химия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата химических наук Москва–2007 Работа выполнена на кафедре аналитической химии Московской Государственной академии тонкой химической технологии им. М.В. Ломоносова Научный руководитель: доктор химических наук, профессор Ищенко Анатолий Александрович Официальные...»

«МАТВЕЕНКО Сергей Иванович ПЕРИОДИЧЕСКИЕ СТРУКТУРЫ В НИЗКОРАЗМЕРНЫХ КОРРЕЛИРОВАННЫХ СИСТЕМАХ Специальность 01.04.02 - теоретическая физика АВТОРЕФЕРАТ диссертации на соискание учёной степени доктора физико-математических наук Черноголовка - 2012 Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте теоретической физики им....»

«УДК 004.896 АКСЕНОВ Константин Александрович ТЕОРИЯ И ПРАКТИКА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ОБЛАСТИ ПРОЦЕССОВ ПРЕОБРАЗОВАНИЯ РЕСУРСОВ Специальность 05.13.01 – Системный анализ, управление и обработка информации Автореферат диссертации на соискание ученой степени доктора технических наук Екатеринбург – 2011 Работа выполнена на кафедре автоматизированных систем управления ФГАОУ ВПО Уральский федеральный университет имени первого Президента России Б.Н.Ельцина. Научный...»

«Восков Алексей Леонидович РАСЧЕТ ФАЗОВЫХ РАВНОВЕСИЙ МЕТОДОМ ВЫПУКЛЫХ ОБОЛОЧЕК Специальность 02.00.04 – физическая химия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата химических наук Москва – 2010 Работа выполнена в лаборатории химической термодинамики на кафедре физической химии Химического факультета Московского государственного университета имени М. В. Ломоносова. Научный руководитель: доктор химических наук, профессор Воронин Геннадий Федорович Официальные...»

«Кравченко Игорь Витальевич ОСОБЕННОСТИ СТРУКТУРИРОВАНИЯ СЛОИСТЫХ И ДИСПЕРСНЫХ СИСТЕМ НЕСОВМЕСТИМЫХ ПОЛИМЕРОВ ПРИ СДВИГОВОМ ТЕЧЕНИИ. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ 02.00.06 – Высокомолекулярные соединения Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Москва 2010 www.sp-department.ru Работа выполнена в Учреждении Российской академии наук Институт проблем химической физики РАН Научный руководитель: доктор физико-математических наук Патлажан...»

«Грибов Андрей Геннадьевич АНАЛИЗ ИНФОРМАЦИОННЫХ ОБМЕНОВ В СИСТЕМАХ УПРАВЛЕНИЯ Специальность 05.13.01 – Системный анализ, управление и обработка информации (промышленность) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2011 Работа выполнена в Учреждении Российской академии наук Вычислительный центр им. А.А. Дородницына РАН в Отделе прикладных проблем оптимизации. Научный руководитель: доктор физико-математических наук...»

«Джардималиева Гульжиан Искаковна (СО)ПОЛИМЕРИЗАЦИЯ И ТЕРМИЧЕСКИЕ ПРЕВРАЩЕНИЯ МЕТАЛЛОСОДЕРЖАЩИХ МОНОМЕРОВ КАК ПУТЬ СОЗДАНИЯ МЕТАЛЛОПОЛИМЕРОВ И НАНОКОМПОЗИТОВ 02.00.06 – высокомолекулярные соединения АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора химических наук Черноголовка – 2009 www.sp-department.ru Работа выполнена в Институте проблем химической физики РАН доктор химических наук, профессор Научный консультант: Помогайло Анатолий Дмитриевич доктор химических...»

«ГАВРИЛОВ Алексей Андреевич ИССЛЕДОВАНИЕ ЛИНЕЙНЫХ И СЕТЧАТЫХ СЛУЧАЙНЫХ ПОЛИМЕРНЫХ СИСТЕМ МЕТОДАМИ КОМПЬЮТЕРНОГО МОДЕЛИРОВАНИЯ Специальности 02.00.06 высокомолекулярные соединения, 01.04.07 – физика конденсированного состояния Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2013 Работа выполнена на кафедре физики полимеров и кристаллов физического факультета Московского Государственного Университета имени М. В. Ломоносова....»

«НГУЕН СУАН НГИА ДИЭЛЕКТРИЧЕСКАЯ РЕЛАКСАЦИЯ НАДМОЛЕКУЛЯРНЫХ СТРУКТУР В БИОЛОГИЧЕСКИХ ЖИДКОСТЯХ НА НИЗКИХ И ИНФРАНИЗКИХ ЧАСТОТАХ Специальность - 01.04.04. Физическая электроника АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Санкт-Петербург - 2011 Работа выполнена в государственном образовательном учреждении высшего профессионального образования Санкт-Петербургский государственный политехнический университет Научный руководитель:...»

«Наймушина Екатерина Александровна. УДК 538.945 ПРИМЕНЕНИЕ МЕТОДА РЕНТГЕНОЭЛЕКТРОННОЙ СПЕКТРОСКОПИИ ДЛЯ ИССЛЕДОВАНИЯ ХИМИЧЕСКОГО СТРОЕНИЯ СЛОЖНЫХ МЕДНЫХ ОКСИДОВ В СВЕРХПРОВОДЯЩЕМ СОСТОЯНИИ Специальность 01.04.01. – приборы и методы экспериментальной физики АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Ижевск – 2004 Работа выполнена в лаборатории электронной спектроскопии Института физики поверхности при Удмуртском государственном...»

«Дашков Евгений Владимирович О пропозициональных исчислениях, представляющих понятие доказуемости 01.01.06 – математическая логика, алгебра и теория чисел АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2012 Работа выполнена на кафедре математической логики и теории алгоритмов Механико-математического факультета Московского государственного университета имени М. В....»

«Русаков Дмитрий Михайлович СХЕМЫ ПРОГРАММ С КОНСТАНТАМИ Специальность 01.01.09 – дискретная математика и математическая кибернетика АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук Москва – 2008 Работа выполнена на кафедре математической кибернетики факультета вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова. Научный...»

«РЕМЕЕВА АЛЬФИЯ НИЛОВНА МЕТОДИКА ОБУЧЕНИЯ ФИЗИКЕ В КЛАССАХ СОЦИАЛЬНОЭКОНОМИЧЕСКОГО ПРОФИЛЯ 13.00.02 – теория и методика обучения и воспитания (физика) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата педагогических наук Челябинск - 2008 Работа выполнена на кафедре теории и методики обучения физике государственного образовательного учреждения высшего профессионального образования Стерлитамакская государственная педагогическая академия Научный руководитель: доктор...»

«Изображение в полиграфии» - Специфика изображения в полиграфии. Главное свойство полиграфического изображения. Книга. Отличительная черта большинства изобразительных полиграфических произведений. Множественность Массовость Общедоступность. Соединение изображения с текстом. Искусство книги. Шрифт.

«Векторная и растровая графика» - Векторные примитивы задаются с помощью описаний. Принципы построения векторных и растровых изображений. Векторные изображения занимают относительно небольшой объём памяти. Виды компьютерной графики. Векторные изображения описываются десятками, а иногда и тысячами команд. Недостатки растровой графики.

«Компьютерная графика» - Основные проблемы при работе с растровой графикой. Виды компьютерной графики отличаются принципами формирования изображения. Компьютерная графика. Фрактальная графика. Виды компьютерной графики. Большие объемы данных. Пиксель. Сравнительная характеристика растровой и векторной графики. Каждая точка экрана может иметь лишь два состояния – «черная» или «белая».

«Создание графических изображений» - Границы полотна. Задание 4. Создать рисунок, состоящий из автофигур. Создание рисунка с помощью панели инструментов Рисование. Положение графического изображения в тексте. Вставить рисунок из коллекции в текст. Полотно. Сравнительная характеристика растровой и векторной графики. Особенности создания векторного изображения в среде Word 2003.

«Изображение головы человека» - Иные холодные, мертвые лица Закрыты решетками, словно темница. Другие - как башни, в которых давно Никто не живет и не смотрит в окно. Какие бывают портреты? Пропорции лица человека. Изображение черт лица. Лицо и эмоции человека. Н. Заболоцкий. Какие бывают лица? Рисунок головы человека. Поистине мир и велик и чудесен!

«Растровые изображения» - Выводы по эксперименту. Красный. Какие основные цвета использует ком-пьютер? Растровое кодирование графической информации. Растровое изображение. Пиксели разных цветов. Голубой (бирюзовый). Серый. Розовый. Палитра современных компьютеров. Все цвета можно пронумеровать, а каждый номер перевести в двоичный код.

Изображение и его ортогональные преобразования

Заключение диссертации по теме "Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей", Умняшкин, Сергей Владимирович

Список литературы диссертационного исследования доктор физико-математических наук Умняшкин, Сергей Владимирович, 2001 год

А также другие работы, которые могут Вас заинтересовать

Алгоритмы цифровой компрессии изображений с использованием ортогональных преобразований

Интересные статьи

Интересные статьи