Способ сжатия и восстановления данных видеоизображения

Номер патента: 6638

Опубликовано: 24.02.2006

Автор: Прохнов Уве

Скачать PDF файл.

Формула / Реферат

1. Способ сжатия и восстановления данных видеоизображения, которые представлены в виде последовательности пикселей с двумерной адресацией ассоциированных пиксельных данных, причем пиксельные данные выбранных количеств пикселей анализируются с использованием математических функций и сжимаются с уменьшением до параметров их функций и после сохранения и/или передачи восстанавливаются с использованием соответствующей математической функции для их дальнейшего преобразования, отличающийся тем, что в первичном анализе видеоданных видеоизображения

определяются контуры структур изображения на основе непоследовательных изменений в значении цвета и/или яркости в случае смежных друг с другом пикселей,

выполняется сглаживание и замыкание контуров посредством интерполяции,

обнаруженные таким образом контуры описываются в сегментах и в каждом случае посредством параметризованной математической функции и определяются как объекты, причем все объекты, содержащие количество пикселей, меньшее предварительно определенного порога, назначаются фоном,

для индивидуальных объектов и для фона в каждом случае определяется вектор цветового преобладания и вектор цветового развития,

в каждом случае векторно определяются позиция и протяженность индивидуальных объектов,

для индивидуальных объектов и для фона в каждом случае определяется структурная функция в соответствии с направлением и размером,

и в случае последующего анализа видеоизображений в каждом случае определяются дифференциальные изменения в яркости, размере, позиции и ориентации объектов с учетом общих контуров объектов, примыкающих друг к другу,

определенные таким образом объекты и фон совместно с их оптическими, позиционными и структурными данными используют в структурированном первичном кадре или последующем кадре,

обеспеченные данные первичного кадра и данные последующего кадра, соответственно, преобразуют в данные пикселя для восстановления и вторичной обработки изображения,

из данных первичного кадра из объектов определяются соответствующие им данные позиции контура в точечно-растровом изображении,

для фона изображения и объектов с границами, определенными, соответственно, на основе данных позиции контура, точечно-растровое представление заполняется данными пикселя, соответствующими заданной ассоциированной структурной функции,

которые воссоздаются в соответствии со значением вектором цветового преобладания и вектором цветового развития, а также значением яркости, и

данные последующего кадра применяются в каждом случае к предыдущему точечно-растровому представлению для перемещения и/или изменения объектов.

2. Способ по п.1, отличающийся тем, что описанные объекты сохраняются их математическими функциями в нейронной сети (NN1), которая служит для дальнейшего распознавания (OE) объектов в данных синтезированного изображения (VD).

3. Способ по любому из предыдущих пунктов, отличающийся тем, что структурные функции (OS), которые были определены, сохраняются со своими параметрами объектов и фона в нейронной сети (NN2), которая служит в качестве исходной базы при дальнейшем определении структурных функций (OS) с их параметрами.

4. Способ по любому из предыдущих пунктов, отличающийся тем, что структурная функция (OS) в каждом случае представлена как математическая функция, а параметры являются целочисленными величинами, и функция обеспечивает неограниченное количество позиций после десятичной точки.

5. Способ по п.4, отличающийся тем, что структурной функцией (OS) является дробь, n-ый корень или трансцендентная функция.

6. Способ по п.4 или 5, отличающийся тем, что целочисленные величины представлены, кодированы как степени простых чисел, а также их суммы или разности.

7. Способ по любому из пп.4-6, отличающийся тем, что параметры представлены как числа по модулю 2 в степени 8 и функция выполняется с величинами, которые представлены как числа по модулю 2 в степени 8, и обеспечивает такие величины как позиции после десятичной точки.

8. Способ по любому из пп.4-7, отличающийся тем, что индивидуальные структурные функции (OS) в каждом случае определяются приблизительно соответствующими последовательности данных пикселей сегмента строки изображения предварительно определенной длины или прямоугольного сегмента точечно-растрового изображения.

9. Способ по п.8, отличающийся тем, что сегмент строки имеет длину в 64, 128 или 256 байтов, или сегмент точечно-растрового изображения имеет размер 8 по 8 или 16 по 16 байтов.

10. Способ по любому из пп.8 или 9, отличающийся тем, что структурная функция (OS) в каждом случае настраивается посредством последовательного приближения к последовательности данных пикселя, которая должна быть приблизительно представлена в каждом случае так долго или с такой точностью, как определяется конкретизацией времени (TMAx) или конкретизацией точности.

11. Способ по п.10, отличающийся тем, что конкретизация времени или конкретизация точности определяется в зависимости от позиции или заданной скорости изменения позиции заданного объекта, причем для объектов, лежащих и/или остающихся в центральной части изображения, назначается более длительное время и/или более высокая точность, чем для объектов с края и/или объектов, относительно быстро перемещающихся, и/или для фона.

12. Способ по любому из предыдущих пунктов, отличающийся тем, что в каждом случае идентификации и обработке подвергаются только такие объекты, которые имеют минимальное количество пикселей, и меньшие объекты назначаются фоном.

13. Способ по п.12, отличающийся тем, что объекты обрабатываются последовательно с уменьшением количества пикселей до тех пор, пока позволяет доступное время вычисления, вследствие чего при кодировании содержимого изображения определяется минимальное количество пикселей объектов в соответствии с доступным временем вычисления.

Рисунок 1

 

Текст

Смотреть все

006638 Изобретение относится к способу сжатия и восстановления данных видеоизображения в последовательностях видеоизображений или подобных им, которые представлены в виде последовательности в каждом случае пикселей с двумерной адресацией ассоциированных пиксельных данных, причем в каждом случае пиксельные данные выбранных количеств пикселей анализируются с использованием математических функций и сжимаются с уменьшением до параметров их функций и после сохранения и/или передачи восстанавливаются с использованием соответствующей математической функции для их дальнейшего преобразования. Такие способы стали известны по стандартам ISO MPEG с MPEG1 по MPEG4, JPEG и т.д. В этом случае посредством дифференциального анализа, анализа образцов, анализа Фурье или подобного анализа данных количества пикселей сегментов изображения, так называемых элементов мозаичного изображения, и, в частности, таких данных элемента мозаичного изображения относительно данных элемента мозаичного изображения, элемента мозаичного изображения с идентичными координатами строки изображения и координатами столбца изображения предыдущего видеоизображения, определяются параметры функции и с учетом изменений в этих последовательностях видеоизображений представляются согласно утвержденным стандартным форматам кадра. Форматы кадра в каждом случае содержат указание соответствующей функции сжатия, которая в каждом случае выбирается для более сильного сжатия содержимого последовательных изображений или элементов мозаичного изображения в идентичной позиции в таких изображениях и параметров, полученных при применении функции в каждом случае. Для восстановления в каждом случае из каждого кадра берется информация относительно заданной функции сжатия и в соответствии с ней посредством соответствующей функции и обеспеченных параметров, а также, возможно, данных элемента(ов) мозаичного изображения по меньшей мере одного предыдущего изображения сохраняется исходное количество пикселей внутри границы допуска. Задачей изобретения является обеспечение существенно большего сжатия данных при прохождении данных последовательностей сегментированных изображений в реальном масштабе времени с качеством почти идентичным качеству известных способов. Решение задачи состоит в том, что в первичном анализе данных изображения видеоизображения определяются контуры структур изображения на основе непоследовательных изменений в значении цвета и/или яркости в случае смежных друг с другом пикселей,выполняется сглаживание и замыкание контуров посредством интерполяции,обнаруженные таким образом контуры описываются в сегментах и в каждом случае посредством параметризованной математической функции и определяются как объекты, причем все объекты, содержащие количество пикселей, меньшее предварительно определенного порога, назначаются фоном,для индивидуальных объектов и для фона в каждом случае векторно определяется цветовое преобладание и цветовое развитие в соответствии с направлением и размером, в каждом случае векторно определяются позиция и протяженность индивидуальных объектов,для индивидуальных объектов и для фона в каждом случае определяется структурная функция,и в случае последующего анализа видеоизображений в каждом случае определяются дифференциальные изменения в яркости, размере, позиции и ориентации объектов с учетом общих контуров объектов, примыкающих друг к другу,определенные таким образом объекты и фон совместно с их оптическими, позиционными и структурными данными, которые получены таким образом, организовываются и обеспечиваются в структурированном первичном кадре или последующем кадре,обеспеченные данные первичного кадра и данные последующего кадра, соответственно, преобразовываются в данные пикселя для восстановления и вторичной обработки изображения,из данных первичного кадра из объектов определяются соответствующие им данные позиции контура в точечно-растровом изображении,для фона изображения и объектов с границами, определенными, соответственно, на основе данных позиции контура, точечно-растровое представление заполняется данными пикселя, соответствующими заданной ассоциированной структурной функции,которые воссоздаются в соответствии со значением цветового преобладания и вектором цветового развития, а также значением яркости, и данные последующего кадра применяются в каждом случае к предыдущему точечно-растровому представлению для перемещения и/или изменения объектов. Предпочтительные варианты осуществления определены в зависимых пунктах формулы изобретения. Определение и описание объектов на основе их контуров и структур приводит к чрезвычайно сильному сжатию данных по сравнению с стандартными способами, в которых в каждом случае обрабатываются отдельные прямоугольные сегменты без обнаружения и использования графических соединений большего размера. Для ускорения процесса на отдельных этапах процесса дополнительно применяются предпочтительные новые способы, которые также могут рассматриваться как независимые изобретения.-1 006638 Основываясь на информации о том, что многие объекты подобны другим в терминах их основной структуры, и их родства с другими, например в отношении человека, наличия головы, рук, верхней части туловища, нижней части туловища, ног и т.д. объекты, которые однажды были распознаны и охарактеризованы в терминах функции, сохраняются на основе их данных в нейронной сети, назначенной для данных контура соответствующих объектов и других, так что в каждом случае для обнаруженного объекта объекты, которые обычно примыкают к нему, позже могут быть расположены непосредственно и использованы для облегчения определения контура. Также можно взять компиляцию описаний математических функций различных объектов из нейронной сети, которая должна быть обозначена только соответствующими текущими параметрами, такими как радиус, вектор в средней точке, координаты начала и конца и т.д. Также структурная функция объекта часто идентична или близка к структурной функции аналогичных объектов, так что она может служить в качестве первого приближения при ее хранении в нейронной сети и извлечении оттуда. Предпочтительно очень сильное сжатие достигается при использовании информации о том, что пиксельные данные строки пикселов в каждом случае являются рядом чисел, который может быть представлен элементарными арифметическими операциями, выполняемыми над натуральными числами. В частности, деление и извлечение корня n-ной степени являются простыми операциями, которые дают более или менее хорошее приближение для пиксельных данных строки. Затем представление строки сжимается в кодированное указание функции и числовые данные, которые преимущественно представлены в виде суммы или разностей степеней простого числа. Каждое такое описание структуры, которое уже было размещено для последовательности пиксельных данных, предпочтительно хранится в нейронной сети, так что оно может использоваться непосредственно там или вызываться как первое приближение, когда позже имеет место аналогичная последовательность пиксельных данных. Так как функции, которые будут использоваться, являются элементарными и могут выполняться стандартными компьютерами с высокой скоростью как операции с фиксированной точкой, данные пикселя могут генерироваться из данных структуры во время выполнения воспроизведения изображения,восстановление сжатых данных не является проблематичным. Предпочтительно в терминах точности для совместимости отклонений сжатие данных изображения во время выполнения настраивается на отдельных его этапах. При определении данных контура, сглаживания и т.д. большее внимание уделяется высокой разрешающей способности перемещающихся объектов переднего плана, чем заднему плану и пассивным объектам, так как в каждом случае обработке объектов соответствуют различные максимальные времена вычисления. Дополнительно для остающегося свободного времени вычисления в каждом случае настраивается минимальное количество пикселей, для которых определяется объект. Вначале обрабатываются наибольшие объекты, и где еще остается время вычисления для времени изображения, из фона выделяются меньшие объекты, подробно описываются геометрически и структурно и размещаются в кадре. Для определения структурной функции объекта в каждом случае преимущественно конкретизируется максимальное время, причем используется информация о том, что отклонения отдельных данных элемента информации, если они не возникают в соседних друг другу группах, не приводят к какому-либо заметному ухудшению качества изображения, так как структура зависит только от общего вида поверхности объекта, но не от каких-либо деталей изображения. Для иллюстрации как возможный вариант структурной функции рассматривается следующее: х-ый корень из а в степени m +/- b в степени n, деленное на с в степени р +/- d в степени q; x = целое число 1-3; а, b, с, d = простые числа до 17; m, n, р, q = целые числа 1-9. В качестве количества пикселей, которое требуется проанализировать, берется, например, 256 пикселей в каждом случае сегмента строки изображения или сегмент 8x8 или 16x16 точечно-растрового изображения. Данные пикселя обычно кодируются в 8-бит. Соответственно, выполняются операции не десятичные или шестнадцатеричные, а по модулю 256, так что исходные данные, как данные кодирования и восстановленные целевые данные всегда представлены непосредственно в виде 8-битовых данных пикселя. Если анализируются несколько строковых сегментов строки изображения или последовательные строки изображения, соответствующее решение часто проистекает очень просто и экономично по времени из продолжения и/или перемещения на несколько позиций ранее применяемой структурной функции. Вместо новой структурной функции указывается изменение в ассоциированном кадре. На чертеже изображена блок-схема кодирования изображения. Данные изображения (VD) подвергаются постепенно различным этапам процесса. Вначале осуществляется распознавание объектов ОЕ, причем в качестве вспомогательной информации используются объекты 01, 02, которые были распознаны в изображении ранее, а также объекты,которые хранятся в первой нейронной сети NN1. Распознанные объекты подвергаются сглаживанию объектов OG с определенным пределом разрешающей способности MIN.-2 006638 Сглаженные объекты подвергаются описанию объектов с учетом отношений границ соседей, так что объекты 01, 02 и т.д. сохраняются функционально в кадре FR. Для индивидуальных объектов осуществляется установление OLV векторов положения и направления OL1, OL2 и т.д., а также описание цвета OFV посредством векторов цвета и векторов цветового развития OF1, OF2 и т.д. Дополнительно для объектов 01, 02 и т.д. определяются структурные функции и их параметры OS1,OS2 и т.д. преимущественно с использованием второй нейронной сети NN2 и размещаются в кадре FR также, как позиционные векторы и векторы цвета. Если все объекты записаны в кадре, определяются векторы цвета HGF и структуры фона HGS из фона HG и размещаются в кадре FR. Затем полный кадр FR изображения обеспечивается как статистический кадр FRH, содержимое которого, помеченное в каждом случае ссылочными позициями с звездочкой, становится доступным в виде исходного материала для кодирования следующего изображения. Если обнаружены только незначительные изменения цвета, позиции, структуры или ориентации объекта, то в следующем кадре указываются только изменения, что приводит к существенной экономии времени обработки, емкости памяти и объема передачи. Заданные описания объектов, их отношения соседства, а также структурные функции поставляются в базовые компоненты нейронных сетей NN1, NN2, чтобы аналогичные объекты и структуры были размещены и использовались при кодировании новых изображений. В каждом случае через устройство управления временем TMG осуществляется мониторинг времени кодирования, которое удерживается в пределах посредством соответствующих конкретизаций минимальной разрешающей способности MIN и максимального времени ТМАх структурного анализа. Альтернативно, вычисление структурной функции, как описано выше, может быть выполнено также предпочтительно шестнадцатеричными операциями, для которых обычная 8-битовая информация пикселя разделяется на два 4-битовых символа, и, соответственно, вычисляется и проверяется двойное число позиций для возможно большей адекватности. Соответственно, функции и параметры, в частности в связи с этим, также кодируются как шестнадцатеричные числа и упаковываются в кадр попарно в 8 битовых байтах. В зависимости от указанной функции требуется указать большее или меньшее количество параметров. Очень высокая плотность упаковки в кадре может быть достигнута, если в байте в каждом случае сохраняется три бита для восьми функций, три бита для восьми первых простых чисел и два бита для их экспонент из 1-4. Например, в виде элементов функции могут кодироваться четыре фундаментальных операции, функция извлечения корня и степенная функция, а также круглые скобки формулы. Для функций, заключенных в скобки, в других 5 битах байта могут быть указаны дополнительные специальные функции, такие как признак конца формулы или комплексные функции. ФОРМУЛА ИЗОБРЕТЕНИЯ 1. Способ сжатия и восстановления данных видеоизображения, которые представлены в виде последовательности пикселей с двумерной адресацией ассоциированных пиксельных данных, причем пиксельные данные выбранных количеств пикселей анализируются с использованием математических функций и сжимаются с уменьшением до параметров их функций и после сохранения и/или передачи восстанавливаются с использованием соответствующей математической функции для их дальнейшего преобразования, отличающийся тем, что в первичном анализе видеоданных видеоизображения определяются контуры структур изображения на основе непоследовательных изменений в значении цвета и/или яркости в случае смежных друг с другом пикселей,выполняется сглаживание и замыкание контуров посредством интерполяции,обнаруженные таким образом контуры описываются в сегментах и в каждом случае посредством параметризованной математической функции и определяются как объекты, причем все объекты, содержащие количество пикселей, меньшее предварительно определенного порога, назначаются фоном,для индивидуальных объектов и для фона в каждом случае определяется вектор цветового преобладания и вектор цветового развития,в каждом случае векторно определяются позиция и протяженность индивидуальных объектов,для индивидуальных объектов и для фона в каждом случае определяется структурная функция в соответствии с направлением и размером,и в случае последующего анализа видеоизображений в каждом случае определяются дифференциальные изменения в яркости, размере, позиции и ориентации объектов с учетом общих контуров объектов, примыкающих друг к другу,определенные таким образом объекты и фон совместно с их оптическими, позиционными и структурными данными используют в структурированном первичном кадре или последующем кадре,обеспеченные данные первичного кадра и данные последующего кадра, соответственно, преобразуют в данные пикселя для восстановления и вторичной обработки изображения,-3 006638 из данных первичного кадра из объектов определяются соответствующие им данные позиции контура в точечно-растровом изображении,для фона изображения и объектов с границами, определенными, соответственно, на основе данных позиции контура, точечно-растровое представление заполняется данными пикселя, соответствующими заданной ассоциированной структурной функции,которые воссоздаются в соответствии со значением вектором цветового преобладания и вектором цветового развития, а также значением яркости, и данные последующего кадра применяются в каждом случае к предыдущему точечно-растровому представлению для перемещения и/или изменения объектов. 2. Способ по п.1, отличающийся тем, что описанные объекты сохраняются их математическими функциями в нейронной сети (NN1), которая служит для дальнейшего распознавания (ОЕ) объектов в данных синтезированного изображения (VD). 3. Способ по любому из предыдущих пунктов, отличающийся тем, что структурные функции (OS),которые были определены, сохраняются со своими параметрами объектов и фона в нейронной сети(NN2), которая служит в качестве исходной базы при дальнейшем определении структурных функций(OS) с их параметрами. 4. Способ по любому из предыдущих пунктов, отличающийся тем, что структурная функция (OS) в каждом случае представлена как математическая функция, а параметры являются целочисленными величинами, и функция обеспечивает неограниченное количество позиций после десятичной точки. 5. Способ по п.4, отличающийся тем, что структурной функцией (OS) является дробь, n-ый корень или трансцендентная функция. 6. Способ по п.4 или 5, отличающийся тем, что целочисленные величины представлены, кодированы как степени простых чисел, а также их суммы или разности. 7. Способ по любому из пп.4-6, отличающийся тем, что параметры представлены как числа по модулю 2 в степени 8 и функция выполняется с величинами, которые представлены как числа по модулю 2 в степени 8, и обеспечивает такие величины как позиции после десятичной точки. 8. Способ по любому из пп.4-7, отличающийся тем, что индивидуальные структурные функции(OS) в каждом случае определяются приблизительно соответствующими последовательности данных пикселей сегмента строки изображения предварительно определенной длины или прямоугольного сегмента точечно-растрового изображения. 9. Способ по п.8, отличающийся тем, что сегмент строки имеет длину в 64, 128 или 256 байтов, или сегмент точечно-растрового изображения имеет размер 8 по 8 или 16 по 16 байтов. 10. Способ по любому из пп.8 или 9, отличающийся тем, что структурная функция (OS) в каждом случае настраивается посредством последовательного приближения к последовательности данных пикселя, которая должна быть приблизительно представлена в каждом случае так долго или с такой точностью, как определяется конкретизацией времени (ТМАх) или конкретизацией точности. 11. Способ по п.10, отличающийся тем, что конкретизация времени или конкретизация точности определяется в зависимости от позиции или заданной скорости изменения позиции заданного объекта,причем для объектов, лежащих и/или остающихся в центральной части изображения, назначается более длительное время и/или более высокая точность, чем для объектов с края и/или объектов, относительно быстро перемещающихся, и/или для фона. 12. Способ по любому из предыдущих пунктов, отличающийся тем, что в каждом случае идентификации и обработке подвергаются только такие объекты, которые имеют минимальное количество пикселей, и меньшие объекты назначаются фоном. 13. Способ по п.12, отличающийся тем, что объекты обрабатываются последовательно с уменьшением количества пикселей до тех пор, пока позволяет доступное время вычисления, вследствие чего при кодировании содержимого изображения определяется минимальное количество пикселей объектов в соответствии с доступным временем вычисления.

МПК / Метки

МПК: G06T 9/20, G06T 9/00

Метки: восстановления, данных, видеоизображения, способ, сжатия

Код ссылки

<a href="https://eas.patents.su/6-6638-sposob-szhatiya-i-vosstanovleniya-dannyh-videoizobrazheniya.html" rel="bookmark" title="База патентов Евразийского Союза">Способ сжатия и восстановления данных видеоизображения</a>

Похожие патенты