38
Автоматическая система реального времени для обнаружения объектов и ориентиров на изображении, основанная на обработке цветных изображений Кий К.И . Институт Прикладной Математики им. Келдыша РАН, IKI Таруса 2010

Постановка задачи и связь с предыдущими исследованиями

Embed Size (px)

DESCRIPTION

Автоматическая система реального времени для обнаружения объектов и ориентиров на изображении, основанная на обработке цветных изображений Кий К.И . Институт Прикладной Математики им. Келдыша РАН , IKI Таруса 2010. Постановка задачи и связь с предыдущими исследованиями. - PowerPoint PPT Presentation

Citation preview

Page 1: Постановка задачи и связь с предыдущими исследованиями

Автоматическая система реального времени для обнаружения объектов и

ориентиров на изображении, основанная на обработке цветных изображений

Кий К.И.Институт Прикладной Математики им. Келдыша РАН,

IKI Таруса 2010

Page 2: Постановка задачи и связь с предыдущими исследованиями

Постановка задачи и связь с предыдущими исследованиями

• Задача обобщенной сегментации цветных изображений и поиска ориентиров

• Выделить на цветном изображении однородные части реальных объектов и построить их сжатое описание, содержащие описание формы и полутоновое и цветовое описания без индексирования точек массива изображения.

• Обеспечить выполнение процедур в реальном времени на современных мобильных компьютерах.

• Задача примыкает к исследованиям по сегментации цветных изображений и выделению объектов интереса (salient features).

• Существенное отличие состоит в том, что мы не решаем задачу преобразования изображения в субъективно подобное, но использующее меньшие диапазоны цветов.

Page 3: Постановка задачи и связь с предыдущими исследованиями

Построение геометризованной гистограммы изображения

Изображение, задаваемое скалярной функцией интенсивности (черно-белое, инфракрасное, и т.д.)

I. Локальная конструкция1. Изображение разбивается на узкие горизонтальные

(вертикальные) полосы.

2. Каждое множествo уровня интенсивности проектируется на горизонтальную (вертикальную) ось. Его проекция является набором отрезков на горизонтальной (вертикальной) оси. Каждому интервалу предписывается его мощность (число точек полосы, спроектированных на этот интервал.

3. В соответствие каждой полосе изображения ставится в соответствие множество интервалов на горизонтальной вертикальной оси координатной системы изображения. Каждому интервалу предписано определенное значение интенсивности и мощности.

Page 4: Постановка задачи и связь с предыдущими исследованиями

Изображение, множество отрезков для всех уровней, и сгустки в полосе

Page 5: Постановка задачи и связь с предыдущими исследованиями

Кадр из Бури в Пустыне, описание полосы изображения

Page 6: Постановка задачи и связь с предыдущими исследованиями

Множество отрезков, соответствующее 20ой полосе полутоновой компоненты изображения

Page 7: Постановка задачи и связь с предыдущими исследованиями

• Предложение. Описанное выше отрезковое описание полосы изображения может быть получено за один проход массива изображения полосы и сложность его получения линейно зависит от числа пикселов.

• Gi - множество интервалов, соответствующее i-ой полосе,

называется геометризованной гистограммой этой полосы

• G= Gi - объединение геометризованных гистограмм для

всех полос называется глобальной геометризованной гистограммой изображения, соответствующей заданному разбиению изображения на полосы.

• Если обозначить B конечное упорядоченное множество, нумерующее полосы, то мы можем рассмотреть проекцию

• p: G →B, слоями которой являются Gi .

Page 8: Постановка задачи и связь с предыдущими исследованиями

Топологические структуры на G, задаваемые неевклидовыми мерами близости

• ri (I, J) = L(I∩J)/Si (I, J) i = 1, 2;

• S1(I, J) = max (L(I), L(J)),

• S2(I, J) = min (L(I), L(J));

• L(I), L(J), L(I∩J) - длины соответствующих отрезков;

• di (I, J) =1 - ri (I, J) - соответствующие псевдо-метрики.

Page 9: Постановка задачи и связь с предыдущими исследованиями

Геометризованная гистограмма, соответствующая распределениям цвета

• Цветовая компонента задается парой G/(G+B), G/(G+R) или G/(G+B), R/(R+B). Вместе с полутоновой компонентой I получаем систему координат G/(G+B), G/(G+R), I и G/(G+B), R/(R+B), I , где (R, G, B) координаты стандартного представления цветных изображений.

• Пары G/(G+B), G/(G+R) и G/(G+B), R/(R+B) задают представление цвета эквивалентное представлению, задаваемому парой (H, S) (оттенок, насыщение), так как любая пара однозначно определяет любую внутреннюю точку цветового треугольника.

• Необходимо построить геометризованную гистограмму для заданного распределения цветов (цветного изображения), т.е. необходимо построить расслоение отрезков аналогичное расслоению отрезков для скалярной функции интенсивности.

Page 10: Постановка задачи и связь с предыдущими исследованиями

Стандартный цветовой треугольник

Hue

(r,g,b)

O

G/(G+B)

R/(R+B) G/(R+G)

R

B G

Page 11: Постановка задачи и связь с предыдущими исследованиями

Системы координат G/(G+B), R/(R+B) и G/(G+B), G/(G+R)

Page 12: Постановка задачи и связь с предыдущими исследованиями

Изображения G/(G+B), G/(G+R), и Grayscale

Page 13: Постановка задачи и связь с предыдущими исследованиями

Изображение комнаты и его компоненты

Page 14: Постановка задачи и связь с предыдущими исследованиями

Изображение коридора и три его компоненты

Page 15: Постановка задачи и связь с предыдущими исследованиями

Изображение темного коридора и его компоненты

Page 16: Постановка задачи и связь с предыдущими исследованиями

Изображение дорожной обочины

Page 17: Постановка задачи и связь с предыдущими исследованиями

Построение геометризованной гистограммы для цветных изображений

• Тривиальный способ: строится геометризованная гистограмма для компоненты G/(G+B) и дополнительно каждый интервал снабжается гистограммой распределения уклонения от среднего значения другого отношения, например G/(G+R), и дополнительно для каждого отрезка вычисляются верхнее и нижнее значение полутоновой компоненты.

• Данный метод хорошо работает, например, на изображениях дорожных сцен на фоне растительности и плохо работает на сложных сценах со многими предметами разных цветов – объекты не различаются на уровне построения локальной геометризованной гистограммы.

• Правильный метод состоит в учете обеих компонент G/(G+B) и G/(G+R) при построении системы отрезков локальной геометризованной гистограммы. Этот метод есть некоторая аналогия человеческой зрительной системы (теория Геринга трех стрелок измерительных приборов).

Page 18: Постановка задачи и связь с предыдущими исследованиями

Процедура расширения диапазона значений G/(G+B)

• Рассмотрим случай G/(G+B) >= 0.5 (остальные случаи аналогичны). Пусть G/(G+B) принимает дискретные значения 0,…,k.

• Если точка, определяемая парой G/(G+B), G/(G+R), имеет оттенок из желтой области, то расширенной функции CF=G/(G+B)ext присваивается значение G/(G+B). В случае если точка попадает в зеленой или красный диапазоны, значения G/(G+B)ext увеличиваются на k + 1 и 2(k + 1), соответственно.

• Для CF строится система интервалов в полосе также как это делалось для G/(G+B) . Каждый интервал снабжается классической гистограммой уклонений значений G/(G+R) от среднего значения в точках полосы, соответствующих заданному интервалу, значением мощности интервала, и верхним, нижним и средним значением полутоновой компоненты.

Page 19: Постановка задачи и связь с предыдущими исследованиями

Корректировка функции CF для отделения бесцветных и темных компонент

• Вводятся дополнительные значения CF, чтобы описывать объекты, которые имеют “наивный” белый, серый (светло-серый, темно-серый) и черный цвета. Кроме того темные но окрашенные компоненты интегрируются по аналогии с человеческим зрением.

• Для каждой цветовой области устанавливаются свои правила (диапазоны значений полутоновой компоненты) принадлежности к определенному наивному цвету.

• Данная процедура принудительным образом делает бесцветные компоненты однородными по отношению к полутону.

• Темным компонентам присваиваются некоторые интегрированные цвета.

Page 20: Постановка задачи и связь с предыдущими исследованиями

Выделение однородных окрашенных интервалов геометризованной гистограммы

• Полученные интервалы геометризованной гистограммы характеристической функции CF в зависимости от гистограммы уклонений оппонентного отношения (R/(R+B) или G/(G+R)) признаются однородными или неоднородными в цветовом отношении.

• Аналогичная процедура проводится для определения полутоновой однородности с рассмотрением ширины полутонового и диапазона и уклонения среднего значения от верхней и нижней границ диапазона.

Page 21: Постановка задачи и связь с предыдущими исследованиями

Процедура согласования результатов с человеческим зрением

• Определение заметных и незаметных цветов окрашенных интервалов.

• Основываясь на средних значениях и диапазонах численных характеристик окрашенных интервалов, их мощности, а также характеристик окружения по некоторым правилам определяется заметен ли сам интервал и его цвет.

Page 22: Постановка задачи и связь с предыдущими исследованиями

Пример геометризованной гистограммы с обработкой

Page 23: Постановка задачи и связь с предыдущими исследованиями

Процедуры построения сгустков (color bunches) интервалов в геометризованной гистограмме

полосы• Выбираются интервалы имеющие однородный заметный

цвет и сами признанные заметными.• Устраивается процедура выживания сильнейших

интервалов. Интервалы бросаются на прямую и в каждой точке выживает сильнейший интервал (имеющий максимальную плотность). Данная процедура проделывается итеративно и в нескольких цветовых диапазонах. Интервалы упорядочиваются в зависимости от доли точек, в которых они выжили. Выжившие интервалы берутся как семена при построении кластеров. Кластеры строятся с помощью метрик, описанных выше.

• Проводятся различные процедуры, устраняющие дублирование. Кластерам приписываются некоторые средние значения H (hue) и S (saturation) и I и диапазоны вариации их значений а также интервал на оси полосы.

Page 24: Постановка задачи и связь с предыдущими исследованиями

Построение структурного графа

• Вершины графа STG – цветовые сгустки для всех полос разбиения изображения. Граф разбивается на несколько слоев, каждый слой соответствует цветовым сгусткам одной полосы.

• Определяются соседние цветовые сгустки в одинаковых слоях (соответствующих одной полосе) и в соседних слоях (соответствующих соседним полосам). Сгустки являются соседними если их интервалы пересекаются или близки в смысле близостей, подобных приведенным выше.

• Слева направо (или справа налево) строятся последовательности ребер графа STG. Каждый цветовой сгусток соединяется с соседним сгустком в соседнем слое имеющим наиболее близкие и сходные цветовые характеристики.

Page 25: Постановка задачи и связь с предыдущими исследованиями

Структурный граф изображения коридора с человеком в кадре. Вертикальные прямые соответствую горизонтальным полосам изображения с соответствующими номерами, окрашенные квадраты – цветовым сгусткам, отрезки прямых – ребрам графа.

Page 26: Постановка задачи и связь с предыдущими исследованиями

Построение глобальных объектов

1. Строятся непрерывные системы сгустков окрашенных интервалов, которые соответствую путям на структурном графе таким, что каждый путь содержит по одной точке в каждом слое. По аналогии с теорией расслоений такие непрерывные системы называются сечениями.

2. Глобальные окрашенные объекты-сечения используются как кубики, из которых складываются реальные окрашенные объекты в кадре. Геометрически глобальные объекты соответствуют связным компонентам ребер графа.

3. Более сложные многоцветные сложные объекты складываются из соседних окрашенных объектов.

Page 27: Постановка задачи и связь с предыдущими исследованиями

Примеры глобальных объектов-сечений

Page 28: Постановка задачи и связь с предыдущими исследованиями

Примеры построения цветовых сгустков

Page 29: Постановка задачи и связь с предыдущими исследованиями

Поиск ориентиров

Page 30: Постановка задачи и связь с предыдущими исследованиями

Структурный граф

Page 31: Постановка задачи и связь с предыдущими исследованиями

Уличная сцена

Page 32: Постановка задачи и связь с предыдущими исследованиями

Структурный граф уличной сцены

Page 33: Постановка задачи и связь с предыдущими исследованиями

Другие примеры

Page 34: Постановка задачи и связь с предыдущими исследованиями

Снимки с конференции

Page 35: Постановка задачи и связь с предыдущими исследованиями

Выделенные объекты

Page 36: Постановка задачи и связь с предыдущими исследованиями

Программная реализация

• Система реализована в С++ (Visual Studio 2008) вместе со средствами сопряжения с вводом изображений из телекамер с использованием DirectX SDK.

• Скорость обработки для цветных изображений 640х480 8-10 fps, для изображений 320х240, в четыре раза быстрее. Однокомпонентные изображения обрабатываются в 6 раз быстрее цветных изображений.

• Система имеет средства для работы через сеть, включая работу через Internet.

Page 37: Постановка задачи и связь с предыдущими исследованиями
Page 38: Постановка задачи и связь с предыдущими исследованиями

• Выводы• Разработан новый метод представления сцен, основанный на

понятии геометризованной гистограммы, удобный для решения задач понимания изображений в реальном времени.

• Основу представления данных составляет структурный граф, поставленный в соответствие любому цветному изображению.

• Геометризованная гистограмма и структурный граф позволяют разделять и находить различные предметы на изображениях.

• Предложенная техника дает подход к интерпретации цветовых характеристик объектов на изображении сходной с интерпретацией, выполненной человеком.

• Разрабатывается система поиска ориентиров на изображениях, основанная на развитой технике.

• Необходимо строить разные правила интерпретации, повысить точность используемых параметров, и организовать процедуру обучения с целью выбора оптимальных правил для разных классов изображений.