55
Анализ изображений и видео Лекция 1: Введение в анализ изображений Наталья Васильева Артамонов Алексей [email protected] [email protected] HP Labs Russia Yandex 10 сентября 2014, Computer Science Center

Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

Embed Size (px)

Citation preview

Page 1: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

Анализ изображений и видеоЛекция 1: Введение в анализ изображений

Наталья Васильева Артамонов Алексей[email protected] [email protected] Labs Russia Yandex

10 сентября 2014, Computer Science Center

Page 2: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

План лекции

•Введение в анализ изображений• Зачем нужен анализ изображений?•Почему это сложно?

•Организация и программа курса•Зрение человека и цифровое представление изображений

• Зрительное восприятие человека•Модели цвета•Цифровые изображения

Page 3: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2013 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Откуда берутся цифровые изображения?

Page 4: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.Слайд K. Grauman

Page 5: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Что полезного можно узнать из картинок?

Page 6: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Медицина

• Выявление аномалий• Диагностика заболеваний• Моделирование организма и предсказание последствий лечения

Page 7: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Системы безопасности

● Обнаружение «подозрительных» предметов● Идентификация лиц, находящихся «в розыске» ● Авторизация доступа по отпечаткам пальцев Записи видеонаблюдений● Записи видеонаблюдений● Отпечатки пальцев, снимки сетчатки глаза, изображения лиц

Page 8: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Визуальный контроль качества

В промышленности

(a) (б) (в) (г)

(д)

(а) CD-ROM контроллер – все детали на месте?(б) Все таблетки на месте?(в) Контроль за уровнем жидкости в бутылках(г) Контроль за качеством пластика(д) Контроль за качеством кукурузных хлопьев!

Page 9: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Индексирование и поиск изображений

•Персональные коллекции (тысячи фотографий)•Коллекции профессиональных фото (миллионы фотографий)•Коллекции репродуций (миллионы фотографий)•Навигация•Поиск дубликатов•Выбор «лучшей» фотографии•Автоматическое создание коллажей (http://www.snapfishlab.com/)• Защита авторских прав

Page 10: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Еще приложения

Военная промышленность• Системы слежения и целенаведения

Кино, компьютерные игры, виртуальная реальность• Моделирование, 3D-реконструкция

Автомобилестроение• Автоматическое управление автомобилем

http://www.pauldebevec.com/

Page 11: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

И еще...

Робототехника• Зрение роботов

Обработка сенсорных данных• Зондирование земной поверхности

Оцифровка печатных документов• Обнаружение и распознавание текста

Page 12: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как?

Page 13: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Мы бы хотели...

• чтобы компьютер «понимал» семантику сцены на изображении• автоматически распознавать что и где изображено

• категоризировать и идентифицировать объекты, определять их свойства и отношения

Slide credit: M. Everingham

Page 14: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как «видит» изображение компьютер?

Растровое изображение

Page 15: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как видим изображение мы?

Page 16: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как видим изображение мы?

Page 17: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.Слайд K. Grauman

Page 18: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Семантический разрыв

Объекты (область изображения)

Текстура(окрестность пикселя)

Цвет, яркость(один пиксель)

семантика

низкоуровневыепризнаки

семантический разрыв

Уровни содерж

ания

изображ

ения

Характеристикиобъектов

Page 19: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как компьютеру «понять» изображение?

Page 20: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как компьютеру «понять» изображение?

Не надо понимать все. Можно решать конкретную задачу.

Page 21: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

● Распознавание лиц● Распознавание позы● Распознавание действия● Выделение текстуры● Выделение областей, однородных по

цвету● Распознавание объектов● Сегментация изображений● Классификация изображений● Поиск изображений● Обнаружение и распознавание текста

Примеры задач

Page 22: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Что такое анализ изображений?

Анализ изображений – извлечение значимой информации из изображений

• “Computing properties of the 3D world from one or more digital images” (Trucco and Veri)

• “Make useful decisions about real physical objects and scenes based on sensed images” (Shapiro)

• “The construction of explicit, meaningful description of physical objects from images” (Ballard and Brown)

Page 23: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Опишите фотографию словамиЧто такое анализ изображений?

Маленькая девочка ест мороженое на улице. Одета в джинсы и футболку с длинным рукавом. На заднем фоне панельные дома. Один из них голубого цвета в белую клетку.

Распознавание лицРаспознавание позыРаспознавание действияВыделение текстурыВыделение областей, однородных по цветуРаспознавание объектов

Page 24: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Связь с другими дисциплинами

Обработка изображенийImage Processing

Анализ изображенийImage Analysis

Компьютерное зрениеComputer vision

Компьютерная графикаComputer graphics

Изображение Изображение

Вектор признаков,модель

ИзображениеРаспознавание образов (Pattern recognition)

Машинное обучение (Machine learning)

Анализ данных (Data mining)

Обработка сигналов (Signal processing)

Искусственный интеллект (Artificial intelligence)

СтатистикаНейропсихология

Page 25: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

План лекции

•Введение в анализ изображений• Зачем нужен анализ изображений?•Почему это сложно?

•Организация и программа курса•Зрение человека и цифровое представление изображений

• Зрительное восприятие человека•Модели цвета•Цифровые изображения

Page 26: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Программа курса

•Пространственная и частотная обработка изображений•Математическая морфология•Построение признаков и сравнение изображений•Поиск по подобию, поиск нечетких дубликатов•Классификация изображений и распознавание объектов

•Сегментация изображений•Обнаружение и распознавание лиц•Обнаружение текста•Основы обработки видео• Распознавание событий в видео

Page 27: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

План лекции

•Введение в анализ изображений• Зачем нужен анализ изображений?•Почему это сложно?

•Организация и программа курса•Зрение человека и цифровое представление изображений

• Зрительное восприятие человека•Модели цвета•Цифровые изображения

Page 28: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Несколько фактов о нашем зрительном восприятии

Наш мозг часто «достраивает» картинку и добавляет семантику (Мы все можем узнать «что-то» или «кого-то» в очертании облака)Зрительная система самообучается• Европейцу сложно различать лица азиатов•Мы ищем знакомые образы в картинке

Page 29: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Несколько фактов о нашем зрительном восприятии

Наш мозг часто «достраивает» картинку и добавляет семантику (Мы все можем узнать «что-то» или «кого-то» в очертании облака)Зрительная система самообучается• Европейцу сложно различать лица азиатов•Мы ищем знакомые образы в картинке

Page 30: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Несколько фактов о нашем зрительном восприятии

− Мы ищем знакомые образы, мозг «достраивает» картинку

Известные оптические иллюзии

Page 31: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Несколько фактов о нашем зрительном восприятии

От того, где мы выросли, зависит, как мы «видим» мир вокруг нас

Ступеньки вверх или вниз?

Page 32: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Несколько фактов о нашем зрительном восприятии

От того, где мы выросли, зависит, как мы «видим» мир вокруг нас

Ступеньки вверх или вниз?• Арабы ответят «сверху вниз»

Page 33: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Яркостная адаптация и контрастная чувствительность

− Зрительная система способна адаптироваться к диапазону значений яркости порядка1010

− Субъективная яркость – логарифмическая функция от физической яркости

Page 34: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Яркостная адаптация и контрастная чувствительность

− Зрительная система не способна работать во всем диапазоне одновременно

Диапазон субъективной яркости при адаптации к уровню Ba

Уровни яркости ниже Bb субъективно воспринимаются как черные

Page 35: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Отношение Вебера

– Отношение Вебера

�Ic – приращение яркости, различимое в 50% случаев на фоне яркости I

Контрастная чувствительность – отношение Вебера

Зависимость отношения Вебера, как функции яркостиНизкая

контрастная чувствительность

Высокая контрастная чувствительность

Page 36: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Воспринимаемая яркость как функция истинной яркостиПолосы Маха

Page 37: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Воспринимаемая яркость как функция истинной яркостиОдновременный контраст

Page 38: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Восприятие цвета

Спектральная чувствительность колбочек трех групп

Три группы колбочек, различающихся чувствительностью к свету с различной длиной волны:

• S-колбочки: короткие волны (blue)• M-колбочки: средние волны (green)• L-колбочки: длинные волны (red)

Page 39: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Восприятие цвета

− Человек воспринимает цвета, как различные сочетания «первичных» цветов: красного, зеленого и синего.

− Сочетание первичных цветов дает вторичные: пурпурный (R+B), голубой (G + B) и желтый (R + G).

− Для красителей – первичный цвет поглощает один первичный основной цвет светового источника.

Аддитивные первичные цвета (световые источники)

Первичные и вторичные цвета

Субтрактивные первичные цвета (красители)

Page 40: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Светлота, цветовой тон и насыщенность

− Светлота связана со зрительным ощущением интенсивности− Цветовой тон характеризует доминирующий цвет− Насыщенность связана с относительной белизной цвета

− Цветовой тон и насыщенность вместе называют цветностью

Page 41: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

От координат цвета к координатам цветности

− Величины красного, синего и зеленого, необходимые для получения некоторого цвета называются координатами цвета и обозначаются как X, Y, and Z

− Цветовой тон и насыщенность можно выразить в координатах цветности:

Page 42: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Диаграмма цветности

Диаграмма цветности МКОCIE xy Chromaticity Diagram

− Создана Международной Коммиссией по Освещению (МКО) в 1931.

− Функция от x (red) и y (green) :z = 1 – (x + y).

− Вдоль границы – цвета спектра. − (x,y) = (1/3, 1/3) - опорный белый цвет стандарта МКО, точка равной энергии.

− Любая точка на границе имеет максимальную насыщенность.

− Граница → точка равной энергии: насыщенность → 0

The CIE 1931 chromaticity diagram.

Page 43: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Цветовой охват

Color Gamut

Gamut of the CIE RGB primaries and location of primaries on the CIE 1931 xy chromaticity diagram.

Typical gamuts of a monitor and of a printing device.

printing devicecolor gamut

RGB monitorcolor gamut

Page 44: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Цветовые пространства

• Назначение цветового пространства (цветовой модели, системы цветов) – стандартизация описания цвета

• Цветовая модель определяет систему координат и подпространство внутри этой системы, в котором каждый цвет представлен единственной точкой

• Распространенные цветовые пространства:− RGB (мониторы, видеокамеры),− CMY/CMYK (принтеры),− HSI/HSV/HSL/HSB (обработка изображений),− CIE Lab (обработка изображений).

Page 45: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

RGB

Если R,G, и B задаются 8 битами (24-битное RGB изображение), то число цветов (28)3=16,777,216

Page 46: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Цветовая система Манселла

− Разработана профессором Альбертом Манселлом в начале 20 века

− Координаты: цветовой тон светлота (значение), насыщенность (хрома).

Page 47: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Цветовые пространства HSI/HSL/HSV/HSB

− RGB, CMY/CMYK ориентированы на устройства цветовоспроизведения (мониторы, принтеры)

− HSI/… (Hue, Saturation, Intensity/Lightness/ Value/Brightness) соответствуют цветовосприятию человека

− Позволяют отделить цветность (H+S) от яркости (I).

Page 48: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Graphical depiction of HSV (cylinder and cone)

http://www.easyrgb.com/index.php?X=MATH

Graphical depiction of HSL

Цветовые пространства HSI/HSL/HSV/HSB

Page 49: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Модель CIE L*a*b

− Аппаратно-независимая и зрительно однородная цветовая модель.

− Позволяет соотносить цветовые охваты мониторов и принтеров− Компоненты L*a*b* задаются так:

Lightness 75%

Lightness 25%

Page 50: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Пространство HCL

CIE Lab color space

HCL color space

Page 51: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Представление цифровых изображений

Растровое изображение

Page 52: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Представление цифровых изображений

Цветное растровое изображение:

Page 53: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Параметры растрового изображения

Размерность (Raster dimensions)

Разрешение (Resolution - ppi)

Число уровней (обычно 2k)

Фиксированная размерность, изменяем разрешение

Фиксированное разрешение, изменяем размерность

Page 54: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Параметры растрового изображения

Одно изображение с различным числом уровней:

16 levels 8 levels 4 levels 2 levels

Распространено: 8 bit (256 уровней), 16 bit – png, tiff

Page 55: Анализ изображений и видео, часть 1, осень 2016: Введение в анализ изображений

© Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Заключение

•Что такое и зачем нужен анализ изображений?

– Медицина, промышленность, киноиндустрия, поиск и индексирование коллекций

•Основные сложности– Семантический разрыв, устойчивость к различиям в освещенности, позе, смене точки съемки, перекрыванию объектов (occlusion), внутривидовому разнообразию

• Зрительное восприятие человека– Основные факты

•Представление цвета– Рассмотрели различные цветовые пространства

•Цифровое представление изображений– Растровые изображений