Computer vision infrastracture

Preview:

Citation preview

Итак, вы занимаетесь компьютерным зрением...

Slide 1 Антон Конушин

Тогда и сейчас

Как раньше был организован научный процесс…

А сейчас есть интернет!

30.07.2011 Slide 2

Что это означает?

Вас нет в интернете = вас не существует Все хотят посмотреть ваши результаты

Все хотят «пощупать» ваши результаты! Совместное творчество

Некоторые сложные задачи можно решить совместными усилиями

Нельзя оставаться в стороне! Конкурсы

Мы всё превращаем в соревнование!

30.07.2011 Slide 3

О чём буду говорить

Личные страницы, cv и блоги Учебные материалы Публикации и конференции Тестовые коллекции и конкурсы Код и библиотеки Совместные проекты, стажировки, школы

и т.д. Компании

30.07.2011 Slide 4

Личная страничка

30.07.2011 Slide 5

Что должно быть:

Имя (как же иначе) Фотография (приятно посмотреть) Кто вы и где вы Чем можете гордиться?

Публикации Проекты Курсы

Резюме (CV)

30.07.2011 Slide 6

Резюме

Резюме как копия страницы + формальнее + опыт работы

30.07.2011 Slide 7

Лаборатории

30.07.2011 Slide 8

Учебные материалы: книги

30.07.2011 Slide 9

http://research.microsoft.com/en-us/um/people/szeliski/Book/

Форсайт, Понс «Компьютерное зрение: современный подход)

R.Szeliski «Computer vision: Algorithm and applications»

Видеолекции

30.07.2011

http://videolectures.net

Slide 10

http://lektorium.tv

Курсы лекций

30.07.2011

Любой университет

Slide 11

Наш университет

Пример

30.07.2011 Slide 12

Публикации «Наше всё» Почему?

Документальное подтверждение ваших результатов с приоритетом и внешней независимой экспертизой

Publish or Perish http://en.wikipedia.org/wiki/Publish_or_perish

30.07.2011 Slide 13

«Track record»

Один из критериев оценки заявок Снобизм – только ведущие конференции

действительно котируются ведущими организациями!

30.07.2011 Slide 14

Система конференций

30.07.2011

Ведущие международные Siggraph (ориентирована на приложения и

индустрию, раз в год, август) CVPR (июнь, раз в год) ICCV / ECCV (осень, чередуются, через год) NIPC / ICML / ECML (распознавание образов)

Международные ICIP, ICPR, ACCV

Региональные BMVC, DAGM, GraphiCon + Журналы!

Slide 15

Рейтинг Citation index

Количество цитирований работы Impact factor

Усредненный индекс цитирования работ в журнале/конференции

Рейтинг конференции http://www.cs.ualberta.ca/~zaiane/htmldocs/Con

fRanking.html

30.07.2011 Slide 16

Double Blind Review

Информация о персоналиях лишь у руководителей комитета Рецензент не знает авторов статьи Авторы не знают рецензентов

Требования: Исключение всех упоминаний об

авторах из поданной работы Информация об авторах добавляется

только при подаче финальной версии для принятых работ

Что читать? Читать надо много, наука быстро

развивается! 250+ публикаций на CVPR/ECCV Просматривать ведущие международные

Siggraph / CVPR / ICCV / ECCV / NIPC

Просмотреть те, где вы сами хотите опубликоваться!

30.07.2011 Slide 18

Где искать статьи? Библиотеки

http://Ieee.org (IEEE) http://portal.acm.org (ACM) http://www.springerlink.com (Springer)

Lecture notes on computer science http://sciencedirect.com (Elsevier)

Свободные каталоги статей Запрос: «ICCV 2009 papers» http://gmazars.info/conf/iccv2009.html

30.07.2011 Slide 19

Где искать статьи?

CiteSeerX http://citeseerx.ist.psu.edu Удобный инструмент для отслеживания кого

цитирует статья, и кто цитирует её Личные страницы авторов/групп

Visual Geometry Group (Oxford) http://www.robots.ox.ac.uk/~vgg/

30.07.2011 Slide 20

Экспертиза

Хорошая конференция – бесплатный способ оценить качество работы несколькими экспертами

Подробная анкета Что вы упустили в работе Что вам подскажут

30.07.2011 Slide 21

Зачем делиться?

Выше шансы, что вас процитируют! Выше доверие Карма

30.07.2011 Slide 22

Тестовые базы

Коллекция изображений Разметка изображений (!!!)

Обработка изображений для базы обычно делается вручную

Размещение Личные страницы Специализированные сайты Специализированные семинары и конкурсы

Мощный стимул к прогрессу!

30.07.2011 Slide 23

Разные коллекции изображений

Zurich building image database 0.5GB http://www.vision.ee.ethz.ch/showroom/zubud/i

ndex.en.html

Caltech 101, 256 30К+ изображений, 1.3GB http://www.vision.caltech.edu/Image_Datasets/

Caltech101/

ImageNet http://www.image-net.org

30.07.2011 Slide 24

LabelMe

Ручная разметка изображения на объекты и их аннотирование

Web-сайт Тысячи изображений Общедоступная

коллекция размеченных изображений

30.07.2011 Slide 25

http://labelme.csail.mit.edu/index.html

Mechanical Turk (1770)

• Automaton Chess Player – робот, игравший в шахматы • Автоматон двигает фигуры, говорит «Чек» и обыгрывает всех!

• C 1770 по 1854 развлекал публику, только в 1820 году раскрыли обман

Task

Is this a dog? o Yes o No

Workers

Answer: Yes

Task: Dog?

Pay: $0.01 Broker

www.mturk.com

$0.01

Amazon Mechanical Turk

• Интернет-брокер для выполнения интеллектуальных заданий по анализу изображений

PASCAL

Конкурсы Классификация Поиск (bounding box) Сегментация (точный контур)

Набор тестовых баз Выделенный сервер для

анализа поданных данных Итоговый семинар

30.07.2011

http://pascallin.ecs.soton.ac.uk/challenges/VOC/voc2009/index.html Slide 28

ImageNet

Total number of images: 12184113 Number of images with bounding box annotations: 657,827

30.07.2011 Slide 29

PETS Performance evaluation of tracking

and video surveillance workshop Разные задачи

Слежение Распознавание действий Определение оставленных

предметов Набор видео для каждой задачи с

нескольких камер

30.07.2011

http://winterpets09.net/

Slide 30

Сайты и рейтинги

Middlebury stereo page http://vision.middlebury.edu/stereo/

MRF Minimization http://vision.middlebury.edu/MRF/

Multi-view stereo http://vision.middlebury.edu/mview/

Optical flow http://vision.middlebury.edu/flow/

30.07.2011 Slide 31

Матирование изображений

http://www.alphamatting.com/

30.07.2011 Slide 32

Программные библиотеки

С/С++/Matlab

OpenCV 2.0

VLFeat http://www.vlfeat.org/

STAIR Vision Library

http://ai.stanford.edu/~sgould/svl/

30.07.2011 Slide 33

Списки наработок

https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

30.07.2011 Slide 34

ALE

http://cms.brookes.ac.uk/staff/PhilipTorr/ale.htm

30.07.2011 Slide 35

Компании

Видеоаналитика и коллекции

30.07.2011 Slide 36

ГИС, Аэро, 3D Дистанционный контроль

Спецэффекты Документооборот Роботы и машины

ГрафиКон

Списки и материалы Компаний Лабораторий История области Видеокурсы

30.07.2011 Slide 37

Цели и задачи

Сформировать и укрепить российское сообщество в области компьютерной графики и компьютерного зрения

Ввести его в мировое научное пространство

30.07.2011 Slide 38