Upload
-
View
229
Download
0
Embed Size (px)
DESCRIPTION
Microphone arrays presentation for FINT-2013 competition
Citation preview
1|11http://microphonearrays.freehphosting.ru
Микрофонные массивы
Д. Леонов
Для конкурса «ФИНТ-2013»
12 октября 2013
Распознавание речи
2|11
Существующий тренд:
а) Уже активно используется в мобильных устройствах
(S Voice, Siri, Google Now)
б) Появляются и продаются успешные стартапы (Mobile Technology,
RealSpeaker)
в) Появляется всё больше научных публикаций в этой области
Существующие трудности:
а) Всё ещё низкая точность
б) Ещё более низкая точность при удалении от микрофона
в) В шумных помещениях может вообще не работать
http://microphonearrays.freehphosting.ru
Рынки
География
EMEA
APAC
Americas
Текст
Биометрия
~30%~50%
~20%
~25%
~75%
Направления
2500
2000
1500
1000
500
0
860
229
1047
321
1257
420
1515
523
1727
697
2012 2013 2014 2015 2016
Биометрия Текст
Прогноз развития рынка распознавания речи
2012-2016 (млн. $)*По данным Technavio. Спасибо RealSpeaker за статистику!
http://microphonearrays.freehphosting.ru 3|11
Микрофонные массивы
Микрофонный массив — один из видов направленных
микрофонов. Состоит из множества микрофонов,
находящихся в одной плоскости. Диаграмма направленности
создаётся при помощи изменения фаз волн. (Википедия)
Устройство
обработки
...
Phono,
XLR,
S/PDIF ...0°
30°
60°90°
120°
150°
180°
210°
240°270°
300°
330°
Микрофонный массив
0°
30°
60°90°
120°
150°
180°
210°
240°270°
300°
330°
Обычный микрофон
http://microphonearrays.freehphosting.ru 4|11
0°
30°
60°90°
120°
150°
180°
210°
240°270°
300°
330°
!
Микрофонные массивы
0°
30°
60°90°
120°
150°
180°
210°
240°270°
300°
330°
!
0°
30°
60°90°
120°
150°
180°
210°
240°270°
300°
330°
!
!
Возможности:
1. Электрическое управление лучом (без механического поворота
самой системы)
2. Автоматическое обнаружение источника звукового сигнала
3. Автоматическое сопровождение объекта лучом
4. Формирование нескольких лучей
5. Фильтрация помех, даже попадающих в луч системы
http://microphonearrays.freehphosting.ru 5|11
Продукт
Характеристики:
1. Диапазон частот 20..20000 Гц
2. Ширина луча - не более 20°
3. Интерфейсы:
▫ выход с микрофонного массива,
Phono Jack, моно
▫ выход с одиночного микрофона
(reference output), Phono Jack, моно
▫ цифровой выход S/PDIF
4. 41..96 кГц, 24 бит, стерео
Ожидаем повышения точности
распознавания речи на 20-30%
http://microphonearrays.freehphosting.ru 6|11
Команда
Леонов Даниил
Радиоэлектронные системы, специалист
(РЛ МГТУ им. Н. Э. Баумана)
исследования и разработка
развитие проекта
Туишев Рифат
Радиоэлектронные системы, специалист
(РЛ МГТУ им. Н. Э. Баумана)
Менеджмент организаций, специалист
(ИБМ МГТУ им. Н. Э. Баумана)
аналитика
маркетинг
http://microphonearrays.freehphosting.ru 7|11
Что готово
Техника:
1. Проведены исследования и моделирование
2. Написана основная часть софта (прошивки, приложения, тесты)
3. Идёт разработка железа
Бизнес:
1. Изучен рынок и конкуренты
2. Запущен сайт проекта
3. Идёт поиск потенциальных клиентов
http://microphonearrays.freehphosting.ru 8|11
Чего пока нет
1. Готового прототипа
2. Договорённостей с потенциальными клиентами
3. Патентов
4. Своей или родительской организации
http://microphonearrays.freehphosting.ru 9|11
Планы на ближайшее будущее
1. Найти реальных покупателей и скорректировать характеристики и
требования
2. Найти средства для завершения разработки и изготовления
прототипа ($2-4K)
3. Закончить прототип
4. Найти недостающих для дальнейшего развития членов команды
5. Найти помещение для лабораторий/офиса (технопарки, инкубаторы)
6. Найти менторов и консультантов для текущих задач
7. Полученные результаты опубликовать в научных изданиях
http://microphonearrays.freehphosting.ru 10|11
Конец
Спасибо за внимание!
Контакты:
Леонов Даниил Игоревич
http://microphonearrays.freehphosting.ru/
+ vk, facebook, linkedin, ...
http://microphonearrays.freehphosting.ru 11|11