71
Задачи музыкального поиска связанные с анализом аудио сигнала

Задачи музыкального поиска, связанные с анализом аудио сигнала

  • Upload
    yandex

  • View
    13.355

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Задачи музыкального поиска, связанные с анализом аудио сигнала

Задачи музыкального поиска связанные с

анализом аудио сигнала

Page 2: Задачи музыкального поиска, связанные с анализом аудио сигнала

План доклада

● Вступление● Обзор существующих задач● Введение в обработку сигналов● Примеры задач, которыми мы занимаемся

Page 3: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

С какими данными мы работаем?

Page 4: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

● Метаданные музыкального трека

Page 5: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

● Метаданные музыкального трека● Тексты песен

Page 6: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

● Метаданные музыкального трека● Тексты песен● Данные о прослушиваниях

Page 7: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

● Метаданные музыкального трека● Тексты песен● Данные о прослушиваниях● Непосредственно аудио сигнал

Page 8: Задачи музыкального поиска, связанные с анализом аудио сигнала

Вступление

Какие задачи можно решать анализируя аудио сигнал?

Page 9: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

Page 10: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

Page 11: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

Page 12: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

● Поиск кавер-версий и ремиксов

Page 13: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

● Поиск кавер-версий и ремиксов

● Выделение мелодии из полифонического сигнала

Page 14: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

● Поиск кавер-версий и ремиксов

● Выделение мелодии из полифонического сигнала

● Классификация музыки

Page 15: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

● Поиск кавер-версий и ремиксов

● Выделение мелодии из полифонического сигнала

● Классификация музыки

● Автотегирование

Page 16: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обзор существующих задач

● Распознавание музыки по фрагменту записанному на микрофон

● Распознавание по напеванию

● Поиск нечетких дубликатов

● Поиск кавер-версий и ремиксов

● Выделение мелодии из полифонического сигнала

● Классификация музыки

● Автотегирование

● Поиск похожих/рекомендации

Page 17: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Как анализировать аудио сигнал?

Page 18: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 19: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио cигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 20: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 21: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 22: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 23: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 24: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как выглядит аудио-сигнал глазами компьютера?

Page 25: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Что мы имеем по сути?

Page 26: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Что мы имеем по сути?– Зависимость амплитуды колебаний от времени

Page 27: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Что мы имеем по сути?– Зависимость амплитуды колебаний от времени

● Какую важную характеристику звука мы забыли?

Page 28: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Что мы имеем по сути?– Зависимость амплитуды колебаний от времени

● Какую важную характеристику звука мы забыли?– Частота колебаний (высота звука)

Page 29: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Пример музыкального фрагмента и его разделение на три полосы частот

Page 30: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?

Page 31: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?– Преобразование Фурье (Fourier transform)

Page 32: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?– Преобразование Фурье (Fourier transform) —

позволяет разложить периодическую функцию в сумму гармонических с разными частотами.

Page 33: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?– Преобразование Фурье (Fourier transform)

– Вейвлет преобразование (Wavelet transform)

Page 34: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?– Преобразование Фурье (Fourier transform)

– Вейвлет преобразование (Wavelet transform)

Вейвлет – это математическая функция, позволяющая анализировать различные частотные компоненты данных.

Page 35: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Как преобразовать сигнал из временного домена в частотный?– Преобразование Фурье (Fourier transform)

– Вейвлет преобразование (Wavelet transform)

– Константное Q преобразование (Constant Q transform)

Page 36: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

● Хочется при этом сохранить временную составляющую сигнала– Оконное преобразование Фурье (Short-time

Fourier transform)

Page 37: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Page 38: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Page 39: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Page 40: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Page 41: Задачи музыкального поиска, связанные с анализом аудио сигнала

Введение в обработку аудио сигналов

Page 42: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация признаков

● По временному масштабу– Frame-level

– Segment-level

– Global-level

● По уровню представления – Low-level

– Middle-level

– High-level

Page 43: Задачи музыкального поиска, связанные с анализом аудио сигнала

Low-level

● Zero Crossing Rate – позволяет неплохо различать музыку и речь

● Short-time energy – отражает изменение энергии во времени

Page 44: Задачи музыкального поиска, связанные с анализом аудио сигнала

Low-level

● Spectral Centroid – центр масс спектра

● Spectral Bandwidth – разброс относительно центра масс

● Spectral Flatness Measure – характеризует «гладкость» спектра. Помогает отличать сигнал похожий на шум от сигналов с выраженной тональностью

Page 45: Задачи музыкального поиска, связанные с анализом аудио сигнала

Low-level

● Что-нибудь более сложное?– Mel-frequency Cepstral Coefficient

(MFCC) (вольный перевод — Коэффициенты кепструма в мел масштабе)

– По сути это спектр спектра

– Изначально использовались в распознавании речи

Page 46: Задачи музыкального поиска, связанные с анализом аудио сигнала

Middle-level

● Beat Tracker● Pitch Histogram● Rhythm Patterns

Page 47: Задачи музыкального поиска, связанные с анализом аудио сигнала

High-level

● Музыкальные жанры● Настроение: веселая, грустная, агрессивная,

спокойная.● Вокальная / Инструментальная● Ощущаемая скорость музыки (медленная,

быстрая, средняя)● Пол вокалиста

Page 48: Задачи музыкального поиска, связанные с анализом аудио сигнала

Обобщение признаков

● Как перейти на более общий уровень — уровень трека?

– Вычисление статистик по шкале времени (среднее/дисперсия)

– Попытка более сложного моделирования распределения значений признаков, например Гауссовы смеси

Page 49: Задачи музыкального поиска, связанные с анализом аудио сигнала

Сравнение

● Как сравнивать признаковые описания?● Вычисление меры близости

– Расстояние Хэмминга при побитовом сравнении

– Евклидово расстояние

– Манхэттенское расстояние

● Оценка максимального правдоподобия

Page 50: Задачи музыкального поиска, связанные с анализом аудио сигнала

Примеры наших задач

● Распознавание музыки по фрагменту записи

Page 51: Задачи музыкального поиска, связанные с анализом аудио сигнала

Примеры наших задач

● Распознавание музыки по фрагменту записи● Поиск нечетких дубликатов

Page 52: Задачи музыкального поиска, связанные с анализом аудио сигнала

Примеры наших задач

● Распознавание музыки по фрагменту записи● Поиск нечетких дубликатов● Классификация/музыкальные рекомендации

Page 53: Задачи музыкального поиска, связанные с анализом аудио сигнала

Распознавание музыки

● В качестве базовых признаков — пики энергии в спектрограмме

● Пики объединяются в пары

Page 54: Задачи музыкального поиска, связанные с анализом аудио сигнала
Page 55: Задачи музыкального поиска, связанные с анализом аудио сигнала
Page 56: Задачи музыкального поиска, связанные с анализом аудио сигнала

Распознавание музыки

● Двухэтапный поиск– Быстрый поиск в «облегченном» индексе

– Более точный поиск среди TopN лучших

Page 57: Задачи музыкального поиска, связанные с анализом аудио сигнала

Отсечение ложных срабатываний

Page 58: Задачи музыкального поиска, связанные с анализом аудио сигнала

Отсечение ложных срабатываний

Page 59: Задачи музыкального поиска, связанные с анализом аудио сигнала

Распознавание музыки

● База 6М треков● Двухуровневый поисковый кластер

Page 60: Задачи музыкального поиска, связанные с анализом аудио сигнала

Поиск нечетких дубликатов

● В основе лежит метод построения сигнатур — Chromaprint

● Исходное представление сигнала в виде хромограммы

Page 61: Задачи музыкального поиска, связанные с анализом аудио сигнала

Поиск нечетких дубликатов

● Основная идея — рассматривать хромаграммы как изображения

● Сравнивать используя методы компьютерного зрения

● Используется набор фильтров

Page 62: Задачи музыкального поиска, связанные с анализом аудио сигнала

Поиск нечетких дубликатов

● Как выглядит сигнатура?

Page 63: Задачи музыкального поиска, связанные с анализом аудио сигнала

Поиск нечетких дубликатов

● Разница между оригинальной и инструментальной версией трека

Page 64: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● Что можно классифицировать?– Жанры

– Настроения

– Пол вокалиста

– И т.д.

Page 65: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● В качестве исходных данных — MFCC (еще можно спектрограмму)

● Обучаем глубокую сверточную нейронную сеть

● Смотрим что получилось

Page 66: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● Пример трека, размеченного как Pop● Что предсказывает нейронная сеть?

Page 67: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● Пример трека, размеченного как Pop● Что предсказывает нейронная сеть?

– Metal 0.45

– Punk 0.23

– Rock 0.17

Page 68: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● Еще один пример, снова Pop● Что предсказывает нейронная сеть?

Page 69: Задачи музыкального поиска, связанные с анализом аудио сигнала

Классификация музыки

● Еще один пример, снова Pop● Что предсказывает нейронная сеть?

– Rap 0.48

– RnB 0.16

– Pop 0.09

Page 70: Задачи музыкального поиска, связанные с анализом аудио сигнала

Музыкальные рекомендации

● Есть методы коллаборативной фильтрации, которые неплохо работают

● В чем преимущества подхода основанного на анализе аудио сигнала?– Лучше для новых треков

– Лучше для мало популярных треков

Page 71: Задачи музыкального поиска, связанные с анализом аудио сигнала

Спасибо за внимание!

Вопросы?