Upload
lidia-pivovarova
View
1.225
Download
4
Embed Size (px)
DESCRIPTION
Евгений Свердлов"Использование Гамма распределения при решении задачи классификации"
Citation preview
1
Использование Гамма распределения при решении
задачи классификации.
Свердлов Евгений
2
Задача: Классификация элементов области (2-class).
Пример: Написан ли текст подписавшимся ? Элемент – (Текст1, Текст2).Автор1 = Автор2 ?(Есть база авторских текстов).
3
Есть несколько характеристик текста. Использование одной недостаточно. Как использовать все?
4
“Naive Bayes Classifer” ?ф-ии плотности для каждой гипотезы ? Н1 : (Автор 1 = Автор2) Н2 : (Автор 1 ≠ Автор2)
Плотности “Гамма-образны”:
5
6
Выяснение авторства по текстам:
1. Распределение биграмм букв (сравнение вероятностей наиболее частотных):
EER ≤ 0.28 (0.95).
7
8
9
2. Распределение биграмм категорий слов (частей речи) (сравнение вероятностей наиболее частотных):
EER ≤ 0.25 (0.95).
Совмещение: EER ≤ 0.23 (0.95).
10
11
12
Требования:
1. Нормальность характеристик.
2. «Хорошая» оценка дисперсий.
13
Далее:
• Применить для n-class задач.
• Использовать информацию из предметных областей, чтобы улучшить результат.