13
1 Использование Гамма распределения при решении задачи классификации. Свердлов Евгений

Использование Гамма распределения при решении задачи классификации

Embed Size (px)

DESCRIPTION

Евгений Свердлов"Использование Гамма распределения при решении задачи классификации"

Citation preview

Page 1: Использование Гамма распределения при решении задачи классификации

1

Использование Гамма распределения при решении

задачи классификации.

Свердлов Евгений

Page 2: Использование Гамма распределения при решении задачи классификации

2

Задача: Классификация элементов области (2-class).

Пример: Написан ли текст подписавшимся ? Элемент – (Текст1, Текст2).Автор1 = Автор2 ?(Есть база авторских текстов).

Page 3: Использование Гамма распределения при решении задачи классификации

3

Есть несколько характеристик текста. Использование одной недостаточно. Как использовать все?

Page 4: Использование Гамма распределения при решении задачи классификации

4

“Naive Bayes Classifer” ?ф-ии плотности для каждой гипотезы ? Н1 : (Автор 1 = Автор2) Н2 : (Автор 1 ≠ Автор2)

Плотности “Гамма-образны”:

Page 5: Использование Гамма распределения при решении задачи классификации

5

Page 6: Использование Гамма распределения при решении задачи классификации

6

Выяснение авторства по текстам:

1. Распределение биграмм букв (сравнение вероятностей наиболее частотных):

EER ≤ 0.28 (0.95).

Page 7: Использование Гамма распределения при решении задачи классификации

7

Page 8: Использование Гамма распределения при решении задачи классификации

8

Page 9: Использование Гамма распределения при решении задачи классификации

9

2. Распределение биграмм категорий слов (частей речи) (сравнение вероятностей наиболее частотных):

EER ≤ 0.25 (0.95).

Совмещение: EER ≤ 0.23 (0.95).

Page 10: Использование Гамма распределения при решении задачи классификации

10

Page 11: Использование Гамма распределения при решении задачи классификации

11

Page 12: Использование Гамма распределения при решении задачи классификации

12

Требования:

1. Нормальность характеристик.

2. «Хорошая» оценка дисперсий.

Page 13: Использование Гамма распределения при решении задачи классификации

13

Далее:

• Применить для n-class задач.

• Использовать информацию из предметных областей, чтобы улучшить результат.