Откриване на взаимовръзки в колекции от документи чрез ЛСА

Embed Size (px)

DESCRIPTION

Откриване на взаимовръзки в колекции от документи чрез ЛСА. Димитър Вулджев, НПМГ Иван Стефанов, ПМГ Казанлък. д-р Преслав Наков, Сингапурски университет. Какво представлява?. Вход: 30 стенограми от заседания на МС Резултат:. Йорданка Фъндъкова. 0,864. - PowerPoint PPT Presentation

Text of Откриване на взаимовръзки в колекции от документи...

, , - , ?: 30

: - 0,864 ? - , 24 25 2011 . . .

; ; , .

= ( , , ; .)

A=UVT

? ; () ; ~ ;

: ; ; . n - ; (k-means); .

- ?-;; : .;Term Frequency Inverse Document Frequency; ; (NER). !!!

;

9674 74 538 5,37 GB0,86 GB(430MB ) ; :9674 . 74538 => 5,37GB; 410MB => 0,83GB -; ; C++ . 1 2 ? 0;0;0;1;0 => 0,20,64- 0;0;0,2;0 => 0,040,361;1;1;1;1 => 10,860,5;0,5;1;0 => 0,40,72 1;1;1;1;1 => 10,49 -0,5;0;1;0;0,5 => 0,40,68 (). .: - , - , (Microsoft), . - !