Classificação/ Clusterização

  • View
    24

  • Download
    0

Embed Size (px)

DESCRIPTION

Classificao/ Clusterizao. Edilson Ferreira Luiz Antnio Marina Alecrim Tarcisio Coutinho & Bruno Andrade ( alterado por Flavia barros ). Roteiro. Motivao Classificao de Texto Definio Tcnicas de Construo de Classificadores Construo Manual Construo Automtica - PowerPoint PPT Presentation

Transcript

PowerPoint Presentation

Edilson FerreiraLuiz AntnioMarina AlecrimTarcisio Coutinho

&Bruno Andrade (alterado por Flavia barros)

Classificao/ClusterizaoRoteiroMotivaoClassificao de TextoDefinioTcnicas de Construo de ClassificadoresConstruo ManualConstruo AutomticaAlgoritmos de Aprendizagem de ClassificadoresSeleo de AtributosReduo da DimensionalidadeAplicaesClusteringObjetivoMtodos de ClusteringHierrquicoNo-HierrquicoAplicaesClustering x ClassificaoRefernciasMotivaoA organizao da informao uma preocupao dos seres humanos desde o surgimentodas primeiras civilizaes, h cerca de 4.000 anos

Registros contbeisOrdenanas do governoContratosSentenas judiciais

Conservados e organizadosem tbulas de argila.

A organizao da informao uma preocupao dos seres humanos desde o surgimentodas primeiras civilizaes, h cerca de 4.000 anos.

Naquele perodo, registroscontbeis, ordenanas do governo, contratos e sentenas judiciais eram conservados e organizadosem tbulas de argila.

3MotivaoCom o passar dos anos, essas tbulas foram substitudas pelo papel e estes gradativamente esto sendo substitudos por documentos digitais.

Localiz-los com agilidade tornou-se um grande desafio para a organizao da informao.

Com o passar dos anos, essas tbulas foram substitudas

pelo papel, a quantidade de documentos aumentou consideravelmente e a atividade delocaliz-los com agilidade tornou-se um grande desafio para a organizao da informao.

4Recuperao de InformaoFacilitar o acesso a documentos relevantes necessidade de informao do usurio

Tcnicas populares e tradicionais associadas recuperao dedocumentos so classicao e clusterizao detextos.

O problema de RI pode ser visto como uma especializao do problema de classificaoRI = classificar documentos em relevantes ou no-relevantes

Classificao de TextoDefinioA classificao de textos a tarefa de associar textos em linguagemnatural a rtulos pr-definidos,a m de agrupar documentos semanticamente relacionados

Definio FormalConsidere C = {c1, c2, ..., cm} como um conjunto de categorias (classes) e D ={d1, d2, ..., dm} como um conjunto de documentos.A tarefa de classificao de textoconsiste em atribuir para cada par (ci, dj) de C x D (com 1