View
31
Download
0
Category
Preview:
Citation preview
José Roberto Motta Garciagarcia.cptec@gmail.comNov/2016
Fases da análise de dados – Aplicações
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Boxplot – Distribuição e detecção de anomalias
Valor discrepante superior (extremo, outlier, anomalia)Maior valor não-discrepante
Terceiro quartil (75% da qtd de dados)
Média (pelos valores)Mediana (divide qtd de dados pela metade, 50%)
Primeiro quartil (25% da qtd de dados)
Menor valor não-discrepante Valores discrepantes inferiores (extremos, outliers, anomalia)
50% dos dados
(interquartil)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Boxplot – Distribuição e detecção de anomalias
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Detecção de anomalias em séries temporais
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
VERIFICAPADRÕES
DEVARIAÇÃO
Mineração de redes sociais (Twitter)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
1. Create an application at dev.twitter
2. Authenticate3. Gets Tweets from Twitter4. Clean the data
Mineração de texto – Nuvem de palavras - Código
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Mineração de texto – Nuvem de palavras - Resultado
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Agrupamento por similaridade (clustering) - Código
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Agrupamento por similaridade (clustering) – Resultado gráfico
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Agrupamento por similaridade (clustering) – Outros plots
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
04.03-Agrupamento2.R
3D
Agrupamento por similaridade (hierárquico) - dendograma
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Criando mapas
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Recommended