126
CURSO DE COMUNICAÇÃO SOCIAL PUBLICIDADE E PROPAGANDA PP029 ESTATÍSTICA APLICADA À COMUNICAÇÃO Prof. Sérgio Duarte Prof. Sérgio Duarte Conteúdo como cortesia aos Conteúdo como cortesia aos estudantes estudantes www.professorsergioduarte.com www.professorsergioduarte.com

Estatística Aplicada à Comunicação

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Estatística Aplicada à Comunicação

CURSO DE COMUNICAÇÃO SOCIALPUBLICIDADE E PROPAGANDA

PP029 ESTATÍSTICA APLICADA À COMUNICAÇÃO

Prof. Sérgio DuarteProf. Sérgio DuarteConteúdo como cortesia aos estudantesConteúdo como cortesia aos estudantes

www.professorsergioduarte.comwww.professorsergioduarte.com

Page 2: Estatística Aplicada à Comunicação

Avaliações

• A1: Prova (7,0) e trabalho de APS (3,0).• A2: Prova (5,0) e trabalho de APS (5,0)• A3: Prova (10,0)

Page 3: Estatística Aplicada à Comunicação

Origem da Estatística

Mesmo na Bíblia , várias passagens insinuavam o uso da estatística como o pedido feito a Moisés de realizar um mapeamento de quantos homens estariam aptos para a guerra.

Page 4: Estatística Aplicada à Comunicação

Origem da Estatística

Por várias vezes no período Clássico e Medieval , os censos eram fonte para informação para auxiliar a coleta de impostos.

Cabe lembrar que a palavra censo , provém do latim “Censere” que significa “taxar”.

Page 5: Estatística Aplicada à Comunicação

Definição de Estatística

O Termo estatística vem da palavra também latina “Status” , que corresponde a informações e descrições que seriam úteis para o estado. É desde então uma ferramenta administrativa utilizada para várias áreas como : recursos humanos, finanças, logística, produção e marketing

Page 6: Estatística Aplicada à Comunicação

Logo Estatística é a ciência que estuda quantitativamente os fenômenos naturais ou sociais, cuja avaliação está baseada em métodos científicos de coleta, organização, apresentação e análise de dados.

Page 7: Estatística Aplicada à Comunicação

Irwin/McGraw-Hill © The McGraw-Hill Companies, Inc., 1998

Slide5-1

Table5.1

Questões sobre mercadosQuestões sobre mercados

Que tipos de pessoas compram nossos produtos?

A demanda por nossos produtos está aumentando ou diminuindo?

Os canais de distribuição de nossos produtos precisam ser alterados?

CompradoresCompradores DemandaDemanda CanaisCanais

Questões sobre o Composto de MarketingQuestões sobre o Composto de Marketing

ProdutoProduto PreçoPreço DistribuiçãoDistribuição PromoçãoPromoçãoQue projeto de produto tem maior probabilidade de conseguir sucesso?

Que preço devemos cobrar por nossos novos produtos?

Onde e por quem nossos produtos devem ser vendidos?

Quanto devemos investir em promoção?

Questões sobre desempenhoQuestões sobre desempenho

Como o público percebe nossa organização?

Participação de mercadoParticipação de mercado Satisfação dos clientesSatisfação dos clientes ReputaçãoReputação

Os clientes estão satisfeitos com os nossos produtos?

Qual é a nossa participação no mercado total?

Page 8: Estatística Aplicada à Comunicação

Estudo da Estatística Estatística Descritiva, que se preocupa com a organização e

descrição dos dados experimentais;

Estatística Indutiva (Estatística Inferencial), que cuida da sua análise e interpretação, ou seja, tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.

Estatística Probabilística – representa o estudo de planejar jogadas ou estratégias de jogos de azar , bem como o risco e o acaso em eventos futuros.

Page 9: Estatística Aplicada à Comunicação

Exercício

Leia o texto Estatísticas na Mídia, na Publicidade e em Estudos.

• Responda: Qual é o tipo de estatística que trata o autor ?

Informações de acesso ao texto disponível em www.professorsergioduarte.com

Page 10: Estatística Aplicada à Comunicação

População e Amostra

• População - Conjunto de todos os elementos que possuem pelo menos uma característica em comum.

• Amostra - Subconjunto representativo da população

Page 11: Estatística Aplicada à Comunicação

População

É a coleção completa de todos os elementos (escores, pessoas, medidas e outros) a serem estudados inclui todos os sujeitos a serem estudados

AmostraUm subconjunto de uma população, com tamanho finito, onde todos os seus elementos serão examinados no estudo estatístico desejado.

População

Amostra

Definições BásicasDefinições Básicas

Page 12: Estatística Aplicada à Comunicação

AmostragemO processo de escolha de uma amostra da população

Censoconjunto dos dados obtidos de todos os membros da população

População

Amostra

Definições BásicasDefinições Básicas

Page 13: Estatística Aplicada à Comunicação

Tamanho da Amostra

O tamanho da amostra é um função da confiabilidade desejada, do custo e do tempo necessário para o levantamento de dados ou experimentos.

Variabilidade

É o fato de que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado sempre.

Definições BásicasDefinições Básicas

Page 14: Estatística Aplicada à Comunicação

Definições BásicasDefinições Básicas

AMOSTRA

ESTATÍSTICA DESCRITIVA

INFERÊNCIA ESTATÍSTICA

POPULAÇÃO

DADOS

Page 15: Estatística Aplicada à Comunicação

Leia os textos e depois responda

Calçados esportivos devem movimentar cerca de R$12 bilhões em 2013 27/02/2013

Classe B é a que apresenta maior potencial de consumo.

Sudeste deve ser responsável por 52,4% do consumo de calçados esportivos. Em 2013, o setor de calçados esportivos segue em ritmo de crescimento, com

perspectiva de movimentar cerca de R$12,3 bilhões em vendas. De acordo com os dados do Pyxis Consumo, do IBOPE Inteligência, as classes B e C serão responsáveis por 43,5% e 40,6% dos gastos do setor durante o ano.

Segundo a projeção, a região Sudeste deverá liderar o consumo, com gastos em torno dos R$6,4 bilhões, o que equivale a 52,4% do potencial do setor. Em seguida aparecem as regiões Sul (18%), Nordeste (15,6%), Centro-Oeste (8,4%) e Norte (5,3%).

Em 2012, a projeção de gastos para o setor foi de aproximadamente R$11 bilhões, valor que em 2010 era estimado em R$9,7 bilhões.

Fonte: http://www.ibope.com.br

Page 16: Estatística Aplicada à Comunicação

Censo 2010: mulheres são mais instruídas que homens e ampliam nível de ocupaçãoO Censo 2010 mostrou que, em dez anos, o nível de instrução das mulheres continuou

mais elevado que o dos homens e elas ganharam mais espaço no mercado de trabalho.

O nível de ocupação (percentual de pessoas ocupadas na semana de referência no total da população do grupo considerado) das mulheres de 10 anos ou mais de idade passou de 35,4% para 43,9% de 2000 para 2010, enquanto o dos homens foi de 61,1% para 63,3%.

Na faixa etária de 25 anos ou mais, o percentual de homens com pelo menos o nível superior de graduação completo foi de 9,9%, e das mulheres, de 12,5%; percentuais que passavam para 11,5% e 19,2%, respectivamente, entre os ocupados.

E a taxa de abandono escolar precoce (proporção de jovens entre 18 e 24 anos de idade que não haviam completado o ensino médio e não estavam estudando), que caiu de 48,0% para 36,5% de 2000 para 2010, era maior entre os homens (41,1%) que entre as mulheres (31,9%). De uma forma geral, o Censo 2010 constatou que as taxas de escolarização e o nível de instrução cresciam com o aumento do rendimento mensal domiciliar per capita.

Continua

Fonte: www.censo2010.ibge.gov.br

Page 17: Estatística Aplicada à Comunicação

Responda

• Qual a diferença entre os dois tipos de pesquisa ?

• Quais são os tipos de população no primeiro e no segundo texto?

• Defina as características das amostras. No segundo texto há algum tipo de amostra?

Page 18: Estatística Aplicada à Comunicação

Dados PrimáriosDados Primários

Vantagens

• Atualizados• Diretamente relacionados com a pesquisa

Desvantagens

• Mais Caro• Exige mais tempo para a coleta dos dados

Tipos

• Observação • Levantamento• Experimental

Page 19: Estatística Aplicada à Comunicação

Vantagens

• Mais barato• Método que exige menos tempo

Desvantagens

• Pode estar desatualizado• Os dados podem ser irrelevantes

Tipos

• Interno• Externo

Dados SecundáriosDados Secundários

Page 20: Estatística Aplicada à Comunicação

Fontes de dados secundáriosFontes de dados

Dadosprimários

Dadossecundários

Registrosinternos

Fontes externas

Internet

Fontes padronizadasde dados de Mkt.

Dadospublicados

Eletrônicos

Impressos

GovernoAss. Com.Periódicos

LivrosJornais

etc.

Auditorias, medição de índices de audiência de

tv, painéis de consumidores, serviços de

multimídia, warehouse, etc.

Page 21: Estatística Aplicada à Comunicação

Discutir os usos, benefícios e limitações dos dados secundários

• Usos: às vezes são suficientes; fonte de idéias; pré-requisito para coleta de dados primários; benchmark para coleta de dados primários; referência de comparação

• Benefícios: economia; viabilidade; muitas vezes, maior precisão.

• Limitações: dificuldades temporais; dúvidas sobre como foram coletados; defasagem

Page 22: Estatística Aplicada à Comunicação

Benefícios e limitações dos dados secundários

• Benefícios• baixo custo• menos esforço• menos tempo• maior precisão (às vezes)

• única possibilidade• etc.

• Limitações• coletados para outros

propósitos• controle sobre a coleta• podem não ser muito

precisos• formato• etc.

Page 23: Estatística Aplicada à Comunicação

FrequênciasDADOS BRUTOSNormalmente, na prática, os dados originais de uma série

estatística não se encontram prontos para análise, pois estarem desorganizados. Por essa razão, costuma-se chamá-los de dados brutos.

ROLÉ a lista ordenada dos dados de uma série estatística.

Essa ordenação pode ser crescente ou decrescente.

Page 24: Estatística Aplicada à Comunicação

FrequênciasELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜENCIAS

X max maior valor observado da variável de freqüências.X min menor valor observado da variável de freqüências AMPLITUDE (A) é a diferença entre o maior e menor valor

observado da variável. A = X - X máx mín

Page 25: Estatística Aplicada à Comunicação

ExercícioUma Pesquisa de Mercado pontuou a nota dada

de 0 a 10 ao desempenho de um determinado prefeito de uma região

0 – 2 – 3 – 7 – 10 – 4 - 8 – 9 - 1 – 8 – 10 –8 – 9 – 6 – 7 – 8 – 7 - 2 – 9 - 8 – 8 – 10 –

8 - 7 – 10 Elaborar a Tabela de Frequências

Page 26: Estatística Aplicada à Comunicação

Frequências

LIMITES DE CLASSE os limites de uma classe são os valores extremos. O limite mínimo de uma classe é denominado Limite Inferior e o limite máximo de Limite Superior.

INTERVALO DE CLASSE (h) é a diferença entre o limite superior e o limite inferior da classe.

h = A / n (quantidade de classes)

PONTO MÉDIO DE CLASSE (Xi) o ponto médio de uma classe é o valor representativo da classe. Para se obter o ponto médio de uma classe, basta somar os limites superior e inferior da classe e dividir por 2.

Page 27: Estatística Aplicada à Comunicação

Distribuição deFrequências

FREQÜÊNCIA RELATIVA - fri• É obtida pela divisão da freqüência simples da classe pelo número total

dos elementos.• fri = fi / n

FREQÜÊNCIA ACUMULADA - Fi :• Resulta da soma da freqüência simples da classe com as freqüências

simples das classes antecedentes.• Fi = f1 + f2+ f3 + ... + fi

FREQÜÊNCIA ACUMULADA RELATIVA - Fri:• É obtida pela divisão da freqüência acumulada da classe pelo número

total dos elementos.• Fri = Fi / n

Page 28: Estatística Aplicada à Comunicação

Roteiro para elaboração de Tabela de Frequência

1- Transformar os dados brutos em ROL.2- Encontrar a amplitude total dos dados.3 -Determinar o número de classes, de acordo com o

total de observações. n = qtd. observações 4 - Dividir a amplitude total da série pelo número de

classes escolhido.5- Determinar os limites das classes, escolhendo-se,

preferencialmente, números inteiros

Page 29: Estatística Aplicada à Comunicação

Exercício

Page 30: Estatística Aplicada à Comunicação

REPRESENTAÇÃO GRÁFICA DE DADOS ESTATÍSTICOS

Os gráficos encontram-se presentes em quase todos os meios de divulgação de informação, como jornais e revistas, nos manuais escolares, nas apresentações públicas e até os nossos relatórios individuais já não passam sem eles.

Page 31: Estatística Aplicada à Comunicação

Tipos de gráficosGráfico de barras simples (verticais ou

horizontais)

Num gráfico de barras, as frequências podem ser indistintamente representadas no eixo das abscissas ou das ordenadas, ou seja, as barras podem ser horizontais ou verticais.

Page 32: Estatística Aplicada à Comunicação

Gráfico de linhasO gráfico de linhas é indicado para mostrar tendências e evolução de

uma variável contínua por outra variável contínua. Num gráfico de linhas, ao contrário dos gráficos de barras, as séries

podem ser longas. O objetivo nestes gráficos é comparar os declives das curvas de forma a responder as perguntas: em que períodos a variação foi significativa? Quantos foram os pontos de inflexão?

Page 33: Estatística Aplicada à Comunicação

Gráficos de setoresOs gráficos de setores exibem as partes do todo como

se fatias de um bolo se tratassem; a isso se deve a denominação inglesa “pie chart” traduzida em português para torta ou pizza.

Page 34: Estatística Aplicada à Comunicação

Pictograma

• Representação gráfica através de figuras

Page 35: Estatística Aplicada à Comunicação

Histograma

O Histograma é o tipo de gráfico mais amplamente utilizado, é constituído desenhando-se barras, cujas bases são determinadas pelos intervalos de classe e cujas alturas são determinadas pelas correspondentes frequências de classe.

Page 36: Estatística Aplicada à Comunicação

Variáveis

• Qualitativa – quando seus valores são expressos por atributos. Exemplo : Sexo , Cor da Pele.

• Quantitativa – quando seus valores são expressos por números. Exemplo : altura, numero de alunos de um colégio.

Page 37: Estatística Aplicada à Comunicação

Variáveis Qualitativas

• Discretas – variáveis que só podem assumir valores pertencentes a um conjunto enumerável. Exemplo : numero de alunos de uma escola.

• Contínuas – quando uma variável pode assumir qualquer valor entre dois limites. Exemplo : Peso de um adulto pode ser de 70 Kg ou 70,1 Kg ou 79,13 Kg ou 70,134 Kg.

Page 38: Estatística Aplicada à Comunicação

Amostragem Não Probabilística

• Acidental ou de conveniência – indicada para assuntos exploratórios.

• Intencional – Escolhe-se um grupo específico.

• Quotas ou proporcional – É necessário o conhecimento prévio da população.

Page 39: Estatística Aplicada à Comunicação

Amostragem Probabilística

• Aleatória Simples – é utilizada uma tabela de números aleatórios.

• Aleatória Estratificada – Estratifica cada subconjunto através de critérios.

• Conglomerado – Por sorteio é indicado um conjunto.

Page 40: Estatística Aplicada à Comunicação

ExercíciosConsidere uma faculdade com 2.000 estudantes dos quais

1.200 estudam Administração e 800 estudam Publicidade. Considerando que 40% dos alunos de Administração e 30% dos alunos de Publicidade possuem bolsas de estudo, responda:

a) Quantidade de estudantes de Administração que possuem bolsas de estudo.

b) Quantidade de estudantes de Publicidade que não possuem bolsas de estudo.

c) Dentre os bolsistas, qual o percentual de alunos de Administração ?

d) Dentre os não bolsistas , qual o percentual de alunos de Publicidade?

Page 41: Estatística Aplicada à Comunicação

Amostragem

• Distribuições de Amostragem

• Intervalos de Confiança para a Média

Page 42: Estatística Aplicada à Comunicação

AmostragemZentgraf (2007) aponta que os métodos de amostragem

podem apresentar alguns problemas em sua aplicação quando :

• Quando a população foi muito pequena• Quando os dados da população apresentarem

volatilidade alta• Casos de necessidade de previsão absoluta• Dados da população já estiverem disponíveis

Page 43: Estatística Aplicada à Comunicação

• Em uma pesquisa, buscamos uma amostra que seja representativa da população analisada. Porém, uma média amostral quase nunca será a mesma de uma média populacional, bem como o desvio-padrão. Esse erro amostral existe independente da forma ou critérios de como uma determinada pesquisa foi elaborada.

Exemplo : Considere que ao analisar 10.000 notas de Estatística do nosso EAD , verificamos uma nota média de 6 , com desvio-padrão de 1,2. Porém ao retirar uma amostra de 50 alunos verificamos uma nota média e desvio-padrão diferentes do que o mensurado pela população.

Page 44: Estatística Aplicada à Comunicação

Se repetirmos essa amostragem por 100 vezes , teremos diferentes médias e desvios-padrões para cada amostra coletada. Podemos chegar desta forma a uma distribuição amostral de médias. A distribuição amostral de médias , de acordo com Levin & Fox (2004) possuem algumas características :

• “A medida que o tamanho das amostras cresce, as médias dessas amostram vão se aproximando a uma distribuição limite que é a distribuição normal.Este é o teorema do Limite Central.

• A média de uma distribuição amostral de médias ( média das médias ) é igual a uma verdadeira média populacional.

• O desvio-padrão de uma distribuição amostral de médias é menor do que a da população.”

Page 45: Estatística Aplicada à Comunicação

• Na prática , uma pesquisa dificilmente é realizada com mais de uma ou duas amostras. Seria difícil, desta forma, chegar a chamada média das médias. O erro padrão da média é calculada pela divisão do desvio-padrão da população pela raiz quadrada do tamanho da amostra.

s x = s / √ n Vamos utilizar como exemplo um exercício: O valor médio em dólar das vendas de um determinado produto no

último ano é conhecida como seguindo a distribuição normal com média de R$ 3.400,00 por revendedor a varejo com desvio-padrão de R$ 200,00. Se um grande número de revendedores comercializar o produto, determine o erro padrão da média para uma amostra de tamanho n=25

s x = s / √ n = 200 /√ 25 = 200 / 5 = 40

Page 46: Estatística Aplicada à Comunicação

Porém em casos de uma nova amostragem seja feita numa população finita sem reposição, os resultados novamente se distorceriam.

As média e desvio-padrão da população sem a amostra retirada se alteraria. Para isso é necessário que possamos ter um fator de correção para populações finitas , sendo : √ (N – n) / (N – 1)

N = tamanho da população.n = tamanho da amostra.

Page 47: Estatística Aplicada à Comunicação

• Considere que a média de uma população seja de 50 e o desvio-padrão de 12. Considere também um tamanho da amostra de 36 escolhida de uma população de 100. O valor esperado e o erro padrão da distribuição da amostragem da média é de :

Calculando o Erro Padrão da Distribuição temos : s x = s / √ ns x = s / √ n = 12 /√ 36 = 12 / 6 = 2

Calculando o Fator de Correção temos : √ (N – n) / (N – 1) = √ (100 – 36) / (100 – 1) = 0,80Após isso multiplicamos o fator de correção pelo erro padrão da

distribuição : 2 x 0,8 = 1,60

Page 48: Estatística Aplicada à Comunicação

Sabe-se que a vida útil de uma lâmpada é de 625 horas , com desvio padrão de 25. Determine o valor esperado e o erro da distribuição de amostragem da média, dado tamanho da amostra de 16.

a) 625 e 16b) 125 e 6,25c) 125 e 4d) 625 e 4e) 625 e 6,25

Page 49: Estatística Aplicada à Comunicação

Medidas de Posição MÉDIA ARITMÉTICA SIMPLES a média aritmética, ou média, de um conjunto de N

números X1, X2, ...., Xn é definido por:_X = X1 + X2 + ....... + Xn / n

EXEMPLO : {1, 1, 3, 4, 4} X = 1 + 1+ 3 + 4 + 4 = 13 = 2,6

MÉDIA PONDERADA Se os valores X1, X2, ...., Xn ocorrerem com freqüências f1, f2, ....., fn, então:_X = X1 f1 + X2 f2 + ..... + Xn fn = Xi fi ----------------------------------------- ----------

f1 + f2 + ..... + fn fi

Page 50: Estatística Aplicada à Comunicação

Medidas de Posição• MODA

Pode-se definir como moda o valor mas freqüente, quando comparada sua freqüência com a dos valores contíguos de um conjunto ordenado. A moda pode não existir e, mesmo que exista, pode não ser única.

EXEMPLOS : X = 4, 5, 5, 6, 6, 6, 7, 7, 8, 8

moda = 6 – valor mais freqüente – unimodal Y = 2, 3, 4, 5, 6

não tem moda – amodal Z = 2, 4, 4, 4, 6, 7, 8, 8, 8, 9

tem duas modas 4 e 8 – bimodal

Page 51: Estatística Aplicada à Comunicação

MODAFÓRMULA PARA DADOS AGRUPADOS:

Mo =( l * + L * ) / 2

Ou

Mo = l* + h ( D1 / D1 + D2) Sendo:

l* Limite Inferior da Classe Modal.L* Limite Inferior da Classe Modal.h intervalo de classe.D1 Frequencia Simples – Frequencia Anterior.D2 Frequencia Simples – Frequencia Posterior

Page 52: Estatística Aplicada à Comunicação

Mediana

FÓRMULA PARA DADOS AGRUPADOS:

Md = l* + h ( Xm – F(Ant) / f*) Sendo:

l* Limite Inferior da Classe Mediana.f* frequencia simples da classe mediana.h intervalo de classe.Xm Valor Mediano.

Page 53: Estatística Aplicada à Comunicação

Exercícios

1) Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria , numa escala de 0 a 100 : 65, 68, 70, 75, 80, 80 ,82 ,85, 90 ,90, 90, 95, 98, 100, 100.

Calcular :a) Média Aritmética Simplesb) Modac) Mediana

Page 54: Estatística Aplicada à Comunicação

Exercícios

1) Segue abaixo os dados agrupados de uma sondagem eleitoral de avaliação do Prefeito Silva. Calcular média , moda e mediana.

Page 55: Estatística Aplicada à Comunicação

ExercícioClasses fi Fi

0 I----- 10 2 210 I----- 20 1 320 I----- 30 3 630 I----- 40 5 1140 I----- 50 10 2150 I----- 60 8 2960 I----- 70 9 3870 I----- 80 6 4480 I----- 90 4 4890 I----100 2 50

Page 56: Estatística Aplicada à Comunicação

ANÁLISE ESTATÍSTICA

PROF. CLAUDIO MACIEL

Aula 3- Medidas de Dispersão

Page 57: Estatística Aplicada à Comunicação

Medidas de Dispersão

• Variância

• Desvio Padrão

• Coeficiente de Variação ( C.V.)

Page 58: Estatística Aplicada à Comunicação

Medidas de Dispersão

Variância A variância da amostra, representada por s2, é

obtida somando-se os quadrados dos desvios, em relação à sua média e dividindo o resultado pelo número de observações menos um.

Σ ( Xi – Média) 2 __________________

( n – 1)

Page 59: Estatística Aplicada à Comunicação

Medidas de Dispersão

• DESVIO -PADRÃO

O desvio padrão é a raiz quadrada do valor obtido para a variância.

Ele é o valor que quantifica a dispersão dos eventos sob distribuição normal, ou seja, a média das diferenças entre o valor de cada evento e a média central.

S = (Σ (Xi - X)² Fi )/ Σ Fi ) ^ (1/ 2)

Page 60: Estatística Aplicada à Comunicação

Medidas de Dispersão

Coeficiente de Variação - Corresponde à relação entre o desvio-padrão e a média.

Page 61: Estatística Aplicada à Comunicação

Medidas de Dispersão

• Calcule o desvio-padrão da amostra: 4, 5, 5, 7 e 8 e marque a opção correta: Fórmula

A) 2,56. B) 1,64. C) 5,80. D) 1,80.

Page 62: Estatística Aplicada à Comunicação

Medidas de Dispersão

• Calcule o desvio-padrão da amostra: 2, 2, 7, 8 e 9 e marque a opção correta: Fórmula :

A) 5,6. B) 3,36. C) 7,6. D) 1,30. E) 1,70.

Page 63: Estatística Aplicada à Comunicação

Medidas de Dispersão

Segue abaixo os dados agrupados de uma sondagem eleitoral de avaliação do Governador Maciel, Calcular a variância e o desvio-padrão

• Classes fi Fi

0 I----- 10 2 2

10 I----- 20 4 6

20 I----- 30 5 11

30 I----- 40 4 15

40 I----- 50 6 21

50 I----- 60 7 28

60 I----- 70 7 35

70 I----- 80 10 45

80 I----- 90 25 70

90 I----100 10 80

Page 64: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Medidas de Assimetria

Nas aulas anteriores já vimos a natureza da assimetria, isto é, quando a curva de frequência se afasta da posição de simetria. Sendo simétrica quando a média e a moda coincidem, isto é, possuem o mesmo valor. A curva de uma distribuição simétrica tem por característica que o valor máximo encontra-se no ponto central da distribuição. Desta forma os pontos equidistantes do centro possuem a mesma frequência.

Quando se faz um levantamento estatístico dificilmente encontramos, na prática, uma distribuição simétrica. O que ocorre na verdade, em levantamentos de dados reais, são medidas mais ou menos assimétricas em relação à frequência máxima. A distribuição assimétrica á esquerda ou negativa, ocorre quando o valor da moda é maior do que a média. Logo a distribuição assimétrica á direita ou positiva ocorre quando a moda é menor do que a média.

Page 65: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

ASSIMETRIA

Desta forma a diferença entre a moda e a média poderá definir o tipo de assimetria. Calculando o valor da diferença: Media - Moda = 0 assimetria nula ou distribuição simétrica Media - Moda < 0 assimetria negativa ou à esquerda Media - Moda> 0 assimetria positiva ou à direita

Page 66: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

ASSIMETRIA

COEFICIENTE DE ASSIMETRIA A fórmula não permite fazer comparações entre duas distribuições com relação ao seu grau de assimetria. Desta forma, o coeficiente de assimetria de Pearson é muito utilizado para verificar o grau de assimetria das curvas de distribuição. Definido como: AS = 3 (Media - Mediana) / DP

Se o resultado for:

0,15 < AS < 1 assimetria moderada AS > 1 assimetria forte

Page 67: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

CURTOSE

Curtose é o grau de achatamento de uma distribuição em relação à curva normal, uma distribuição padrão. A curva normal corresponde a uma distribuição teórica de probabilidade.

Quando a distribuição apresenta uma curva de frequência com dados mais concentrados em torno da média do que a curva normal. Essa distribuição chama-se leptocúrtica.

Quando a distribuição apresenta uma curva de frequência com dados mais dispersos em relação a média do que na curva normal. Essa distribuição chama-se platicúrtica.

A curva normal, tomada por base para classificação do achatamento das distribuições de frequências, recebe o nome de mesocúrtica.

Page 68: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

CURTOSE

A fórmula que determina a medida da curtose, isto é, o grau de achatamento da curva é: C (Q3 – Q1) / 2 (P90 – P10) Essa fórmula é denominada como coeficiente percentílico de curtose.O coeficiente de curtose define o grau de achatamento da curva, da seguinte forma: C = 0,263 curva mesocúrtica;C < 0,263 curva leptocúrtica;C > 0,263 curva platicúrtica;

Page 69: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Medidas de Curtose

Sejam as seguintes medidas, relativas as distribuições de frequências A, B e C.

DISTRIBUIÇÕES Q3 Q1 P90 P10

A 930 809 1020 780

B 82,4 65,8 88,6 57,0

C 46,5 29,7 51,2 20,9

Determine os graus de curtose e classifique cada uma das distribuições;

curva leptocúrtica

curva mesocúrtica

curva platicúrtica

Page 70: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Medidas de Assimetria e Curtose

A análise conjunta da assimetria e curtose da distribuição de frequências pode fornecer informações importantes sobre os dados obtidos, que muitas vezes não aparece na simples observância dos valores obtidos.

A assimetria nos mostra o quanto a média se desloca para a direita ou para a esquerda, mostrando, também, como algumas condições impostas sobre a população podem influenciar o resultado e deslocamento da média.

O grau de curtose indica se a distribuição está mais ou menos concentrada, fazendo com que a curva esteja mais ou menos achatada em relação à curva normal (curva mesocúrtica), padrão de referência para a classificação do grau de curtose.

Page 71: Estatística Aplicada à Comunicação

ASSIMETRIA E CURTOSE

Exercicios

A curva normal, quanto ao seu grau de curtose, também pode ser chamada de:a. ( ) Assimétricab. ( ) Platicúrticac. ( ) Mesocúrticad. ( ) Assimétrica à direitae. ( ) Leptocúrtica

Page 72: Estatística Aplicada à Comunicação

ASSIMETRIA E CURTOSE

Exercicios

. O grau de assimetria mede:a. ( ) A diferença entre dois valores quaisquer de um conjunto de valores.b. ( ) A diferença entre o maior e o menor valor observado da variável dividido pela variânciac. ( ) O quanto a curva de distribuição está mais ou menos achatada em relação à curva normald. ( ) A diferença entre a média e a moda, indicando o deslocamento da curva para a direita ou para a esquerdae. ( ) Nenhuma das alternativas anteriores.

Page 73: Estatística Aplicada à Comunicação

ASSIMETRIA E CURTOSE

Exercicios

• .O grau de curtose da curva de distribuição mostra: a. ( ) O grau de dispersão dos dadosb. ( ) A diferença entre os limites inferior e superior dos dadosc. ( ) A diferença entre os valores da média e modad. ( ) A diferença entre os valores da média e medianae. ( ) O grau de achatamento da curva de distribuição em relação à curva normal

Page 74: Estatística Aplicada à Comunicação

ANÁLISE ESTATÍSTICA

PROF. CLAUDIO MACIEL

Aula 7- Probabilidade

Page 75: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Conteúdo Programático desta aula

Conhecer a definição dos modelos teóricos de distribuição de probabilidade ; Aprender o significado e aplicação das variáveis aleatórias; Entender a definição dos conceitos de distribuição normal.

Page 76: Estatística Aplicada à Comunicação

PROBABILIDADEVariável Aleatória

Considere um espaço amostral S e que cada ponto amostral seja atribuído um número. Fica , então, definida uma função chamada variável aleatória , indicada por uma letra maiúscula , sendo seus valores indicados por letras minúsculas.

Dado lançamento simultâneo de duas moeas o espaço amostral é S= {(Ca,Ca),(Ca,Co), (Co,Ca), (Co,Co)} e X representa o número de caras que aparecem a cada espaço amostral.

Page 77: Estatística Aplicada à Comunicação

PROBABILIDADEVariável Aleatória

Assim X será a frequência da seguinte tabela :

Ponto Amostral X(Ca,Ca) 2(Ca,Co) 1(Co,Ca) 1(Co,Co) 0

Page 78: Estatística Aplicada à Comunicação

PROBABILIDADESDistribuição de Probabilidade

Consideremos a distribuição de frequências relativas ao número de acidentes em um estacionamento :

Em um dia a possibilidade de a) Não ocorrer acidente b) ocorrer um acidente c) ocorrerem dois

acidentes c) ocorrerem três acidentes

Numero de Acidentes Frequência0 221 52 23 1

30

Page 79: Estatística Aplicada à Comunicação

PROBABILIDADESDistribuição de Probabilidade

Podemos escrever:

Essa tabela é denominada distribuição de probabilidade.

Numero de Acidentes Probab.0 0,731 0,172 0,073 0,03

1

Page 80: Estatística Aplicada à Comunicação

PROBABILIDADEDistribuição Binomial

Consiste na análise de problemas do tipo : determinar a probabilidade de encontrar k sucessos com n tentativas.

F(X) = P(X = k) = n pk qn-k

k P(X = k) = probabilidade de que o evento se realiza em k vezes em n provasp é a possibilidade de que o evento se realize numa só provaq é a possibilidade de que o evento não se realize nessa prova

Page 81: Estatística Aplicada à Comunicação

PROBABILIDADEDistribuição Binomial (Exemplo 1)

Uma moeda é lançada cinco vezes seguidas. Calcule a possibilidade de serem obtidas três caras nessas cinco provas

F(X) = P(X = k) = 5 p3 q5-3

3 P(X = k) = 10 * (1/2)3 * (1/2)2 = 10*1/8*1/4 = 10/32 = 5/16

Page 82: Estatística Aplicada à Comunicação

PROBABILIDADEDistribuição Binomial (Exemplo 2)

Dois times de futebol , A e B, jogam entre si seis vezes. Encontre a possibilidade do time A ganhar quatro jogos.

F(X) = P(X = k) = 6 p4 q6-4

4 P(X = k) = 15 * (1/3)4 * (2/3)2 = 15*1/81*4/9 = 20/243

Page 83: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância 1. As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição.

Page 84: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

A) A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo?

Page 85: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

B) Qual é a probabilidade de ocorrer valor maior do que z = 1,25?

C) Qual é a probabilidade de ocorrer valor menor do que z = -0,5?

Page 86: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

• Suponhamos que uma nota média de estudantes em uma prova foi de 6 com desvio-padrão de 1,5.

• Para calcular probabilidades associadas à distribuição normal, usa-se um artifício. Sabe-se que, se X tem distribuição normal com média, e desvio padrão, a variável z .Esta variável corresponde a :

• Z = ( Xi – Xm ) / DP . Ou seja o valor da variável menos a média , dividido pelo desvio-padrão.

Page 87: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDAPara a realização deste exercício será necessário o uso de uma Tabela de Distribuição Normal , anexada na

Biblioteca Virtual.

• Caso desejamos calcular o percentual de alunos com media entre 4,5 e 7,5 , temos :

• Z = (7,5-6) / 1,5 = 1 , que corresponde a 0,3413 na tabela de distribuição normal.

• Z = (4,5-6) / 1,5 = -1 , que corresponde a 0,3413 na tabela de distribuição normal.

• Assim , o percentual de alunos que obtiveram entre 4,5 e 7,5 de média é de 68,26%

Page 88: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media acima de 7,5 , temos :

Page 89: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media acima de 4,5 , temos :

Page 90: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media abaixo de 5,25 , temos :

Page 91: Estatística Aplicada à Comunicação

Distribuição Normal

Uma população com características normais tem peso médio de 75 kg e desvio padrão de 3 kg. Calcule o percentual de pessoas que tem peso acima de 79,5 Kg a) 10% b) 6,68% c) 43,32% d) 34,13% e) 5,87%

Page 92: Estatística Aplicada à Comunicação

Distribuição Normal

O levantamento do custo unitário de produção de um medicamento revelou que sua distribuição é normal com média R$ 56,00 e desvio padrão R$ 5,00. Um item da produção é escolhido ao acaso. Calcular a probabilidade do custo desse item ser menor que R$ 51,00;

a) 16,67% b) 6,68% c) 13,32% d) 34,13% e) 15,87%

Page 93: Estatística Aplicada à Comunicação

ANÁLISE ESTATISTICA

PROF. CLAUDIO MACIEL

Aula 8- Distribuição Normal

Page 94: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Conteúdo Programático desta aula

Capacidade de conhecer os conceitos e aplicações da Distribuição Normal

Resolver problemas envolvendo Distribuição Normal;

Page 95: Estatística Aplicada à Comunicação

Amostragem

• Distribuição Normal

Page 96: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância 1. As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição.

Page 97: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

A) A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo?

Page 98: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

B) Qual é a probabilidade de ocorrer valor maior do que z = 1,25?

C) Qual é a probabilidade de ocorrer valor menor do que z = -0,5?

Page 99: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA

• Suponhamos que uma nota média de estudantes em uma prova foi de 6 com desvio-padrão de 1,5.

• Para calcular probabilidades associadas à distribuição normal, usa-se um artifício. Sabe-se que, se X tem distribuição normal com média, e desvio padrão, a variável z .Esta variável corresponde a :

• Z = ( Xi – Xm ) / DP . Ou seja o valor da variável menos a média , dividido pelo desvio-padrão.

Page 100: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDAPara a realização deste exercício será necessário o uso de uma Tabela de Distribuição Normal , anexada na

Biblioteca Virtual.

• Caso desejamos calcular o percentual de alunos com media entre 4,5 e 7,5 , temos :

• Z = (7,5-6) / 1,5 = 1 , que corresponde a 0,3413 na tabela de distribuição normal.

• Z = (4,5-6) / 1,5 = -1 , que corresponde a 0,3413 na tabela de distribuição normal.

• Assim , o percentual de alunos que obtiveram entre 4,5 e 7,5 de média é de 68,26%

Page 101: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media acima de 7,5 , temos :

Page 102: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media acima de 4,5 , temos :

Page 103: Estatística Aplicada à Comunicação

Distribuição Normal

DISTRIBUIÇÃO NORMAL REDUZIDA• Caso desejamos calcular o percentual de alunos com

media abaixo de 5,25 , temos :

Page 104: Estatística Aplicada à Comunicação

Distribuição Normal

Uma população com características normais tem peso médio de 75 kg e desvio padrão de 3 kg. Calcule o percentual de pessoas que tem peso acima de 79,5 Kg a) 10% b) 6,68% c) 43,32% d) 34,13% e) 5,87%

Page 105: Estatística Aplicada à Comunicação

Distribuição Normal

O levantamento do custo unitário de produção de um medicamento revelou que sua distribuição é normal com média R$ 56,00 e desvio padrão R$ 5,00. Um item da produção é escolhido ao acaso. Calcular a probabilidade do custo desse item ser menor que R$ 51,00;

a) 16,67% b) 6,68% c) 13,32% d) 34,13% e) 15,87%

Page 106: Estatística Aplicada à Comunicação

Distribuição Normal

Page 107: Estatística Aplicada à Comunicação

ANÁLISE ESTATÍSTICA

PROF. CLAUDIO MACIEL

Aula 9- Correlação e Regressão

Page 108: Estatística Aplicada à Comunicação

NOME DA AULA – AULA1

ASSIMETRIA E CURTOSE

Conteúdo Programático desta aula

Conhecer a definição dos modelos teóricos de distribuição de probabilidade ; Aprender o significado e aplicação das variáveis aleatórias; Entender a definição dos conceitos de distribuição normal.

Page 109: Estatística Aplicada à Comunicação

Correlação

• Significa relação em dois sentidos e usado como a força que mantém unidos dois conjuntos de valores.

Exemplo : Pesquisa com 5 pessoas na Cidade XYZ sobre educação.

• Pergunta 1 : Tempo de Escolaridade• Pergunta 2 : Quantidade de livros que possui.

Page 110: Estatística Aplicada à Comunicação

Correlação

Respostas

Entrevistado Escolaridade Livros

A 5 10

B 8 30

C 10 45

D 12 50

E 15 75

Page 111: Estatística Aplicada à Comunicação

Correlação

• Fórmula de Coeficiente de Correlação Linear :

• R x,y = n ∑ XiYi – (∑ Xi) (∑ Yi) __________________________ \| ( n ∑ Xi2 –(∑ Xi) 2 ) (n (∑ Yi 2) - (∑ Yi)

Page 112: Estatística Aplicada à Comunicação

Correlação

Entrevistado

Escolaridade Livros XY X2 Y2

A 5 10 50 25 100

B 8 30 240 64 900

C 10 45 450 100 2025

D 12 50 600 144 2500

E 15 75 1125 225 5625

50 210 2465 558 11150

Page 113: Estatística Aplicada à Comunicação

Correlação

• Fórmula de Coeficiente de Correlação Linear :

• R x,y = 5 x 2465 – 50 x 210 __________________________ \|( 5 x 558 – 50 2 ) x ( 5x11150 – 210 2 )

Page 114: Estatística Aplicada à Comunicação

Correlação

• Fórmula de Coeficiente de Correlação Linear :

• R x,y = 12325 - 10500 __________________________ \|( 2790- 2500) x ( 55750 – 44100 )

Page 115: Estatística Aplicada à Comunicação

Correlação

• Fórmula de Coeficiente de Correlação Linear :

• R x,y = 1825 _________ = 1825 / 1838,1 = 0,99 \| 3.378.500

Page 116: Estatística Aplicada à Comunicação

Correlação

Interpretação

• 0.70 para mais ou para menos indica uma forte correlação.

• 0.30 a 0.7 positivo ou negativo indica correlação moderada.

• 0 a 0.30 Fraca correlação.

Page 117: Estatística Aplicada à Comunicação

Correlação

Page 118: Estatística Aplicada à Comunicação

Regressão Linear

• Regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.

• A regressão, em geral, trata da questão de se estimar um valor condicional esperado.

Page 119: Estatística Aplicada à Comunicação

Regressão Linear

• A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear.

Page 120: Estatística Aplicada à Comunicação

Regressão Linear

Estimar valores de uma variável, com base em valores conhecidos da outra. Em situações em que as duas variáveis medem aproximadamente a mesma coisa, mas uma delas é relativamente dispendiosa, ou difícil de lidar, enquanto que a outra não.

Page 121: Estatística Aplicada à Comunicação

Regressão Linear

Explicar valores de uma variável em termos da outra, ou seja, confirmar uma relação de causa e efeito entre duas variáveis.

Predizer valores futuros de uma variável. Ex. aplicar testes para avaliar o sucesso de um ingressante na escola ou no emprego.

Page 122: Estatística Aplicada à Comunicação

Regressão Linear

• a= (∑ y – b ∑ x)/ n

• b= [n (∑ xy) – (∑ x ∑ y)] / [n (∑ x2) – (∑ x) 2]

Page 123: Estatística Aplicada à Comunicação

Regressão Linear

Chuvas (em mm) Produção Acerola42 2918 4125 37,520 4035 32,510 45

Page 124: Estatística Aplicada à Comunicação

Regressão Linear

Page 125: Estatística Aplicada à Comunicação

Regressão Linear

Chuvas (em mm) Produção Manga42 13418 8625 10020 9035 12010 70

Page 126: Estatística Aplicada à Comunicação