118
Estatística e Análise de Dados Professor Leandro Morilhas

Estatística e Análise de Dados Professor Leandro Morilhas

Embed Size (px)

Citation preview

Page 1: Estatística e Análise de Dados Professor Leandro Morilhas

Estatística e Análise de Dados

Professor Leandro Morilhas

Page 2: Estatística e Análise de Dados Professor Leandro Morilhas

Agenda‐ Conceito e origem da Estatística.‐ Áreas de Estudo.‐ Medidas de posição central.‐ Medidas de dispersão.‐ Probabilidade.‐ Correlação e regressão linear.

Page 3: Estatística e Análise de Dados Professor Leandro Morilhas

Um passeio pela história …

Page 4: Estatística e Análise de Dados Professor Leandro Morilhas

3000 AC – Censos no Egito

Page 5: Estatística e Análise de Dados Professor Leandro Morilhas

Outras cenas ...

Page 6: Estatística e Análise de Dados Professor Leandro Morilhas

Na Babilônia também …

Page 7: Estatística e Análise de Dados Professor Leandro Morilhas

Na Bíblia …• Quarto livro do velho

testamento• Instrução a Moisés• Fazer um levantamento dos

homens de Israel que estivessem aptos a guerrear

Page 8: Estatística e Análise de Dados Professor Leandro Morilhas

Augusto César• Édito para que se fizesse o

censo em todo o império romanoCensere em latim = taxar

Page 9: Estatística e Análise de Dados Professor Leandro Morilhas

Maria e José• Em função do édito,

Maria e José viajaram para Belém

Page 10: Estatística e Análise de Dados Professor Leandro Morilhas

Guilherme o conquistador• Inglaterra• 1085• Levantamento estatístico

– Terras– Propriedades– Empregados– Animais

• Base de cálculo de impostos

Dom

esd

ay =

Dia

do ju

ízo fi

nal

Dom

esd

ay =

Dia

do ju

ízo fi

nal

Page 11: Estatística e Análise de Dados Professor Leandro Morilhas

Um livro para os impostos …

Page 12: Estatística e Análise de Dados Professor Leandro Morilhas

Séc XVII - Tábuas de Mortalidade• John Graunt• Análises de nascimentos e

mortes• % de homens ligeiramente

superior a de mulheres

Page 13: Estatística e Análise de Dados Professor Leandro Morilhas

Palavra Estatística• Cunhada pelo acadêmico

alemão Gottfried Achenwall por volta da metade do século XVIII

• O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797

Page 14: Estatística e Análise de Dados Professor Leandro Morilhas

Para entender a ...

EstatísticaStatusStatus EstadoEstado

Poder públicoPoder públicoCaracterização Caracterização dos dadosdos dados

Page 15: Estatística e Análise de Dados Professor Leandro Morilhas

Uma origem controversa

Estatísticapara cobrarIMPOSTOS

Page 16: Estatística e Análise de Dados Professor Leandro Morilhas

E depois ….

Facilitar a análise de

DADOS

Page 17: Estatística e Análise de Dados Professor Leandro Morilhas

A Estatística é dividida em:Análise de dados:

Coleta, organização e

resumo dos dadosProbabilidade:

Necessária para tirar conclusões a partir de

amostras Inferência estatística: Tirar

conclusões estatísticas de dados específicos usando os

conhecimentos de probabilidade

Page 18: Estatística e Análise de Dados Professor Leandro Morilhas

Definições:

População

É o conjunto de todos os elementos de interesse em um determinado estudo

Amostra

É uma parte da população selecionada para análise

Page 19: Estatística e Análise de Dados Professor Leandro Morilhas

Dados

Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que

tenham sido coletados

Qualitativos:Representam a

informação

que identifica alguma

qualidade, categoria

ou característica 

Quantitativos:

Quando é possível

atribuir um valor

numérico

Page 20: Estatística e Análise de Dados Professor Leandro Morilhas

Campos de Aplicação

Estudos de mercado 

O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto.

População: conjunto de todos as famílias do país

Amostra: conjunto de algumas famílias, pesquisados pela empresa

Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.

Page 21: Estatística e Análise de Dados Professor Leandro Morilhas

Campos de Aplicação

Controle de qualidade 

O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada.

População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo.

Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos.

Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.

Page 22: Estatística e Análise de Dados Professor Leandro Morilhas

Analisando ...

FrequênciasMédiaMedianaDesvio-Padrão

Page 23: Estatística e Análise de Dados Professor Leandro Morilhas

Medidas de Medidas de Posição CentralPosição Central

Page 24: Estatística e Análise de Dados Professor Leandro Morilhas

Medidas úteis para a decisão

• Medidas de posição central:

–Média ou Valor Esperado–Moda–Mediana

Page 25: Estatística e Análise de Dados Professor Leandro Morilhas

Média Aritmética Simples• Mais usual das medidas estatísticas• Relação entre soma e contagem• Centro geométrico de um conjunto de

dados

n

xxou

n

i 1

contagem

somamédia

Page 26: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios1 – Em março de 2009, os vendedores da Empresa

Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.

Page 27: Estatística e Análise de Dados Professor Leandro Morilhas

2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de 2009. Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular:

A - O volume total gasto com o pagamento dos salários no mês de julho.

B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?

Exercícios

Page 28: Estatística e Análise de Dados Professor Leandro Morilhas

Média aritmética ponderada

n

ii

n

iii

w

xf

xfxx

1

1

.

É preciso considerar as frequências …

Page 29: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios

3 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg.

A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança?

B – Qual o peso médio das caixas carregadas no caminhão?

Page 30: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios4 – O capital da Empresa Maguary Ltda. é formado pelo

aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro:

Calcular a taxa média do capital da empresa.

Forma de Capital Participação em US$ Taxa de Juros

Acionistas 2.400 12%

Financiamentos de Longo Prazo

1.200 8%

Debêntures 400 14%

Page 31: Estatística e Análise de Dados Professor Leandro Morilhas

Cuidado com as médias!!!

Aparências podem enganar!

Page 32: Estatística e Análise de Dados Professor Leandro Morilhas

Maior problema da média …

Maldição dos extremos

ou outliersExtremos distorcemExtremos distorcem

algumas medidasalgumas medidas

Page 33: Estatística e Análise de Dados Professor Leandro Morilhas

Solução para o problema …Remover Remover os extremos!!os extremos!!

Page 34: Estatística e Análise de Dados Professor Leandro Morilhas

Pesquisa sobre remuneração• Empresa paga $400,00 aos estagiários de

Administração• Quer saber …

É muito ou pouco?• Coletou amostra de dados• Dados:

{300; 350; 6000; 340; 310; 380}

contagem

somamédia 7680

6$1.280,00

Pouquíssimo!!!Pouquíssimo!!!

Page 35: Estatística e Análise de Dados Professor Leandro Morilhas

Organizando os dados …• Dados:

{300; 350; 6000; 340; 310; 380}• Rol:

{300; 310; 340; 350; 380; 6000}

$400,00$400,00

Extremo distorce a média!

Rol sem extremo:Rol sem extremo:{300; 310; 340; 350; 380}{300; 310; 340; 350; 380}

Média = 1680/5 = $336,00Média = 1680/5 = $336,00

Alto!Alto!

Page 36: Estatística e Análise de Dados Professor Leandro Morilhas

O centro dos dados ordenados

Onde está ocentro???

Page 37: Estatística e Análise de Dados Professor Leandro Morilhas

Mediana• Valor central de uma série ordenada de dados (Rol)

{3; 7; 9; 10; 4; 8; 2}{3; 7; 9; 10; 4; 8; 2}

{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}

Ordenando no RolOrdenando no Rol

3 menores

3 maiores

{2; 3; 4; 8; 9; 10}{2; 3; 4; 8; 9; 10}

n par?n par?mediana = 6mediana = 6

Page 38: Estatística e Análise de Dados Professor Leandro Morilhas

O que é mais frequente

Será que está na

modamoda???

Page 39: Estatística e Análise de Dados Professor Leandro Morilhas

Moda• Valor que se repete com

maior frequência

{2; 3; 4; 7; 7; 9; 10}{2; 3; 4; 7; 7; 9; 10}

{2; 2; 4; 7; 7; 9; 10}{2; 2; 4; 7; 7; 9; 10}

{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}

unimodalunimodal

bimodal ou multimodalbimodal ou multimodal

amodalamodal

Page 40: Estatística e Análise de Dados Professor Leandro Morilhas

Medidas de Localização Não Centrais

Page 41: Estatística e Análise de Dados Professor Leandro Morilhas

Quartis

Dividem os dados ordenados em quatro partes:

Primeiro Quartil (Q1): valor que faz com que 25% das observações

sejam menores e 75% sejam maiores que Q1

Segundo Quartil (Q2): é a MEDIANA – 50% das observações são

menores que Q2 e 50% são maiores

Terceiro Quartil (Q3): valor que faz com que 75% das observações

sejam menores e 25% sejam maiores que Q3

 

Page 42: Estatística e Análise de Dados Professor Leandro Morilhas

Dados não agrupados

Q1 = valor que corresponde à posição:

 

 

   

Q2 = valor que corresponde à posição:

  

 

 

Q3 = valor que corresponde à posição:

4

1N

4

)1(2 N

4

)1(3 N

Page 43: Estatística e Análise de Dados Professor Leandro Morilhas

Regras usadas para obter os valores do quartil

Se o ponto de posicionamento for um número inteiro, é só usar

o número correspondente àquela posição

Se o ponto de posicionamento estiver na metade entre 2

números inteiros, a média dos dois números à direita e à

esquerda será o quartil

Se o ponto de posicionamento não for a metade do caminho

entre dois números inteiros, usamos o que estiver mais próximo.

 

Page 44: Estatística e Análise de Dados Professor Leandro Morilhas

5 - Os salários mensais para uma amostra de 12 administradores são:

2.350 2.450 2.550 2.380 2.255 2.2102.390 2.630 2.440 2.825 2.420 2.380

Determine os três quartis.

6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros:

11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,213,1 23,8 18,3 15,5 18,8 22,7 14,0

Encontre os três quartis.

Exercícios

Page 45: Estatística e Análise de Dados Professor Leandro Morilhas

7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela:

Nº de Publicações

Nº de Profissionais

0 3

1 12

2 15

3 10

4 16

Quais são os três quartis?

Exercícios

Page 46: Estatística e Análise de Dados Professor Leandro Morilhas

8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população:

Determine o valor da moda, da mediana e da média

No de defeito

No de caixas

0 32

1 28

2 11

3 4

4 3

5 1

Exercícios

Page 47: Estatística e Análise de Dados Professor Leandro Morilhas

Medidas de dispersãoMedidas de dispersão

Page 48: Estatística e Análise de Dados Professor Leandro Morilhas

Medidas de Dispersão

– Amplitude– Desvio médio– Variância– Desvio padrão

Page 49: Estatística e Análise de Dados Professor Leandro Morilhas

Encontrando os extremos dos dados• Fundo de investimento, com retornos: {7, 3 e 2}• Amplitude• Maior menos menor• Range ou intervalo

RR ==MaiorMaiorMenorMenor

--

RR == 77 22-- == 55

Page 50: Estatística e Análise de Dados Professor Leandro Morilhas

Desvio médio• Desvio médio ou afastamento

médio em relação à média

SérieSérie

22

33

77

DesviosDesvios

-2-2

-1-1

33Soma 0Soma 0Média 0Média 0

É preciso calcular osdesviosABSOLUTOS

Média = 4Média = 4

n

xxDM

n

ii

1

Page 51: Estatística e Análise de Dados Professor Leandro Morilhas

Desvio médio absoluto• Desvio médio absoluto ou

afastamento médio absoluto em relação à média

SérieSérie

22

33

77

Desv AbsDesv Abs

22

11

33Soma 6Soma 6Média 2Média 2

Calculamos os

MÓDULOS

Média = 4Média = 4 n

xxDMA

n

ii

1

Page 52: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios9 – A produção de manteiga dos últimos seis meses do Laticínio

Sabor do Leite Ltda. está apresentada a seguir. Com base nos números apresentados, calcule:

A- Média.B – O desvio médio absoluto

Produção mensal de manteiga em toneladas:{ 11; 8; 4; 10; 9; 12}

Page 53: Estatística e Análise de Dados Professor Leandro Morilhas

Variância• Dispensa o uso do MÓDULO• Usa o desvio ao quadrado

Série

2

3

7

Desvio2

4

1

9Soma 14

Média 4,67

Média = 4

n

xxn

ii

1

2

2

Page 54: Estatística e Análise de Dados Professor Leandro Morilhas

Desvio padrão• Resolve o problema

dimensional da variância• Raiz da variância

Desvio = Raiz (4,67) = 2,16

n

xxn

ii

1

2

2

Page 55: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios10 – Considerando o enunciado do exercício 9,

calcule a variância e o desvio padrão.

Page 56: Estatística e Análise de Dados Professor Leandro Morilhas

n

XXi

22 )(

1

)( 22

n

XXis

n

XXi

2)(

1

)( 2

n

XXis

VariânciaVariância

DesvioDesvioPadrãoPadrão

PopulacionalPopulacional AmostralAmostral

Fórmulas

Page 57: Estatística e Análise de Dados Professor Leandro Morilhas

Coeficiente de variação

x

souCV

Page 58: Estatística e Análise de Dados Professor Leandro Morilhas

58

11 - A U.S. Energy Information Administration monitora todas as usinas de

energia nuclear operando nos Estados Unidos. A tabela a seguir lista o número

de usinas ativas operando em cada um dos 20 estados da amostra.

A - Encontre a amplitude, a variância e o desvio-padrão desse conjunto de dados.

B - Elimine o maior valor dos dados e repita a alternativa a.

C - Que efeito a retirada dessa medição tem nas medidas de variação encontradas na letra a?

D - Elimine o maior e o menor valor do conjunto de dados e repita a alternativa a. Que efeito a

retirada de ambas as medições tem sobre a variação encontrada na alternativa a?

Est

ad

oN

úm

ero

de

Usi

na

s

Ala

bam

a5

Ariz

ona

3

Cal

iforn

ia4

Flo

rida

5

Geo

rgia

4

Illin

ois

13

Kan

sas

1

Loui

sian

a2

Mas

s1

Mis

s1

New

Ham

p1

New

Yor

k6

NC

arol

ina

5

Ohi

o2

Pen

n9

SC

arol

ina

7

Tenn

esse

e3

Texa

s4

Ver

mon

t1

Wis

cons

in3

Exercícios

Page 59: Estatística e Análise de Dados Professor Leandro Morilhas

59

12 - Uma amostra aleatória de 15 empresas dentre as que pediram concordata

no último mês em São Paulo foi selecionada por um analista. As idades das

empresas, em anos, foram registradas:

1.4 10.1 5.7 22.4 7.4

5.1 2.4 3.1 8.3 6.3

3.9 4.5 11.4 2.9 17.2

A - Encontre a média, a amplitude, a variância e o desvio-padrão desse conjunto de dados.

B - Calcule o valor da média menos o desvio-padrão; calcule também o valor da média mais

o desvio-padrão.

C - Quantos valores estão entre o intervalo definido pela média menos o desvio-padrão e a

média mais o desvio-padrão?

D - O que você pode inferir com estes resultados?

Exercícios

Page 60: Estatística e Análise de Dados Professor Leandro Morilhas

60

13 - Um fábricante de baterias automotivas alega que a duração média da vida

útil de uma bateria tipo A é de 60 meses. Entretanto, a garantia dessa marca é

de apenas 36 meses. Suponha que o desvio-padrão da vida útil seja de 10

meses e a distribuição de freqüência dos dados da vida útil tenda a ter um

formato numérico, conforme os dados a seguir.

45 57 65 51 74

58 68 57 68 64

40 63 54 59 77

A - Qual a porcentagem das baterias tipo A desse fábricante irão durar mais de 50 meses?

B - Qual a porcentagem das baterias tipo A desse fábricante irão durar menos de 41 meses?

C - Suponha que sua bateria dure 37 meses. O que você pode inferir sobre a alegação do

fábricante?

Exercícios

Page 62: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Consolidated Foods

A Consolidated Foods opera uma rede de supermercados no Novo México, no Arizona e na Califórnia. Os dados na Tabela 1 mostram as quantias em dólar e os métodos de pagamento para uma amostra de 100 clientes. Os gerentes da Consolidated solicitaram a amostra para descobrirem as práticas de pagamento dos clientes da loja. Em particular, os gerentes estão interessados em saber como uma nova opção de pagamento por cartão de crédito está relacionada com as quantias gastas pelos clientes.

Page 63: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Consolidated Foods

TABELA 1 - QUANTIA GASTA E MÉTODO DE PAGAMENTO PARA UMA AMOSTRA

Dinheiro Cheque Pessoal Cartão de Crédito Dinheiro Cheque Pessoal Cartão de Crédito7,40 27,60 50,30 5,08 52,87 69,775,15 30,60 33,76 20,48 78,16 48,114,75 41,58 25,57 16,28 25,9615,10 36,09 46,24 15,57 31,078,81 2,67 46,13 6,93 35,381,85 34,67 14,44 7,17 58,117,41 58,64 43,79 11,54 49,2111,77 57,59 19,78 13,09 31,7412,07 43,14 52,35 16,69 50,589,00 21,11 52,63 7,02 59,785,98 52,04 57,55 18,09 72,467,88 18,77 27,66 2,44 37,945,91 42,83 44,53 1,09 42,693,65 55,40 26,91 2,96 41,1014,28 48,95 55,21 11,17 40,511,27 36,48 54,19 16,38 37,202,87 51,66 22,59 8,85 54,844,34 28,58 53,32 7,22 58,753,31 35,89 26,57 17,8715,07 39,55 27,89 69,22

DE 100 CLIENTES DA CONSOLIDATED FOODS (em dólares)

Page 64: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Consolidated Foods

Relatório Gerencial:Use os métodos de estatística descritiva para sintetizar os dados da

amostra. Forneça separadamente sumários das quantias gastas para clientes que pagaram à vista, clientes de cheque pessoal e clientes de cartão de crédito. Seu relatório deve conter os seguintes sumários e discussões.

1 – Uma comparação e interpretação das médias e das medianas.2 – Uma comparação e interpretação das medidas de variabilidade

tais como a amplitude e o desvio-padrão.3 – A identificação e interpretação da regra de cinco itens para cada

método de pagamento.4 – Gráficos de pontos para cada método de pagamento.

Page 65: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso:

2 – Empresa Platox

Page 66: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Empresa PlatoxA empresa Platox, S.A. fabrica e comercializa celulares. A empresa tem sede

administrativa e fábrica na cidade de Curitiba e filiais em mais cinco cidades do Brasil.

As empresas Platox-Rio, Platox-Brasília, Platox-São Paulo, Platox – Belo Horizonte e Platox-Salvador, foram criadas com o objetivo de descentralizar a comercialização de celulares e para responder de forma mais eficiente às necessidades dos três tipos de clientes-alvo da empresa: adolescentes, executivos e pessoas fanáticas por novas tecnologias.

A empresa atua no mercado desde 2000, mas as filiais de São Paulo, Belo Horizonte e Salvador só foram criadas em 2003.

A capacidade produtiva da fábrica é de 500.000 celulares por ano, mas até agora a utilização dessa capacidade não ultrapassou os 70%: até 2002 foram produzidos 200.000 celulares por ano; e a partir de 2003, com a abertura das três novas filiais, esse número elevou-se para 350.000 unidades.

Page 67: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Empresa PlatoxPara aproveitar o efeito sinérgico que pode resultar do forte crescimento que se

esperava para a economia nacional, e atendimento à evolução favorável das margens de comercialização que se tem verificado nos últimos anos, os responsáveis pela empresa pretendem aumentar a produção de celulares para 450.000 unidades por ano.

Assim, e antes de decidir pela maior utilização da capacidade produtiva, a Administração da empresa deu instruções no sentido da diretoria de planejamento apresentar um relatório completo sobre as vendas de todas as filiais ao longo dos últimos anos. Paralelamente foi encomendado um estudo de marcado a uma empresa de consultoria, com o objetivo de saber qual é o posicionamento competitivo da empresa no mercado de celulares, tanto em nível nacional como em nível regional. Do estudo de mercado deverão resultar também algumas idéias sobre a estratégia de marketing a ser implementada em cada uma das filiais.

Portanto, cabe à diretoria de planejamento da empresa, a realização de um estudo do qual possam ser extraídas algumas conclusões importantes sobre o comportamento das vendas de todas as filiais ao longo dos últimos anos.

Page 68: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Empresa PlatoxPara a Administração da empresa importa saber em cada filial:

1 – Os níveis médio e mediano das vendas;2 – O comportamento das vendas em relação ao nível médio,

para se poder concluir sobre o grau de risco em aumentar a produção;

3 – A forma como as vendas se distribuíram ao longo do tempo;4 – O grau de concentração das vendas dentro da própria

empresa, para saber se as vendas se repartiram de forma mais ou menos equitativa por todas as filiais;

5 – Que ações devem ser realizadas tendo em vista o aumento das vendas para fazer face à maior utilização da capacidade produtiva.

Page 69: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: Empresa PlatoxObservação: No quadro seguinte apresentam-se as vendas (em reais) das seis filiais da

empresa ao longo dos últimos anos. Os dados foram já introduzidos planilha para que os cálculos possam ser feitos pelo Excel.

2000 62000 73450 581742001 61278 74528 638572002 58978 74582 658772003 65412 72145 86744 54782 38957 305872004 67857 66478 89887 57848 35764 286752005 68452 65432 95784 60124 36997 245782006 67582 61780 96784 60304 33393 224782007 67237 55781 95787 64578 29541 254782008 68412 52564 97581 71425 32151 263542009 68542 48790 101325 73458 33451 21960

Page 70: Estatística e Análise de Dados Professor Leandro Morilhas

Probabilidade

Page 71: Estatística e Análise de Dados Professor Leandro Morilhas

Distribuição NormalDistribuição Normal

““Curva normal Curva normal dos erros”dos erros”

Page 72: Estatística e Análise de Dados Professor Leandro Morilhas

Médias, desvios e sinos …• Uso da curva normal

FreqüênciaFreqüência

Variável XVariável XMédiaMédia

Alta frequênciaAlta frequência

BaixaBaixafrequênciafrequência

Área sob a curva permite obteras probabilidades

Page 73: Estatística e Análise de Dados Professor Leandro Morilhas

Características da curva• Na teoria, prolonga-se de

– infinito a + infinito– Área sob toda a curva igual a

100%

• Simétrica– Área de cada lado igual a 50%

Page 74: Estatística e Análise de Dados Professor Leandro Morilhas

Probabilidade

68%

95%

> 99%

– 3 – 2 – 1 0 + 1 + 2 + 3

Áreas sob a curva normal

68%68%

95%95%

99%99%

Page 75: Estatística e Análise de Dados Professor Leandro Morilhas

Para sempre lembrar!Uma indústria de cosméticos analisa a sua

produção de frascos de esmalte de unha que apresenta uma produção normalmente distribuída, com média igual a 12g e desvio 4g.

FreqüênciaFreqüência

Variável XVariável X = 12= 12

= 4= 4

Page 76: Estatística e Análise de Dados Professor Leandro Morilhas

A gerência industrial quer saber …

a) Qual a probabilidade de um frasco

escolhido ao acaso apresentar um

peso entre 12 e 14,56 g?

Page 77: Estatística e Análise de Dados Professor Leandro Morilhas

Assinalando a área no gráfico

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14,5614,56

Page 78: Estatística e Análise de Dados Professor Leandro Morilhas

Convertendo a variável original

x

Z

x Número de desvios de afastamento em relação

à média

Page 79: Estatística e Análise de Dados Professor Leandro Morilhas

Calcule a probabilidade ...

x

Z

ProbabilidadeProbabilidadeem tabela Zem tabela Z

ZZ

4

1256,14 Z

Z = +0,64Z = +0,64

0,640,6400

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14,5614,56

Page 80: Estatística e Análise de Dados Professor Leandro Morilhas

Tabelas facilitam os cálculos

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

Para Z =0,64

0,2389

Page 81: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios.

x

Z

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14 - Calcule a probabilidade entre 12 e 17 g,

entre 6 e 12g e entre 11 e 15g.

1717

ProbabilidadeProbabilidadeem tabela Zem tabela Z

ZZ00

Page 82: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios

FrequênciaFrequência

Variável XVariável Xmédiamédia

15 – Calcule o valor de Z para a área central

igual a 90%.

90%90%

Page 83: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios16 – Latas de conserva são fabricadas por uma

indústria com média de 990g e desvio padrão de 10g. Uma lata é rejeitada pelo controle de qualidade dessa indústria se possuir peso menor que 975g. Assim, qual é a probabilidade de uma lata de conserva ser rejeitada pelo controle de qualidade?

Page 84: Estatística e Análise de Dados Professor Leandro Morilhas

Anexos …

Distribuição Normal Padronizada

Page 85: Estatística e Análise de Dados Professor Leandro Morilhas

Tabelas de Z (1)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

Page 86: Estatística e Análise de Dados Professor Leandro Morilhas

Tabelas de Z (2)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

Page 87: Estatística e Análise de Dados Professor Leandro Morilhas

Tabelas de Z (3)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

Page 88: Estatística e Análise de Dados Professor Leandro Morilhas

Correlação e Regressão Linear

Page 89: Estatística e Análise de Dados Professor Leandro Morilhas

Duas variáveis quantitativas

XX independenteindependente

YY dependentedependente

Page 90: Estatística e Análise de Dados Professor Leandro Morilhas

Sem relação …

X

Y Análise de regressão:ajuste de reta aos pontos

Sem relação aparente

Page 91: Estatística e Análise de Dados Professor Leandro Morilhas

Com relação

X

Y

Análise de regressão:ajuste de reta aos pontosCom relação aparente

Page 92: Estatística e Análise de Dados Professor Leandro Morilhas

Erros quadráticos mínimos

X

Y

Erros2 devem ser mínimos!!!

Page 93: Estatística e Análise de Dados Professor Leandro Morilhas

Definindo a equação da reta

X

Y Equação da retaEquação da reta

Y = a + b.Xa

y b x

n

bn xy x y

n x x

2 2

Page 94: Estatística e Análise de Dados Professor Leandro Morilhas

Uma aplicação didática …

• Análise e separação de gastos … Fixos: não oscilam conforme produção

e vendas Variáveis: oscilam conforme produção

e vendas

Page 95: Estatística e Análise de Dados Professor Leandro Morilhas

Uma análise de vendas e gastosMês Vendas Gastos

jan 3 18

fev 9 39

mar 6 30

abr 3 15

mai 2 12

jun 9 45

Page 96: Estatística e Análise de Dados Professor Leandro Morilhas

Uma análise gráfica …

05

101520253035404550

0 2 4 6 8 10

Vendas Gastos

3 18

9 39

6 30

3 15

2 12

9 45

XX YY

Page 97: Estatística e Análise de Dados Professor Leandro Morilhas

Calculando os somatóriosVendas

XGastos

Y

3 18

9 39

6 30

3 15

2 12

9 45

3232 159159

X2 Y2 XY

9 324 54

81 1.521 351

36 900 180

9 225 45

4 144 24

81 2.025 405

220220 51395139 10591059

Page 98: Estatística e Análise de Dados Professor Leandro Morilhas

Calculando b

bn xy x y

n x x

2 2

n X Y X2 Y2 XY

6 32 159 220 5.139 1.059

6 1059 32 159

6 220 32

b = 4,27703b = 4,27703

Page 99: Estatística e Análise de Dados Professor Leandro Morilhas

ay b x

n

Calculando an X Y X2 Y2 XY

6 32 159 220 5.139 1.059

159

a = 3,6892a = 3,6892

4,42770 32

6

Page 100: Estatística e Análise de Dados Professor Leandro Morilhas

y = 3,6892 + 4,277x

05

101520253035404550

0 2 4 6 8 10

No gráfico …

Page 101: Estatística e Análise de Dados Professor Leandro Morilhas

Assim …• Equação obtida …

y = 3,6892 + 4,277x • Para vendas previstas iguais a 10 unidades …

y = 3,6892 + 4,277(10)

y = 46,4592

Page 102: Estatística e Análise de Dados Professor Leandro Morilhas

Análise de correlação …

Estuda a qualidade do ajuste linear feito

para os pontos

Page 103: Estatística e Análise de Dados Professor Leandro Morilhas

Diferentes níveis de aproximaçãoPositivaPositiva Positiva PerfeitaPositiva Perfeita

NegativaNegativa Negativa perfeitaNegativa perfeita

r > 0r > 0 r = 1r = 1

r < 0r < 0 r = -1r = -1

Page 104: Estatística e Análise de Dados Professor Leandro Morilhas

Correlação inexistente

r = 0r = 0

Page 105: Estatística e Análise de Dados Professor Leandro Morilhas

Coeficiente de determinação

totalVariação

licadaVariaçãor

exp2

n

ii

n

ii

yy

yyr

1

2

1

2

2

ˆ

Page 106: Estatística e Análise de Dados Professor Leandro Morilhas

Coeficiente de Pearson

2222 .

.

yynxxn

yxxynr

Page 107: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios17 – As exportações da castanha in natura, processadas pela

Empresa Castanheira Ltda., no período 2002 a 2008, encontram-se na tabela a seguir

Onde a variável quantidade está expressa em toneladas. Pede-se:A- a equação de regressão linear da quantidade sobre o tempo.B – O coeficiente de correlação linear.C – A quantidade estimada para exportação em 2009.

Ano 2002 2003 2004 2005 2006 2007 2008

Quantidade 50 46 36 31 25 11 18

Page 108: Estatística e Análise de Dados Professor Leandro Morilhas

Exercícios18 – A Empresa Squadrus Ltda., fabricante de implementos agrícolas de alta

tecnologia, realizou um levantamento do custo total de um de seus produtos (Y), expresso em US$ 1.000,00, em função do número total de peças produzidas (X), expresso em unidades, durante cinco meses, com o objetivo de montar uma regressão linear simples, entre essas variáveis, obtendo os somatórios:

Ʃx = 440 Ʃy = 120 Ʃxy = 12.300

Ʃx² = 49.450 Ʃy² = 3.200

Nessas condições, pede-se:A – A reta que melhor se ajuste a esses dados.B – O valor do coeficiente de correlação linear.C – O valor mais provável dos custos fixos.D – O valor estimado do custo variável para uma produção de 500 unidades.E – Admitindo-se um preço de venda de US$ 3.000,00, por unidade, estimar a

quantidade mínima que se deve produzir para se obter um lucro de US$ 80.000,00

Page 109: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso:

U. S. Department of Transportation

Page 110: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: U.S. Department of Transportation

Como parte de um estudo de segurança no transporte, o U. S. Department of Transportation levantou dados do número de acidentes fatais por 1.000 carteiras de habilitação, e a porcentagem de motoristas licenciados abaixo de 21 anos que possuem habilitação em uma amostra de 42 cidades. Os dados obtidos são apresentados na tabela 2.

Relatório Gerencial:A-) Desenvolva sumários gráficos e numéricos dos dados.B-) Use análise de regressão para investigar a relação entre o número de

acidentes fatais e a porcentagem de motoristas abaixo da idade de 21 anos. Discuta suas conclusões.

C-) Quais conclusões e/ou recomendações você pode derivar de suas análises?

Page 111: Estatística e Análise de Dados Professor Leandro Morilhas

Estudo de Caso: U.S. Department of Transportation

Porcentagem Acidentes Fatais Porcentagem Acidentes FataisAbaixo por 1.000 Abaixo por 1.000de 21 Carteiras de de 21 Carteiras de

Habilitação Habilitação13 2,962 17 4,10012 0,708 8 2,1908 0,885 16 3,62312 1,652 15 2,62311 2,091 9 0,83517 2,627 8 0,82018 3,830 14 2,8908 0,368 8 1,26713 1,142 15 3,2248 0,645 10 1,0149 1,028 10 0,49316 2,801 14 1,44312 1,405 18 3,6149 1,433 10 1,92610 0,039 14 1,6439 0,338 16 2,94311 1,849 12 1,91312 2,246 15 2,81414 2,855 13 2,63414 2,352 9 0,92611 1,294 17 3,256

Page 112: Estatística e Análise de Dados Professor Leandro Morilhas

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Page 113: Estatística e Análise de Dados Professor Leandro Morilhas

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Page 114: Estatística e Análise de Dados Professor Leandro Morilhas

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Page 115: Estatística e Análise de Dados Professor Leandro Morilhas

RESUMO DOS RESULTADOS

Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10

ANOVAgl SQ MQ F F de significação

Regressão 1 2272 2272 106.9176 6.60903E-06Resíduo 8 170 21.25Total 9 2442

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.61E-06 3.107936731 4.892063269

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Page 116: Estatística e Análise de Dados Professor Leandro Morilhas

RESUMO DOS RESULTADOS

Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10

ANOVAgl SQ MQ F F de significação

Regressão 1 2272 2272 106.9176471 6.60903E-06Resíduo 8 170 21.25Total 9 2442

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12002E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.60903E-06 3.107936731 4.892063269

Coeficiente de Correlação Linear de Pearson

Coeficiente de Determinação : Neste exemplo 93 % da variabilidade da variável das vendas é explicada pelo modelo

Número de observações utilizadas no cálculo dos coeficientes do modelo de regressão

Testa a hipótese de que existe relação linear entre as variáveis. Quando este valor for < 0,10 concluímos que existe relação linear entre as variáveis

Coeficientes do modeloVendas = 80 + 4 anos de experiencia

Quando esse valor for menor do que 0,10 a constante deve fazer parte do modelo.

Valor = 0,000006609 Quando esse valor for menor do que 0,10 existe relação linear entre as variáveis

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Page 117: Estatística e Análise de Dados Professor Leandro Morilhas

Referências Bibliográficas• Anderson, D; Sweeney, D e Williams, T; ESTATÍSTICA

APLICADA À ADMINISTRAÇÃO E ECONOMIA. São Paulo: Pioneira Thomson Learning, 2003.

• Bruni, A. L. ESTATÍSTICA APLICADA À GESTÃO EMPRESARIAL. São Paulo: Atlas, 2007.

• Kazmier, L. ESTATÍSTICA APLICADA À ECONOMIA E ADMINISTRAÇÃO. São Paulo: Mc Graw-Hill, 1982.

• Oliveira, F. E. M. ESTATÍSTICA E PROBABILIDADE: Exercícios Resolvidos e Propostos. 2 ed. São Paulo: Atlas, 1999.

• Smailes, J e Mc Graine, A. ESTATÍSTICA APLICADA À ADMINISTRAÇÃO COM EXCEL. São Paulo: Atlas, 2002.

Page 118: Estatística e Análise de Dados Professor Leandro Morilhas

Muito Obrigado!Professor Leandro Morilhas

[email protected]