Upload
internet
View
146
Download
5
Embed Size (px)
Citation preview
Estatística e Análise de Dados
Professor Leandro Morilhas
Agenda‐ Conceito e origem da Estatística.‐ Áreas de Estudo.‐ Medidas de posição central.‐ Medidas de dispersão.‐ Probabilidade.‐ Correlação e regressão linear.
Um passeio pela história …
3000 AC – Censos no Egito
Outras cenas ...
Na Babilônia também …
Na Bíblia …• Quarto livro do velho
testamento• Instrução a Moisés• Fazer um levantamento dos
homens de Israel que estivessem aptos a guerrear
Augusto César• Édito para que se fizesse o
censo em todo o império romanoCensere em latim = taxar
Maria e José• Em função do édito,
Maria e José viajaram para Belém
Guilherme o conquistador• Inglaterra• 1085• Levantamento estatístico
– Terras– Propriedades– Empregados– Animais
• Base de cálculo de impostos
Dom
esd
ay =
Dia
do ju
ízo fi
nal
Dom
esd
ay =
Dia
do ju
ízo fi
nal
Um livro para os impostos …
Séc XVII - Tábuas de Mortalidade• John Graunt• Análises de nascimentos e
mortes• % de homens ligeiramente
superior a de mulheres
Palavra Estatística• Cunhada pelo acadêmico
alemão Gottfried Achenwall por volta da metade do século XVIII
• O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797
Para entender a ...
EstatísticaStatusStatus EstadoEstado
Poder públicoPoder públicoCaracterização Caracterização dos dadosdos dados
Uma origem controversa
Estatísticapara cobrarIMPOSTOS
E depois ….
Facilitar a análise de
DADOS
A Estatística é dividida em:Análise de dados:
Coleta, organização e
resumo dos dadosProbabilidade:
Necessária para tirar conclusões a partir de
amostras Inferência estatística: Tirar
conclusões estatísticas de dados específicos usando os
conhecimentos de probabilidade
Definições:
População
É o conjunto de todos os elementos de interesse em um determinado estudo
Amostra
É uma parte da população selecionada para análise
Dados
Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que
tenham sido coletados
Qualitativos:Representam a
informação
que identifica alguma
qualidade, categoria
ou característica
Quantitativos:
Quando é possível
atribuir um valor
numérico
Campos de Aplicação
Estudos de mercado
O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto.
População: conjunto de todos as famílias do país
Amostra: conjunto de algumas famílias, pesquisados pela empresa
Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.
Campos de Aplicação
Controle de qualidade
O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada.
População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo.
Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos.
Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.
Analisando ...
FrequênciasMédiaMedianaDesvio-Padrão
Medidas de Medidas de Posição CentralPosição Central
Medidas úteis para a decisão
• Medidas de posição central:
–Média ou Valor Esperado–Moda–Mediana
Média Aritmética Simples• Mais usual das medidas estatísticas• Relação entre soma e contagem• Centro geométrico de um conjunto de
dados
n
xxou
n
i 1
contagem
somamédia
Exercícios1 – Em março de 2009, os vendedores da Empresa
Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.
2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de 2009. Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular:
A - O volume total gasto com o pagamento dos salários no mês de julho.
B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?
Exercícios
Média aritmética ponderada
n
ii
n
iii
w
xf
xfxx
1
1
.
É preciso considerar as frequências …
Exercícios
3 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg.
A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança?
B – Qual o peso médio das caixas carregadas no caminhão?
Exercícios4 – O capital da Empresa Maguary Ltda. é formado pelo
aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro:
Calcular a taxa média do capital da empresa.
Forma de Capital Participação em US$ Taxa de Juros
Acionistas 2.400 12%
Financiamentos de Longo Prazo
1.200 8%
Debêntures 400 14%
Cuidado com as médias!!!
Aparências podem enganar!
Maior problema da média …
Maldição dos extremos
ou outliersExtremos distorcemExtremos distorcem
algumas medidasalgumas medidas
Solução para o problema …Remover Remover os extremos!!os extremos!!
Pesquisa sobre remuneração• Empresa paga $400,00 aos estagiários de
Administração• Quer saber …
É muito ou pouco?• Coletou amostra de dados• Dados:
{300; 350; 6000; 340; 310; 380}
contagem
somamédia 7680
6$1.280,00
Pouquíssimo!!!Pouquíssimo!!!
Organizando os dados …• Dados:
{300; 350; 6000; 340; 310; 380}• Rol:
{300; 310; 340; 350; 380; 6000}
$400,00$400,00
Extremo distorce a média!
Rol sem extremo:Rol sem extremo:{300; 310; 340; 350; 380}{300; 310; 340; 350; 380}
Média = 1680/5 = $336,00Média = 1680/5 = $336,00
Alto!Alto!
O centro dos dados ordenados
Onde está ocentro???
Mediana• Valor central de uma série ordenada de dados (Rol)
{3; 7; 9; 10; 4; 8; 2}{3; 7; 9; 10; 4; 8; 2}
{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}
Ordenando no RolOrdenando no Rol
3 menores
3 maiores
{2; 3; 4; 8; 9; 10}{2; 3; 4; 8; 9; 10}
n par?n par?mediana = 6mediana = 6
O que é mais frequente
Será que está na
modamoda???
Moda• Valor que se repete com
maior frequência
{2; 3; 4; 7; 7; 9; 10}{2; 3; 4; 7; 7; 9; 10}
{2; 2; 4; 7; 7; 9; 10}{2; 2; 4; 7; 7; 9; 10}
{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}
unimodalunimodal
bimodal ou multimodalbimodal ou multimodal
amodalamodal
Medidas de Localização Não Centrais
Quartis
Dividem os dados ordenados em quatro partes:
Primeiro Quartil (Q1): valor que faz com que 25% das observações
sejam menores e 75% sejam maiores que Q1
Segundo Quartil (Q2): é a MEDIANA – 50% das observações são
menores que Q2 e 50% são maiores
Terceiro Quartil (Q3): valor que faz com que 75% das observações
sejam menores e 25% sejam maiores que Q3
Dados não agrupados
Q1 = valor que corresponde à posição:
Q2 = valor que corresponde à posição:
Q3 = valor que corresponde à posição:
4
1N
4
)1(2 N
4
)1(3 N
Regras usadas para obter os valores do quartil
Se o ponto de posicionamento for um número inteiro, é só usar
o número correspondente àquela posição
Se o ponto de posicionamento estiver na metade entre 2
números inteiros, a média dos dois números à direita e à
esquerda será o quartil
Se o ponto de posicionamento não for a metade do caminho
entre dois números inteiros, usamos o que estiver mais próximo.
5 - Os salários mensais para uma amostra de 12 administradores são:
2.350 2.450 2.550 2.380 2.255 2.2102.390 2.630 2.440 2.825 2.420 2.380
Determine os três quartis.
6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros:
11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,213,1 23,8 18,3 15,5 18,8 22,7 14,0
Encontre os três quartis.
Exercícios
7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela:
Nº de Publicações
Nº de Profissionais
0 3
1 12
2 15
3 10
4 16
Quais são os três quartis?
Exercícios
8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população:
Determine o valor da moda, da mediana e da média
No de defeito
No de caixas
0 32
1 28
2 11
3 4
4 3
5 1
Exercícios
Medidas de dispersãoMedidas de dispersão
Medidas de Dispersão
– Amplitude– Desvio médio– Variância– Desvio padrão
Encontrando os extremos dos dados• Fundo de investimento, com retornos: {7, 3 e 2}• Amplitude• Maior menos menor• Range ou intervalo
RR ==MaiorMaiorMenorMenor
--
RR == 77 22-- == 55
Desvio médio• Desvio médio ou afastamento
médio em relação à média
SérieSérie
22
33
77
DesviosDesvios
-2-2
-1-1
33Soma 0Soma 0Média 0Média 0
É preciso calcular osdesviosABSOLUTOS
Média = 4Média = 4
n
xxDM
n
ii
1
Desvio médio absoluto• Desvio médio absoluto ou
afastamento médio absoluto em relação à média
SérieSérie
22
33
77
Desv AbsDesv Abs
22
11
33Soma 6Soma 6Média 2Média 2
Calculamos os
MÓDULOS
Média = 4Média = 4 n
xxDMA
n
ii
1
Exercícios9 – A produção de manteiga dos últimos seis meses do Laticínio
Sabor do Leite Ltda. está apresentada a seguir. Com base nos números apresentados, calcule:
A- Média.B – O desvio médio absoluto
Produção mensal de manteiga em toneladas:{ 11; 8; 4; 10; 9; 12}
Variância• Dispensa o uso do MÓDULO• Usa o desvio ao quadrado
Série
2
3
7
Desvio2
4
1
9Soma 14
Média 4,67
Média = 4
n
xxn
ii
1
2
2
Desvio padrão• Resolve o problema
dimensional da variância• Raiz da variância
Desvio = Raiz (4,67) = 2,16
n
xxn
ii
1
2
2
Exercícios10 – Considerando o enunciado do exercício 9,
calcule a variância e o desvio padrão.
n
XXi
22 )(
1
)( 22
n
XXis
n
XXi
2)(
1
)( 2
n
XXis
VariânciaVariância
DesvioDesvioPadrãoPadrão
PopulacionalPopulacional AmostralAmostral
Fórmulas
Coeficiente de variação
x
souCV
58
11 - A U.S. Energy Information Administration monitora todas as usinas de
energia nuclear operando nos Estados Unidos. A tabela a seguir lista o número
de usinas ativas operando em cada um dos 20 estados da amostra.
A - Encontre a amplitude, a variância e o desvio-padrão desse conjunto de dados.
B - Elimine o maior valor dos dados e repita a alternativa a.
C - Que efeito a retirada dessa medição tem nas medidas de variação encontradas na letra a?
D - Elimine o maior e o menor valor do conjunto de dados e repita a alternativa a. Que efeito a
retirada de ambas as medições tem sobre a variação encontrada na alternativa a?
Est
ad
oN
úm
ero
de
Usi
na
s
Ala
bam
a5
Ariz
ona
3
Cal
iforn
ia4
Flo
rida
5
Geo
rgia
4
Illin
ois
13
Kan
sas
1
Loui
sian
a2
Mas
s1
Mis
s1
New
Ham
p1
New
Yor
k6
NC
arol
ina
5
Ohi
o2
Pen
n9
SC
arol
ina
7
Tenn
esse
e3
Texa
s4
Ver
mon
t1
Wis
cons
in3
Exercícios
59
12 - Uma amostra aleatória de 15 empresas dentre as que pediram concordata
no último mês em São Paulo foi selecionada por um analista. As idades das
empresas, em anos, foram registradas:
1.4 10.1 5.7 22.4 7.4
5.1 2.4 3.1 8.3 6.3
3.9 4.5 11.4 2.9 17.2
A - Encontre a média, a amplitude, a variância e o desvio-padrão desse conjunto de dados.
B - Calcule o valor da média menos o desvio-padrão; calcule também o valor da média mais
o desvio-padrão.
C - Quantos valores estão entre o intervalo definido pela média menos o desvio-padrão e a
média mais o desvio-padrão?
D - O que você pode inferir com estes resultados?
Exercícios
60
13 - Um fábricante de baterias automotivas alega que a duração média da vida
útil de uma bateria tipo A é de 60 meses. Entretanto, a garantia dessa marca é
de apenas 36 meses. Suponha que o desvio-padrão da vida útil seja de 10
meses e a distribuição de freqüência dos dados da vida útil tenda a ter um
formato numérico, conforme os dados a seguir.
45 57 65 51 74
58 68 57 68 64
40 63 54 59 77
A - Qual a porcentagem das baterias tipo A desse fábricante irão durar mais de 50 meses?
B - Qual a porcentagem das baterias tipo A desse fábricante irão durar menos de 41 meses?
C - Suponha que sua bateria dure 37 meses. O que você pode inferir sobre a alegação do
fábricante?
Exercícios
Estudo de Caso:1 - Consolidated Foods
Estudo de Caso: Consolidated Foods
A Consolidated Foods opera uma rede de supermercados no Novo México, no Arizona e na Califórnia. Os dados na Tabela 1 mostram as quantias em dólar e os métodos de pagamento para uma amostra de 100 clientes. Os gerentes da Consolidated solicitaram a amostra para descobrirem as práticas de pagamento dos clientes da loja. Em particular, os gerentes estão interessados em saber como uma nova opção de pagamento por cartão de crédito está relacionada com as quantias gastas pelos clientes.
Estudo de Caso: Consolidated Foods
TABELA 1 - QUANTIA GASTA E MÉTODO DE PAGAMENTO PARA UMA AMOSTRA
Dinheiro Cheque Pessoal Cartão de Crédito Dinheiro Cheque Pessoal Cartão de Crédito7,40 27,60 50,30 5,08 52,87 69,775,15 30,60 33,76 20,48 78,16 48,114,75 41,58 25,57 16,28 25,9615,10 36,09 46,24 15,57 31,078,81 2,67 46,13 6,93 35,381,85 34,67 14,44 7,17 58,117,41 58,64 43,79 11,54 49,2111,77 57,59 19,78 13,09 31,7412,07 43,14 52,35 16,69 50,589,00 21,11 52,63 7,02 59,785,98 52,04 57,55 18,09 72,467,88 18,77 27,66 2,44 37,945,91 42,83 44,53 1,09 42,693,65 55,40 26,91 2,96 41,1014,28 48,95 55,21 11,17 40,511,27 36,48 54,19 16,38 37,202,87 51,66 22,59 8,85 54,844,34 28,58 53,32 7,22 58,753,31 35,89 26,57 17,8715,07 39,55 27,89 69,22
DE 100 CLIENTES DA CONSOLIDATED FOODS (em dólares)
Estudo de Caso: Consolidated Foods
Relatório Gerencial:Use os métodos de estatística descritiva para sintetizar os dados da
amostra. Forneça separadamente sumários das quantias gastas para clientes que pagaram à vista, clientes de cheque pessoal e clientes de cartão de crédito. Seu relatório deve conter os seguintes sumários e discussões.
1 – Uma comparação e interpretação das médias e das medianas.2 – Uma comparação e interpretação das medidas de variabilidade
tais como a amplitude e o desvio-padrão.3 – A identificação e interpretação da regra de cinco itens para cada
método de pagamento.4 – Gráficos de pontos para cada método de pagamento.
Estudo de Caso:
2 – Empresa Platox
Estudo de Caso: Empresa PlatoxA empresa Platox, S.A. fabrica e comercializa celulares. A empresa tem sede
administrativa e fábrica na cidade de Curitiba e filiais em mais cinco cidades do Brasil.
As empresas Platox-Rio, Platox-Brasília, Platox-São Paulo, Platox – Belo Horizonte e Platox-Salvador, foram criadas com o objetivo de descentralizar a comercialização de celulares e para responder de forma mais eficiente às necessidades dos três tipos de clientes-alvo da empresa: adolescentes, executivos e pessoas fanáticas por novas tecnologias.
A empresa atua no mercado desde 2000, mas as filiais de São Paulo, Belo Horizonte e Salvador só foram criadas em 2003.
A capacidade produtiva da fábrica é de 500.000 celulares por ano, mas até agora a utilização dessa capacidade não ultrapassou os 70%: até 2002 foram produzidos 200.000 celulares por ano; e a partir de 2003, com a abertura das três novas filiais, esse número elevou-se para 350.000 unidades.
Estudo de Caso: Empresa PlatoxPara aproveitar o efeito sinérgico que pode resultar do forte crescimento que se
esperava para a economia nacional, e atendimento à evolução favorável das margens de comercialização que se tem verificado nos últimos anos, os responsáveis pela empresa pretendem aumentar a produção de celulares para 450.000 unidades por ano.
Assim, e antes de decidir pela maior utilização da capacidade produtiva, a Administração da empresa deu instruções no sentido da diretoria de planejamento apresentar um relatório completo sobre as vendas de todas as filiais ao longo dos últimos anos. Paralelamente foi encomendado um estudo de marcado a uma empresa de consultoria, com o objetivo de saber qual é o posicionamento competitivo da empresa no mercado de celulares, tanto em nível nacional como em nível regional. Do estudo de mercado deverão resultar também algumas idéias sobre a estratégia de marketing a ser implementada em cada uma das filiais.
Portanto, cabe à diretoria de planejamento da empresa, a realização de um estudo do qual possam ser extraídas algumas conclusões importantes sobre o comportamento das vendas de todas as filiais ao longo dos últimos anos.
Estudo de Caso: Empresa PlatoxPara a Administração da empresa importa saber em cada filial:
1 – Os níveis médio e mediano das vendas;2 – O comportamento das vendas em relação ao nível médio,
para se poder concluir sobre o grau de risco em aumentar a produção;
3 – A forma como as vendas se distribuíram ao longo do tempo;4 – O grau de concentração das vendas dentro da própria
empresa, para saber se as vendas se repartiram de forma mais ou menos equitativa por todas as filiais;
5 – Que ações devem ser realizadas tendo em vista o aumento das vendas para fazer face à maior utilização da capacidade produtiva.
Estudo de Caso: Empresa PlatoxObservação: No quadro seguinte apresentam-se as vendas (em reais) das seis filiais da
empresa ao longo dos últimos anos. Os dados foram já introduzidos planilha para que os cálculos possam ser feitos pelo Excel.
2000 62000 73450 581742001 61278 74528 638572002 58978 74582 658772003 65412 72145 86744 54782 38957 305872004 67857 66478 89887 57848 35764 286752005 68452 65432 95784 60124 36997 245782006 67582 61780 96784 60304 33393 224782007 67237 55781 95787 64578 29541 254782008 68412 52564 97581 71425 32151 263542009 68542 48790 101325 73458 33451 21960
Probabilidade
Distribuição NormalDistribuição Normal
““Curva normal Curva normal dos erros”dos erros”
Médias, desvios e sinos …• Uso da curva normal
FreqüênciaFreqüência
Variável XVariável XMédiaMédia
Alta frequênciaAlta frequência
BaixaBaixafrequênciafrequência
Área sob a curva permite obteras probabilidades
Características da curva• Na teoria, prolonga-se de
– infinito a + infinito– Área sob toda a curva igual a
100%
• Simétrica– Área de cada lado igual a 50%
Probabilidade
68%
95%
> 99%
– 3 – 2 – 1 0 + 1 + 2 + 3
Áreas sob a curva normal
68%68%
95%95%
99%99%
Para sempre lembrar!Uma indústria de cosméticos analisa a sua
produção de frascos de esmalte de unha que apresenta uma produção normalmente distribuída, com média igual a 12g e desvio 4g.
FreqüênciaFreqüência
Variável XVariável X = 12= 12
= 4= 4
A gerência industrial quer saber …
a) Qual a probabilidade de um frasco
escolhido ao acaso apresentar um
peso entre 12 e 14,56 g?
Assinalando a área no gráfico
FreqüênciaFreqüência
Variável XVariável X1212
= 4= 4
14,5614,56
Convertendo a variável original
x
Z
x Número de desvios de afastamento em relação
à média
Calcule a probabilidade ...
x
Z
ProbabilidadeProbabilidadeem tabela Zem tabela Z
ZZ
4
1256,14 Z
Z = +0,64Z = +0,64
0,640,6400
FreqüênciaFreqüência
Variável XVariável X1212
= 4= 4
14,5614,56
Tabelas facilitam os cálculos
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
Para Z =0,64
0,2389
Exercícios.
x
Z
FreqüênciaFreqüência
Variável XVariável X1212
= 4= 4
14 - Calcule a probabilidade entre 12 e 17 g,
entre 6 e 12g e entre 11 e 15g.
1717
ProbabilidadeProbabilidadeem tabela Zem tabela Z
ZZ00
Exercícios
FrequênciaFrequência
Variável XVariável Xmédiamédia
15 – Calcule o valor de Z para a área central
igual a 90%.
90%90%
Exercícios16 – Latas de conserva são fabricadas por uma
indústria com média de 990g e desvio padrão de 10g. Uma lata é rejeitada pelo controle de qualidade dessa indústria se possuir peso menor que 975g. Assim, qual é a probabilidade de uma lata de conserva ser rejeitada pelo controle de qualidade?
Anexos …
Distribuição Normal Padronizada
Tabelas de Z (1)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
Tabelas de Z (2)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
Tabelas de Z (3)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
Correlação e Regressão Linear
Duas variáveis quantitativas
XX independenteindependente
YY dependentedependente
Sem relação …
X
Y Análise de regressão:ajuste de reta aos pontos
Sem relação aparente
Com relação
X
Y
Análise de regressão:ajuste de reta aos pontosCom relação aparente
Erros quadráticos mínimos
X
Y
Erros2 devem ser mínimos!!!
Definindo a equação da reta
X
Y Equação da retaEquação da reta
Y = a + b.Xa
y b x
n
bn xy x y
n x x
2 2
Uma aplicação didática …
• Análise e separação de gastos … Fixos: não oscilam conforme produção
e vendas Variáveis: oscilam conforme produção
e vendas
Uma análise de vendas e gastosMês Vendas Gastos
jan 3 18
fev 9 39
mar 6 30
abr 3 15
mai 2 12
jun 9 45
Uma análise gráfica …
05
101520253035404550
0 2 4 6 8 10
Vendas Gastos
3 18
9 39
6 30
3 15
2 12
9 45
XX YY
Calculando os somatóriosVendas
XGastos
Y
3 18
9 39
6 30
3 15
2 12
9 45
3232 159159
X2 Y2 XY
9 324 54
81 1.521 351
36 900 180
9 225 45
4 144 24
81 2.025 405
220220 51395139 10591059
Calculando b
bn xy x y
n x x
2 2
n X Y X2 Y2 XY
6 32 159 220 5.139 1.059
6 1059 32 159
6 220 32
b = 4,27703b = 4,27703
ay b x
n
Calculando an X Y X2 Y2 XY
6 32 159 220 5.139 1.059
159
a = 3,6892a = 3,6892
4,42770 32
6
y = 3,6892 + 4,277x
05
101520253035404550
0 2 4 6 8 10
No gráfico …
Assim …• Equação obtida …
y = 3,6892 + 4,277x • Para vendas previstas iguais a 10 unidades …
y = 3,6892 + 4,277(10)
y = 46,4592
Análise de correlação …
Estuda a qualidade do ajuste linear feito
para os pontos
Diferentes níveis de aproximaçãoPositivaPositiva Positiva PerfeitaPositiva Perfeita
NegativaNegativa Negativa perfeitaNegativa perfeita
r > 0r > 0 r = 1r = 1
r < 0r < 0 r = -1r = -1
Correlação inexistente
r = 0r = 0
Coeficiente de determinação
totalVariação
licadaVariaçãor
exp2
n
ii
n
ii
yy
yyr
1
2
1
2
2
ˆ
Coeficiente de Pearson
2222 .
.
yynxxn
yxxynr
Exercícios17 – As exportações da castanha in natura, processadas pela
Empresa Castanheira Ltda., no período 2002 a 2008, encontram-se na tabela a seguir
Onde a variável quantidade está expressa em toneladas. Pede-se:A- a equação de regressão linear da quantidade sobre o tempo.B – O coeficiente de correlação linear.C – A quantidade estimada para exportação em 2009.
Ano 2002 2003 2004 2005 2006 2007 2008
Quantidade 50 46 36 31 25 11 18
Exercícios18 – A Empresa Squadrus Ltda., fabricante de implementos agrícolas de alta
tecnologia, realizou um levantamento do custo total de um de seus produtos (Y), expresso em US$ 1.000,00, em função do número total de peças produzidas (X), expresso em unidades, durante cinco meses, com o objetivo de montar uma regressão linear simples, entre essas variáveis, obtendo os somatórios:
Ʃx = 440 Ʃy = 120 Ʃxy = 12.300
Ʃx² = 49.450 Ʃy² = 3.200
Nessas condições, pede-se:A – A reta que melhor se ajuste a esses dados.B – O valor do coeficiente de correlação linear.C – O valor mais provável dos custos fixos.D – O valor estimado do custo variável para uma produção de 500 unidades.E – Admitindo-se um preço de venda de US$ 3.000,00, por unidade, estimar a
quantidade mínima que se deve produzir para se obter um lucro de US$ 80.000,00
Estudo de Caso:
U. S. Department of Transportation
Estudo de Caso: U.S. Department of Transportation
Como parte de um estudo de segurança no transporte, o U. S. Department of Transportation levantou dados do número de acidentes fatais por 1.000 carteiras de habilitação, e a porcentagem de motoristas licenciados abaixo de 21 anos que possuem habilitação em uma amostra de 42 cidades. Os dados obtidos são apresentados na tabela 2.
Relatório Gerencial:A-) Desenvolva sumários gráficos e numéricos dos dados.B-) Use análise de regressão para investigar a relação entre o número de
acidentes fatais e a porcentagem de motoristas abaixo da idade de 21 anos. Discuta suas conclusões.
C-) Quais conclusões e/ou recomendações você pode derivar de suas análises?
Estudo de Caso: U.S. Department of Transportation
Porcentagem Acidentes Fatais Porcentagem Acidentes FataisAbaixo por 1.000 Abaixo por 1.000de 21 Carteiras de de 21 Carteiras de
Habilitação Habilitação13 2,962 17 4,10012 0,708 8 2,1908 0,885 16 3,62312 1,652 15 2,62311 2,091 9 0,83517 2,627 8 0,82018 3,830 14 2,8908 0,368 8 1,26713 1,142 15 3,2248 0,645 10 1,0149 1,028 10 0,49316 2,801 14 1,44312 1,405 18 3,6149 1,433 10 1,92610 0,039 14 1,6439 0,338 16 2,94311 1,849 12 1,91312 2,246 15 2,81414 2,855 13 2,63414 2,352 9 0,92611 1,294 17 3,256
ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)
ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)
ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)
RESUMO DOS RESULTADOS
Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10
ANOVAgl SQ MQ F F de significação
Regressão 1 2272 2272 106.9176 6.60903E-06Resíduo 8 170 21.25Total 9 2442
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.61E-06 3.107936731 4.892063269
ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)
RESUMO DOS RESULTADOS
Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10
ANOVAgl SQ MQ F F de significação
Regressão 1 2272 2272 106.9176471 6.60903E-06Resíduo 8 170 21.25Total 9 2442
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12002E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.60903E-06 3.107936731 4.892063269
Coeficiente de Correlação Linear de Pearson
Coeficiente de Determinação : Neste exemplo 93 % da variabilidade da variável das vendas é explicada pelo modelo
Número de observações utilizadas no cálculo dos coeficientes do modelo de regressão
Testa a hipótese de que existe relação linear entre as variáveis. Quando este valor for < 0,10 concluímos que existe relação linear entre as variáveis
Coeficientes do modeloVendas = 80 + 4 anos de experiencia
Quando esse valor for menor do que 0,10 a constante deve fazer parte do modelo.
Valor = 0,000006609 Quando esse valor for menor do que 0,10 existe relação linear entre as variáveis
ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)
Referências Bibliográficas• Anderson, D; Sweeney, D e Williams, T; ESTATÍSTICA
APLICADA À ADMINISTRAÇÃO E ECONOMIA. São Paulo: Pioneira Thomson Learning, 2003.
• Bruni, A. L. ESTATÍSTICA APLICADA À GESTÃO EMPRESARIAL. São Paulo: Atlas, 2007.
• Kazmier, L. ESTATÍSTICA APLICADA À ECONOMIA E ADMINISTRAÇÃO. São Paulo: Mc Graw-Hill, 1982.
• Oliveira, F. E. M. ESTATÍSTICA E PROBABILIDADE: Exercícios Resolvidos e Propostos. 2 ed. São Paulo: Atlas, 1999.
• Smailes, J e Mc Graine, A. ESTATÍSTICA APLICADA À ADMINISTRAÇÃO COM EXCEL. São Paulo: Atlas, 2002.
Muito Obrigado!Professor Leandro Morilhas