Estatística e Análise de Dados Professor Leandro Morilhas

Preview:

Citation preview

Estatística e Análise de Dados

Professor Leandro Morilhas

Agenda‐ Conceito e origem da Estatística.‐ Áreas de Estudo.‐ Medidas de posição central.‐ Medidas de dispersão.‐ Probabilidade.‐ Correlação e regressão linear.

Um passeio pela história …

3000 AC – Censos no Egito

Outras cenas ...

Na Babilônia também …

Na Bíblia …• Quarto livro do velho

testamento• Instrução a Moisés• Fazer um levantamento dos

homens de Israel que estivessem aptos a guerrear

Augusto César• Édito para que se fizesse o

censo em todo o império romanoCensere em latim = taxar

Maria e José• Em função do édito,

Maria e José viajaram para Belém

Guilherme o conquistador• Inglaterra• 1085• Levantamento estatístico

– Terras– Propriedades– Empregados– Animais

• Base de cálculo de impostos

Dom

esd

ay =

Dia

do ju

ízo fi

nal

Dom

esd

ay =

Dia

do ju

ízo fi

nal

Um livro para os impostos …

Séc XVII - Tábuas de Mortalidade• John Graunt• Análises de nascimentos e

mortes• % de homens ligeiramente

superior a de mulheres

Palavra Estatística• Cunhada pelo acadêmico

alemão Gottfried Achenwall por volta da metade do século XVIII

• O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797

Para entender a ...

EstatísticaStatusStatus EstadoEstado

Poder públicoPoder públicoCaracterização Caracterização dos dadosdos dados

Uma origem controversa

Estatísticapara cobrarIMPOSTOS

E depois ….

Facilitar a análise de

DADOS

A Estatística é dividida em:Análise de dados:

Coleta, organização e

resumo dos dadosProbabilidade:

Necessária para tirar conclusões a partir de

amostras Inferência estatística: Tirar

conclusões estatísticas de dados específicos usando os

conhecimentos de probabilidade

Definições:

População

É o conjunto de todos os elementos de interesse em um determinado estudo

Amostra

É uma parte da população selecionada para análise

Dados

Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que

tenham sido coletados

Qualitativos:Representam a

informação

que identifica alguma

qualidade, categoria

ou característica 

Quantitativos:

Quando é possível

atribuir um valor

numérico

Campos de Aplicação

Estudos de mercado 

O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto.

População: conjunto de todos as famílias do país

Amostra: conjunto de algumas famílias, pesquisados pela empresa

Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.

Campos de Aplicação

Controle de qualidade 

O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada.

População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo.

Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos.

Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.

Analisando ...

FrequênciasMédiaMedianaDesvio-Padrão

Medidas de Medidas de Posição CentralPosição Central

Medidas úteis para a decisão

• Medidas de posição central:

–Média ou Valor Esperado–Moda–Mediana

Média Aritmética Simples• Mais usual das medidas estatísticas• Relação entre soma e contagem• Centro geométrico de um conjunto de

dados

n

xxou

n

i 1

contagem

somamédia

Exercícios1 – Em março de 2009, os vendedores da Empresa

Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.

2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de 2009. Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular:

A - O volume total gasto com o pagamento dos salários no mês de julho.

B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?

Exercícios

Média aritmética ponderada

n

ii

n

iii

w

xf

xfxx

1

1

.

É preciso considerar as frequências …

Exercícios

3 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg.

A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança?

B – Qual o peso médio das caixas carregadas no caminhão?

Exercícios4 – O capital da Empresa Maguary Ltda. é formado pelo

aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro:

Calcular a taxa média do capital da empresa.

Forma de Capital Participação em US$ Taxa de Juros

Acionistas 2.400 12%

Financiamentos de Longo Prazo

1.200 8%

Debêntures 400 14%

Cuidado com as médias!!!

Aparências podem enganar!

Maior problema da média …

Maldição dos extremos

ou outliersExtremos distorcemExtremos distorcem

algumas medidasalgumas medidas

Solução para o problema …Remover Remover os extremos!!os extremos!!

Pesquisa sobre remuneração• Empresa paga $400,00 aos estagiários de

Administração• Quer saber …

É muito ou pouco?• Coletou amostra de dados• Dados:

{300; 350; 6000; 340; 310; 380}

contagem

somamédia 7680

6$1.280,00

Pouquíssimo!!!Pouquíssimo!!!

Organizando os dados …• Dados:

{300; 350; 6000; 340; 310; 380}• Rol:

{300; 310; 340; 350; 380; 6000}

$400,00$400,00

Extremo distorce a média!

Rol sem extremo:Rol sem extremo:{300; 310; 340; 350; 380}{300; 310; 340; 350; 380}

Média = 1680/5 = $336,00Média = 1680/5 = $336,00

Alto!Alto!

O centro dos dados ordenados

Onde está ocentro???

Mediana• Valor central de uma série ordenada de dados (Rol)

{3; 7; 9; 10; 4; 8; 2}{3; 7; 9; 10; 4; 8; 2}

{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}

Ordenando no RolOrdenando no Rol

3 menores

3 maiores

{2; 3; 4; 8; 9; 10}{2; 3; 4; 8; 9; 10}

n par?n par?mediana = 6mediana = 6

O que é mais frequente

Será que está na

modamoda???

Moda• Valor que se repete com

maior frequência

{2; 3; 4; 7; 7; 9; 10}{2; 3; 4; 7; 7; 9; 10}

{2; 2; 4; 7; 7; 9; 10}{2; 2; 4; 7; 7; 9; 10}

{2; 3; 4; 7; 8; 9; 10}{2; 3; 4; 7; 8; 9; 10}

unimodalunimodal

bimodal ou multimodalbimodal ou multimodal

amodalamodal

Medidas de Localização Não Centrais

Quartis

Dividem os dados ordenados em quatro partes:

Primeiro Quartil (Q1): valor que faz com que 25% das observações

sejam menores e 75% sejam maiores que Q1

Segundo Quartil (Q2): é a MEDIANA – 50% das observações são

menores que Q2 e 50% são maiores

Terceiro Quartil (Q3): valor que faz com que 75% das observações

sejam menores e 25% sejam maiores que Q3

 

Dados não agrupados

Q1 = valor que corresponde à posição:

 

 

   

Q2 = valor que corresponde à posição:

  

 

 

Q3 = valor que corresponde à posição:

4

1N

4

)1(2 N

4

)1(3 N

Regras usadas para obter os valores do quartil

Se o ponto de posicionamento for um número inteiro, é só usar

o número correspondente àquela posição

Se o ponto de posicionamento estiver na metade entre 2

números inteiros, a média dos dois números à direita e à

esquerda será o quartil

Se o ponto de posicionamento não for a metade do caminho

entre dois números inteiros, usamos o que estiver mais próximo.

 

5 - Os salários mensais para uma amostra de 12 administradores são:

2.350 2.450 2.550 2.380 2.255 2.2102.390 2.630 2.440 2.825 2.420 2.380

Determine os três quartis.

6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros:

11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,213,1 23,8 18,3 15,5 18,8 22,7 14,0

Encontre os três quartis.

Exercícios

7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela:

Nº de Publicações

Nº de Profissionais

0 3

1 12

2 15

3 10

4 16

Quais são os três quartis?

Exercícios

8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população:

Determine o valor da moda, da mediana e da média

No de defeito

No de caixas

0 32

1 28

2 11

3 4

4 3

5 1

Exercícios

Medidas de dispersãoMedidas de dispersão

Medidas de Dispersão

– Amplitude– Desvio médio– Variância– Desvio padrão

Encontrando os extremos dos dados• Fundo de investimento, com retornos: {7, 3 e 2}• Amplitude• Maior menos menor• Range ou intervalo

RR ==MaiorMaiorMenorMenor

--

RR == 77 22-- == 55

Desvio médio• Desvio médio ou afastamento

médio em relação à média

SérieSérie

22

33

77

DesviosDesvios

-2-2

-1-1

33Soma 0Soma 0Média 0Média 0

É preciso calcular osdesviosABSOLUTOS

Média = 4Média = 4

n

xxDM

n

ii

1

Desvio médio absoluto• Desvio médio absoluto ou

afastamento médio absoluto em relação à média

SérieSérie

22

33

77

Desv AbsDesv Abs

22

11

33Soma 6Soma 6Média 2Média 2

Calculamos os

MÓDULOS

Média = 4Média = 4 n

xxDMA

n

ii

1

Exercícios9 – A produção de manteiga dos últimos seis meses do Laticínio

Sabor do Leite Ltda. está apresentada a seguir. Com base nos números apresentados, calcule:

A- Média.B – O desvio médio absoluto

Produção mensal de manteiga em toneladas:{ 11; 8; 4; 10; 9; 12}

Variância• Dispensa o uso do MÓDULO• Usa o desvio ao quadrado

Série

2

3

7

Desvio2

4

1

9Soma 14

Média 4,67

Média = 4

n

xxn

ii

1

2

2

Desvio padrão• Resolve o problema

dimensional da variância• Raiz da variância

Desvio = Raiz (4,67) = 2,16

n

xxn

ii

1

2

2

Exercícios10 – Considerando o enunciado do exercício 9,

calcule a variância e o desvio padrão.

n

XXi

22 )(

1

)( 22

n

XXis

n

XXi

2)(

1

)( 2

n

XXis

VariânciaVariância

DesvioDesvioPadrãoPadrão

PopulacionalPopulacional AmostralAmostral

Fórmulas

Coeficiente de variação

x

souCV

58

11 - A U.S. Energy Information Administration monitora todas as usinas de

energia nuclear operando nos Estados Unidos. A tabela a seguir lista o número

de usinas ativas operando em cada um dos 20 estados da amostra.

A - Encontre a amplitude, a variância e o desvio-padrão desse conjunto de dados.

B - Elimine o maior valor dos dados e repita a alternativa a.

C - Que efeito a retirada dessa medição tem nas medidas de variação encontradas na letra a?

D - Elimine o maior e o menor valor do conjunto de dados e repita a alternativa a. Que efeito a

retirada de ambas as medições tem sobre a variação encontrada na alternativa a?

Est

ad

oN

úm

ero

de

Usi

na

s

Ala

bam

a5

Ariz

ona

3

Cal

iforn

ia4

Flo

rida

5

Geo

rgia

4

Illin

ois

13

Kan

sas

1

Loui

sian

a2

Mas

s1

Mis

s1

New

Ham

p1

New

Yor

k6

NC

arol

ina

5

Ohi

o2

Pen

n9

SC

arol

ina

7

Tenn

esse

e3

Texa

s4

Ver

mon

t1

Wis

cons

in3

Exercícios

59

12 - Uma amostra aleatória de 15 empresas dentre as que pediram concordata

no último mês em São Paulo foi selecionada por um analista. As idades das

empresas, em anos, foram registradas:

1.4 10.1 5.7 22.4 7.4

5.1 2.4 3.1 8.3 6.3

3.9 4.5 11.4 2.9 17.2

A - Encontre a média, a amplitude, a variância e o desvio-padrão desse conjunto de dados.

B - Calcule o valor da média menos o desvio-padrão; calcule também o valor da média mais

o desvio-padrão.

C - Quantos valores estão entre o intervalo definido pela média menos o desvio-padrão e a

média mais o desvio-padrão?

D - O que você pode inferir com estes resultados?

Exercícios

60

13 - Um fábricante de baterias automotivas alega que a duração média da vida

útil de uma bateria tipo A é de 60 meses. Entretanto, a garantia dessa marca é

de apenas 36 meses. Suponha que o desvio-padrão da vida útil seja de 10

meses e a distribuição de freqüência dos dados da vida útil tenda a ter um

formato numérico, conforme os dados a seguir.

45 57 65 51 74

58 68 57 68 64

40 63 54 59 77

A - Qual a porcentagem das baterias tipo A desse fábricante irão durar mais de 50 meses?

B - Qual a porcentagem das baterias tipo A desse fábricante irão durar menos de 41 meses?

C - Suponha que sua bateria dure 37 meses. O que você pode inferir sobre a alegação do

fábricante?

Exercícios

Estudo de Caso: Consolidated Foods

A Consolidated Foods opera uma rede de supermercados no Novo México, no Arizona e na Califórnia. Os dados na Tabela 1 mostram as quantias em dólar e os métodos de pagamento para uma amostra de 100 clientes. Os gerentes da Consolidated solicitaram a amostra para descobrirem as práticas de pagamento dos clientes da loja. Em particular, os gerentes estão interessados em saber como uma nova opção de pagamento por cartão de crédito está relacionada com as quantias gastas pelos clientes.

Estudo de Caso: Consolidated Foods

TABELA 1 - QUANTIA GASTA E MÉTODO DE PAGAMENTO PARA UMA AMOSTRA

Dinheiro Cheque Pessoal Cartão de Crédito Dinheiro Cheque Pessoal Cartão de Crédito7,40 27,60 50,30 5,08 52,87 69,775,15 30,60 33,76 20,48 78,16 48,114,75 41,58 25,57 16,28 25,9615,10 36,09 46,24 15,57 31,078,81 2,67 46,13 6,93 35,381,85 34,67 14,44 7,17 58,117,41 58,64 43,79 11,54 49,2111,77 57,59 19,78 13,09 31,7412,07 43,14 52,35 16,69 50,589,00 21,11 52,63 7,02 59,785,98 52,04 57,55 18,09 72,467,88 18,77 27,66 2,44 37,945,91 42,83 44,53 1,09 42,693,65 55,40 26,91 2,96 41,1014,28 48,95 55,21 11,17 40,511,27 36,48 54,19 16,38 37,202,87 51,66 22,59 8,85 54,844,34 28,58 53,32 7,22 58,753,31 35,89 26,57 17,8715,07 39,55 27,89 69,22

DE 100 CLIENTES DA CONSOLIDATED FOODS (em dólares)

Estudo de Caso: Consolidated Foods

Relatório Gerencial:Use os métodos de estatística descritiva para sintetizar os dados da

amostra. Forneça separadamente sumários das quantias gastas para clientes que pagaram à vista, clientes de cheque pessoal e clientes de cartão de crédito. Seu relatório deve conter os seguintes sumários e discussões.

1 – Uma comparação e interpretação das médias e das medianas.2 – Uma comparação e interpretação das medidas de variabilidade

tais como a amplitude e o desvio-padrão.3 – A identificação e interpretação da regra de cinco itens para cada

método de pagamento.4 – Gráficos de pontos para cada método de pagamento.

Estudo de Caso:

2 – Empresa Platox

Estudo de Caso: Empresa PlatoxA empresa Platox, S.A. fabrica e comercializa celulares. A empresa tem sede

administrativa e fábrica na cidade de Curitiba e filiais em mais cinco cidades do Brasil.

As empresas Platox-Rio, Platox-Brasília, Platox-São Paulo, Platox – Belo Horizonte e Platox-Salvador, foram criadas com o objetivo de descentralizar a comercialização de celulares e para responder de forma mais eficiente às necessidades dos três tipos de clientes-alvo da empresa: adolescentes, executivos e pessoas fanáticas por novas tecnologias.

A empresa atua no mercado desde 2000, mas as filiais de São Paulo, Belo Horizonte e Salvador só foram criadas em 2003.

A capacidade produtiva da fábrica é de 500.000 celulares por ano, mas até agora a utilização dessa capacidade não ultrapassou os 70%: até 2002 foram produzidos 200.000 celulares por ano; e a partir de 2003, com a abertura das três novas filiais, esse número elevou-se para 350.000 unidades.

Estudo de Caso: Empresa PlatoxPara aproveitar o efeito sinérgico que pode resultar do forte crescimento que se

esperava para a economia nacional, e atendimento à evolução favorável das margens de comercialização que se tem verificado nos últimos anos, os responsáveis pela empresa pretendem aumentar a produção de celulares para 450.000 unidades por ano.

Assim, e antes de decidir pela maior utilização da capacidade produtiva, a Administração da empresa deu instruções no sentido da diretoria de planejamento apresentar um relatório completo sobre as vendas de todas as filiais ao longo dos últimos anos. Paralelamente foi encomendado um estudo de marcado a uma empresa de consultoria, com o objetivo de saber qual é o posicionamento competitivo da empresa no mercado de celulares, tanto em nível nacional como em nível regional. Do estudo de mercado deverão resultar também algumas idéias sobre a estratégia de marketing a ser implementada em cada uma das filiais.

Portanto, cabe à diretoria de planejamento da empresa, a realização de um estudo do qual possam ser extraídas algumas conclusões importantes sobre o comportamento das vendas de todas as filiais ao longo dos últimos anos.

Estudo de Caso: Empresa PlatoxPara a Administração da empresa importa saber em cada filial:

1 – Os níveis médio e mediano das vendas;2 – O comportamento das vendas em relação ao nível médio,

para se poder concluir sobre o grau de risco em aumentar a produção;

3 – A forma como as vendas se distribuíram ao longo do tempo;4 – O grau de concentração das vendas dentro da própria

empresa, para saber se as vendas se repartiram de forma mais ou menos equitativa por todas as filiais;

5 – Que ações devem ser realizadas tendo em vista o aumento das vendas para fazer face à maior utilização da capacidade produtiva.

Estudo de Caso: Empresa PlatoxObservação: No quadro seguinte apresentam-se as vendas (em reais) das seis filiais da

empresa ao longo dos últimos anos. Os dados foram já introduzidos planilha para que os cálculos possam ser feitos pelo Excel.

2000 62000 73450 581742001 61278 74528 638572002 58978 74582 658772003 65412 72145 86744 54782 38957 305872004 67857 66478 89887 57848 35764 286752005 68452 65432 95784 60124 36997 245782006 67582 61780 96784 60304 33393 224782007 67237 55781 95787 64578 29541 254782008 68412 52564 97581 71425 32151 263542009 68542 48790 101325 73458 33451 21960

Probabilidade

Distribuição NormalDistribuição Normal

““Curva normal Curva normal dos erros”dos erros”

Médias, desvios e sinos …• Uso da curva normal

FreqüênciaFreqüência

Variável XVariável XMédiaMédia

Alta frequênciaAlta frequência

BaixaBaixafrequênciafrequência

Área sob a curva permite obteras probabilidades

Características da curva• Na teoria, prolonga-se de

– infinito a + infinito– Área sob toda a curva igual a

100%

• Simétrica– Área de cada lado igual a 50%

Probabilidade

68%

95%

> 99%

– 3 – 2 – 1 0 + 1 + 2 + 3

Áreas sob a curva normal

68%68%

95%95%

99%99%

Para sempre lembrar!Uma indústria de cosméticos analisa a sua

produção de frascos de esmalte de unha que apresenta uma produção normalmente distribuída, com média igual a 12g e desvio 4g.

FreqüênciaFreqüência

Variável XVariável X = 12= 12

= 4= 4

A gerência industrial quer saber …

a) Qual a probabilidade de um frasco

escolhido ao acaso apresentar um

peso entre 12 e 14,56 g?

Assinalando a área no gráfico

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14,5614,56

Convertendo a variável original

x

Z

x Número de desvios de afastamento em relação

à média

Calcule a probabilidade ...

x

Z

ProbabilidadeProbabilidadeem tabela Zem tabela Z

ZZ

4

1256,14 Z

Z = +0,64Z = +0,64

0,640,6400

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14,5614,56

Tabelas facilitam os cálculos

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

Para Z =0,64

0,2389

Exercícios.

x

Z

FreqüênciaFreqüência

Variável XVariável X1212

= 4= 4

14 - Calcule a probabilidade entre 12 e 17 g,

entre 6 e 12g e entre 11 e 15g.

1717

ProbabilidadeProbabilidadeem tabela Zem tabela Z

ZZ00

Exercícios

FrequênciaFrequência

Variável XVariável Xmédiamédia

15 – Calcule o valor de Z para a área central

igual a 90%.

90%90%

Exercícios16 – Latas de conserva são fabricadas por uma

indústria com média de 990g e desvio padrão de 10g. Uma lata é rejeitada pelo controle de qualidade dessa indústria se possuir peso menor que 975g. Assim, qual é a probabilidade de uma lata de conserva ser rejeitada pelo controle de qualidade?

Anexos …

Distribuição Normal Padronizada

Tabelas de Z (1)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

Tabelas de Z (2)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

Tabelas de Z (3)Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

Correlação e Regressão Linear

Duas variáveis quantitativas

XX independenteindependente

YY dependentedependente

Sem relação …

X

Y Análise de regressão:ajuste de reta aos pontos

Sem relação aparente

Com relação

X

Y

Análise de regressão:ajuste de reta aos pontosCom relação aparente

Erros quadráticos mínimos

X

Y

Erros2 devem ser mínimos!!!

Definindo a equação da reta

X

Y Equação da retaEquação da reta

Y = a + b.Xa

y b x

n

bn xy x y

n x x

2 2

Uma aplicação didática …

• Análise e separação de gastos … Fixos: não oscilam conforme produção

e vendas Variáveis: oscilam conforme produção

e vendas

Uma análise de vendas e gastosMês Vendas Gastos

jan 3 18

fev 9 39

mar 6 30

abr 3 15

mai 2 12

jun 9 45

Uma análise gráfica …

05

101520253035404550

0 2 4 6 8 10

Vendas Gastos

3 18

9 39

6 30

3 15

2 12

9 45

XX YY

Calculando os somatóriosVendas

XGastos

Y

3 18

9 39

6 30

3 15

2 12

9 45

3232 159159

X2 Y2 XY

9 324 54

81 1.521 351

36 900 180

9 225 45

4 144 24

81 2.025 405

220220 51395139 10591059

Calculando b

bn xy x y

n x x

2 2

n X Y X2 Y2 XY

6 32 159 220 5.139 1.059

6 1059 32 159

6 220 32

b = 4,27703b = 4,27703

ay b x

n

Calculando an X Y X2 Y2 XY

6 32 159 220 5.139 1.059

159

a = 3,6892a = 3,6892

4,42770 32

6

y = 3,6892 + 4,277x

05

101520253035404550

0 2 4 6 8 10

No gráfico …

Assim …• Equação obtida …

y = 3,6892 + 4,277x • Para vendas previstas iguais a 10 unidades …

y = 3,6892 + 4,277(10)

y = 46,4592

Análise de correlação …

Estuda a qualidade do ajuste linear feito

para os pontos

Diferentes níveis de aproximaçãoPositivaPositiva Positiva PerfeitaPositiva Perfeita

NegativaNegativa Negativa perfeitaNegativa perfeita

r > 0r > 0 r = 1r = 1

r < 0r < 0 r = -1r = -1

Correlação inexistente

r = 0r = 0

Coeficiente de determinação

totalVariação

licadaVariaçãor

exp2

n

ii

n

ii

yy

yyr

1

2

1

2

2

ˆ

Coeficiente de Pearson

2222 .

.

yynxxn

yxxynr

Exercícios17 – As exportações da castanha in natura, processadas pela

Empresa Castanheira Ltda., no período 2002 a 2008, encontram-se na tabela a seguir

Onde a variável quantidade está expressa em toneladas. Pede-se:A- a equação de regressão linear da quantidade sobre o tempo.B – O coeficiente de correlação linear.C – A quantidade estimada para exportação em 2009.

Ano 2002 2003 2004 2005 2006 2007 2008

Quantidade 50 46 36 31 25 11 18

Exercícios18 – A Empresa Squadrus Ltda., fabricante de implementos agrícolas de alta

tecnologia, realizou um levantamento do custo total de um de seus produtos (Y), expresso em US$ 1.000,00, em função do número total de peças produzidas (X), expresso em unidades, durante cinco meses, com o objetivo de montar uma regressão linear simples, entre essas variáveis, obtendo os somatórios:

Ʃx = 440 Ʃy = 120 Ʃxy = 12.300

Ʃx² = 49.450 Ʃy² = 3.200

Nessas condições, pede-se:A – A reta que melhor se ajuste a esses dados.B – O valor do coeficiente de correlação linear.C – O valor mais provável dos custos fixos.D – O valor estimado do custo variável para uma produção de 500 unidades.E – Admitindo-se um preço de venda de US$ 3.000,00, por unidade, estimar a

quantidade mínima que se deve produzir para se obter um lucro de US$ 80.000,00

Estudo de Caso:

U. S. Department of Transportation

Estudo de Caso: U.S. Department of Transportation

Como parte de um estudo de segurança no transporte, o U. S. Department of Transportation levantou dados do número de acidentes fatais por 1.000 carteiras de habilitação, e a porcentagem de motoristas licenciados abaixo de 21 anos que possuem habilitação em uma amostra de 42 cidades. Os dados obtidos são apresentados na tabela 2.

Relatório Gerencial:A-) Desenvolva sumários gráficos e numéricos dos dados.B-) Use análise de regressão para investigar a relação entre o número de

acidentes fatais e a porcentagem de motoristas abaixo da idade de 21 anos. Discuta suas conclusões.

C-) Quais conclusões e/ou recomendações você pode derivar de suas análises?

Estudo de Caso: U.S. Department of Transportation

Porcentagem Acidentes Fatais Porcentagem Acidentes FataisAbaixo por 1.000 Abaixo por 1.000de 21 Carteiras de de 21 Carteiras de

Habilitação Habilitação13 2,962 17 4,10012 0,708 8 2,1908 0,885 16 3,62312 1,652 15 2,62311 2,091 9 0,83517 2,627 8 0,82018 3,830 14 2,8908 0,368 8 1,26713 1,142 15 3,2248 0,645 10 1,0149 1,028 10 0,49316 2,801 14 1,44312 1,405 18 3,6149 1,433 10 1,92610 0,039 14 1,6439 0,338 16 2,94311 1,849 12 1,91312 2,246 15 2,81414 2,855 13 2,63414 2,352 9 0,92611 1,294 17 3,256

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

RESUMO DOS RESULTADOS

Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10

ANOVAgl SQ MQ F F de significação

Regressão 1 2272 2272 106.9176 6.60903E-06Resíduo 8 170 21.25Total 9 2442

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.61E-06 3.107936731 4.892063269

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

RESUMO DOS RESULTADOS

Estatística de regressãoR múltiplo 0.964564633R-Quadrado 0.93038493R-quadrado ajustado 0.921683047Erro padrão 4.609772229Observações 10

ANOVAgl SQ MQ F F de significação

Regressão 1 2272 2272 106.9176471 6.60903E-06Resíduo 8 170 21.25Total 9 2442

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superioresInterseção 80 3.075344937 26.01334 5.12002E-09 72.90823727 87.09176273Tempo de Experiência (Anos)4 0.386843492 10.3401 6.60903E-06 3.107936731 4.892063269

Coeficiente de Correlação Linear de Pearson

Coeficiente de Determinação : Neste exemplo 93 % da variabilidade da variável das vendas é explicada pelo modelo

Número de observações utilizadas no cálculo dos coeficientes do modelo de regressão

Testa a hipótese de que existe relação linear entre as variáveis. Quando este valor for < 0,10 concluímos que existe relação linear entre as variáveis

Coeficientes do modeloVendas = 80 + 4 anos de experiencia

Quando esse valor for menor do que 0,10 a constante deve fazer parte do modelo.

Valor = 0,000006609 Quando esse valor for menor do que 0,10 existe relação linear entre as variáveis

ANEXO: Análise de Regressão Linear Simples - Excel

Fonte: Prof. Canton (FEA – USP)

Referências Bibliográficas• Anderson, D; Sweeney, D e Williams, T; ESTATÍSTICA

APLICADA À ADMINISTRAÇÃO E ECONOMIA. São Paulo: Pioneira Thomson Learning, 2003.

• Bruni, A. L. ESTATÍSTICA APLICADA À GESTÃO EMPRESARIAL. São Paulo: Atlas, 2007.

• Kazmier, L. ESTATÍSTICA APLICADA À ECONOMIA E ADMINISTRAÇÃO. São Paulo: Mc Graw-Hill, 1982.

• Oliveira, F. E. M. ESTATÍSTICA E PROBABILIDADE: Exercícios Resolvidos e Propostos. 2 ed. São Paulo: Atlas, 1999.

• Smailes, J e Mc Graine, A. ESTATÍSTICA APLICADA À ADMINISTRAÇÃO COM EXCEL. São Paulo: Atlas, 2002.

Muito Obrigado!Professor Leandro Morilhas

ljmorilhas@ig.com.br

Recommended