122
6/19/2016 1 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva Estatística Aplicada I Universidade Federal do Pará Instituto de Tecnologia Campus de Belém Curso de Engenharia Mecânica Prof. Dr. Jorge Teófilo de Barros Lopes 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva Capítulo I Universidade Federal do Pará Instituto de Tecnologia Estatística Descritiva Campus de Belém Curso de Engenharia Mecânica

Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

  • Upload
    vandiep

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

1

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Estatística Aplicada I

Universidade Federal do Pará

Instituto de Tecnologia

Campus de Belém

Curso de Engenharia Mecânica

Prof. Dr. Jorge Teófilo de Barros Lopes

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Capítulo I

Universidade Federal do Pará

Instituto de Tecnologia

Estatística Descritiva

Campus de Belém

Curso de Engenharia Mecânica

Page 2: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

2

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

I - Estatística Descritiva

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

Page 3: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

3

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

ESTATÍSTICA: É a disciplina que objetiva estudar os

métodos científicos para a coleta, organização, resumo,

apresentação e análise de dados, bem como obter

conclusões válidas e tomar decisões razoáveis baseadas

em tais análises.

Técnicas Estatísticas: São as várias técnicas por meio

das quais é possível estudar conjuntos de dados e, a

partir de uma amostra (se necessária), tirar conclusões

válidas para conjuntos maiores (população).

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

De uma maneira geral, as técnicas estatísticas são

utilizadas em três etapas principais do trabalho de

pesquisa:

1. A coleta de dados, incluindo o planejamento do

trabalho e da pesquisa;

2. A apresentação dos dados coletados; e

3. A análise dos dados coletados, com a formulação

de conclusões e generalizações.

Page 4: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

4

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

- Corresponde ao estabelecimento do método de

coleta de dados (questionário ou teste ou ensaio de

material) e elaboração dos questionamentos ou

determinação das variáveis que serão estudadas, de

acordo com o interesse do pesquisador;

- Cálculo do tamanho da amostra, de acordo com a

natureza da pesquisa, do tempo e do orçamento

disponíveis.

COLETA DE DADOS

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

- Requer técnicas específicas para a transformação

dos dados numéricos em tabelas ou gráficos (é a

partir da organização dos dados coletados que se

poderá elaborar a interpretação).

APRESENTAÇÃO DOS DADOS COLETADOS

ANÁLISE DOS DADOS COLETADOS

- Etapa simultânea à anterior, pois durante a própria

organização dos dados já é possível ir percebendo a

tendência geral da pesquisa.

Page 5: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

5

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• No sentido de melhor esclarecer o significado da

análise e interpretação dos dados, deve-se estabelecer

uma distinção entre

ESTATÍSTICA DESCRITIVA

e

INFERÊNCIA ESTATÍSTICA

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• Como o próprio nome sugere, constitui-se num conjunto

de técnicas que objetivam descrever, analisar e interpretar

os dados numéricos de uma população ou amostra.

Estatística Descritiva: Objetiva sintetizar e representar de

uma forma compreensível a informação contida num

conjunto de dados.

• Materializa-se na construção de tabelas e/ou gráficos ou

no cálculo de medidas que representem convenientemente

a informação contida nos dados.

• Adquire importância quando o volume de dados for

significativo.

Page 6: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

6

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• Objetivo mais ambicioso que o da estatística descritiva.

Inferência Estatística: Baseada na análise de um conjunto

limitado de dados (uma amostra), objetiva caracterizar o

todo a partir do qual tais dados foram obtidos (a população).

• Os métodos e técnicas utilizados são mais sofisticados.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

Figura 1.1- Diferença entre Estatística Descritiva e Inferência

Estatística (Silva e Carvalho, 2006).

Page 7: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

7

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

Figura 1.2- Diferença entre Estatística Descritiva e Inferência

Estatística (Silva e Carvalho, 2006).

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

Page 8: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

8

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

População: É o conjunto de todos os elementos que contêm

uma certa característica que se deseja estudar.

• Como é comum a todos os elementos, esta característica

varia em quantidade ou qualidade.

• Uma população pode ter dimensão finita ou infinita.

Amostra: É um subconjunto de dados que pertencem à

população. As amostras aleatórias são escolhidas por meio

de processos (técnicas de amostragem) que garantem que o

subconjunto obtido é representativo da população.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Principais motivos para o estudo da amostra:

1. População infinita;

2. Custo em termos de tempo ou de dinheiro que um

estudo em toda a população implicaria;

3. Obtenção de informação por meio de testes destrutivos,

no âmbito industrial;

4. Impossibilidade de acesso a todos os elementos da

população.

Page 9: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

9

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

OBSERVAÇÃO:

População finita: é aquela em que é possível realizar a

enumeração de todos os seus elementos. Retrata um

universo limitado.

- Exemplos:

• O número de medicamentos produzidos por uma

indústria farmacêutica por mês;

• O número de habitantes de determinada cidade;

• O número de estudantes em uma sala de aula;

• O número de doentes que apresentam determinada

doença em um hospital;

• O número de centros de saúde de uma cidade.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

OBSERVAÇÃO:

População infinita: é aquela em que não é possível

realizar a enumeração de seus elementos constituintes.

Dessa forma, não é possível uma delimitação do universo,

já que seus elementos não podem ser mensurados.

- Exemplos:

• Os resultados (cara ou coroa) obtidos em sucessivos

lançamentos de uma moeda;

• O conjunto de números inteiros, reais ou naturais;

• Os pontos de uma reta;

• A temperatura em cada ponto do Brasil.

Page 10: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

10

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Fases do método de análise estatística:

• No âmbito da Estatística, o método de abordagem dos

problemas pode ser dividido em cinco fases:

1. Estabelecimento do objetivo da análise a efetuar (questões a

serem resolvidas) e definição das populações correspondentes;

2. Concepção de um procedimento adequado para a seleção de

uma ou mais amostras (escolha das técnicas de amostragem a

utilizar).

3. Coleta de dados.

4. Análise dos dados (Estatística Descritiva).

5. Estabelecimento de inferências a respeito da população

(Inferência Estatística)

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Fases do método de análise estatística:

Identificação do problema → Objetivo da análise

Planejamento da experiência → Técnicas de Amostragem

Coleta de dados

Análise exploratória dos dados → Estatística Descritiva

Análise e interpretação dos resultados → Inferência Estatística

Page 11: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

11

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Isso é necessário, pois podem ocorrer registros que não

se encaixam no padrão geral observado e, dessa forma,

a sua veracidade deve ser averiguada, pois podem tratar-

se de erros de observação, bem como do próprio registro

ou provenientes de alterações do fenômeno em estudo.

• Não existe uma estratégia única para iniciar o estudo

descritivo, mas uma primeira recomendação seria

começar por uma exploração visual dos dados

levantados.

Page 12: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

12

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Embora estas análises já se encontrem disponíveis em

vários softwares e calculadoras programáveis, para uma

melhor interpretação das mesmas é conveniente

conhecer as técnicas utilizadas.

• Para se ter uma ideia mais concreta sobre os dados

levantados, deve-se recorrer às tabelas e/ou gráficos que

podem representar, de maneira sintética, as informações

sobre o comportamento de variáveis numéricas

levantadas.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Portanto, para se proceder um estudo descritivo, é importante:

- Ordenação dos dados – fase onde se começa a ter uma ideia a

respeito de algumas medidas de posição (média, mediana, quartis

etc.);

- Estatísticas amostrais – a partir de algumas medidas promove-se

um resumo dos dados levantados, relativamente à posição,

dispersão e forma;

- Agrupamento dos dados e representação gráfica – revela a forma

possível para a população em estudo e permite escolher a classe

de modelos que deve ser explorada nas análises mais

sofisticadas.

Page 13: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

13

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Dados brutos: Como primeiro resultado de uma pesquisa, obtêm-

se dados brutos, ou seja, um conjunto de números ainda sem

organização alguma.

Rol: Os dados brutos são então ordenados de forma crescente ou

decrescente, com a indicação da frequência de cada um, dando origem

ao chamado rol.

Tabulação dos dados: Depois de elaborar o rol é preciso

determinar quantas faixas terá a tabela de frequência. A fórmula de

Sturges é utilizada para estabelecer o número aproximado de classes

onde: n = número de elementos da amostra (tamanho da amostra)

k = número de classes que a tabela de classes deverá conter.

nlog22,31k

25nparanke25npara,5kou

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

• Observações: - k deverá ser no mínimo 3 e no máximo 20;

- Como a variável k é um número inteiro, ela

deverá ser aproximada para o maior inteiro (por

exemplo, se k ≈ 6,4, usa-se k = 7).

Frequência de classes: O passo seguinte é subdividir os dados

pelas classes ou categorias e determinar o número de indivíduos

pertencentes a cada uma, resultando nas frequências de classes.

Apresentação final dos dados (tabela completa): Com

base em todos os cálculos feitos anteriormente, pode-se fazer uma

nova tabela com todas as frequências, as quais serão estudadas a

posteriori.

Gráficos: A partir da tabela de frequências, faz-se o desenho

gráfico, um recurso de visualização dos dados constantes na tabela.

Page 14: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

14

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Os dados que constituem uma amostra podem ser de

quatro tipos, assim distribuídos:

• Qualitativos

- Nominal

- Ordinal

• Quantitativos

- Intervalar

- Absoluto

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

a) Dados nominais: Quando cada um deles for identificado

pela atribuição de um nome que designa uma classe.

a) Exaustivas - qualquer dado pertence a uma das classes;

b) Mutuamente exclusivas - cada dado pertence somente

a uma classe;

c) Não ordenáveis - não existe nenhum critério relevante

que permita estabelecer preferência por qualquer

classe em relação às restantes.

Neste caso, as classes devem ser:

- Exemplo: Classificação das pessoas pela cor do cabelo

(preto, castanho, louro etc.).

Page 15: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

15

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Exemplo: Classificação de conceitos de avaliação na

disciplina em insuficiente, regular, bom e excelente.

b) Dados ordinais: São semelhantes aos dados nominais;

contudo, nessa escala existe a possibilidade de se

estabelecer uma ordenação dos dados nas classes,

segundo algum critério relevante.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Observação: Neste caso, pode-se atribuir um significado

à diferença entre esses números, mas não à razão entre

eles.

Por exemplo, o registro de temperaturas em ºC, em determinadas

horas de dias sucessivos. Se em três dias consecutivos a

temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o

terceiro dia esteve duas vezes mais quente que o segundo, pois se a

temperatura fosse expressa em outra escala, a razão entre os

valores registrados naqueles dias seria diferente.

c) Dados intervalares: No caso da escala intervalar, os

dados são diferenciados e ordenados por números

expressos em uma ordem cuja origem é arbitrária.

Page 16: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

16

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

d) Dados absolutos: Contrariamente ao que sucede com a

escala intervalar, a escala absoluta tem origem fixa (nesta

escala, o valor zero tem significado).

• Escala intervalar: temperatura de 0ºC não significa que não haja

temperatura. • Escala absoluta: peso de 0 kg significa que não existe peso. • Em consequência ao fato da origem ser fixa, a razão entre os dados

expressos numa escala absoluta passa a ter significado; uma pessoa

com 60 kg tem o dobro do peso de uma com 30 kg.

- Exemplo: Pesos de pessoas expressos em kg.

- Observações:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Observação: Quando se trabalha com dados quantitativos,

é necessário que se faça a distinção entre os dados discretos

e os contínuos.

Os dados denominam-se discretos quando são valores de uma

variável aleatória discreta, que é a aquela que assume valores em

pontos da reta real (por exemplo, número de páginas em um livro:

1, 2, 3, 4, 5...).

Os dados são contínuos quando são valores de uma variável

aleatória contínua, que é aquela que pode assumir qualquer valor

em certo intervalo da reta real (por exemplo, o peso de

funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)

Page 17: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

17

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

• Devido à necessidade das categorias estarem

ordenadas, somente se pode falar de frequências

acumuladas quando os dados estão em escalas ordinais,

intervalar ou absoluta.

• A representação tabular com todos os tipos de

frequências é mostrada a seguir:

Page 18: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

18

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

a) Frequência absoluta (ni): O número de dados contidos

numa classe ou categoria qualquer i (i = 1,..., k) de

um conjunto de dados designa-se por frequência

absoluta da classe ou categoria i.

• Denotando-se por ni tal frequência e admitindo que

as categorias especificadas contêm todos os dados,

o número total de dados (n) é calculado por:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

b) Frequência relativa (fi): O número total de dados que

pertencem a uma classe ou categoria qualquer i,

quando expressos como uma proporção do número

total de dados, designa-se por frequência relativa da

classe ou categoria i e é dada por:

• As frequências relativas são muitas vezes definidas

em termos percentuais.

Page 19: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

19

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

c) Frequência absoluta acumulada (Ni): Representa para

cada classe ou categoria i, a frequência absoluta de

dados que pertencem à classe ou às classes anteriores.

d) Frequência relativa acumulada (Fi): Representa para

cada classe categoria i, a frequência relativa de dados

que pertencem à classe ou às classes anteriores.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

Page 20: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

20

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

• Uma vez elaborada a tabela de frequências, segue-se o

desenho do gráfico, um recurso de visualização dos

dados constantes na tabela.

• Os tipos de gráficos mais comuns são: histograma;

polígono de frequência, setograma e ogiva de Galton.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma: Este tipo de gráfico é utilizado para

representar as frequências absolutas (ni) em relação à

sua classe, e é assim construído:

1. No eixo das abscissas marcam-se, em escala, as classes dos

dados;

2. No eixo das ordenadas, marcam-se as frequências das classes;

3. Faz-se a correspondência entre cada intervalo no eixo das

classes com um valor no eixo das frequências, formando um

desenho de colunas paralelas.

Page 21: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

21

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

1. No eixo das abscissas, coloca-se o ponto médio de

cada intervalo de classe;

2. No eixo das ordenadas, permanecem as frequências

absolutas das classes (ni) ;

3. Ligam-se os pontos médios por segmentos de reta;

4. Para completar o polígono, acrescenta-se um ponto

médio com frequência zero em cada uma das

extremidades da escala horizontal.

- Polígono de frequência: Utilizado para indicar o ponto médio

ou representante de classe em suas respectivas frequências

absolutas; normalmente, é construído sobre o histograma, da

seguinte forma:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma e Polígono de frequência:

Page 22: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

22

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma

- Polígono de frequência:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico em setores (Setograma): Também conhecido como

gráfico de pizza, é utilizado para representar valores relativos (%);

é construído da seguinte forma:

1. Faz-se um círculo;

2. Cada setor é regido pela

fórmula:

3. No círculo, distribui-se os

valores das frequências

percentuais

Page 23: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

23

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Ogiva de Galton: Este tipo de gráfico é utilizada para

representar as frequências acumuladas de uma

distribuição; é construído da seguinte forma:

1. No eixo das abscissas coloca-se as classes dos dados, tal como

no histograma;

2. No eixo das ordenadas, escreve-se uma das frequências

acumuladas, marcando o ponto com os limites superiores (Li) de

cada classe; inicia-se com a frequência zero e com limite

inferior da 1ª classe.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Ogiva de Galton:

Page 24: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

24

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico linear: É o tipo

de gráfico que apresenta

os dados estatísticos por

meio de uma linha

poligonal. Os pontos da

polígono são obtidos pelas

informações contidas em

cada linha da tabela, e

marcados no plano

utilizando o sistema

cartesiano. São utilizados

para representar séries

cronológicas.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico de colunas: É

o tipo de gráfico que

apresenta os dados

estatísticos por meio de

retângulos (colunas)

dispostas em posições

vertical. Todos os

retângulos possuem a

mesma base e a altura

proporcional aos dados.

Podem ser utilizados para

representar qualquer série

estatística.

Page 25: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

25

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico de colunas: Este tipo de gráfico é

semelhante ao de colunas,

onde os retângulos

(barras) estão dispostos

horizontalmente. É

utilizado para legendas

longas, em todas as séries.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Qualitativos:

• Exemplo: Em uma amostra constituída de 120 peças, constatou-

se que 100 não tinham qualquer defeito, 15 tinham defeitos

recuperáveis e 5 apresentavam defeitos irrecuperáveis. Representar

em uma tabela, e também graficamente, as frequências (absolutas e

relativas) dos dados que constituem essa amostra:

Categoria de peças Frequência absoluta

(ni)

Frequência relativa

(fi)

Sem defeitos

Recuperáveis

irrecuperáveis

100

15

5

83,3%

12,5%

4,2%

TOTAL 120 100%

Page 26: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

26

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Qualitativos:

Gráfico em Setores

83,3%

12,5%

4,2%

Sem defeitos

Recuperáveis

irrecuperáveis

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

• Exemplo: Em um estudo realizado com o objetivo de

caracterizar o comportamento dos clientes de um

supermercado, analisou-se o número de ocupantes por

veículo para 1.000 veículos que entraram no

estacionamento do referido supermercado, em um

sábado. Os resultados encontram-se resumidos na

tabela seguinte:

Page 27: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

27

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

Nº de ocupantes

por veículo

(xi)

Frequência

absoluta

(ni)

Frequência

relativa

(fi)

Frequência

absoluta acumulada

(Ni)

Frequência

relativa acumulada

(Fi)

1

2

3

4

5

6

7

103

147

248

197

152

100

53

10,3%

14,7%

24,8%

19,7%

15,2%

10,0%

5,3%

103

250

498

695

847

947

1.000

10,3%

25,0%

49,8%

69,5%

84,7%

94,7%

100,0%

TOTAL 1.000 100%

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

0

50

100

150

200

250

300

n i

1 2 3 4 5 6 7

Nº ocupantes / veículo

Gráfico em colunas

Page 28: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

28

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• Distribuições agrupadas: Essas distribuições são úteis

quando existe um grande número de dados relativos a

uma variável contínua, cujos valores observados são

muito próximos uns dos outros.

- A frequência de cada classe é o número de observações que ela

contém.

- No exemplo anterior, os dados observados correspondem a uma

variável discreta; para o caso de dados relativos uma variável

contínua existem algumas diferenças.

Dados Quantitativos:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• Exemplo: O conjunto de dados baixo representa o

peso, em gramas, do conteúdo de uma série de 100

garrafas que, no decurso de um teste, saíram de uma

linha de enchimento automático:

302,25; 299,20; 300,24; 297,22; 298,35; 303,76;

298,65; 299,38; 300,36; 299,16; 300,86; 299,83;

302,52; 300,12; 301,81; 297,99; 299,23; 298,73;

303,07; 299,07; 297,83; ... ; 300,80

Dados Quantitativos:

Page 29: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

29

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• No conjunto de dados mostrado não existe praticamente

repetição de valores; logo, não é vantagem se utilizar os

dados agrupados numa tabela de frequências, pois a

mesma teria tantas linhas quanto o número de dados.

• No entanto, a tabela de frequências pode ser construída

se os dados forem agrupados por classes:

Dados Quantitativos:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Classes

Frequência

absoluta

(ni)

Frequência

relativa (%)

(fi)

Frequência

absoluta

acumulada

(Ni)

Frequência

relativa

acumulada (%)

(Fi)

[297,00 ; 298,00[

[298,00 ; 299,00[

[299,00 ; 300,00[

[300,00 ; 301,00[

[301,00 ; 302,00[

[302,00 ; 303,00[

[303,00 ; 304,00[

[304,00 ; 305,00[

[305,00 ; 306,00[

8

21

28

15

11

10

5

1

1

8

21

28

15

11

10

5

1

1

8

29

57

72

83

93

98

99

100

8

29

57

72

83

93

98

99

100

TOTAL 100 100%

Page 30: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

30

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Histograma

0

5

10

15

20

25

30

[297,00 ;

298,00[

[298,00 ;

299,00[

[299,00 ;

300,00[

[300.00 ;

301,00[

[301,00 ;

302,00[

[302,00 ;

303,00[

[303,00 ;

304,00[

[304,00 ;

305,00[

[305,00 ;

306,00[

Peso (kg)

f i

Dados Quantitativos:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

Page 31: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

31

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Nas seções anteriores foi visto a sintetização de dos dados

sob a forma de tabelas, gráficos e distribuição de

frequências.

O cálculo de estatísticas amostrais é uma forma mais

sintética de descrever um conjunto de dados, ou seja,

possibilita representar um conjunto de dados relativos à

observação de determinado fenômeno de forma reduzida.

As estatísticas amostrais são calculadas com base nos

dados, a partir das quais é possível descrever globalmente

o conjunto de valores que os referidos dados tomam.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição ou de tendência central:

• Média aritmética, média geométrica, média harmônica,

mediana, quartis, decis, percentis e moda.

• Amplitude total, desvio médio, variância, desvio

padrão, amplitude interquartílica e coeficiente de

variação.

b) Medidas de dispersão:

• Medidas de assimetria e medidas de curtose.

c) Medidas de forma:

As estatísticas amostrais ou medidas estatísticas são

divididas em três grupos:

Page 32: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

32

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Essas medidas nos orientam quanto à posição da

distribuição no eixo x (eixo dos números reais);

• Possibilitam comparações de séries de dados entre si

pelo confronto desses números.

• São chamadas de medidas de tendência central, pelo

fato de representarem os fenômenos pelos seus valores

médios, em torno dos quais tendem a concentrar-se os

dados.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

n

x

x

n

1i

i (dados não agrupados)

a) Medidas de posição:

• Para um conjunto de n dados de xi (i = 1,2,..., n) a

média aritmética simples ou média amostral,

representada por é definida pela expressão: x

Page 33: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

33

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

87,2x

15

4 1 1 31 25 5 7 3 2 3 31 2x

n

x

x

n

1i

i

2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4

• Exemplo: Determinar a média aritmética simples (média

aritmética amostral) dos dados mostrados abaixo:

a) Medidas de posição:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Quando os dados estiverem agrupados numa

distribuição de frequência usa-se a média aritmética

dos valores xi ponderadas pelas respectivas

frequências absolutas ni, assim:

n

xn

x

n

1i

ii (dados agrupados)

Page 34: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

34

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados): Determinar a média

aritmética simples (média aritmética amostral) da

distribuição dada abaixo:

xi 1 2 3 4 5 7

ni 4 3 4 1 2 1

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

87,2x

15

43

15

)17(...)41(

n

nx

x

n

1i

ii

a) Medidas de posição:

• Exemplo (dados agrupados): xi ni xini

1

2

3

4

5

7

4

3

4

1

2

1

4

6

12

4

10

7

Σ 15 43

Page 35: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

35

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição

• No caso da variável ser contínua, visto que se

perdeu os valores concretos do conjunto (ficaram

afetos a uma determinada classe) não se pode

calcular a média amostral diretamente dos valores

dos dados.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Deste modo, à cada classe vai ser atribuído um representante

(xi), e a média amostral será calculada por meio desses

representantes:

n

xn

x

k

1i

ii (dados agrupados em classes)

onde k é o número de classes do agrupamento, ni é a

frequência absoluta da classe i e xi é o ponto médio da classe

i, o qual é considerado como elemento representativo da

classe.

Page 36: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

36

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados em classes):

Determinar a média da distribuição a seguir, a

qual representa o peso, em gramas, do conteúdo

de uma série de 100 garrafas que, no decurso de

um teste, saíram de uma linha de enchimento

automático (exemplo anterior):

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados em classes):

Classes ni xi xini

[297,00 ; 298,00[

[298,00 ; 299,00[

[299,00 ; 300,00[

[300,00 ; 301,00[

[301,00 ; 302,00[

[302,00 ; 303,00[

[303,00 ; 304,00[

[304,00 ; 305,00[

[305,00 ; 306,00[

8

21

28

15

11

10

5

1

1

297,5

298,5

299,5

300.5

301,5

302,5

303,5

304,5

305,5

2380,0

6268,5

8386,0

4507,5

3316,5

3025,0

1517,5

304,5

305,5

Σ 100 30011,0

11,300x

100

0,30011x

n

xn

x

9

1i

ii

Page 37: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

37

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética (Ponderada)

a) Medidas de posição:

• Às vezes, associam-se os números x1, x2, ..., xk a certos

fatores de ponderação ou pesos w1, w2, ... , wk que

dependem do significado ou importância atribuída aos

mesmos. Nesse caso

k21

kk2211

i

k

1i

ii

w...ww

xw...xwxw

w

xw

x

é denominada de média aritmética ponderada.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética (Ponderada)

a) Medidas de posição:

• Exemplo: Em um curso, a avaliação final tem peso 3 e as

parciais peso 1; a nota média de um estudante que obtenha

nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais,

será:

3,85

5,41

311

)5,83()0,91()0,71(

w

xw

x3

1i

i

3

1i

ii

Page 38: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

38

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.2) Média geométrica: A média geométrica G (ou ) de

um conjunto de n números x1, x2, ..., xn é a raiz de

ordem n do produto desses números:

a) Medidas de posição:

nn21 x...xxG

464842G 33

- Exemplo: A média geométrica dos números 2, 4 e 8:

Gx

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.2) Média geométrica (dados agrupados): Se os elementos

x1, x2, ..., xn ocorrem com as frequências n1, n2,..., nk,

sendo n1+n2+...+nk = n a frequência total, a média

geométrica G desses elementos será deduzida como:

a) Medidas de posição:

n n

k

n

2

n

1n

vezesnkkk

vezesn222

vezesn111

k21

k21

x...xxxxxx...xxx...xxG

Page 39: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

39

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.3) Média harmônica: A média harmônica H (ou ) de

um conjunto de n elementos x1, x2, ..., xn é a

recíproca da média aritmética da recíproca dos

elementos:

a) Medidas de posição:

n

1j j

n

1j j x

1

n

x

1

n

1

1H

43,3

8

7

3

8

1

4

1

2

1

3

x

1

nH

n

1j j

- Exemplo: A média harmônica dos números 2, 4 e 8:

Hx

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana: Para os dados colocados em ordem crescente,

mediana (md, Me ou ) é o valor que divide a amostra,

ou população, em duas partes iguais. Assim:

a) Medidas de posição:

50% 100% 0%

x~

Page 40: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

40

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (série de elementos não agrupados):

a) Medidas de posição:

• Considerando que os dados que integram a

amostra são colocados em ordem crescente,

formando um vetor (x1, x2, ..., xn) - amostra

ordenada -, a mediana amostral é definida como

segue:

2

xx

x~

xx~

2

2n

2

n

2

1n n ímpar

n par

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (série de elementos não agrupados):

a) Medidas de posição:

• Exemplo: Para as distribuições abaixo, determinar as

respectivas medianas:

8, 5, 15,11, 4, 1, 7, 2, 9

Ordenando:

1, 2, 4, 5, 7, 8, 9, 11,15

Como n é ímpar, então:

7xxx~ 5

2

1n

8, 5, 15,11, 4, 1, 7, 2, 9, 3

Ordenando:

1, 2, 3, 4, 5, 7, 8, 9, 11,15

Como n é par, então:

62

75

2

xx

2

xx

x~ 652

2n

2

n

Page 41: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

41

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (variáveis discretas, dados agrupados em

tabela de distribuição de frequência):

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

1

2

3

4

1

3

5

2

1

4

9

11

Σ 11

contém o 6º

elemento

n = 11 (ímpar), logo será o

elemento de ordem (n+1)/2, ou

seja, (11+1)/2 = 6º elemento.

Da coluna da frequência

acumulada crescente, encontra-se

o valor xi correspondente à classe

que contém a ordem calculada,

assim: = 3. x~

x~

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

82

85

87

89

90

9

12

11

6

4

9

21

32

38

42

Σ 42 862

8785x~

22º

n = 42, é par, logo será a média

entre os elemento de ordem n/2 e

(n/2)+1, ou seja, 21º e 22º

elementos.

Como no exemplo anterior,

identificam-se os elementos de

ordem 21 e 22 pela Ni, ou seja, 85

e 87, assim:

21º

x~

a.4) Mediana (variáveis discretas, dados agrupados em

tabela de distribuição de frequência):

Page 42: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

42

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

82

85

87

89

90

5

10

15

8

4

5

15

30

38

42

Σ 42

21º e 22º

n = 42, é par, logo será a média

entre os elemento de ordem n/2 e

(n/2)+1, ou seja, 21º e 22º

elementos.

Como no exemplo anterior,

identificam-se os elementos de

ordem 21 e 22 pela Ni, ou seja, 87

e 87, assim:

872

8787x~

x~

a.4) Mediana (variáveis discretas, dados agrupados em

tabela de distribuição de frequência):

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Para variáveis contínuas, identifica-se a classe que contém a

mediana (n/2), denominada classe Md (como a variável é

contínua, não interessa se n é par ou ímpar); o valor

aproximado para a mediana será calculado pela equação:

Md

Md

1Md

Md

Md

Md1Md

Md af

F5,0l

n

aN2

n

lx~

onde: NMd-1 é a frequência absoluta acumulada da classe antes da classe

mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente,

o limite inferior, a amplitude e a frequência absoluta da classe mediana.

a.4) Mediana (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 43: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

43

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Dada a distribuição amostral, calcular a mediana:

Classes ni Ni

35 45

45 55

55 65

65 75

75 85

85 95

5

12

18

14

6

3

5

17

35

49

55

58

Σ 58

classe Md

a.4) Mediana (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo:

1º Passo: Calcula-se n/2; como n=58, então 58/2=29º.

2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª).

3º Passo: Aplica-se a fórmula:

Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:

67,6118

10172

58

55n

aN2

n

lx~

i

i1i

i

a.4) Mediana (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 44: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

44

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis:

a) Medidas de posição:

• Como já visto anteriormente, a mediana é a

medida de posição que divide um conjunto de

dados em duas partes iguais;

• Os quartis dividem um conjunto de dados em

quatro partes iguais, assim:

50% 75% 25%

Q1 Q2 Q3

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis:

a) Medidas de posição:

Q1 = 1º quartil, deixa 25% dos elementos;

Q2 = 2º quartil, coincide com a mediana, deixa 50% dos

elementos;

Q3 = 3º quartil, deixa 75% dos elementos.

50% 75% 25%

Q1 Q2 Q3

Page 45: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

45

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Qk (k = 1, 2 e 3), segue a fórmula:

4

1nkQk

• Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207,

305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ?

196elementoº24

171Q1

3,193elementoº75,14

161Q1

597elementoº64

173Q3

8,579elementoº25,54

163Q3

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Qk (k = 1, 2 e 3), segue os passos:

k

k

k

k Q

Q

1Q

Qk an

N4

kn

lQ

- 1º Passo: Calcula-se a ordem kn/4;

- 2º Passo: Identifica-se a classe Qk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.5) Quartis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 46: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

46

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição

• Exemplo: Dada a distribuição amostral, determinar Q1 e Q3:

Classes ni Ni

35 45

45 55

55 65

65 75

75 85

85 95

5

12

18

14

6

3

5

17

35

49

55

58

Σ 58

classe Q1

classe Q3

a.5) Quartis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para Q1.

1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º.

2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).

3º Passo: Aplica-se a fórmula:

Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:

92,5210

12

55,1445a

n

N4

n1

lQ1

1

1

1 Q

Q

1Q

Q1

a.5) Quartis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 47: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

47

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para Q3.

1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º.

2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).

3º Passo: Aplica-se a fórmula:

Neste caso lQ3 = 65, n = 58, NQ3-1 = 35, aQ3 = 10, nQ3 = 14; logo:

07,7110

14

355,4365a

n

N4

n3

lQ3

3

3

3 Q

Q

1Q

Q3

a.5) Quartis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Diante desses resultados, pode-se afirmar que,

nesta distribuição, tem-se:

25% 25% 25% 25%

52,92 61,67 71,07 35 95

ou seja: O valor de 52,92 deixa 25% dos elementos;

O valor de 61,67 deixa 50% dos elementos;

O valor de 71,07 deixa 75% dos elementos.

a.5) Quartis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 48: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

48

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis:

a) Medidas de posição:

• Os decis dividem um conjunto de dados em dez

partes iguais, assim:

D1

90% 80% 70% 60% 50% 40% 30% 20% 10%

D2 D3 D4 D5 D6 D7 D8 D9

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis:

a) Medidas de posição:

D1 = 1º decil, deixa 10% dos elementos da série;

D2 = 2º decil, deixa 12% dos elementos da série;

D5 = 5º decil, coincide com a mediana, deixa 50% dos

elementos da série;

D6 = 6º decil, deixa 60% dos elementos da série;

D7 = 7º decil, deixa 70% dos elementos da série;

D8 = 8º decil, deixa 80% dos elementos da série;

D9 = 9º decil, deixa 90% dos elementos da série.

Page 49: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

49

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Dk (k = 1, 2, ..., 9), segue a fórmula:

10

1nkDk

• Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207,

305, 574, 597, 612.

305elementoº410

175D5

2,520elementoº8,410

176D6

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Dk (k = 1, 2, ..., 9), para o caso de

variáveis contínuas com os dados divididos em classes,

segue os passos:

k

k

k

k D

D

1D

Dk an

N10

kn

lD

- 1º Passo: Calcula-se a ordem kn/10;

- 2º Passo: Identifica-se a classe Dk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.6) Decis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 50: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

50

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis:

a) Medidas de posição:

• Os percentis dividem um conjunto de dados em

cem partes iguais, assim:

P1

99% 98% 97% 3% . . . 2% 1%

P2 P3 P50 P97 P98 P99

50% . . .

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis:

a) Medidas de posição:

P1 = 1º percentil, deixa 1% dos elementos;

P2 = 2º percentil, deixa 2% dos elementos.

P50 = 50º percentil, coincide com a mediana, deixa 50% dos

elementos;

P99 = 99º percentil, deixa 99% dos elementos.

Page 51: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

51

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Pk (k = 1, 2, ..., 99) para uma série de

elementos não agrupados, segue a fórmula:

100

1nkPk

• Exemplo: Determine o 50º e o 60º percentis da série 185, 196,

207, 305, 574, 597, 612.

305elementoº4100

1750P50

2,520elementoº8,4100

1760D60

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Pk (k = 1, 2, ..., 99), para o caso de

variáveis contínuas com os dados divididos em classes,

segue os passos:

k

k

k

k P

P

1P

Pk an

N100

kn

lP

- 1º Passo: Calcula-se a ordem kn/100;

- 2º Passo: Identifica-se a classe Pk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.7) Percentis (variáveis contínuas com os dados divididos em

classes, tabela de distribuição de frequência):

Page 52: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

52

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º

percentil da seguinte distribuição:

a) Medidas de posição:

Classes ni Ni

35 45

45 55

55 65

65 75

75 85

85 95

5

12

18

14

6

3

5

17

35

49

55

58

Σ 58

classe D4

classe P72

Cálculo de D4

34,551018

1710

584

55D

18n;10a

;58n;17N;55l

2,2310

584

10

kn

4

DD

1DD

o

44

44

1º Passo:

2º Passo:

3º Passo:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º

percentil da seguinte distribuição:

a) Medidas de posição:

Classes ni Ni

35 45

45 55

55 65

65 75

75 85

85 95

5

12

18

14

6

3

5

17

35

49

55

58

Σ 58

classe D4

classe P72

Cálculo de P72

82,691014

35100

5872

65P

14n;10a

;58n;35N;65l

8,41100

5872

100

kn

72

PP

1PP

o

7272

7272

1º Passo:

2º Passo:

3º Passo:

Page 53: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

53

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil).

a) Medidas de posição:

• Portanto, na distribuição analisada, tem-se que:

- O valor 55,34 indica que 40% dos elementos da

distribuição estão abaixo dele e os outros 60%

acima.

- O valor 69,82 indica que 72% dos elementos da

distribuição estão abaixo dele e os outros 28%

acima.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Moda (Mo) é a medida que indica o valor ou a gama

de valores nos quais a concentração dos dados

amostrais é máxima.

- Para variáveis discretas, a moda é o valor dos dados

que ocorre com maior frequência;

- Para variáveis contínuas, a classe modal é o intervalo

de classe com maior frequência.

Page 54: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

54

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Assim, da representação gráfica dos dados, obtém-se

imediatamente o valor que representa a moda ou a

classe modal.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Esta medida é especialmente útil para reduzir a

informação de um conjunto de dados qualitativos,

apresentados sob a forma de nomes ou categorias,

para os quais não se pode calcular a média e por

vezes a mediana (se não forem susceptíveis de

ordenação).

Page 55: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

55

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (distribuições simples)

a) Medidas de posição:

• Para distribuições simples (sem agrupamento em

classes), a identificação da moda é facilitada pela

simples observação do elemento que apresenta maior

frequência.

- Exemplo: Para a distribuição abaixo Mo = 248.

xi 243 245 248 251 307

ni 7 17 23 20 8

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

• Para dados agrupados em classe, existem diversas

fórmulas para o cálculo da moda:

- Fórmula de Czuber: Após a identificação da classe modal,

aplica-se a fórmula abaixo, onde

i

21

1

io alM

l = limite inferior da classe modal;

Δ1= diferença entre a frequência absoluta da

classe modal e a imediatamente anterior;

Δ2 = diferença entre a frequência absoluta da

classe modal e a imediatamente posterior;

ai = amplitude da classe modal.

Page 56: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

56

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Exemplo: Determinar a moda para a distribuição:

Classes ni

35 45

45 55

55 65

65 75

75 85

85 95

5

12

18

14

6

3

- A classe com maior frequência absoluta é

[55, 65[; logo, ela é a classe modal.

- Aplicando a fórmula de Czuber, tem-se:

61M

10)1418()1218(

121855M

alM

o

o

i

21

1

io

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Densidades de classes: Quando as amplitudes das

classes são diferentes, deve-se calcular as densidades

de classes para identificar a classe modal, as quais são

obtidas por meio da relação ni/ai.

Page 57: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

57

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Exemplo: Determinar a moda para a distribuição:

Salários (US$) ni ai ni/ai

80 180

180 250

250 300

300 500

70

140

140

60

100

70

50

200

0,7

2,0

2,8

0,3

12,26250)3,08,2()0,28,2(

0,28,2250alM i

21

1

io

classe modal

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Fórmula de Pearson: Fornece uma boa aproximação

quando a distribuição apresenta razoável simetria em

relação à média. É dada pela relação:

x2x~3Mo

ou seja, a moda é aproximadamente igual a diferença

entre o triplo da mediana e o dobro da média

Page 58: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

58

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

1. Média versus Mediana:

Diferença entre estas duas medidas fica mais clara quando se

considera o exemplo das notas obtidas por um aluno como

sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode

ser comprovado, a média aritmética e a mediana são iguais a 14.

Se esse aluno elevar a nota mais baixa, passando de 10 para 14,

a mediana ainda será o mesmo valor, mas o valor da média

sofrerá um aumento, passando para 14,4.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

A média, ao contrário da mediana, é uma medida de posição

muito pouco resistente, isto é, ela é muito influenciada por

valores muito grandes ou muito pequenos, mesmo que estes

valores surjam em pequeno número na amostra.

Estes valores são os responsáveis pela má utilização da média

em muitas situações em que teria mais significado utilizar a

mediana.

1. Média versus Mediana:

Page 59: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

59

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

Entretanto, a preferência de uma ou de outra dependerá do

contexto em que forem utilizadas: se a distribuição é simétrica

essas medidas coincidem; caso contrário, observar que a mediana

não é tão sensível quanto a média, às observações que são muito

maiores ou muito menores do que as restantes; além disso, a

média reflete o valor de todas as observações.

1. Média versus Mediana:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

Representação das distribuições dos dados na forma de uma

curva de frequência:

1. Média versus Mediana:

Page 60: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

60

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

A média geométrica de um conjunto de números positivos é

menor ou igual à sua média aritmética, mas é maior ou igual à

sua média harmônica:

xGH

O sinal de igualdade somente é válido quanto todos os números

do conjunto de dados são idênticos.

2. Relação entre as médias aritmética, geométrica e harmônica:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

• São medidas estatísticas utilizadas para avaliar o grau de

variabilidade ou dispersão, dos valores em torno da

média.

• Servem para medir a representatividade da média

b) Medidas de dispersão

- Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30,

como pode ser calculado, ambas possuem média aritmética

igual a 20; entretanto, na primeira não existe dispersão,

enquanto a segunda apresenta dispersão em torno da média 20;

portanto, a média é muito mais representativa para a segunda

série.

Page 61: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

61

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

- Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36

R = 36 – 10 = 26

b.1) Amplitude total (ou amplitude amostral): É definida

como sendo a diferença entre o maior e o menor dos

valores da série, ou seja:

minmáx xxR

- Observação: É uma medida de dispersão muito limitada, pois

depende apenas dos valores externos, o que a torna instável, não

sendo afetada pela dispersão dos valores internos.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.2) Desvio médio: O desvio médio de um conjunto de n

números x1, x2 , ... , xn é definido por:

n

xx

n

xx

n

d

D

n

1i

i

n

1i

i

M

onde

xx i

média aritmética dos números;

valor absoluto do desvio de cada número

em relação à média aritmética.

x

Page 62: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

62

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn

ocorrerem com as frequências n1, n2, ... , nn,

respectivamente, o desvio médio poderá ser indicado

da seguinte forma:

n

xxn

n

xxn

n

dn

Di

n

1i

ii

n

1i

ii

M

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância: A variância de um conjunto de dados é

definida como o quadrado do desvio padrão, evitando-

se com isso que Σdi=0.

- Quando é necessário distinguir entre o desvio

padrão de uma população e o de uma amostra

dela extraída, adota-se frequentemente o símbolo

σ para o primeiro e s para o último.

Page 63: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

63

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

- Para o caso da variância populacional são

adotadas as seguintes fórmulas:

N

)Xx(

N

)Xx( 2

n

1i

2

i2

(dados não agrupados)

N

)Xx(n

N

)Xx(n 2

i

k

1i

2

ii2

(dados agrupados)

média populacional; X tamanho da população. N

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

- Para o caso da variância amostral são adotadas

as seguintes fórmulas:

1n

)xx(

1n

)xx(

s

2

n

1i

2

i2

(dados não agrupados)

1n

)xx(n

1n

)xx(n

s

2

i

k

1i

2

ii2

(dados agrupados)

média amostral; x tamanho da amostra. n

Page 64: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

64

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

• Fórmulas práticas para os cálculos das variâncias:

N

xnxn

N

12

ii2

ii

2

n

xnxn

1n

1s

2

ii2

ii

2

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão: Uma vez que a variância envolve a

soma de quadrados, a unidade em que se exprime não

é a mesma que a dos dados. Assim, para se conseguir

uma medida da variabilidade ou dispersão com as

mesmas unidades que os dados, toma-se a raiz

quadrada da variância e obtém-se o desvio padrão.

2

2

ss

(desvio padrão populacional)

(desvio padrão amostral)

Page 65: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

65

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• O desvio padrão é uma medida que só pode assumir valores

não negativos e quanto maior for, maior será a dispersão

dos dados.

• Algumas propriedades do desvio padrão, que resultam

imediatamente da definição, são:

- o desvio padrão é sempre não negativo e será tanto maior,

quanta mais variabilidade houver entre os dados;

- se s= 0, então não existe variabilidade, isto é, os dados são

todos iguais.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio

padrão da seguinte distribuição amostral:

xi 5 7 8 9 11

ni 2 3 5 4 2

xi ni nixi

5

7

8

9

11

2

3

5

4

2

10

21

40

36

22

Σ 16 129 06,8

16

129

16

xn

n

xn

x

5

1i

ii

k

1i

ii

- Média aritmética:

Page 66: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

66

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio

padrão da seguinte distribuição amostral:

2,116

24,19

n

xxnD

i

M

xi ni nixi |xi-x| = |di| ni|di|

5

7

8

9

11

2

3

5

4

2

10

21

40

36

22

|5 – 8,06| = 3,06

|7 – 8,06| = 1,06

|8 – 8,06| = 0,06

|9 – 8,06| = 0,94

|11 – 8,06| = 2,94

6,12

3,18

0,30

3,76

5,88

Σ 16 129 19,24

- Desvio médio:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio

padrão da seguinte distribuição amostral:

xi ni nixi nixi2

5

7

8

9

11

2

3

5

4

2

10

21

40

36

22

50

147

320

324

242

Σ 16 129 1.083

- Variância:

86,216

)129(083.1

116

1s

n

xnxn

1n

1s

22

2

ii2

ii

2

- Desvio padrão:

69,186,2ss2

Page 67: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

67

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• A medida anterior tem a grande desvantagem de

ser muito sensível à existência, na amostra, de

uma observação muito grande ou muito pequena.

• Por esse motivo, define-se uma outra medida, a

amplitude interquartílica.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Esta medida é, de certa forma, uma solução de

compromisso, pois não é afetada, de um modo

geral, pela existência de um pequeno número de

valores demasiadamente grandes ou pequenos. É

definida como sendo a diferença entre o 3º e 1º

quartis; assim:

13Q QQD

Page 68: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

68

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Da definição de amplitude interquartílica, pode-se concluir

que 50% dos elementos do meio da amostra estão contidos

num intervalo com aquela amplitude. Esta medida é não

negativa e será tanto maior quanto maior for a variabilidade

nos dados.

• Ao contrário do que acontece com o desvio padrão, uma

amplitude interquartílica nula não significa necessariamente,

que os dados não apresentem variabilidade. Ex: 10 11 13 14 14 14 14 14 14 14 14 14 14 16 17

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Alguns autores preferem calcular uma medida

próxima da referida: a amplitude semi-

interquartílica (ASI).

2

QQASI 13

Page 69: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

69

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• A variação ou dispersão real, determinada a partir

do desvio padrão, ou qualquer outra medida de

dispersão, é denominada dispersão absoluta;

entretanto, uma variação ou dispersão, na medida

de uma determinada distância, é inteiramente

diferente quanto ao efeito, da mesma variação em

uma distância menor.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• A medida desse efeito é proporcionada pela

dispersão relativa, definida por:

Média

absolutaDispersãorelativaDispersão

Page 70: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

70

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Se a dispersão absoluta é o desvio padrão e a

média é a aritmética, a dispersão relativa é

denominada coeficiente de variação ou de

dispersão, dado por:

• Coeficiente de variação é uma medida relativa de

dispersão, útil para a comparação em termos relativos do

grau de concentração em torno da média de séries distintas.

100x

sCVou100

XCV

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Exemplo: Em uma empresa, o salário médio dos homens é

de $4.000,00, com desvio padrão de $1.500,00, e o das

mulheres é em média de $3.000,00, com desvio padrão de

$1.200,00. Então:

• Desses valores conclui-se, portanto, que o salário das

mulheres apresentam maior dispersão que os dos homens

%0,401003000

1200100

XCV

%5,371004000

1500100

XCV

Para os homens:

Para as mulheres:

Page 71: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

71

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Diz-se que a distribuição possui baixa, média ou alta

variabilidade (dispersão) conforme os seguintes valores:

Baixa dispersão: CV ≤ 10%

Média dispersão: 10% < CV < 20%

Alta dispersão: CV ≥ 20%

• Alguns analistas consideram valores diferentes:

Baixa dispersão: CV ≤ 15%

Média dispersão: 15% < CV < 30%

Alta dispersão: CV ≥ 30%

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Uma distribuição de frequência pode ser simétrica,

assimétrica positiva ou assimétrica negativa.

c.1) Medidas de assimetria:

• Denomina-se assimetria o grau de desvio ou

afastamento da simetria de uma distribuição.

Page 72: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

72

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Uma distribuição simétrica apresenta a igualdade entre as três

medidas de posição, média aritmética, mediana e modo, ou:

xx~Mo

xx~Mo

• Em uma distribuição assimétrica positiva, ou assimétrica à

direita, tem-se que:

• Em uma distribuição assimétrica negativa, ou assimétrica à

esquerda, tem-se que:

oMx~x

c.1) Medidas de assimetria:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Existem várias fórmulas para o cálculo do coeficiente de

assimetria, dentre elas duas são bastante utilizadas:

- 1º Coeficiente de Pearson: s

MxASou

MxAS oo

- 2º Coeficiente de Pearson:

13

31

QQ

x~2QQAS

• Se AS = 0, a distribuição é simétrica

AS > 0, a distribuição é assimétrica positiva

AS < 0. a distribuição é assimétrica negativa.

c.1) Medidas de assimetria:

Page 73: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

73

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo: Identificar o grau de assimetria da

distribuição:

c.1) Medidas de assimetria:

Salários ($1.000,00) 30 50 50 100 100 150

Empregados 80 50 30

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo:

c.1) Medidas de assimetria:

Classes xi ni nixi nixi2 ni/ai Ni

30 50

50 100

100 150

40

75

125

80

50

30

3200

3750

3750

128.000

281.250

468.750

80/20 = 4

50/50 = 1

30/50 = 0,6

80

130

160

Σ 160 10.700 878.000

Page 74: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

74

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo:

c.1) Medidas de assimetria:

6,04090

29040~2

796,096,31

429,4185,66429,4120

34

430

502080

)080(30~96,31

905050

)80120(5062,1021

160

)700.10(000.878

159

1

402080

)040(30875,66

160

700.10

13

31

3

22

1

QQ

xQQAS

s

MxASM

xs

Qs

Qx

oo

- Como AS > 0, então a distribuição é assimétrica positiva.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Denomina-se curtose o grau de achatamento de

uma distribuição.

• Uma distribuição de frequência pode ser:

- Mesocúrtica: quando sua forma nem é achatada e

nem delgada;

- Leptocúrtica: quando apresenta a forma delgada;

- Platicúrdica: quando apresenta a forma achatada.

c.2) Medidas de curtose:

Page 75: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

75

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

c.2) Medidas de curtose:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Para medir o grau de curtose utiliza-se o coeficiente:

)PP(2

QQK

1090

13

onde Q3 = 3º quartil; P90 = 90º percentil;

Q1 = 1º quartil; P10 = 10º percentil.

• Se K = 0,263 – a curva correspondente à distribuição é

mesocúrtica;

K > 0,263 – a curva é platicúrdica;

K < 0,263 – a curva é leptocúrdica.

c.2) Medidas de curtose:

Page 76: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

76

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo: Para a mesma distribuição do exemplo da assimetria,

calcula-se ainda P10 e P90; logo:

c.2) Medidas de curtose:

355,0)34375,104(2

4090

)PP(2

QQK

375,10450160

)130144(100P

342080

)016(30P

1090

13

90

10

- Como K > 0,273, então a distribuição é do tipo platicúrtica.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

I - Estatística Descritiva

Page 77: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

77

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados

• Além dos diagramas já estudados, existem outras formas bastante

utilizadas internacionalmente para apresentar os dados amostrais. Um

bom modo de obter uma apresentação visual eficiente de um conjunto de

dados pode ser conseguido por meio de três tipos de gráficos: diagramas

de pontos, diagramas de ramo e folhas, e diagramas de caixa.

• O diagrama de pontos é uma apresentação útil de dados, no caso de

amostras pequenas (até cerca de 20 observações). Entretanto, quando o

número de observações for moderadamente alto, o diagrama de ramo e

folhas e o diagrama de caixa podem ser mais úteis.

• Questões como quantidades de dados abaixo de certo valor, tendência

central (média ou mediana), dispersão (desvio-padrão), possibilidade de

detectar outliers (pontos bastante diferentes do conjunto de dados) e o

desvio da simetria, não são fáceis de responder, pois existem muitas

observações, e a construção de um diagrama de pontos, usando esses

dados, seria relativamente ineficiente .

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Um diagrama de pontos é um gráfico estatístico que consiste

em grupos de pontos de dados traçados em uma escala

simples.

• São utilizados para dados contínuos, quantitativos e

univariados, e são muito úteis para exibir um pequeno

conjunto de dados.

• Esse tipo de gráfico permite uma fácil visualização de duas

características dos dados: a posição (meio) e a dispersão

(espalhamento ou variabilidade)

1.6 Outras Apresentações Gráficas de Dados

Page 78: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

78

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está

projetando um conector de náilon para ser usado em aplicação

automotiva. Ele considera estabelecer como especificação do projeto

uma espessura de 3/32 pol., mas está inseguro. Oito unidades do

protótipo são produzidas e suas forças de remoção são medidas,

resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3;

13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses

dados.

1.6 Outras Apresentações Gráficas de Dados

12 14 15

13

Força de remoção

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Exemplo 02: O engenheiro do exemplo anterior decide considerar

um projeto alternativo com uma espessura maior da parede do

conector, 1/8 pol. Oito protótipos desse projeto são construídos,

sendo as medidas observadas da força de remoção, resultando nos

seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e

13,1. Construa um diagrama de pontos para esses dados,

sobrepondo-o ao anterior para uma melhor análise da influência da

espessura da parede na força de remoção.

1.6 Outras Apresentações Gráficas de Dados

12 14 15

13,0 13,4

Força de remoção 3/32 pol.

1/8 pol.

Page 79: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

79

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Esta forma de apresentação de dados tem sido frequentemente

utilizada em trabalhos técnicos do mundo inteiro.

• Para construir o diagrama de ramo e folhas, dividimos o elemento

amostral em duas partes: um ramo (stem), consistindo em um ou

mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos

restantes.

Exemplo: O dado 458 é dividido em duas partes, a primeira parte 45,

e a segunda parte 8.

• Geralmente, escolhe-se relativamente poucos ramos em comparação

ao número de observações (5 a 20 itens).

1.6 Outras Apresentações Gráficas de Dados

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Exemplo (Montgomery, 2004, p.16): Considere o

conjunto de dados abaixo, relativos à resistência a

compressão de uma liga de alumínio.

105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141

245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133

207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146

218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158

160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149

O diagrama de ramo e folhas resultante é apresentado a

seguir:

1.6 Outras Apresentações Gráficas de Dados

Page 80: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

80

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas (dados brutos)

Ramo Folha Frequência

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

6

7

7

5 1

5 8 0

1 0 3

4 1 3 5 3 5

2 9 5 8 3 1 6 9

4 7 1 3 4 0 8 8 6 8 0 8

3 0 7 3 0 5 0 8 7 9

8 5 4 4 1 6 2 1 0 6

0 3 6 1 4 1 0

9 6 0 9 3 4

7 1 0 8

8

1 8 9

7

5

1

1

1

2

3

3

6

8

12

10

10

7

6

4

1

3

1

1

1.6 Outras Apresentações Gráficas de Dados

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas (dados ordenados)

Ramo Folha Frequência

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

6

7

7

1 5

0 5 8

0 1 3

1 3 3 4 5 5

1 2 3 5 6 8 9 9

0 0 1 3 4 4 6 7 8 8 8 8

0 0 0 3 3 5 7 7 8 9

0 1 1 2 4 4 5 6 6 8

0 0 1 1 3 4 6

0 3 4 6 9 9

0 1 7 8

8

1 8 9

7

5

1

1

1

2

3

3

6

8

12

10

10

7

6

4

1

3

1

1

1.6 Outras Apresentações Gráficas de Dados

Page 81: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

81

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Em alguns casos pode ser desejável construir mais intervalos ou

ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em

dois ou mais novos ramos, conforme mostrado abaixo:

Ramo Folha

14L

14U

15L

15U

1 2 3 5

6 8 9 9

0 0 1 3 4 4

6 7 8 8 8 8

Ramo Folha

14z

14t

14f

14s

14e

15z

15t

15f

15s

15e

1

2

3

5

0 0

1 3

4 4

6 7 8

8 8 8

1.6 Outras Apresentações Gráficas de Dados

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

Frequência acumulada Ramo Folha

1

2

3

5

8

11

17

25

37

(10)

33

23

16

10

6

5

2

1

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

6

7

7

1 5

0 5 8

0 1 3

1 3 3 4 5 5

1 2 3 5 6 8 9 9

0 0 1 3 4 4 6 7 8 8 8 8

0 0 0 3 3 5 7 7 8 9

0 1 1 2 4 4 5 6 6 8

0 0 1 1 3 4 6

0 3 4 6 9 9

0 1 7 8

8

1 8 9

7

5

1.6 Outras Apresentações Gráficas de Dados

N = 80

Min = 76

Max = 245

Média = 162,7

Mediana = 161,5

Q1 = 143,50

Q3 = 181,00

S2 = 33,77

Page 82: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

82

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

1.6 Outras Apresentações Gráficas de Dados

• Exercício (Montgomery, 2004, p.17): Os seguintes dados são os

números de ciclos até a falha, de corpos de prova de alumínio,

sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos

por segundo:

1115

1310

1540

1502

1258

1315

1085

798

1020

865

2130

1421

1109

1481

1567

1883

1203

1270

1015

845

1674

1016

1102

1605

706

2215

785

885

1223

375

2265

1910

1018

1452

1890

2100

1594

2023

1315

1269

1260

1888

1782

1522

1792

1000

1820

1940

1120

910

1730

1102

1578

758

1416

1560

1055

1764

1330

1608

1535

1781

1750

1501

1238

990

1468

1512

1750

1642

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

1.6 Outras Apresentações Gráficas de Dados

• (a) Construa um diagrama de ramo e folhas para esses dados. (b)

Você acha que o corpo de prova “sobreviverá” além de 2.000

ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.

Profundidade Ramo Folha

1

5

8

10

17

22

29

33

(5)

32

22

18

11

7

5

4

2

3

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

75

06 58 85 98

45 65 85

10 90

00 15 16 18 20 55 85

02 02 09 15 20

03 23 38 58 60 69 70

10 15 15 30

16 21 52 68 81

01 02 12 22 35 40 60 67 78 94

05 08 42 74

30 50 50 64 81 82 92

20 83 88 90

10 40

23

00 30

15 65

b) Não. A probabilidade

é muito pequena.

c) M = 1436,5

Q1 = 1097,8

Q3 = 1735

a)

Page 83: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

83

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• Uma outra forma gráfica de apresentar os dados é o chamado

diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and

whiskers), que permite descrever simultaneamente vários fatores

importantes de uma série de dados, tais como a tendência central

(média ou mediana), a dispersão (desvio-padrão), a possibilidade de

detectar outliers (pontos bastante diferentes do conjunto de dados) e

o desvio da simetria.

• Um diagrama de caixa apresenta três quartis, em uma caixa

retangular, alinhados tanto horizontal como verticalmente;

opcionalmente, pode apresentar a média.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• A caixa inclui a amplitude interquartil, com o canto esquerdo (ou

inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no

terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a

amplitude interquartil , DQ = Q3 - Q1.

• Uma linha é desenhada através da caixa, no segundo quartil (que é o

percentil 50 ou a mediana), Q2. A média, como já dito, é opcional.

• Uma linha (whisker) estende-se de cada extremidade da caixa.

• A linha inferior (ou esquerda) começa no primeiro quartil indo até o

menor valor do conjunto de pontos dentro das amplitudes

interquartis de 1,5, a partir do primeiro quartil.

Page 84: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

84

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• A linha superior (ou direita) começa no terceiro quartil indo até o

maior do conjunto de pontos dentro das amplitudes interquartis de

1,5, a partir do terceiro quartil.

• Dados mais afastados dos que as linhas são plotados como pontos

individuais. Um ponto além da linha, porém a menos de 3

amplitudes interquartis a partir da extremidade da caixa, é chamado

de dispersos (outliers).

• Um ponto a mais de 3 amplitudes interquartis a partir da

extremidade da caixa é chamado de um outlier extremo.

Ocasionalmente, símbolos diferentes (círculos abertos e fechados,

por exemplo) são usados para identificar os dois tipos de outlier.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

Page 85: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

85

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• Exercício: Represente o diagrama de caixa para os dados da

resistência à compressão do alumínio mostrados no exercício

anterior.

N = 80

Min = 76

Max = 245

Média = 162,7

Mediana = 161,5

Q1 = 143,50

Q3 = 181,00

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear

I - Estatística Descritiva

Page 86: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

86

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Introdução

• A análise de regressão é uma técnica estatística para

investigar e modelar a relação entre variáveis, sendo uma

das mais utilizadas na análise de dados.

• É denominada “linear” porque se considera que a relação

da resposta às variáveis é uma função linear de alguns

parâmetros.

• Os modelos de regressão que não são uma função linear

dos parâmetros se chamam modelos de regressão não-

linear.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Introdução

• A regressão linear pode ser simples ou múltipla.

• A regressão simples envolve duas variáveis

(estimadores): uma variável dependente e uma variável

independente.

• A regressão múltipla envolve três ou mais variáveis,

ainda uma única variável dependente, porém duas ou

mais variáveis independentes (explicativas).

Page 87: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

87

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Simples

Relação entre duas variáveis

• Em inúmeras ocasiões o estudo descritivo não se resume

ao estudo de apenas uma variável; para se ter uma visão

global do problema em estudo, muitas vezes é necessário

a observação de duas ou mais variáveis.

• Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passa-

se a ter dados bivariados (xi, yi), i = 1, 2, ..., n.

• Um dos objetivos desse estudo é a relação existente entre

as variáveis do par.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

• Para se ter uma ideia de como as duas variáveis se

relacionam é comum representar graficamente esta

relação por meio de um diagrama de dispersão. Esta

representação consiste na marcação das observações em

um sistema de eixos cartesianos.

• Se as variáveis fornecem um diagrama de dispersão em

que os pontos se colocam ao redor de uma reta crescente

ou decrescente, diz-se que essas variáveis estão

linearmente correlacionadas.

Page 88: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

88

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

• Quanto menor a dispersão dos pontos em torno da reta,

mais forte será a correlação.

• A correlação linear será positiva ou negativa caso a

tendência da reta seja crescente ou decrescente.

• Se nenhuma tendência positiva ou negativa pode ser

detectada, a explicação possível para os valores da

segunda variável é sua média. Nesse caso, o eixo da

dispersão será horizontal, contendo a média da segunda

variável, e diz-se que as variáveis não são linearmente

correlacionadas.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

y

x

Correlação linear forte

(positiva)

y

x

Correlação linear forte

(negativa)

y

x

Correlação linear fraca

(positiva)

Page 89: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

89

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

y

x

Variáveis não

correlacionadas

y

x

Variáveis não

correlacionadas

linearmente

y

x

Variáveis não

correlacionadas

linearmente

y

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

• Exemplo: A tabela abaixo mostra os dados da temperatura do gás

combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma

turbina de combustão, para ser usada em refrigeração, construa o

diagrama de dispersão para esses dados.

x 100 125 150 175 200 225 250 275

y 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8

x 300 325 350 375 400 425 450 500

y 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7

• Desse diagrama pode-se extrair que talvez exista uma correlação

linear entre as variáveis; esta relação pode ser traduzida por meio

de uma reta.

Page 90: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

90

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• A determinação da correlação entre duas variáveis por

meio de uma inspeção nos pares anotados ou no

diagrama de dispersão correspondente é pouco precisa e

subjetiva.

• Essa dificuldade pode ser contornada pelo uso de uma

medida que caracterize a correlação linear e seja

independente do observador que esteja examinando os

dados.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Karl Pearson propôs o chamado coeficiente de

correlação linear, o qual é dado pela relação:

2

y

2

x ss

)y,x(Covr

onde: Cov (x,y) é a covariância das variáveis x e y, e seu

cálculo é dado por

1n

)yy()xx()y,x(Cov

e sx2 e sy

2 são as variâncias da variáveis x e y.

Page 91: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

91

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Fazendo-se as devidas substituições e simplificações,

obtém-se o coeficiente de correlação de forma mais

simples:

yyxx

xy

ss

sr

n

xxs

2

2

xx

n

yys

2

2

yy

onde:

n

yxxysxy

1r1

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• r = -1, indica correlação linear negativa perfeita; os

pontos (x,y) estão sobre uma reta com coeficiente angular

negativo.

• r = 0, indica que os pontos não estão correlacionados,

nem apresentam tendência crescente ou decrescente.

• r = 1, indica correlação linear positiva perfeita; os pontos

(x,y) estão sobre uma reta com coeficiente angular

positivo.

Page 92: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

92

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Nos casos em que os pontos do diagrama de dispersão estão em uma

reta vertical ou horizontal, o quociente que calcula o coeficiente de

correlação não está definido, pois apresenta numerador e

denominador nulos. Nesse caso, o coeficiente de correlação será

considerado nulo.

r = 0, Cov (x,y) = 0, sy2 = 0

y

x

r = 0, pois Cov (x,y) = 0, sx2 = 0

y

x

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• A correlação entre duas variáveis pretende captar o fato

dessas variáveis apresentarem a mesma tendência ao

crescimento, ou tendências contrárias.

• O fato de duas variáveis evoluírem no mesmo sentido ou

em sentidos opostos fornece uma ideia do que se pode

esperar sobre um valor desconhecido da variável y para

um particular valor de x.

Page 93: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

93

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

x

y

• Se as variáveis x e y são positivamente correlacionadas, e se procura

estimar o valor de y1 para certo valor x1 menor que a média , deve-

se esperar o valor correspondente y1 menor que a média ; para um

valor x2 maior que a média , deve-se esperar um valor y2 maior que

a média , acompanhando a tendência do eixo crescente dos pontos.

x

y

y

x

y2

y1

x2 x1 x

y

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Os problemas que envolvem estimativas de valores desconhecidos a

partir de valores históricos são chamados problemas de previsão ou

predição.

• O conhecimento da correlação entre duas variáveis, embora possa

fornecer uma pista para a previsão de um valor desconhecido de uma

delas, nada informa a respeito da qualidade dessa previsão, ou seja,

não se pode, em geral, com base apenas no conhecimento da

correlação, transformar a incerteza da previsão em risco (isto só é

possível quando a correlação é perfeita).

• Entretanto, o fato de duas variáveis serem correlacionadas levanta a

possibilidade de uma relação causal entre elas, o que é importante

em problemas de previsão.

Page 94: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

94

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples

• Como visto anteriormente, uma previsão construída

baseada nas informações obtidas da correlação nada diz a

respeito da confiabilidade do valor previsto.

• Um método de previsão que permite a avaliação em

termos de confiabilidade é a regressão linear, pois,

satisfeitas determinadas condições, ela proporciona a

transformação da incerteza em risco

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Quando se verifica, quer por meio do gráfico de

dispersão, quer pelo coeficiente de correlação linear, uma

correlação forte entre duas variáveis, a relação entre

essas variáveis pode ser descrita por meio de uma reta de

regressão (a reta que melhor se ajusta aos dados).

• Essa reta serve de modelo matemático para expressar a

relação linear entre duas variáveis.

Page 95: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

95

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Considere o relacionamento de duas variáveis x e y com

as seguintes características:

x: é a variável cujos valores são controlados e, portanto,

determinados; ela é conhecida por variável independente ou

variável de decisão;

y: variável aleatória; é a variável que se quer prever; seu valor

depende do valor atribuído a x, embora para cada valor de x se

possa ter vários valores de y, devido a sua característica aleatória

(variável dependente de x).

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• O modelo teórico define a verdadeira reta de regressão, cuja

equação pode ser escrita como:

xy

y

O valor de y é dado por:

onde:

UxyouUyy

é a parte funcional de y (a parte do valor de y explicada pelo

valor de x);

U é a parte aleatória de y, a qual é introduzida no valor de y por

fatores imponderáveis.

Page 96: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

96

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Nessas condições, dado um valor para x, a previsão ou expectativa

para o correspondente valor de y é:

• Entretanto, dificilmente se conhece a população dos valores de y

para cada valor da variável controlada x. O que se conhece,

geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma

amostra dessas variáveis.

• Portanto, com base nos dados amostrais, deve-se pensar como

estimar os valores de α e β, o que pode ser feito de forma eficiente

por meio do método dos mínimos quadrados.

xy

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Um dos métodos mais utilizados para ajustar uma reta a um conjunto

de dados é o Método dos Mínimos Quadrados (MMQ), o qual

consiste em determinar a reta que minimiza a soma dos quadrados

dos desvios (os chamados erros ou resíduos) entre os verdadeiros

valores de y e os valores estimados a partir da reta de regressão que

se pretende ajustar, ŷ.

^ ŷ = a + bx

Page 97: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

97

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Adota-se o quadrado das diferenças, pois como os pontos

se situam acima e abaixo da reta estimada, as diferenças

podem ser positivas ou negativas, e na soma podem

anular-se, não refletindo o ajustamento.

• Sendo números positivos, esses quadrados refletem a

qualidade do ajuste através de sua soma.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• O modelo de regressão linear é a reta de regressão

yi = ŷi + εi = a + bxi + εi

onde

ŷ é o estimador de y;

a e b os estimadores de α e β.

2

ii

2

ii

2

i )]bxa(y[min)yy(minmin

• A reta estimada é obtida de tal modo que a soma dos quadrados dos

desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,

Page 98: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

98

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Como tal, para estimar os parâmetros do modelo, é necessário que as

primeiras derivadas em relação a a e a b sejam nulas, e as segundas

sejam maiores ou iguais a zero, assim:

0)bxay(b

0)bxay(a

2

ii

2

ii

xx

xy

2

2

s

s

n

xx

n

yxxy

b,xbyn

xb

n

ya

As estimativas dos mínimos quadrados para os parâmetros α e β são:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

• Calculada a estimativa de mínimos quadrados para uma

amostra dada, deve-se verificar a qualidade do ajuste

dessa reta aos dados históricos.

• Uma forma de medir a qualidade do ajuste é verificar

qual a porcentagem da variação dos valores de y em

relação à sua média pode ser explicada pela regressão de

y sobre x, o que dará origem ao coeficiente de explicação

R2.

Page 99: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

99

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

• Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x,

observa-se que o valor de yi correspondente a um valor xi pode ser

composto de duas partes: a parte explicada pela média e a parte não

explicada pela média.

y

y parte do valor de y explicada pela média

parte do valor de y explicada pela regressão yy

parte do valor de y não explicada pela média yyi

x xi

yi

ŷ

y

ŷ = a + bx

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

• Interessa avaliar que porcentagem da parte não explicada pela

média, , pode ser explicada pela regressão de y sobre x, isto é,

por .

1.7 Regressão Linear

Coeficiente de explicação

yy

yyi

2

i yyVT

VE = variação explicada, a soma dos quadrados das variações em

relação à média. 2

yyVE

• Designando:

VT = variação total, soma dos quadrados das variações de y em

relação à sua média.

• No método dos mínimos quadrados, ao invés de somar essas

diferenças, soma-se o quadrado delas para evitar que valores

positivos e negativos se anulem.

Page 100: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

100

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

22

yy

xy2

2

2

2rR

s

sbRou

n

yy

n

yxxy

bR

• O coeficiente de explicação R2 pode ser definido agora como sendo

a porcentagem da variação total representada pela variação

explicada.

2

i

2

2

yy

yy

VT

VER

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Exemplo: No exemplo anterior, observou-se no diagrama

de dispersão uma possível relação linear entre as

variáveis.

a) Confirme essa relação por meio do coeficiente de

correlação;

b) Encontre a reta de regressão pelo método dos

mínimos quadrados.

Page 101: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

101

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Cálculos: i x y x2 y2 xy

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

100

125

150

175

200

225

250

275

300

325

350

375

400

425

450

500

99,1

98,8

98,5

98,5

98,5

98,2

98,0

97,8

97,8

97,8

97,6

97,5

97,3

97,0

96,8

96,7

10000

15625

22500

30625

40000

50625

62500

75625

90000

105625

122500

140625

160000

180625

202500

250000

9820,8

9761,4

9702,2

9702,2

9702,2

9643,2

9604,0

9564,8

9564,8

9564,8

9525,8

9506,2

9467,3

9409,0

9370,2

9350,9

9910,0

12350,0

14775,0

17237,5

19700,0

22095,0

24500,0

26895,0

29340,0

31785,0

34160,0

36562,5

38920,0

41225,0

43560,0

48350,0

Σ 4625 1565,9 1559375 153259,8 451365,0

%7,97ou977,0)99,0(R

99,0r

16

)9,1565(8,153259

16

)4625(1559375

16

9,15654625451365

r

n

yy

n

xx

n

yxxy

r

ss

sr

22

22

2

2

2

2

yyxx

xy

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Cálculos:

- O valor da correlação e do coeficiente de explicação indicam uma

forte correlação linear entre a temperatura do gás combustível e a

taxa de calor. Pode-se, portanto, estimar, através do MMQ os

parâmetros a e b e traçar a reta de regressão:

516,9916

4625)0057,0(

16

9,1565

n

xb

n

ya

0057,0

16

46251559375

16

9,15654625451365

n

xx

n

yxxy

b22

2

- Sendo assim, a reta de regressão é: x0057,0516,99bxay

Page 102: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

102

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Para que se evite erros de previsão, a condição inicial para

um estudo de regressão linear entre duas variáveis é que

essas variáveis apresentem uma razoável correlação

linear.

• Caso os valores de y para crescentes valores de x variem

de modo aleatório, sem apresentar qualquer tendência, o

valor que melhor explica y é, geralmente, a sua média;

entretanto, em alguns casos, o diagrama de dispersão

apresenta uma tendência não linear, isto é, uma curva bem

definida, em torno da qual os pontos parecem agrupar-se.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Existe um grupo de funções que apresentam diagramas

ajustáveis a muitas dessas tendências, e que possuem a

qualidade de poder transformar-se em funções lineares

com a aplicação de logaritmos ou por mudança de

variável.

• A forma linear dessas funções transformadas pode então

ser usada para estimar os parâmetros da curva ajustada

àquela tendência, conforme será estudado a seguir.

Page 103: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

103

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0

• Para este caso, a primeira e a segunda derivadas da função

fornecem a forma da curva.

b > 1

Crescente

Concavidade para cima

Contém a origem

x

y

0 < b < 1

Crescente

Concavidade para baixo

Contém a origem

x

y

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0

• Se x = 0, então y = 0.

• Para x > 0, aplicando o logaritmo, tem-se: ln y = ln a + b.ln x

• Fazendo Y = ln y, A = ln a e X = ln x, tem-se a forma linear:

Y = A + b.X

O diagrama de dispersão de (X = ln x, Y = ln y) e o coeficiente de

correlação correspondente podem indicar a oportunidade e

qualidade do ajuste.

Page 104: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

104

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0

• Como no caso anterior, as derivadas fornecem a forma das curvas.

a b > 1

Crescente

Concavidade para cima

x = 0 → y = a

x

y

0 < b < 1

Decrescente

Concavidade para cima

x = 0 → y = a

x

y

a

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0

• Aplicando o logaritmo, tem-se: ln y = ln a + x.ln b

• Fazendo Y = ln y, A = ln a e B = ln b, tem-se a forma linear:

Y = A + B.x

O diagrama de dispersão de (x, Y=lny) e o coeficiente de

correlação correspondente podem indicar a oportunidade e

qualidade do ajuste.

Page 105: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

105

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função hiperbólica, tipo I:

• A primeira e a segunda derivadas fornecem a forma das curvas.

0y,0a,0x,x

bay

b > 0

Decrescente

Concavidade para cima

Assíntota em x = 0 e y = a

x

y

a

x

Crescente

Concavidade para baixo

Assíntota em y = a

y

a b < 0

- b/a

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

3. Função hiperbólica, tipo I:

• Fazendo X = 1/x, obtém-se a forma linear:

y = a + b.X

O diagrama de dispersão de (X=1/x, y) e o coeficiente de

correlação correspondente podem indicar a oportunidade e

qualidade do ajuste.

0y,0a,0x,x

bay

Page 106: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

106

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

4. Função hiperbólica, tipo II:

• As derivadas da função indicam que a curva é decrescente e tem

concavidade voltada para cima, com assíntotas em y = 0. Para x

=0, y = 1/a.

0x,0b,0a,bxa

1y

x

y

1/a

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

4. Função hiperbólica, tipo II:

• Fazendo Y = 1/y, obtém-se:

0x,0b,0a,bxa

1y

bxaYoubxa

1

Y

1

O diagrama de dispersão de (x, Y=1/y) e o coeficiente de

correlação correspondente podem indicar a oportunidade e

qualidade do ajuste.

Page 107: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

107

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

5. Função logaritmo: y = a + b.ln x, x > 0

• As derivadas indicam a forma da curva:

b < 0

Decrescente

Concavidade para cima

x

y

e-a/b x

Crescente

Concavidade para baixo

y b > 0

e- a/b

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

5. Função logaritmo: y = a + b.ln x, x > 0

• Fazendo X = ln x, obtém-se a forma linear:

bXay

O diagrama de dispersão de (X=ln x, y) e o coeficiente de

correlação correspondente podem indicar a oportunidade e

qualidade do ajuste.

Page 108: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

108

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Exemplo: Um estudo sobre a oferta de mercado de um

produto revelou as seguintes quantidades que os

produtores estariam dispostos a oferecer a vários níveis

de preços:

x = preço 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50

y = oferta

(em 1000 un.) 427 440 447 453 460 465 470 472

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

a. Construa um diagrama de dispersão para os dados da tabela;

b. Calcule o coeficiente de correlação linear das variáveis;

c. O diagrama de dispersão sugere o uso de alguma forma linearizável

para ajustar os pontos?

d. Construa o gráfico de dispersão da forma linear correspondente à

função escolhida em (c);

e. Calcule o coeficiente de correlação dos pares em (d);

f. Comente os resultados obtidos;

g. Calcule a regressão de y sobre x para a função de maior correlação;

h. Calcule o coeficiente de explicação para a função escolhida em (g);

i. Calcule a oferta para um preço de 15,00.

Page 109: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

109

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Solução:

a. Diagrama de dispersão

420

425

430

435

440

445

450

455

460

465

470

475

9 9,5 10 10,

5

11 11,

5

12 12,

5

13 13,

5

14

x

y

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

b. Coeficiente de correlação.

n x y x2 y2 xy

1

2

3

4

5

6

7

8

10,0

10,5

11,0

11,5

12,0

12,5

13,0

13,5

424

440

447

453

460

465

470

472

100,00

110,25

121,00

132,25

144,00

156,25

160,00

182,25

182329

193600

198809

205209

211600

216225

220900

222284

4270,0

4620,0

4917,0

5209,5

5520,0

5812,5

6110,0

6372,0

Σ 94,0 3.634 1.115,00 1.652.456 42.831,0

Page 110: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

110

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

b. Coeficiente de correlação.

98,05,711.15,10

5,131r5,711.1

8

)634.3(456.652.1s

5,108

)94(115.1s5,131

8

634.394831.42s

2

yy

2

xxxy

c. A forma do diagrama de dispersão sugere a curva logarítmica por

suas características.

y = a + b.ln x

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

d. Diagrama de dispersão: a forma linear é y = a + b.X, com X = ln x.

X = ln x 2,30 2,35 2,40 2,44 2,48 2,53 2,56 2,60

y = oferta

(em 1000 un. 427 440 447 453 460 465 470 472

420

425

430

435

440

445

450

455

460

465

470

475

2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3

ln x

y

Page 111: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

111

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

e. Coeficiente de correlação.

n X=ln x y X2 y2 Xy

1

2

3

4

5

6

7

8

2,30

2,35

2,40

2,44

2,48

2,53

2,56

2,60

424

440

447

453

460

465

470

472

5,29

2,52

5,76

5,95

6,15

6,40

6,55

6,77

182.329

193.600

198.809

205.209

211.600

216.225

220.900

222.284

982,1

1.034,0

1.072,8

1.105,5

1.140,8

1.176,45

1.203,2

1.227,2

Σ 19,67 3.634 48,45 1.652.456 8.947,57

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

e. Coeficiente de correlação.

9879,05,711.10771,0

3453,11r5,711.1

8

)634.3(456.652.1s

0771,08

)67,19(45,48s3453,11

8

634.367,1957,947.8s

2

yy

2

xxxy

f. A correlação obtida com a curva logarítmica é maior; portanto, essa

função será escolhida para o processo de regressão.

Page 112: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

112

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

g. Cálculo da regressão linear:

xln.1505,1471907,92y

9219078

67,191505,147

8

634.3

n

xb

n

ya

1505,1470771,0

3453,11

s

sb

xx

xy

h. Cálculo do R2.

976,05,711.1

3453,111505,147

s

sbR

yy

xy2

A regressão de y sobre x explica 97,6% das variações de y a partir de sua

média; os outros 2,4% são atribuídos a fatores imponderáveis.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

i.Projeção da oferta para um preço de 15,00:

A oferta esperada quando o preço for 15,00 é de 490,68

mil unidades.

Page 113: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

113

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Múltipla

Relação entre as variáveis

• A finalidade das variáveis independentes adicionais é

melhorar a capacidade de predição em confronto com a

regressão linear simples.

• Isto é, reduzir o coeficiente do intercepto, o qual, em

regressão, significa a parte da variável dependente

explicada por outras variáveis, que não a considerada no

modelo.

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Múltipla

Relação entre as variáveis

• Mesmo quando interessa o efeito de apenas uma das

variáveis, é aconselhável incluir as outras capazes de

afetar Y (análise de regressão múltipla), por 2 razões:

− Para reduzir os resíduos estocásticos. Reduzindo-se a

variância residual (erro padrão da estimativa);

− Para eliminar a tendenciosidade que poderia resultar se

simplesmente ignorássemos uma variável que afeta Y

substancialmente.

Page 114: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

114

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• A regressão múltipla apresenta um funcionamento

parecido com o da regressão simples, porém leva em

consideração diversas variáveis explicativas

influenciando ao mesmo tempo.

• Suponha que temos n observações (n>p) da variável

resposta e das p variáveis explicativas. Assim, yi é o

valor da variável resposta na i-ésima observação,

enquanto que xij é o valor da variável explicativa xj na i-

ésima observação, j = 1, 2 …, p.

Modelo

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os dados da MRLM podem ser apresentados na forma da

tabela abaixo:

Estimativa dos Parâmetros do Modelo

yi x1 x2 ... xp

y1 x11 x12 ... x1p

y2 x21 x22 ... x2p

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

yn xn1 xn2 ... xnp

• Em que cada relação satisfaz:

Page 115: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

115

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• O objetivo é minimizar o somatório do quadrado dos

desvios de cada observação:

Método dos Mínimos Quadrados

• Derivando o L em função dos β´s :

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos Mínimos Quadrados

Page 116: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

116

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os estimadores dos parâmetros do modelo podem ser

encontrados a partir da notação matricial dos dados.

Assim, considerando a entrada dos dados como mostrado

na tabela, o MRLM pode ser escrito como:

Representação Matricial do Modelo

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Representação Matricial do Modelo

Page 117: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

117

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Usando a técnica de derivação em termos matriciais:

Representação Matricial do Modelo

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os estimadores para os parâmetros βj são dados pelo vetor

Representação Matricial do Modelo

• Em geral a matriz (X´X) tem determinante diferente de

zero (não singular) e, portanto, é invertível.

• O modelo de regressão linear ajustado e o vetor de

resíduos são, respectivamente:

Page 118: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

118

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• No sistema de equações anterior, fazendo-se

Modelo de Regressão com duas Variáveis Explicativas

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Resolvendo-se o sistema:

Modelo de Regressão com duas Variáveis Explicativas

Page 119: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

119

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Onde:

Modelo de Regressão com duas Variáveis Explicativas

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Considere a seguinte base de dados:

Exemplo:

i Consumo ($)

y

Renda ($)

x1

Taxa de juros (%)

x2

1

2

3

4

5

6

7

8

9

10

122

114

86

134

146

107

68

117

71

98

139

126

90

144

163

136

61

62

41

120

11,5

12,0

10,5

9,0

10,0

12,0

10,5

8,0

10,0

11,5

Page 120: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

120

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Aplicando-se a fórmula anterior tem-se:

Exemplo:

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo:

• Logo,

• Interpretação: Tirando a parte do Consumo que não é

influenciada pela Taxa de Juros, o incremento de $1,00 na

Renda causa um acréscimo esperado de $0,6136 no

Consumo; além disso, o incremento de 1 ponto percentual

(0,01) na Taxa de juros causa um decréscimo esperado de

$10,3441 no Consumo.

Page 121: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

121

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo no modelo não matricial:

i y x1 x2 y.x1 y.x2 x1² x2² x1.x2 y²

1 122 139 0,115 16958 14,03 19321 0,013225 15,985 14884

2 114 126 0,12 14364 13,68 15876 0,0144 15,12 12996

3 86 90 0,105 7740 9,03 8100 0,011025 9,45 7396

4 134 144 0,09 19296 12,06 20736 0,0081 12,96 17956

5 146 163 0,1 23798 14,6 26569 0,01 16,3 21316

6 107 136 0,12 14552 12,84 18496 0,0144 16,32 11449

7 68 61 0,105 4148 7,14 3721 0,011025 6,405 4624

8 117 62 0,08 7254 9,36 3844 0,0064 4,96 13689

9 71 41 0,1 2911 7,1 1681 0,01 4,1 5041

10 98 120 0,115 11760 11,27 14400 0,013225 13,8 9604

∑ 1063 1082 1,05 122781 111,11 132744 0,1118 115,4 118955

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo:

Sy1 Sy2 S11 S22 S12 b1 b2 a

7764,4 -0,505 15672 0,00155 1,79 0,6135934 -1034,41 148,52202

y = 148,52 + 0,6136.x1 – 1034,41.x2

Page 122: Universidade Federal do Pará Instituto de Tecnologia · - Etapa simultânea à anterior, ... 3. Coleta de dados. 4. ... 19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

6/19/2016

122

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de Explicação:

• Similarmente ao que foi feito para a RLS, o coeficiente

de explicação R² é definido como sendo:

(variação explicada pela regressão/variação total)

19/06/2016 09:16 ESTATÍSTICA APLICADA I - Estatística Descritiva

FIM

I - Estatística Descritiva