Upload
joao-leal
View
10.486
Download
2
Embed Size (px)
Citation preview
CET – Curso de Especialização Tecnológica
Ano Lectivo 2009/2010
Métodos Computacionais e Estatísticos
Professor: João Leal
www.joaoleal.net Professor: João José Leal 2
1. Estatística Descritiva
www.joaoleal.net Professor: João José Leal 3
Estatística: É um ramo da Matemática que nos
ajuda a recolher, a organizar e a interpretar dados
que através da utilização de métodos e técnicas
permitem-nos classificar os dados recolhidos e
reunir informações de modo a destacar o que é mais
importante.
www.joaoleal.net Professor: João José Leal 4
A Estatística, enquanto conjunto de métodos e técnicas
próprios para recolher, classificar (tratar), apresentar e interpretar
os dados, organiza-se em dois sub-conjuntos: a Estatística
Descritiva e a Estatística Analítica.
A Estatística Descritiva éé oo ssub-conjunto da estatística que
se ocupa indistintamente de um universo ou de uma amostra, com
o intuito de os descrever, ou seja, dedica-se apenas à classificação
(tratamento), representação e redução de dados, podendo
compreender a análise dos mesmos, sempre que as conclusões não
respeitem a um conjunto maior do que o observado.
www.joaoleal.net Professor: João José Leal 5
Portanto, quando se torna necessário manusear e organizar
dados para os transformar em informação, é na Estatística
Descritiva que buscamos os métodos e as técnicas para realizar
essas actividades.
www.joaoleal.net Professor: João José Leal 6
Rotina de Abordagem da Fase Descritiva
1. Determinar a natureza da informação desejada para os fins que
se têm em vista;
2. Indagar se os dados já publicados - pelos serviços oficiais de
estatística ou outras entidades – contêm elementos de interesse:
Conhecer as principais fontes de dados estatísticos;
3. Citar as fontes a que se recorreu. Procurar as fontes originais,
tentando saber como foram apurados os dados e que fim
presidiu à sua recolha;
www.joaoleal.net Professor: João José Leal 7
4. Se os dados pretendidos não estiverem disponíveis, há que
proceder à sua recolha, que terá um objectivo e um âmbito. Há
ainda a considerar a definição do:
– PLANO DE RECOLHA DOS DADOS: dados necessários e
suficientes e meios para os obter
– PROCESSO DE RECOLHA DOS DADOS• Inquéritos exaustivos ou censos
• Inquéritos ou indagações parciais• Sondagens ou inquéritos por amostragem
– MODO DE RECOLHA DOS DADOS
• Contínuo
• Periódico
• Ocasional
www.joaoleal.net Professor: João José Leal 8
5. Obtidas as respostas, há que fazer a análise crítica dos dados,
verificando a verosimilhança das respostas e as suas falhas
(censura das respostas), eliminando as contraditórias ou
inexactas
6. Finalmente, há que tratar os dados (classificação) com vista à
sua representação: Quadros, Gráficos, Redução de Dados
www.joaoleal.net Professor: João José Leal 9
População/ Universo: Conjunto de todos os elementos
que vão ser objecto de estudo ou análise, que têm pelo
menos uma característica em comum.
Exemplo: Os alunos da Escola X.
www.joaoleal.net Professor: João José Leal 10
Amostra: É um subconjunto finito da população que se
supõe representativo desta. Ou seja, na impossibilidade
de se estudar todos os elementos da população efectua-
se um subconjunto finito da população.
Exemplo: Os alunos de uma determinada turma da
Escola X.
Unidade Estatística: É cada elemento da população ou
da amostra.
www.joaoleal.net Professor: João José Leal 11
Exercícios:
1. Para estimar a audiência de cada um dos quatro canais de
televisão, realizou-se um estudo a partir de 1000 famílias
portuguesas. Relativamente ao estudo indique:
a) a população;
b) a amostra;
c) a unidade estatística.
www.joaoleal.net Professor: João José Leal 12
2. De entre os 3000 alunos de uma escola seleccionaram-se 60 e
inquiriram-se sobre o programa de televisão preferido.
Os resultados obtidos de dados, indique:
a) a população;
b) a amostra;
c) a unidade estatística.
www.joaoleal.net Professor: João José Leal 13
Censos ou Recenseamento: Num censo ou recenseamento são
observados todos os indivíduos da população relativamente aos
diferentes atributos que estão a ser objecto do estudo estatístico.
Sondagens: Numa sondagem, o estudo estatístico baseia-se numa
parte da população, isto é, numa amostra que deve ser representativa
dessa população.
Caracter (ou atributos ou variável): É um modo pelo qual eu vou
estudar a minha população, isto é, segundo uma determinada
característica.
Exemplo: Relativamente aos elementos de uma família, podemos observar: a altura; a
cor dos olhos; o sexo; a idade (em anos); etc.
www.joaoleal.net Professor: João José Leal 14
AtributosAtributos ouou característicascaracterísticas dede umauma populaçãopopulação
ÉÉ oo queque sese pretendepretende conhecerconhecer quandoquando sese estudaestuda umauma
populaçãopopulação.. PodemPodem serser::
••QualitativosQualitativos:: São aquelas que estão relacionadas com uma qualidade e se
apresentam com várias modalidades. Ou seja, não é possível a sua mensuração,
não é possível traduzi-los em números. Exemplo: O sexo (masculino, feminino); Cor
dos olhos (castanhos, verdes, azuis).
••QuantitativosQuantitativos:: São aquelas a que é possível atribuir uma medida e
apresentam-se com diferentes intensidades ou valores. Isto é, são mensuráveis e
podem ser traduzidos por números. Exemplo: A altura; a idade (em anos).
www.joaoleal.net Professor: João José Leal 15
DadosDados
Os dados quantitativos de um atributo ou característica Os dados quantitativos de um atributo ou característica
podem ser discretos ou contínuos.podem ser discretos ou contínuos.
•• DiscretosDiscretos se tomam um número finito ou infinito se tomam um número finito ou infinito
numerável de valores.numerável de valores.
•• ContínuosContínuos se tomam um número infinito se tomam um número infinito nãonão--
numerávelnumerável de valores.de valores.
www.joaoleal.net Professor: João José Leal 16
VariávelVariável
É um símbolo que representa determinado atributo ou É um símbolo que representa determinado atributo ou
característica de uma população.característica de uma população.
Pode ser:Pode ser:
-- discretadiscreta
-- contínuacontínua
www.joaoleal.net Professor: João José Leal 17
ProporçãoProporção
Permite avaliar o peso relativo de uma parte em relação a
um todo, e obtém-se através do quociente da parte pelo
todo.
Ex:
RelaçãoRelação entreentre desempregadosdesempregados ee populaçãopopulação activaactiva;; proporçãoproporção dede
observaçõesobservações comcom umum determinadodeterminado valorvalor dada característicacaracterística
analisadaanalisada ee oo totaltotal dede observaçõesobservações realizadasrealizadas.
www.joaoleal.net Professor: João José Leal 18
PercentagemPercentagem
Proporção, multiplicada por 100.
Ex:
A percentagem de desempregados é de 6,4%, ou seja, em 100
pessoas activas há 6,4 no desemprego.
www.joaoleal.net Professor: João José Leal 19
TaxaTaxaPercentagemPercentagem
ExEx::TaxaTaxa dede desempregodesemprego éé dede 66,,44%%.. TraduzTraduz oo pesopeso dada populaçãopopulaçãodesempregadadesempregada sobresobre oo totaltotal dada populaçãopopulação activaactiva;; taxataxa dedeabstençãoabstenção foifoi dede 2121,,33 %%..
TaxaTaxa dede variaçãovariaçãoComparaCompara doisdois valoresvalores dada mesmamesma variávelvariável.. TraduzTraduz oo acréscimoacréscimoouou oo decréscimodecréscimo verificadoverificado relativamenterelativamente aa umauma variávelvariável..
Ex:Ex:A Taxa de variação mensal compara o nível de variação da variável A Taxa de variação mensal compara o nível de variação da variável entre dois meses consecutivos.entre dois meses consecutivos.
www.joaoleal.net Professor: João José Leal 20
EmEm resultadoresultado dada observaçãoobservação (em(em sentidosentido amplo,amplo,
sejaseja porpor visualização,visualização, medição,medição, inquirição,inquirição, etcetc..)) dasdas
unidadesunidades estatísticasestatísticas queque constituemconstituem osos conjuntosconjuntos alvosalvos
dada nossanossa atenção/interesse,atenção/interesse, osos correspondentescorrespondentes dadosdados
queque sese obtêmobtêm vêmvêm ““a granel””:: rolrol dede dadosdados..
www.joaoleal.net Professor: João José Leal 21
Exemplo 1: Relativamente a 50 motoristas que trabalham numaempresa de transportes, observou-se a quantidade de acidentessofridos em serviço, donde se obtiveram os seguintes dados:
Estes dados apenas foram inscritos e listados pela ordem em
que foram sendo recolhidos, não tendo havido ainda qualquer
preocupação de representação, visando a facilitação da apreensão
das características do conjunto a que os dados se referem.
www.joaoleal.net Professor: João José Leal 22
Todavia, se tomarmos os dados anteriores e os tratarmos, poderemosapresentá-los de uma forma muito mais “apelativa” e susceptível de permitira quem os aprecie uma percepção mais fácil das características do conjuntoa que respeitam
Atributo alvo da observação realizada sobre o conjunto dos
motoristas
Modalidades numéricas (valores) assumidas pelo
atributoVariável DISCRETA
Qtd. de repetições Qtd. de repetições de cada de cada
modalidade do modalidade do atributo: atributo:
frequências frequências absolutas simplesabsolutas simples
Proporção de Proporção de repetições de cada repetições de cada
modalidade do modalidade do atributoatributo: : frequências frequências
relativas simplesrelativas simples
Frequências Absolutas
Acumuladas
Frequências Frequências Relativas Relativas
AcumuladasAcumuladas
www.joaoleal.net Professor: João José Leal 23
AA umum conjuntoconjunto dede elementoselementos comocomo osos queque sese identificaramidentificaram nono quadroquadro
anterior,anterior, chamachama--sese DistribuiçãoDistribuição dede FrequênciasFrequências..
Ou seja, uma Distribuição de Frequências é uma associação de 1
atributo (ou mais), e o respectivo campo de variação, com as suas
frequências e os respectivos campos de frequências.
Se estamos a trabalhar apenas com 1 atributo, a distribuição diz-se
unidimensional. Se forem 2 atributos, será bidimensional; se forem
N, será N-dimensional.
www.joaoleal.net Professor: João José Leal 24
Distribuição de Frequências de acidentes sofridos por 50 motoristas
Neste caso estamos a trabalhar apenas com 1 atributo, a
distribuição diz-se unidimensional.
www.joaoleal.net Professor: João José Leal 25
O quadro estatístico é uma forma possível de representação
da distribuição de frequências, mas não é a única!
0 1 2 3
44
2020
1111
1515
Quant. Acid. Sofridos
Freq. Absoluta
Temos assim os gráficos de frequências absolutas simples e
absolutas acumuladas.
0 1 2 3
2020
5050
3535
4646
Quant. Acid. Sofridos
Freq. Absoluta
www.joaoleal.net Professor: João José Leal 26
As frequências relativas são representadas com os
mesmos tipos de gráficos mas utilizando uma escala de
valores relativos no eixo das ordenadas
Na representação de dados que acabámos de
apreciar, o quadro e os gráficos estatísticos são típicos do
tratamento de uma variável discreta.
www.joaoleal.net Professor: João José Leal 27
Exemplo 2: Uma fábrica de parafusos pretende analisar a qualidade
da produção de uma determinada máquina e seleccionou uma
amostra de 100 parafusos produzidos por essa máquina, tendo
procedido à medição dos respectivos comprimentos, em milímetros,
donde obteve o seguinte rol de dados:
www.joaoleal.net Professor: João José Leal 28
Atributo Analisado:
Tipo de Variável:
Comprimento (em mm)
Variável Contínua
Modo de Representação:
Em Classes de Valores
www.joaoleal.net Professor: João José Leal 29
Distribuição de Frequências dos comprimentos (em mm)de 100 parafusos produzidos por uma determinada máquina
Frequências Relativas Acumuladas
0,00
0,20
0,40
0,60
0,80
1,00
1,20
-1,00 0,
009,
009,
209,
409,
609,
8010
,0010
,2010
,4010
,6010
,8011
,0011
,2011
,40
Comprimentos (em mm)
Fre
qu
ênci
as
09,0
0
09,2
0
09,4
0
09,6
0
09,8
0
10,0
0
10,2
0
10,4
0
10,6
0
10,8
0
11,0
0
Comprimentos(em mm)
50
100
120
Freq
. / A
mpl
.Cla
sse
0488 7 9 9 19 23 9 4
Frequências Absolutas Simples
www.joaoleal.net Professor: João José Leal 30
As medidas de estatística descritiva permitem:
representar um conjunto de dados de forma
resumida (Redução de Dados);
a comparação de diferentes distribuições.
As medidas descritivas designam-se por:
parâmetros (população)
estatísticas (amostra)
www.joaoleal.net Professor: João José Leal 31
As medidas descritivas dividem-se em:
Medidas de localização
Medidas de dispersão
Medidas de assimetria
Medidas de achatamento
Medidas de concentração
www.joaoleal.net Professor: João José Leal 32
Medidas de tendência centralMédias:aritmética
geométricaharmónica
MedianaModa
Medidas de tendência não centralQuantis:Quartis
Quintis…Decis…Centis…Milis
www.joaoleal.net Professor: João José Leal 33
Fórmulas de cálculo:
xk : Dados observados (k = 1, 2, 3, …, N)N : Quantidade de observaçõesm : Quantidade de diferentes valores observadosni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
A média aritmética ( ) é a soma de todos os valores observados, dividida
pela quantidade de observações.
x
Dados Não Classificados :
Dados Classificados :
Sendo,
N
x
N
x...xxx
N
1kk
N21
==+++
=
N
ni xi
N
n1 x1 + n2 x2 + … + nm xmx
m
1i
=== =
fi xi
m
1i
=
=
www.joaoleal.net Professor: João José Leal 34
Exemplo 3: Relativamente a 50 motoristas que trabalham numa empresa de
transportes, observou-se a quantidade de acidentes sofridos em serviço…
www.joaoleal.net Professor: João José Leal 35
O valor da média aritmética não tem,
necessariamente, que ser algum dos valores
observados, mas tem de estar compreendido no
intervalo dos valores observados!
A média aritmética, corresponde ao valor que,
para o mesmo total do valor de todas as observações,
cada uma teria, se todas tivessem igual valor.
www.joaoleal.net Professor: João José Leal 36
Exemplo 4: Uma fábrica de parafusos seleccionou uma amostra de 100 parafusos
produzidos por uma máquina, tendo procedido à medição dos respectivos
comprimentos, em milímetros …
www.joaoleal.net Professor: João José Leal 37
Se já não tivermos acesso ao rol de dados, e estes estiverem
agrupados em classes, não podemos saber com rigor quais os
valores observados em cada classe. Nestas circunstâncias, a média
aritmética calcula-se por aproximação, estabelecendo a hipótese de
o valor de cada observação dentro da mesma classe ter valor igual
ao ponto central dessa classe (hipótese de tabulagem). À diferença
entre o verdadeiro valor da média aritmética (apurado a partir dos
dados das observações) e o valor da média aritmética que é apurado
desta forma, chama-se erro de tabulagem.
www.joaoleal.net Professor: João José Leal 38
A média geométrica (Mg) de N números positivos é a raiz de índice N do
produto desses números.
xk : Dados observados (k = 1, 2, 3, …, N)N : Quantidade de observaçõesm : Quantidade de diferentes valores observadosni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
Sendo,
Fórmulas de cálculo
Dados Não Classificados :
Dados Classificados :
NN xkMg =
==N
k 1
x1 . x2 … xN
NN xkMg =
==m
k 1
x1 . x2 … xmn1 n2 nm
nk
www.joaoleal.net Professor: João José Leal 39
Exemplo 5: Num determinado momento um indivíduo investiu
10.000 € numa aplicação financeira e manteve esse investimento
durante 3 anos, ao longo dos quais obteve diferentes taxas de
rentabilidade anuais, conforme exposto no quadro seguinte:
www.joaoleal.net Professor: João José Leal 40
Pretende calcular-se qual foi a taxa média anual de rentabilidade
que o indivíduo obteve, durante os 3 anos, com este investimento.
www.joaoleal.net Professor: João José Leal 41
A média harmónica ( Mh ) é o inverso da média aritmética dosinversos dos valores observados.
xk : Dados observados (k = 1, 2, 3, …, N)N : Quantidade de observaçõesm : Quantidade de diferentes valores observadosni : Frequência absoluta de cada valor observado xi
fi : Frequência relativa de cada valor observado xi
Sendo,
Fórmulas de cálculo
Dados Não Classificados :
Dados Classificados :
=
= N
1kxkN
11
Mh
. 1
==
== m
1i
m
1i
fi
1
N
1
1Mh
. xi
ni
xi
www.joaoleal.net Professor: João José Leal 42
Exemplo 6: Em cada um de 3 anos, um indivíduo gastou 1000 € na
compra de um certo produto, nas condições descritas no quadro
seguinte:
Pretende calcular-se as médias por ano de cada uma das grandezas
envolvidas nesta questão: Gasto, Quantidade comprada e Preço.
www.joaoleal.net Professor: João José Leal 43
www.joaoleal.net Professor: João José Leal 44
A mediana (Me) é o valor da variável que ocupa a posição central
na sucessão de observações ou na distribuição de frequências
depois de se colocar os dados por ordem.
Para observações de variável discreta, temos de verificar
previamente se a quantidade de observações é par ou ímpar:
* Se N for ímpar, então: Me será o elemento central de ordem [(N+1) / 2]
* Se N for par, então: Me será a média aritmética entre os elementos
centrais (de ordem N/2 e de [(N+2)/2] )
www.joaoleal.net Professor: João José Leal 45
Porém, dado que já aprendemos a representar distribuições
de frequências de variável discreta, também podemos apurar o valor
da mediana com recurso às respectivas funções cumulativas de
frequências acumuladas.
No caso de variável discreta, o valor da mediana será o valor
da variável que satisfaça simultaneamente as seguintes
desigualdades:F(Me – ε ) ≤ 0,5 F(Me) ≥ 0,5
www.joaoleal.net Professor: João José Leal 46
Exemplo 7: Cálculo da Mediana Cálculo da Mediana (variável discreta)(variável discreta)
Distribuição de Frequências de acidentessofridos por 50 motoristas
0 1 2 3
0,400,40
11
0,700,70
0,920,92
Quant. Acid. Sofridos
Freq. Relativa Acum.
Temos uma quantidade par de observações: 50
Ordenando as 50 observações, verifica-seque a 25ª. e a 26ª. observações têm ovalor 1, pelo que Me = 1
Para x = 1, vem:
F(1 – ε ) = 0,4 e F(1) = 0,7
Pelo que Me = 1
www.joaoleal.net Professor: João José Leal 47
Para valores de variável contínua, agrupados em classes, o
cálculo da mediana faz-se do seguinte modo:
1.º - Calcula-se a ordem N/2.
2.º- Pelas frequências acumuladas identifica-se a classe que
contém a mediana e que será a classe mediana.
3.º - Calcula-se o valor exacto através de uma das seguintes
fórmulas:
www.joaoleal.net Professor: João José Leal 48
Frequências absolutas
Frequências relativas
Com
www.joaoleal.net Professor: João José Leal 49
Porém, dado que já aprendemos a representar distribuições
de frequências de variável contínua, também podemos apurar o
valor da mediana com recurso às respectivas funções cumulativas
de frequências acumuladas.
No caso de variável contínua, o valor da mediana será o valor
da variável que satisfaça a seguinte igualdade da função cumulativa
de frequências relativas:
F(Me) = 0,5
www.joaoleal.net Professor: João José Leal 50
Distribuição de Frequências dos comprimentos (em mm)de 100 parafusos produzidos por uma determinada máquina
Exemplo 8:
Frequências Relativas Acumuladas
0,00
0,20
0,40
0,60
0,80
1,00
1,20
-1,00 0,
009,
009,
209,
409,
609,
8010
,0010
,2010
,4010
,6010
,8011
,0011
,2011
,40
Comprimentos (em mm)
Fre
qu
ênci
as
AB
CDE
www.joaoleal.net Professor: João José Leal 51
Exemplo 9: Cálculo da Mediana Cálculo da Mediana (variável contínua)(variável contínua)
AB
C
DE
0,50
1.º N/2 = 25
2.º A classe mediana é a de [55 – 65[
3.º Fórmula 1:
Fórmula 2:
www.joaoleal.net Professor: João José Leal 52
A moda (Mo) é a modalidade ou o valor do atributo mais frequente
na distribuição, isto é, o que mais observações apresenta.
Para distribuições de frequências de atributo qualitativo, ou
de atributo quantitativo de variável discreta, a moda encontra-se
por observação directa !
Para variáveis contínuas, é necessário identificar a classe
modal e depois aplicar alguma fórmula, como por exemplo, a
fórmula de King:
www.joaoleal.net Professor: João José Leal 53
Frequências absolutas
Frequências relativas
Com
www.joaoleal.net Professor: João José Leal 54
Outra fórmula empírica de localizar a moda (Mo) a partir da
identificação da classe modal, baseia-se na relação de
proporcionalidade de dois triângulos, conforme exemplificado na
imagem seguinte:
A B C
D
E
F
G
MoliMo LiMo
ClasseModal
nMo
nMo-1
nMo+1
AB = Mo - liMo
BC = LiMo - Mo
DE = nMo – nMo-1
FG = nMo – nMo+1
AB
BC
DE
FG
=
com
www.joaoleal.net Professor: João José Leal 55
O apuramento do valor da moda pela fórmula de
King ou pela proporcionalidade dos triângulos
desenhados no interior da classe modal não tem que
dar exactamente o mesmo resultado, mas dá resultados
aproximados!
www.joaoleal.net Professor: João José Leal 56
1.º Classe modal é a de [55 – 65[
2.ºFórmula 1:
Fórmula 2:
Fórmula de King: Proporcionalidade dos triângulos:
0,6
0,4
Mo - 55
65 - Mo=
Mo = 61
Exemplo 10: Classes ni Ni fi Fi
35 - 45 5 5 0,10 0,1045 - 55 10 15 0,20 0,3055 - 65 16 31 0,32 0,6265 - 75 12 43 0,24 0,8675 - 85 4 47 0,08 0,9485 - 95 3 50 0,06 1,00
50 1Cálculo da Moda