Upload
internet
View
112
Download
0
Embed Size (px)
Citation preview
Introdução à Probabilidade e à EstatísticaAula 01
Prof. Christopher Freire SouzaCentro de TecnologiaUniversidade Federal de Alagoaswww.ctec.ufal.br/professor/cfs
1
Introdução à Probabilidade e à Estatística•Termos básicos•Hidrologia estatística•Tipos de dados•Pensamento crítico
2
Termos básicos• Dados
▫Observações coletadas• Evento
▫Qualquer conjunto de resultados ou conseqüências de um experimento/estudo que caracterizem um fenômeno
• Amostra▫Subconjunto de Informações
• População▫Todo o grupo de informações
• Censo▫Conjunto de dados obtidos de todo o grupo
3
Termos básicos• Estatística - origem no latim ‘status’=estado;
▫ medida numérica que descreve alguma característica de um subconjunto de informações (amostra);
▫ conjunto de métodos para o planejamento de estudos e experimentos, obtenção de dados e conseqüente organização, resumo, apresentação, análise, interpretação e elaboração de conclusões básicas dos dados.
• Parâmetro – origem no grego ‘par(a)+metro’=quase-medição▫ Medida numérica que descreve alguma característica de
uma população• Probabilidade
▫ “grau de crença” ou chance de ocorrência de um evento particular
4
Hidrologia Estatística• Conceitos Fundamentais• Variáveis• Séries• Dados
5
Conceitos Fundamentais• Hidrologia - geociência que investiga os fenômenos
que determinam a distribuição espaço-temporal da água.
• Fenômenos – Ocorrências que definem os mecanismos de armazenamento e transporte entre as diversas fases do ciclo da água. Ex.: precipitação
• Processos - funções do tempo, ou do espaço, que descrevem a intensidade de fenômenos hidrológicos. Ex.: hidrograma típico.▫ Existe forte influência da ação do sol nos processos
hidrológicos. Informações com discretização menor que um ano apresentam tendência a uma periodicidade de um ano na ocorrência de eventos hidrológicos.
6
Conceitos Fundamentais• Processos Determinísticos - resultam da
aplicação de leis da física, química e/ou biologia.• Processos Estocásticos - governados por leis de
probabilidade por conterem variáveis aleatórias.• Modelos Mecanísticos – a forma da função é
construída a partir do mecanismo físico básico, que relaciona variáveis.
• Modelos Empíricos - conhece-se as variáveis inter-relacionadas, mas não a forma como estas se relacionam. Observações são agrupadas para sua elaboração.▫ Ex.: Q = f(A)
7
Variáveis Hidrológicas - Conceitos• Variável - símbolo que representa uma característica de
fenômeno, cujo valor pode variar ao longo da análise a depender da dimensão (tempo, espaço) em consideração.
• Variável Hidrológica – símbolo cujo valor descreve a variação temporal ou espacial dos fenômenos hidrológicos.▫ Ex.: P→Precipitação
• Variável Univariada - associa-se a ela apenas um atributo de quantidade ou qualidade de águas.▫ Ex.: vazão em uma seção.
• Variável Multivariada - mais de um atributo está associado a ela.▫ Ex.: índice de risco de inundação
8
Séries Hidrológicas - Conceitos• Séries de dados medidos ou observados, registrados
em intervalos discretos, em função da limitação do processo de monitoramento.
• Séries Completas - contém registros sem falhas.▫ Ex.: séries de dados diários
• Séries Reduzidas - contém apenas alguns valores da série completa.▫ Em função do objetivo do estudo e visando a minimizar
distorções nas estimativas, utiliza-se de intervalos menos discretos, sendo eles uniformes (e.g., séries mensais, anuais, decadais) ou não (séries de durações parciais).
▫ Ex.: séries de mínimas anuais, i.e., séries consistidas dos menores dados diários por ano
9
Séries Hidrológicas - Conceitos• Estacionariedade - estatística não se altera de
forma significativa.• Homogeneidade - padrão de variabilidade é
mantido.• Representatividade - valores da série
representam a variabilidade de valores do fenômeno.
10
Séries Hidrológicas• Para séries anuais, recomenda-se identificar a
janela de doze meses que melhor enquadre os eventos hidrológicos sob análise (também denominada ano hidrológico).
• Esta consideração objetiva diminuir o risco de ter um mesmo evento hidrológico de interesse influenciando duas informações na série de dados, em favor da independência da série de dados.
11
Séries Hidrológicas (Ano hidrológico)
• Estudos em engenharia e ecologia têm interesse em períodos com magnitudes extremas de vazão, para os quais se define:▫ Ano hidrológico de
cheia – Inicia no mês com maior freqüência de ocorrência de vazões mínimas anuais. Ex.: Em Xingó, o ano
hidrológico de cheia vai de setembro a setembro.
O N D J F M A M J J A S O0
0.5
1
1.5
2
2.5
x 104 Hidrogramas do posto 18850000
Q(m
³/s)
88-89
99-0000-01
01-02
Rio Xingú em Altamira, próximo à UHE Belo Monte
12
Séries Hidrológicas (Ano hidrológico)
▫ Ano hidrológico de seca – período de doze meses que compreende a estiagem. Emprega-se (Gordon et al. 2004) seis meses de defasagem em relação ao ano hidrológico de cheia. Ex.: Para Xingó, o ano
hidrológico de seca seria definido de março a março.
M A M J J A S O N D J F F0
500
1000
1500
2000
2500
Hidrogramas do posto B.ESPERANCA
Q(m
³/s)
62-63
71-72
80-81
89-90
98-99
05-06
Rio Jaguaribe na UHE Boa Esperança
13
Séries Hidrológicas (parciais)• Para séries de valores extremos anuais, considera-se um
intervalo regular de um ano entre informações consecutivas. Esta consideração pode acarretar em tendenciosidade no estudo de eventos mais freqüentes que um ano.
• Para minimizar essa tendenciosidade, trabalha-se séries com intervalos menos discretos e não-uniformemente espaçados, ao aliar aos dados de magnitude de eventos de interesse a informação de espaçamento entre dados escolhidos (séries de durações parciais). Para tanto, considera-se todos os eventos que atendem um critério pré-estabelecido.▫ Ex.:Superação de uma magnitude específica quando do estudo
de cheias, onde apenas o dado mais extremo de cada evento de superação do valor pré-definido passa a fazer parte da nova série de dados.
14
Dados Hidrológicos• Tipos: climatológicos, pluviométricos,
fluviométricos, evaporimétricos, sedimentométricos e de indicadores de qualidade de água.
• Validade – Grau com que os dados representam o que foi medido.▫ Ex.: Comparar o resultado de aplicação de
procedimentos diferentes a mesma amostra e obter resultados similares
• Confiabilidade do modelo – Consistência.▫ Ex.: Comparar o valor do teste de QI executado numa
data com outro executado em outra data
• Atualização dos dados – Mudanças nos processos demandam alteração dos dados. Necessidade de revisar parâmetros de modelos.
15
Dados Hidrológicos (erros)• Ausência de dados – Razão aleatória ou
sistemática. Falha sistemática demanda por modificação do sistema de coleta de dados.
• Erros de dados: aleatórios, sistemáticos e grosseiros▫ Aleatórios - inerentes à medição/observação.▫ Sistemáticos - Exigem mudança de técnica de medição,
calibração ou na coleta, transmissão ou processamento▫ Grosseiros - falhas anormais e falta de cuidado na
medição/observação/transcrição
• Erros de Amostragem- diferenças entre estatística e parâmetro
16
Tipos de dados• Quanto à forma:
▫Quantitativos: discretos (número anterior de dias sem chuva) e contínuos (total precipitado num período)
▫Qualitativos (presença de metais pesados)• Quanto à mensuração
▫Nominais (cor da água)▫Ordinais (classificação da qualidade)▫Intervalares (temperatura)▫Razão (vazões)
17
Pensamento Crítico• Mais importante que
▫ saber usar as técnicas de análise estatística
• É▫ saber analisar quando se pode usar a técnica ou mesmo▫ saber analisar a aplicação da técnica
18
Pensamento Crítico• Para isto, sugere-se observar:
▫ A técnica e o tamanho da amostragem Amostras a partir de resposta voluntária, como envio
de questionários pela internet, normalmente apresentam resposta de quem tem opinião mais forte
Não-resposta tem o mesmo aspecto do anterior e deve ser considerada
Pequenas amostras podem não representar a variabilidade do fenômeno em análise
Dados ausentes: Falhas sempre nas cheias por dificuldade de leitura
19
Pensamento Crítico• Sugere-se observar
ainda:▫A representação dos
resultados Gráficos: eixo-y
20
Pensamento Crítico• Sugere-se observar
ainda:▫A representação dos
resultados Gráficos: eixo-y Pictogramas
21
Pensamento Crítico• Sugere-se observar
ainda:▫A representação dos
resultados Gráficos: eixo-y Pictogramas Porcentagens
• 75% = 150000/200000
• 75%=3/4
22
Pensamento Crítico• Sugere-se observar
ainda:▫A representação dos
resultados Gráficos: eixo-y Pictogramas Porcentagens Precisão na
apresentação de números
• Estima-se que há agora 103.215.027 famílias nos Estados Unidos
23
Pensamento Crítico•Sugere-se observar também:
▫A formulação de questões Direcionamento de questões
Ex.: Taxas reais de resposta sim: 97%: O presidente deve ter poder de veto para
eliminar desperdícios? 57%: O presidente deve ter poder de veto, ou não?
Ordem de opções em questões Você diria que o tráfego (45%) contribui mais ou
menos do que a indústria (27%) para a poluição do ar? Você diria que a indústria (24%) contribui mais ou
menos do que o tráfego (57%) para a poluição do ar?
24
Pensamento Crítico▫ Quem está realizando/bancando os estudos
Estudo de interesse próprio Empresa de graxa de sapato, Kiwi Brands, encomenda
pesquisa para saber se sapatos gastos eram a razão mais comum para candidato ao emprego não causar boa impressão
Cenários Parciais “90% de todos os nossos carros vendidos neste país nos
últimos 10 anos ainda estão rodando”. A maioria dos carros foi produzida nos últimos 3 anos.
Distorções deliberadas Revista Corporate Travel publicou resultados mostrando que a
Avis era a vencedora em pesquisa com pessoas que alugavam carros. Hertz pediu informação detalhada. Respostas desapareceram e na justiça revista e Avis (propaganda enganosa) entraram em acordo com a Hertz.
25
Pensamento Crítico▫Correlação e causalidade
Haver correlação não significa que exista uma relação de causa e efeito Ex: Homicidas podem se alimentar sempre de
pão, mas não necessariamente o pão leva alguém a ser homicida (a não ser que o padeiro mereça)
26