Relatório Final da disciplina de
Probabilidades e Estatística
Economia Gestão
Informática e Gestão
Docentes: Paulo Infante (responsável)
Gonçalo Jacinto
Ano Lectivo 2005/2006
Índice • Relatório Crítico de Leccionação • Relatório Crítico de Leccionação em inglês • Programa detalhado e informação da disciplina • Programa detalhado e informação da disciplina em
inglês • Programa da disciplina resumido • Programa da disciplina resumido em inglês • Sumários das aulas teóricas • Sumários das aulas práticas • Material de apoio às aulas teóricas • Material de apoio às aulas práticas • Provas de avaliação • Resultados de avaliação • Inquérito anónimo realizado aos alunos
Probabilidades e Estatística
Economia, Gestão, Informática e Gestão
Ano Lectivo 2005/2006
Relatório Crítico de Leccionação
Este relatório será um relatório crítico sobre o ano lectivo de 2005/2006. Será
também um relatório de evolução da disciplina nos últimos 3 anos lectivos.
A disciplina de Probabilidades e Estatística é ministrada aos Cursos de
Licenciatura em Economia, Gestão (caso em que funciona também para os inscritos em
Estatística I) e Informática e Gestão. Trata-se de uma disciplina semestral, sendo
leccionada no 3º Semestre destes Cursos e que veio substituir as disciplinas semestrais
Estatística I e Estatística II ministradas antes da revisão curricular.
Neste ano lectivo todo o material de apoio foi melhorado. O programa aprovado
pelas Comissões de Curso foi inteiramente cumprido. Podemos concluir que os
objectivos inicialmente propostos foram amplamente atingidos.
Todo o material de apoio foi colocado à disposição dos alunos numa página
própria da disciplina na Internet. Para além de diversas informações também se
disponibilizavam nesta página os sumários das aulas. Além disso, pelo facto das aulas
serem leccionadas no Colégio do Espírito Santo e os gabinetes dos docentes se
localizarem no Colégio Luís António Verney, a existência da página na Internet
permitiu uma melhor acessibilidade por parte dos alunos ao material de apoio. Neste
semestre lectivo esta página teve mais de 17200 visitas, o que demonstra a importância
da informação aí disponibilizada. Recorde-se que no primeiro ano de criação do site se
registaram quase 3000 visitas e que no 2º ano se registaram mais de 5000, pelo que
podemos constatar um crescimento quase exponencial no número de acessos à página.
Esta é a primeira disciplina da área das Probabilidades e Estatística destes cursos e
tem apenas como suporte de base, em termos teóricos e metodológicos, alguns
conceitos de Estatística Descritiva e de Introdução às Probabilidades leccionados no
Ensino Secundário. Em alguns pontos foi possível fazer apenas uma revisão de
conhecimentos, mas noutros a matéria foi dada como se fosse a primeira vez. Tal
permitiu uma consolidação de conhecimentos em pontos que julgamos muito
importantes numa primeira fase da análise de dados.
No que concerne à sua carga horária semanal, esta disciplina tem 3 horas de aulas
teóricas e 3 horas de aulas práticas, correspondendo-lhe 6 ECTS. Como temos referido
em anos anteriores, esta carga horária parece-nos manifestamente insuficiente, tendo em
conta o extenso Programa (muito próximo da junção dos Programas de Estatística I e
Estatística II). Um maior número de horas permitiria também uma melhor exploração
das potencialidades de tratamento estatístico de algum pacote de software. Tal, torna
difícil colocar em prática a perspectiva que defendemos de que o Professor deve ensinar
a pensar e a aprender. Refira-se, com base em alguma experiência que temos do ensino
deste tipo de matérias, que esta é uma disciplina difícil para os alunos, os quais revelam
grandes dificuldades na compreensão de alguns conceitos. Tal é também explicado pela
sua fraca formação de base e falta de sentido de sentido crítico. Numa disciplina deste
tipo fica clara, e cada vez mais acentuada nos últimos anos, a deficiência de muitos
alunos em saber pensar.
Como referimos, o programa desta disciplina inclui também a utilização efectiva
de software estatístico optando-se pelo pacote SPSS, pois trata-se do único pacote
estatístico para o qual a Universidade de Évora dispõe de um número considerável de
licenças. A propósito, gostaríamos de salientar a necessidade de melhoramento das
condições físicas, quer ao nível do número de computadores quer ao nível das infra-
estruturas. Apesar de ter sido atribuída ao Departamento de Matemática uma sala
laboratorial, a mesma funciona em tempo parcial o que é manifestamente insuficiente
para compatibilizar os diversos horários das várias turmas. Torna-se, portanto, premente
criar as condições necessárias para se poder incluir a utilização efectiva de software
estatístico nestas aulas.
Nos dois anos lectivos anteriores (2003/04 e 2004/05) em que leccionámos a
disciplina de Probabilidades e Estatística, e que simultaneamente são os dois anos da
existência da mesma, sempre trabalhámos procurando atingir os objectivos da própria
disciplina e satisfazer os interesses das Comissões de Curso aos quais é leccionada. A
nossa experiência nesses dois anos permitiu concluir que a presença nas aulas é
fundamental para a boa compreensão das matérias e que o estudo contínuo é, nesta
disciplina, indispensável para a aprovação. Conforme relatado nos anteriores relatórios
críticos podemos verificar que no ano lectivo de 2003/04 nenhum aluno obteve
aprovação no regime de avaliação por exame final (isto para 60,3% de aprovações
relativas aos alunos avaliáveis), enquanto no ano lectivo de 2004/05 apenas 8 obtiveram
aprovação na avaliação por exame (isto para 48,6% de aprovações relativas aos alunos
avaliáveis). Em quaisquer destes dois anos praticamente todos os alunos que se
submeteram a todos os testes de avaliação contínua e que obtiveram aprovação à
disciplina estiveram presentes na esmagadora maioria das aulas. Consequentemente,
resolvemos implementar algumas medidas que impusessem uma autodisciplina aos
alunos e obrigasse, a quem optasse por entrar no regime de avaliação contínua, a
trabalhar diariamente e a comparecer na grande maioria das aulas. Do nosso ponto de
vista, avaliação contínua não significa apenas comparecer às frequências. Para se estar
em avaliação contínua e obter sucesso é necessário trabalhar diariamente e a presença
nas aulas (que não apenas física) é fundamental.
Assim, com base nos resultados e na experiência lectiva dos dois últimos anos e
com vista a atingir uma maior taxa de sucesso, identificaram-se as principais razões para
o insucesso escolar e introduziu-se um novo esquema de avaliação com vista a melhorar
o sucesso escolar. Esta iniciativa também surgiu numa tentativa de aproximar a
disciplina às ideias subjacentes no Processo de Bolonha, nomeadamente, num maior
trabalho realizado pelo aluno e dum maior acompanhamento da matéria leccionada, bem
como numa maior taxa de assistência às aulas.
Os alunos podiam optar por Avaliação Contínua ou por Avaliação por Exame
Final. No sistema de Avaliação Contínua foram realizadas três provas de avaliação,
sendo que a data da segunda prova de avaliação foi anunciada apenas uma semana antes
da sua realização. Apenas se impôs nota mínima na primeira frequência e na terceira
frequência, permitindo a recuperação de alunos que não estejam tão seguros na segunda
frequência pelo facto de ter matérias com um maior grau de dificuldade. Por outro lado,
exigiu-se a presença em 2/3 das aulas aos alunos neste regime (refira-se que nenhum
aluno reprovou à disciplina por não verificar este requisito e nem era essa a nossa
intenção). Tais medidas foram polémicas, mas mereceram a concordância quase
unânime dos alunos. Muitos alunos reconheceram (pessoalmente, por e-mail e em
observações registadas num inquérito de avaliação ao docente e à disciplina) que tais
medidas foram muito importantes para o seu sucesso. O Professor tem de motivar o
aluno, fazê-lo acreditar de que é capaz mesmo em condições muito adversas. Não deve
permitir que o aluno se sinta só. Tal foi fundamental para obter os bons resultados deste
ano lectivo.
Relativamente ao regime de Avaliação por Exame Final, este consistiu na
realização de um exame na época normal e dum exame em época de recurso.
Apesar de termos disponibilizado um horário para, de uma forma complementar e
menos formal, esclarecer dúvidas e aprofundar matérias, a verdade é que a grande
maioria dos alunos apareceram apenas nos 2 ou 3 dias que antecederam cada prova de
avaliação. Contudo, registámos um grande aumento do recurso ao e-mail para
esclarecimento de dúvidas o que facilitou o nosso contacto com os alunos mesmo fora
da data de realização das frequências e exames.
Geralmente, em cada semana foi leccionado um novo tópico, o que originou uma
elevada carga de trabalho exigida semanalmente aos alunos. Esse trabalho desenvolvido
pelos alunos fora das aulas revelou-se um aspecto muito importante e pensamos ter sido
uma das razões principais pela discrepância entre a taxa de aprovações verificada nos
dois sistemas de Avaliação à semelhança do que tinha acontecido nos dois anos
anteriores.
Devido a este novo sistema de avaliação, o número de alunos que assistiram às aulas
(teóricas e práticas) apenas registou uma quebra após a realização da primeira
frequência, sendo aproximadamente igual ao número de alunos que consideramos
avaliáveis. De notar que neste ano lectivo registámos uma assistência às aulas
substancialmente superior à dos anos anteriores. Conseguimos evitar algumas quebras
sazonais de assistência, que aconteciam em períodos de maior número de provas de
avaliação, e, em particular, uma quebra que acontecia imediatamente a seguir à segunda
frequência a qual foi muito prejudicial para vários alunos o ano passado. Pensamos que
tal é revelador de termos conseguido motivar os alunos para a necessidade de
assistência às aulas e termos incutido o interesse pela disciplina. Tal revela também a
empatia entre alunos e docentes. Num inquérito anónimo realizado aos alunos, mais de
90% dos alunos que responderam ao inquérito (n=100) avaliaram globalmente os
docentes com notas de Bom ou Muito Bom. Saliente-se que estes resultados foram
análogos aos obtidos nos dois anos anteriores, o que mostra que a opinião dos alunos
acerca da equipa docente não se alterou ao longo destes 3 anos.
Por outro lado, refira-se que o número médio de alunos nas aulas reforçou a
insuficiência das condições físicas para a sua realização (pelo menos das mais
concorridas), nomeadamente nalgumas salas de aula no Colégio Espírito Santo com
piores condições para actividades lectivas.
Relativamente às aulas práticas, as folhas de exercícios e as respectivas soluções
foram melhoradas através da introdução de novos exercícios, da correcção de pequenas
gralhas e da reordenação da listagem de exercícios. Procurou-se, a todo o instante,
incentivar o trabalho do aluno em casa. Houve a preocupação de adoptar exercícios
tendo em conta os contextos de actuação dos futuros licenciados e na tentativa de criar
nos alunos o incentivo e o gosto pela disciplina.
No desenrolar das aulas práticas procurou-se também corresponder às expectativas
do Processo de Bolonha. Procurámos, sempre que possível, quer com trabalhos
realizados em casa, quer com exercícios sugeridos na sala de aula, que fossem os alunos
a dinamizar as aulas práticas, apesar de alguma resistência inicial. Fomentou-se as
dúvidas carteira a carteira e a resolução do exercício individualmente pelo aluno.
Durante todo o semestre houve a preocupação de manter as turmas ao mesmo nível,
resolvendo-se os mesmos exercícios em cada aula, de forma a ter turmas homogéneas e
a que alguns alunos pudessem circular entre turmas diferentes por dificuldades de
horário.
Ainda em relação às aulas práticas, refira-se que os tópicos eram abordados muito
pouco tempo após a sua introdução nas aulas teóricas, permitindo não haver
praticamente desfasamento entre a parte teórica e a sua aplicação prática. Pensamos que
tal procedimento conduz a uma melhor compreensão das matérias. Esta é uma disciplina
em que faria sentido ter aulas teórico-práticas.
Antes de apresentarmos os resultados finais gostaríamos de salientar que mais de
75% dos alunos pontuaram com notas de Bom ou Muito Bom a correspondência entre
conhecimentos avaliados e matéria leccionada. Esta proporção manteve-se idêntica nos
3 anos lectivos, o que permite mostrar que para os alunos o grau de exigência se
manteve.
Relativamente aos resultados finais, se tivermos como referência o número de
inscritos na disciplina (n=247), a percentagem de aprovações foi igual a 31,4%. Caso
tenhamos como referência o número de alunos que compareceram à primeira frequência
(n=179), a percentagem de aprovações foi igual a 41,9%. Finalmente, tomando como
referência o número de alunos que compareceram a toda a avaliação contínua e/ou a
algum dos exames, o que nós designamos por alunos avaliáveis (n=99), a
percentagem de aprovações foi igual a 75,8%.
Em relação à percentagem de aprovações por curso, verificou-se 85,1% de
aprovações em Economia, 72,8% de aprovações em Gestão e 44,4% em Informática
de Gestão.
Como se pode facilmente concluir por observação dos quadros 1 e 2, a taxa de
aprovações foi muito superior neste ano lectivo. O sucesso assentou na metodologia de
ensino e no método de avaliação. No primeiro ano de leccionação desta disciplina
obtivemos 95% de aprovações em avaliação contínua (regime de 4 frequências), mas
nenhuma aprovação em exame. Neste ano lectivo obtivemos uma percentagem de
aprovações análoga em avaliação contínua (92%) e 27% de aprovações em exame.
Repare-se que neste ano lectivo se submeteram a avaliação contínua 72 alunos, mais 28
alunos que no ano lectivo 2003/04.
2003/04 2004/05 2005/06
% Aprovados/Inscritos 26,7 16,4 31,4
% Aprovados/1ª Freq. 31,0 21,6 41,9
% Aprovados/Avaliáveis 60,3 48,6 75,9
Quadro 1
% Aprovados/Avaliáveis
2003/04 2004/05 2005/06
Economia 58,5 48,3 85,1
Gestão 62,5 50,0 72,1
Inf Gestão - 40,0 44,4
Quadro 2
Cerca de metade dos alunos inscritos não frequentaram qualquer aula e há muitos
cerca de ¼ dos inscritos que nós classificamos de alunos “fantasma”, pois nunca
apareceram a qualquer aula nem a qualquer prova de avaliação. Pensamos que medidas
que visem terminar com esta situação, que é comum em muitas outras disciplinas, são
desejáveis e urgentes. Pensamos que ajudaria muito a resolver esta situação se os alunos
apenas se pudessem inscrever a um número limitado de disciplinas. Muitos alunos
inscritos em Probabilidades e Estatística têm disciplinas em atraso, estando
simultaneamente inscritos a 7 ou 8 disciplinas. Em alturas de sobrecarga de trabalho
verifica-se uma diminuição significativa da assiduidade às aulas e muitas vezes a não
comparência nas provas de avaliação. Ao considerarmos a presença nas aulas como um
critério de avaliação contínua conseguimos que os alunos verdadeiramente interessados
em obter aprovação à disciplina neste regime de avaliação não só se mantivessem
assiduamente nas aulas como também administrassem de uma outra forma os seus
esforços em outras disciplinas. Gostaríamos de salientar o aumento do número de
alunos avaliáveis em regime de avaliação contínua relativamente aos dois anos
anteriores (quadro 3).
2003/04 2004/05 2005/06
Inscritos 165 207 247
% Avaliáveis em Aval. Cont. 26,7 21,7 29,1
% Avaliáveis (Total) 44,2 34,8 40,1
Quadro 3
O método de avaliação e a metodologia de ensino implementados nesta disciplina
foram muito bem recebidos pelos alunos quer pela atitude demonstrada por estes, quer
pelas opiniões apresentadas nos inquéritos anónimos realizados. Os resultados obtidos
pelos alunos no regime de avaliação contínua permitem corroborar este ponto de vista
ao longo dos 3 anos.
No gráfico abaixo podemos observar as caixas de bigodes que permitem comparar
as notas obtidas em exame pelos alunos provenientes da avaliação contínua e pelos
restantes alunos. No quadro 4 apresentamos também os valores de algumas grandezas
estatísticas. Como se pode verificar a nota média é significativamente superior quando o
aluno se submete a exame tendo passado previamente por avaliação contínua. Numa
disciplina com a exigência desta é fundamental um estudo contínuo. Doutro modo
torna-se muito difícil estudar tudo em apenas alguns dias. Se considerarmos os alunos
de ambos os grupos como amostras representativas das respectivas populações de
alunos, então com uma confiança de 95%, podemos afirmar que a nota esperada de um
aluno que se submeta a exame tendo passado por todas as provas de avaliação contínua
é entre 2 a 7 valores superior à de um aluno que não tenha completado a avaliação
contínua (alunos que muitas vezes apenas fazem a primeira frequência ou transitam
directamente para exame).
Alunos que fizeram só Exame
Alunos que vieram daAvaliação Contínua
14121086420
Descriptive Statistics
6 10,0000 1,78885 8,00 12,00 8,0000 10,0000 12,0000
18 5,3333 4,00000 ,00 13,00 2,0000 4,5000 10,0000
Alunos que vieram daAvaliação ContínuaAlunos que fizeram sóExame
N MeanStd.
Deviation Minimum Maximum 25th 50th (Median) 75thPercentiles
Quadro 4
Pensamos que uma excelente coordenação entre os dois docentes é essencial para
uma troca sistemática de informações acerca das aulas, para a rápida resolução de
algumas questões que surjam durante o semestre e para o bom acompanhamento dos
alunos. No inquérito de avaliação do docente e disciplina mais de 80% dos alunos
pontua com notas de Bom e Muito Bom a coordenação entre os docentes e essa
percentagem manteve-se ao longo destes 3 anos. Este Relatório é também o reflexo
dessa excelente coordenação.
Probability and Statistics Course
Economics, Management, Computer Science and Management
Academic Year 2005/2006
Critical Report
This is a critical report for the academic year 2005/2006. We also report on the
evolution of this discipline during the last three years.
Probability and Statistics is lectured to students from Economics, Management
and Computer Science and Management. This is a one-semester course lectured during
the 3rd semester of the undergraduate programs. It replaced the courses named Statistics
I and Statistics II which were lectured in previous years.
This academic year the complementary teaching material was improved and the
objectives were fulfilled as approved by the Program Boards.
Complementary teaching material was available to students in an internet site. The
site provided information related to the course, including lessons’ summaries. It also
facilitated coursework material and eased accessibility to readily available information
displayed at the professors office, located at the Verney College.
The site had more than 17200 visits this semester, which demonstrates its utility to
disseminate the information following almost an exponential growth since last year we
had 5000 visits, and the previous one (first year of existence of this internet page), we
had almost 3000 visits.
This is the first course of Probability and Statistics in these academic courses. The
students have only some concepts of Descriptive Statistics and Introduction to
Probability, lectured in Secondary School. A revision was possible in some topics but
the majority was lectured for them for the first time. This permits a consolidation of the
knowledge of some concepts which we think are very important at an initial stage of
data analysis.
Related to weekly workload, this course has 3 hours of theoretical lessons and 3
hours of practical lessons, corresponding to 6 ECTS. As we have being referring in the
last three years, this workload seems clearly insufficient if we take into account the
extensive Program (approximately the same of the two joint Programs of Statistics I and
Statistics II). More teaching load would allow to better explore the potentialities of
statistical treatment of some software package. With such as limited teaching load it is
difficult to put in practice our philosophy of teaching to think and to learn. According
to our experience teaching this course, students usually show a great difficulty in
understanding some concepts. This is partly due to theirs weak basic formation and the
lack of critical sense. There is a deficiency of many students in knowing how to think.
The program of this course includes the effective use of statistical software. We
opted to use SPSS because it is the only statistical package for which the University of
Évora had a large number of licences. We stress the need for improvement of physical
facilities, number of computers and the quality of the infrastructures. There is only a
part time computer lab attributed to Department of Mathematics to teach several classes.
It’s necessary to create conditions for the effective use of statistical software.
Since the academic year 2003/2004 (first year in which we lectured this course),
we aimed to achieve the objectives of the discipline and to satisfy the Program Boards’
suggestions. Based on our experience we found that attendance to the classes is
fundamental for a good comprehension of the several topics and that the continuous
study is essential for the student’s success in this discipline. As reported in previous
critical reports, in 2003/2004 no students approved the Final Exam (compared to 60,3%
success of students evaluated), and in 2004/2005 only 8 students passed the Final Exam
(compared to 48,6% success of students evaluated). In any of these two years,
practically all the students, who approved in continuous evaluation, attended almost all
the lessons. Therefore, this year we have implemented some measures to impose auto-
discipline for students who have chosen continuous evaluation, to work on a daily basis
and to attend to the majority of the lessons. From our perspective, continuous evaluation
doesn’t mean only to appear at the partial tests and to assist a few lessons. To succeed
it’s necessary to work hard every day and class participation is also fundamental.
Therefore, based on our last two year’s experience and with the objective of
success rate improvement, we identify the main reasons for the high failure rate and
introduced a new assessment method. This initiative is aimed to approach the
underlying ideas introduced by the Bologna Process, namely, a greater work carried out
by the student and more attendance to classes.
Students could choose between Continuous Evaluation and Final Exam
Evaluation. The regime of Continuous Evaluation consisted in 3 midterms, but for the
second one, they only know the date of its realization one week before. Besides that,
only for the first and third midterms there is a minimal grade for approval, which
permits the recuperation of some students that were not so secure in the second midterm
due to the fact that those topics were a little more difficult. We established a minimum
of attendance to 2/3 of the classes (note that none students failed on basis of this
requirement, since this was our intention). Those measures were a little polemic, but
almost all students accepted them. Several students recognized (in person, by e-mail and
in observations on the inquiry to the lecturers and to the discipline) that those measures
were very important for their success. The professor should motivate students, making
them believe in their capabilities to succeed even in very adverse conditions and
students shouldn’t feel alone. This was fundamental for the success this year.
Relatively to the Final Exam evaluation regime, there are two examinations, one
during the normal period and another one during the appeal period.
Despite the regular schedule for office hours to clarify subject matters, most
students only take advantage of this time only 2 or 3 days before the test. However, the
increasing use of email, in order to clarify some questions, facilitates our contact with
students not only right before evaluation dates.
Generally, each week a new topic was introduced and that originated a high
weekly workload demanded to the students. The work developed by the students
became a very important aspect and we think that it was one of the main reasons for the
discrepancy between the success rates verified in the two evaluation systems. The same
trend was verified in the last two years.
Based on this new evaluation system, there was a decrease in the number of
students attending classes only after the first midterm. The average assistance was
approximately equal to the number of students that were evaluated. Note that this
number was superior to the registered in the last two years. We also avoided some lack
of attendance during periods of more evaluations and in particular right after the second
midterm, which was very prejudicial for many students in last year.
We think that the interest for the course, the motivation for class attendance, and the
ease of communication (empathy) between students and teachers improved the success
rate. This can be verified through the results of an anonymous inquiry that we carried
out. The results of this inquiry show that more than 90% of the students, (n=100),
provided a global evaluation of Good or Very Good for the Professors. These results
were analogous to those obtained in the last two years, which reflects that the students’
opinion about the teachers didn’t change in these three years.
On the other hand, the mean number of students attending the lessons reinforced
the insufficient physical conditions of the classrooms, namely some rooms in Espírito
Santo College with bad conditions for teaching activities.
Relatively to the practical lessons, exercises and solutions from the previous year
were improved after correction of some minor mistakes and reorganization of the
exercises. We were looking to stimulate the student’s homework. In choosing the
exercises, we took into account the expectations of future graduated students and
examples to motivate students for the class.
During the practical lessons, we also tried to correspond to the expectations of the
Bologna Process. When ever possible, we use homework and classroom exercises to
motivate students’ participation in the classroom, but there was some initial resistance.
We also fomented individual work by the students. We tried to maintain the lessons for
the different group’s schedules at the same level, discussing the same exercises and
keeping some homogeneity.
Theoretical and practical lessons were lectured within a short span period so that
we have a closed coordination between the subject matters. We think that this procedure
leads to a better understanding of the topics. This is a discipline that theoretical -
practical lessons makes more sense.
Before presenting the final results, we would like to emphasize that more than
75% of the students have classified with Good or Very Good the relation between the
topics that were lectured and later evaluated. This proportion was the same in the last 3
years, which shows that the exigency was the same.
Relatively to final results, if we have the number of registered students (n=247) as
reference, the success rate was equal to 31,4%. If we use as a base the number of
students who had attended to the first midterm (n=179), the success rate was equal
41,9%. Finally, using the number of students that took all midterms or the final exam,
i.e. evaluated students (n=99), the success rate was equal 75,8%.
The success rate of evaluated students by course are; 85,1% for Economics,
72,8% for Management and 44,4% for Computer Science and Management.
The success rate during this academic year was much higher than in previews
years (Table 1 and 2). We attribute this increase to the new teaching methodology and
evaluation method adopted. During the first year we achieved a success rate of 95% for
continuous evaluation (with four midterms), but no student approved the Final Exam.
This year, the success rate for continuous evaluation was 92% and 27% for Final Exam.
Note that this year 72 students took continuous evaluation; this means 28 more students
than in 2003/2004.
2003/04 2004/05 2005/06
% Approved/Registered 26,7 16,4 31,4
% Approved/1st midterm 31,0 21,6 41,9
% Approved/Evaluated 60,3 48,6 75,9
Table 1
% Approved / Evaluated
2003-2004 2004-2005 2005-2006
Economics 58,5 48,3 85,1
Management 62,5 50,0 72,1
Computer Science and Management - 40,0 44,4
Table 2
Almost half of the registered students didn’t attend to any classes, and there were
about ¼ that we classified as “ghost” students, because they never showed up to any
evaluation, or to any lesson. We think there is an urgent need put an end to this
situation, which is common to other courses. We believe that it would help to resolve
this issue if there is a limit to the number of courses students could register. Several
students in Probability and Statistics have postponed other courses, and were
simultaneously registered in 7 or 8 courses. In periods of highest workload there is a
clear trend to miss classes and many times miss to examinations too. Considering the
attendance a criterion of the continuous evaluation, students are really interested in
attending classes and make better use of their efforts to get success in other courses. We
would like the point out the increase in the number of students in continuous evaluation
relatively to the last two years (table 3).
2003/04 2004/05 2005/06
Number of Registered Students 165 207 247
% Evaluated (Continuous Evaluation 26,7 21,7 29,1
% Evaluated (total) 44,2 34,8 40,1
Table 3
The method of evaluation and the teaching methodology implemented in this
course was well received by the students as can be shown by their attitude and opinions
the presented in the anonymous inquiries. Their performance in Continuous evaluation
represents evidence during the last three years
The box-plot below shows a comparison of the distribution of the notes obtained
by students who took the Final Exam after failure of continuous evaluation and other
students who took only the Final Examination. A summary statistics is presented in
table 4. We can see that the average note is superior for students in the first group. In a
course with this difficulty is fundamental continuous study.
If we consider both groups of students as representative sample from their
respective populations, then with a confidence interval of 95%, there is a difference of
about 2 to 7 points between the groups.
other students
students from the continuousevaluation
14121086420
Descriptive Statistics
6 10,0000 1,78885 8,00 12,00 8,0000 10,0000 12,0000
18 5,3333 4,00000 ,00 13,00 2,0000 4,5000 10,0000
Students fromcontinous evaluationOther students
N MeanStd.
Deviation Minimum Maximum 25th 50th (Median) 75thPercentiles
Table 4
We believe that an excellent coordination between the two professors is essential
to exchange information about the lessons and to resolve some of the problems that
appeared at student’s attendance among others. In the inquiry, more than 80% of the
students classified the coordination between the professors with Good and Very Good,
and this percentage was maintained throughout the years. This report is also result of
this excellent coordination.
• ECONOMIA (3º semestre), GESTÃO (3º semestre; funciona também para os
inscritos em Estatística I), INFORMÁTICA E GESTÃO (3º semestre).
• Carga horária: 3 T + 3 P
• 6 ECTS
• Docentes: Paulo Infante (Responsável) – [email protected]
Gonçalo Jacinto – [email protected]
• Todas as informações relativas à disciplina podem ser consultadas através do
link:
http://www.ensino.uevora.pt/pe_eg
OBJECTIVOS
Esta disciplina fornece um conjunto de conceitos e métodos que visam, por um lado,
permitir que os alunos sejam capazes, através da sua correcta aplicação, de interpretar e
analisar dados amostrais e, por outro lado, inferir conclusões tendo presente o carácter
probabilístico que lhes está associado.
Para além do domínio de noções fundamentais da teoria das Probabilidades,
incluindo as distribuições de probabilidade mais utilizadas, os alunos deverão ser
capazes de, consoante a natureza dos dados e a situação experimental, aplicar as
técnicas apropriadas à análise dos dados e interpretar os resultados de uma forma crítica.
Os alunos deverão ainda ser capazes de utilizar o software estatístico SPSS.
ATENDIMENTO AOS ALUNOS
• Paulo Infante
Quarta-feira: 14h-15h / Sexta-feira: 9h30-11h e 14h-15h
• Gonçalo Jacinto
Segunda-feira: 10h-13h / Quarta-feira: 10h-13h
� Os docentes apresentam disponibilidade total para responder a qualquer dúvida por
e-mail.
AVALIAÇÃO
Nesta disciplina, os alunos podem optar por dois tipos de avaliação:
1. Avaliação Contínua
a. No regime de avaliação contínua o aluno(a) terá obrigatoriamente de
assistir a um mínimo de dois terços das aulas teóricas e práticas.
b. O regime de avaliação contínua consiste na realização de 3 Frequências
com a duração de 2 horas cada.
c. A primeira Frequência a realizar em 29 de Outubro de 2005.
d. A segunda Frequência a realizar em data a anunciar três dias antes.
e. A terceira Frequência a realizar em 17 de Dezembro de 2005.
f. A matéria para avaliação relativa à primeira e terceira Frequências será
definida nas aulas teóricas uma semana antes da data prevista para a
realização das frequências. A matéria para avaliação na segunda
frequência será a matéria que já tenha sido leccionada nas aulas e ainda
não tenha sido avaliada.
g. Para a primeira e terceira Frequências o aluno(a) terá que ter uma nota
superior ou igual a 7 valores. Caso a nota seja inferior a 7 valores numa
destas duas frequências, o aluno(a) opta automaticamente pelo regime de
avaliação por Exame Final e caso a nota seja inferior a 7 valores na
terceira Frequência o aluno reprova à disciplina.
h. A nota final (NF) será o resultado da fórmula:
NF=0.35 N1 + 0.30 N2 + 0.35 N3
onde Ni é a nota na Frequência i, i=1, 3, com Ni, ≥7.
i. A apreciação do desempenho do aluno durante as aulas poderá, se daí
resultar benefício para o aluno, alterar a nota final.
j. Para obter aprovação à disciplina a nota final (NF) deverá ser igual ou
superior a 9.5 valores e ter assistido a pelo menos 2/3 das aulas teóricas e
2/3 das aulas práticas.
k. Caso o aluno(a) não realize a primeira ou terceira Frequências opta
automaticamente pelo regime de avaliação por Exame Final.
2. Exame Final
a. O regime de avaliação por Exame Final, em época normal, consiste na
realização de uma chamada com a duração de 3 horas.
b. A data dos exames em época normal e em época de recurso é, de acordo
com o Regulamento Escolar Interno, fixada pela comissão de horários.
c. A nota final será a da prova de exame e deverá ser igual ou superior a 9.5
valores para obter aprovação à disciplina.
d. A matéria para avaliação será toda aquela leccionada durante o semestre.
e. O Exame de Época Especial, com a duração de 3 horas, realizar-se-á em
20 de Setembro de 2006.
OBSERVAÇÕES:
� As Frequências e os Exames são provas sem consulta, podendo os alunos utilizar
um formulário de apoio e tabelas estatísticas fornecidos para o efeito.
� Os alunos podem utilizar máquina de calcular (pessoal e intransmissível).
PROGRAMA
Cap I – Introdução Cap. 2 – Estatística Descritiva
2.1. Distribuições de frequência
2.2. Medidas de Localização
2.3. Medidas de Dispersão
2.4. Medidas de Assimetria e Achatamento
2.5. Medidas de Concentração Cap. 3 – Introdução às Probabilidades e Probabilidades Condicionais
3.1. Conceitos de Probabilidade
3.2. Experiências aleatórias e acontecimentos
3.3. Definição axiomática de probabilidade
3.4. Probabilidade condicional e independência
3.5. Teorema da probabilidade total
3.6. Teorema de Bayes
Cap. 4 – Variáveis Aleatórias Unidimensionais e Bidimensionais
4.1. Variáveis aleatórias discretas
4.1.1. Função massa de probabilidade
4.1.2. Função distribuição
4.2. Variáveis aleatórias contínuas
4.2.1. Função densidade de probabilidade
4.2.2. Função distribuição
4.3. Esperança matemática
4.4. Variância e desvio padrão
4.5. Momentos
4.6. Distribuições conjuntas e marginais
4.7. Distribuições condicionais
4.8. Independência entre variáveis aleatórias
4.9. Covariância e coeficiente de correlação
Cap. 5 – Principais Distribuições de Probabilidade
5.1. Distribuição de Bernoulli
5.2. Distribuição Binomial
5.3. Distribuição de Poisson
5.4. Distribuição Geométrica
5.5. Distribuição Uniforme
5.6. Distribuição Exponencial
5.7. Distribuição Normal
5.8. Distribuição qui-quadrado, t-student e F de Fisher-Snedecor.
5.9. Lei dos grandes números
5.10. Teorema do limite central
Cap. 6 – Introdução à Amostragem
6.1. Noção de estatística
6.2. Distribuições amostrais
6.2.1. Distribuição amostral de médias
6.2.2. Distribuição amostral de variâncias e de razão de variâncias
6.2.3. Distribuição amostral de diferença de médias
6.2.4. Distribuição amostral de proporções
6.2.5. Distribuição amostral de diferença de proporções
Cap. 7 – Estimação Pontual e Intervalos de Confiança
7.1. Noção de estimador e de estimativa
7.2. Estimação pontual
7.2.1. Propriedades dos estimadores pontuais
7.2.2. Método dos momentos
7.2.3. Método da máxima verosimilhança
7.3. Estimação por intervalos
7.3.1. Intervalo de confiança da média
7.3.2. Intervalo de confiança da variância e da razão de variâncias
7.3.3. Intervalo de confiança da diferença de médias
7.3.4. Intervalo de confiança de proporções
7.3.5. Intervalo de confiança de diferença de proporções
Cap. 8 – Testes de Hipóteses
8.1. Hipótese nula e hipótese alternativa
8.2. Região de aceitação e de rejeição
8.3. Erros tipo I e tipo II
8.4. Nível de significância
8.5. Testes bilaterais e unilaterais
8.6. Potência de um teste
8.7. Testes de médias
8.8. Testes de variâncias e comparação de variâncias
8.9. Testes de diferença de médias
8.10. Testes de proporções
8.11. Testes de diferença de proporções
Cap. 9 – Testes Não Paramétricos
9.1. Testes de ajustamento e de independência
9.1.1. Teste do qui-quadrado como teste de ajustamento
9.1.2. Teste de Kolmogorov-Smirnov
9.1.3. Tabelas de contingência
9.2. Outros testes não paramétrico
Cap. 10 – Correlação e Regressão Linear e Não-Linear Simples
10.1. Noção de correlação e de regressão
10.2. Diagrama de dispersão
10.3. Regressão linear e não linear
10.4. Método dos mínimos quadrados
10.5. Coeficiente de determinação e coeficiente de correlação
10.6. Testes de hipóteses dos coeficientes de regressão
10.7. Predição de novas observações
OSERVAÇÕES:
� Para as aulas práticas haverá folhas de exercícios visando uma diversidade de
exemplos de aplicação, sendo os alunos aconselhados a resolver, para além
destes, outros exercícios de livros apresentados na Bibliografia.
� Parte do estudo da Estatística Descritiva e Introdução às Probabilidades foi
iniciado no decurso do Ensino Secundário, pelo que se pressupõe o
conhecimento destes conteúdos pelos alunos, sendo feita uma revisão de
conhecimentos em alguns dos pontos já anteriormente abordados no ensino
secundário.
BIBLIOGRAFIA
Murteira, B. J. F.; Silva Ribeiro, C.; Andrade e Silva, J.; Pimenta, C. (2001) –
Introdução à Estatística, McGraw-Hill.
OUTRA BIBLIOGRAFIA
Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. (2001) – Basic Business Statistics:
Concepts and Applications, 5th Ed., Prentice Hall.
Carlson, W. L.; Thorne, B. (1996) – Applied Statistical Methods: For Business,
Economics, and the Social Sciences, Prentice Hall.
D’Hainault, L. (1990) – Conceitos e Métodos da Estatística, Uma Variável a uma
Dimensão, Vol I, Fundação Calouste Gulbenkian.
D’Hainault, L. (1992) – Conceitos e Métodos da Estatística, Duas ou Três Variáveis
a Duas ou Três Dimensões, Vol II, Fundação Calouste Gulbenkian.
Galvão de Mello, F. (2000) – Probabilidades e Estatística, Conceitos e Métodos
Fundamentais, Vol I, 2ª Ed., Escolar Editora.
Galvão de Mello, F. (1997) – Probabilidades e Estatística, Conceitos e Métodos
Fundamentais, Vol II, Escolar Editora.
Guimarães, R.C.; Cabral, J. A. S. (1998) – Estatística, 2º Ed., McGraw-Hill.
Hines, W. W.; Montgomery, D. C. (1990) – Probability and Statistics in
Engineering and Management Science, 3rd Ed., John Wiley.
Maroco, J. (2003) – Análise Estatística - Com Utilização do SPSS, Edições Sílabo.
Martins, M. E. G. (2000) – Introdução às Probabilidades e à Estatística, SPE.
Mendenhall, W.; Scheaffer, R. L.; Wackerly, D. D. (2001) – Mathematical Statistics
with Applications, 6th Ed., Duxbury Press.
Mood, A. M.; Graybill, F. A.; Boes, D. C. (1974) – Introduction to the Theory of
Statistics, 3rd Ed. McGraw-Hill International Editions.
Murteira, B. (1990) – Probabilidades e Estatística, Vol I e II, 2ª Ed., McGraw-Hill.
Newbold, P.; Carlson, W. L.; Thorne, B. (2002) – Statistics for Business and
Economics, Pearson Higher Education.
Pestana, D. D.; Velosa, S. F. (2002) – Introdução à Probabilidade e à Estatística,
Fundação Calouste Gulbenkian.
Pereira, A. (2003) – SPSS - Guia Prático de Utilzação, 4ª Ed., Edições Sílabo.
Pinto, J. C. C.; Curto, J. J. D. (2000) – Estatística para Economia e Gestão, Edições
Sílabo.
Ross, S. M. (2000) – Introduction to Probability and Statistics for Engineers and
Scientists, Academic Press.
• ECONOMICS (3rd semester), MANAGEMENT (3rd semester; lecture to students
register in Statistics I), COMPUTER SCIENCE (3rd semester).
• Workload: 3 T + 3 P
• 6 ECTS
• Professors: Paulo Infante (Responsable) – [email protected]
Gonçalo Jacinto – [email protected]
• All teaching material is available to students in an internet site
http://www.ensino.uevora.pt/pe_eg
AIMS OF THE COURSE
This course provides concepts and methods of probability theory and statistical
inference that allows students be able to interpret and analyse sampling data and to get
some conclusions having into account the various levels of uncertainly presented.
Moreover the Theory of Probability fundamental concepts, including the most used
probability distributions, students should be able to select and apply statistical methods
and models appropriately and to interpret results in a critical way. Finally, it is intended
to provide some guidance for students to use correctly the statistical software SPSS.
STUDENT SUPPORT AND GUIDANCE
• Paulo Infante
Wednesday: 14h-15h / Friday: 9h30-11h e 14h-15h
• Gonçalo Jacinto
Monday: 10h-13h / Wednesday: 10h-13h
� Teachers present total availability to answer to any question by mail.
EVALUATION METHODS
In this course students can choose continuous evaluation and final exam evaluation:
1. Continuous evaluation
a. Students must attend to 2/3 of total theoretical and practical lessons.
b. The regimen of continuous evaluation consists in 3 midterms each one
with two hours.
c. The evaluation topics for the first and third midterms will be defined in
the lecture classes one week before the date foreseen to accomplish the
midterm.
d. In the firs and third midterms the student must have a score greater or
equal to 7 values. Case of score is less then 7 values in the first
frequency, students automatically choose final exam evaluation and case
of score is less then 7 values in the third midterm students reprove.
e. The final score (FS) will be the result of the formula:
FS=0.35 N1 + 0.30 N2 + 0.35 N3
where Ni is the score in midterm i, i=1, 2, 3, with N1>7 and N3>7.
f. Student’s performance during the lessons can modify the final score, if it
is in student’s benefit.
g. To get approved to the course the final score (FS) must be greater or
equal to 9.5 values.
h. Case students don’t attend to the first or to the third midterms,
automatically they opt by final exam evaluation.
2. Final Exam
a. In the evaluation regime by Final Exam, at normal time, students must
attend to one exam with three hours duration.
b. The final score will be the one of the exam proof and the student must
have a score greater or equal to 9.5 to get approved to the course.
c. The evaluation topics will be that whole lectured during the semester.
d. The Appeal Exam and the Exam at Special Time will have the duration
of 3 hours.
OBSERVATIONS:
- The midterms and the Final Exams are tests without consultation. The students can use
a support form and statistical tables supplied by the professors.
- The students should use a personal calculator.
PROGRAM CONTENTS
Cap I-Introduction Cap. 2-Descriptive statistics
2.1. Frequency tables
2.2. Measures of location
2.3. Measures of Dispersion
2.4. Measures of skewness and Flattening
2.5. Measures of Concentration
Cap. 3- Introduction to the Probabilities and Conditional Probabilities
3.1. Concepts of Probability
3.2. Random experiences and events
3.3. Axiomatic definition of probability
3.4. Conditional probability and independence
3.5. Theorem of the total probability
3.6. Bayes theorem
Cap. 4-One-dimensional and bidimensional random variables
4.1. Discreet random variables
4.1.1. Probability mass function
4.1.2. Distribution function
4.2. Continuous random variables
4.2.1. Probability density function
4.2.2. Distribution function
4.3. Expectation of a random variable
4.4. Variance and standard deviation
4.5. Moments
4.6. Joint and marginal probability distributions
4.7. Conditional distributions
4.8. Independence
4.9. Covariance and correlation coefficient
Cap. 5- Distributions of Probability
5.1. Bernoulli distribution
5.2. Binomial distribution
5.3. Geometric distribution
5.3. Poisson distribution
5.4. Uniform distribution
5.5. Exponential distribution
5.6. Normal distribution
5.7. Qui-square, t-student and F of Fisher-Snedecor distributions
5.9. The Central Limit Theorem
Cap. 6- Introduction to Sampling
6.1. Sampling methods
6.2. Statistics notion
6.3. Sampling distributions
6.3.1. Distribution of the sample mean
6.3.2. Distribution of the sample variance and of the ratio of variances
6.3.3. Sampling distribution of means difference
6.3.4. Distribution of the sample proportion
6.3.5. Sampling distribution of difference of proportions
Cap. 7-Point estimate and confidence intervals
7.1. Estimator and estimate
7.2. Point estimate
7.2.1. Properties of the point estimators
7.2.2. Method of moments
7.2.3. Method of maximum likelihood
7.3. Confidence interval estimation
7.3.1. Confidence intervals on the mean
7.3.2. Confidence intervals on the variance and on the ratio of variances
7.3.3. Confidence intervals on the difference in two means
7.3.4. Confidence intervals on a proportion
7.3.5. Confidence intervals on the difference in two proportions
Cap. 8- Tests of Hypotheses
8.1. Null hypothesis and alternative hypothesis
8.2. Acceptance and rejection regions
8.3. Type I and type II errors
8.4. Significance level
8.5. Bilateral and unilateral tests
8.6. Power of a test
8.7. Tests of Hypotheses tests on the mean
8.8. Tests of Hypotheses on the variance and for the equality of two variances
8.9. Tests of Hypotheses on the difference of two means
8.10. Tests of Hypotheses on a proportion
8.11. Tests of Hypotheses on two proportions
Cap. 9- Non-Parametric tests
9.1. Independence and Goodness of fit tests
9.1.1. Test of the qui-square as goodness of fit test
9.1.2. Test of Kolmogorov-Smirnov
9.1.3. Contingency tables: independence tests and homogeneity tests
9.2. Other non-parametric tests
Cap. 10- Correlation and Linear and No Linear Regression
10.1. Notion of correlation and regression
10.2. Dispersion diagram
10.3. Linear regression and non linear regression
10.4. Least squares method
10.5. Coefficient of determination and coefficient of correlation
10.6. Tests of hypotheses on the regression coefficients
10.7. Prediction of new observations
OSERVATIONS:
- The program of this course includes the use of the statistical software SPSS.
- For practical lessons we took exercises looking for a diversity of application examples,
being the students advised to solve other exercises looking to books presented in the
Bibliography.
- The students have some concepts of Descriptive Statistics and Introduction to
Probability, lectured in Secondary School. Because of it we presupposed the knowledge
of these contents. Only a revision will be possible in some topics.
REFERENCES
Murteira, B. J. F.; Silva Ribeiro, C.; Andrade e Silva, J.; Pimenta, C. (2001) –
Introdução à Estatística, McGraw-Hill.
OTHER REFERENCES
Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. (2001) – Basic Business Statistics:
Concepts and Applications, 5th Ed., Prentice Hall.
Carlson, W. L.; Thorne, B. (1996) – Applied Statistical Methods: For Business,
Economics, and the Social Sciences, Prentice Hall.
D’Hainault, L. (1990) – Conceitos e Métodos da Estatística, Uma Variável a uma
Dimensão, Vol I, Fundação Calouste Gulbenkian.
D’Hainault, L. (1992) – Conceitos e Métodos da Estatística, Duas ou Três Variáveis
a Duas ou Três Dimensões, Vol II, Fundação Calouste Gulbenkian.
Galvão de Mello, F. (2000) – Probabilidades e Estatística, Conceitos e Métodos
Fundamentais, Vol I, 2ª Ed., Escolar Editora.
Galvão de Mello, F. (1997) – Probabilidades e Estatística, Conceitos e Métodos
Fundamentais, Vol II, Escolar Editora.
Guimarães, R.C.; Cabral, J. A. S. (1998) – Estatística, 2º Ed., McGraw-Hill.
Hines, W. W.; Montgomery, D. C. (1990) – Probability and Statistics in
Engineering and Management Science, 3rd Ed., John Wiley.
Maroco, J. (2003) – Análise Estatística - Com Utilização do SPSS, Edições Sílabo.
Martins, M. E. G. (2000) – Introdução às Probabilidades e à Estatística, SPE.
Mendenhall, W.; Scheaffer, R. L.; Wackerly, D. D. (2001) – Mathematical Statistics
with Applications, 6th Ed., Duxbury Press.
Mood, A. M.; Graybill, F. A.; Boes, D. C. (1974) – Introduction to the Theory of
Statistics, 3rd Ed. McGraw-Hill International Editions.
Murteira, B. (1990) – Probabilidades e Estatística, Vol I e II, 2ª Ed., McGraw-Hill.
Newbold, P.; Carlson, W. L.; Thorne, B. (2002) – Statistics for Business and
Economics, Pearson Higher Education.
Pestana, D. D.; Velosa, S. F. (2002) – Introdução à Probabilidade e à Estatística,
Fundação Calouste Gulbenkian.
Pereira, A. (2003) – SPSS - Guia Prático de Utilzação, 4ª Ed., Edições Sílabo.
Pinto, J. C. C.; Curto, J. J. D. (2000) – Estatística para Economia e Gestão, Edições
Sílabo.
Ross, S. M. (2000) – Introduction to Probability and Statistics for Engineers and
Scientists, Academic Press.
Sumários das aulas teóricas Lição Nº 1 – 16/09/05
Apresentação genérica do programa e da Bibliografia. Considerações gerais sobre o
modo de funcionamento das aulas. Definição do método de avaliação da disciplina.
Marcação das datas dos testes e do horário de atendimento dos alunos. Considerações
genéricas sobre as Probabilidades e a Estatística.
Lição Nº 2 – 22/09/5 e 23/09/05
Conceito de população e de amostra. Dados Estatísticos. Variáveis discretas e
contínuas. Estatística Descritiva. Agrupamento dos dados e formação de classes. Noção
de frequência absoluta, frequência relativa e de frequências acumuladas. Tábuas de
distribuição de frequências. Exemplos de aplicação. Histograma e polígono de
frequências. Medidas de localização: média, moda e mediana. Quantil de ordem p:
quartis, decis e percentis. Exemplo de aplicação. Medidas de dispersão: noção de
dispersão, amplitude, amplitude inter-quartis, variância e desvio padrão. Noção de
dispersão absoluta e de dispersão relativa: coeficiente de variação
Lição Nº 3 – 24/09/05
Medidas de Assimetria: noção de assimetria; comparação entre media, mediana e moda;
grau de assimetria de Pearson; coeficiente de assimetria de Bowley. Momentos ordinais
e momento centrais. Coeficiente de assimetria com base nos momentos. Medidas de
achatamento: noção de achatamento, coeficiente de achatamento com base nos
momentos, coeficiente percentil de curtose. Barreiras Internas e Barreiras Externas.
Noção de outlier. Diagrama de Caixa-e-bigodes. Exemplos de aplicação. Medidas de
Concentração. Exemplo de aplicação.
Lição Nº 4 – 6/10/05 e 7/10/05
Introdução às Probabilidades e Probabilidades Condicionais. Noção de experiência
aleatória, espaço-amostra, acontecimento elementar e acontecimento. Espaço de
acontecimentos e espaço de probabilidades. Definição axiomática de probabilidade.
Propriedades. Conceito Laplaciano, frequencista e subjectivo de Probabilidades.
Exemplos. Probabilidade condicional. Fórmula das probabilidades compostas.
Exemplos de aplicação.
Lição Nº 5 – 12/10/05 e 13/10/05
Teorema da Probabilidade Total. Exemplo de aplicação. Teorema de Bayes. Exemplos
de aplicação. Independência de acontecimentos. Exemplo de aplicação. Conceito de
variável aleatória. Variáveis aleatórias discretas: função massa de probabilidade e
função distribuição. Exemplo de aplicação.
Lição Nº 6 – 14/10/05
Propriedades da função distribuição. Conceito de esperança matemática de uma variável
aleatória. Propriedades da esperança matemática. Exemplo de aplicação. Mediana e
moda. Conceito de variância de uma variável aleatória. Propriedades da variância.
Desvio padrão. Coeficiente de variação. Momentos. Coeficiente de assimetria e de
achatamento. Distribuição de Bernoulli. Exemplos de aplicação. Distribuição Binomial.
Exemplos de aplicação. Esperança matemática, variância e desvio padrão de uma
variável aleatória com distribuição Binomial. Exemplos de aplicação da distribuição
Binomial. Distribuição Geométrica. Exemplo de aplicação. Esperança matemática,
variância e desvio padrão de uma variável aleatória com distribuição Geométrica.
Lição Nº 7 – 19/10/05 e 20/10/05
Distribuição de Poisson. Processo de Poisson. Esperança matemática, variância e desvio
padrão de uma variável aleatória com distribuição de Poisson. Aproximação da
distribuição Binomial pela distribuição de Poisson. Exemplos de aplicação. Variáveis
aleatórias contínuas: função densidade de probabilidade, função distribuição, esperança
matemática e variância. Exemplos. Distribuição Uniforme. Esperança matemática de
uma variável aleatória com distribuição uniforme.
Lição Nº 8 – 21/10/05
Exemplos de aplicação da distribuição Uniforme. Distribuição exponencial. Esperança
matemática, variância e desvio padrão de uma variável aleatória com distribuição
exponencial. Falta de memória da distribuição exponencial. Exemplos de aplicação.
Lição Nº 9 – 26/10/05 e 27/10/05 Distribuição Normal. Variável aleatória normal reduzida. Leitura e utilização da tabela
da distribuição normal. Quantis da distribuição normal. Exemplos de aplicação.
Lição Nº 10 – 28/10/05 Algumas considerações gerais sobre diferentes pontos da matéria dada. Dúvidas para o
teste.
Lição Nº 11 – 02/11/05 e 03/11/2005 Combinação linear de variáveis normais independentes. Soma de variáveis aleatórias
normais independentes. Teorema do Limite Central. Aproximação da Binomial pela
Normal. Aproximação da Poisson pela Normal. Exemplo de aplicação. Distribuição
Qui-quadrado, distribuição t-student e distribuição F. Quantis de probabilidade.
Conceito de variável aleatória bidimensional. Exemplos. Variáveis aleatórias
bidimensionais discretas: função massa de probabilidade conjunta e função distribuição.
Variáveis aleatórias bidimensionais contínuas: função densidade de probabilidade
conjunta e função distribuição. Distribuições marginais. Independência entre variáveis
aleatórias. Conceito de covariância. Propriedades. Coeficiente de correlação linear.
Lição Nº 12 – 04/11/2005 Introdução à Amostragem. Noção de estatística. Estimação pontual. Noção de estimador
e de estimativa. Exemplos. Propriedades dos Estimadores Pontuais: não enviesamento,
eficiência e consistência. Exemplos de aplicação. Erro quadrático médio. Método dos
momentos. Exemplo de aplicação.
Lição Nº 13 – 9/11/2005 e 10/11/2005 Método da máxima verosimilhança. Exemplos de aplicação. Propriedade da Invariância.
Lição Nº 14 – 11/11/05
Distribuição amostral de médias. Intervalo de confiança para a média quando o desvio
padrão é conhecido. Intervalo de confiança para a média quando o desvio padrão não é
conhecido. Conceito de erro padrão da estimativa. Exemplos de aplicação. Distribuição
amostral de variâncias. Intervalo de confiança para a variância. Exemplo de aplicação.
Lição Nº 15 – 16/11/05 e 17/11/05
Distribuição amostral de proporções. Intervalo de confiança para a proporção. Exemplos
de aplicação. Introdução aos testes de hipóteses: hipótese nula e hipótese alternativa;
erro de 1ª espécie e erro de 2ª espécie; teste unilateral e teste bilateral. Nível de
significância e região critica. Testes de hipóteses para a média quando o desvio padrão é
conhecido. Valor de prova. Exemplos de aplicação.
Lição Nº 16 – 18/11/05
Dualidade entre testes de hipóteses e intervalos de confiança. Exemplo de aplicação.
Obtenção do tamanho da amostra de modo a limitar o erro de 2ª espécie mantendo-se o
erro de 1ª espécie. Testes de hipóteses para a média quando o desvio padrão é
desconhecido. Exemplo de aplicação.
Lição Nº 17 – 23/11/05 e 24/11/05 Testes de hipóteses para a variância. Exemplo de aplicação. Testes de hipóteses para a
proporção. Exemplo de aplicação. Distribuição amostral de diferença de médias.
Intervalo de confiança para a diferença de médias com desvios padrões conhecidos.
Intervalo de confiança para diferença de médias com desvios padrões desconhecidos,
mas iguais. Exemplo de aplicação.
Lição Nº 18 – 25/11/05 Testes de hipóteses para a diferença de médias. Exemplos de aplicação. Distribuição
amostral de razão de variâncias. Intervalo de confiança para a razão de variâncias.
Exemplo de aplicação. Testes para a comparação de variâncias. Exemplo de aplicação.
Algumas considerações críticas acerca da matéria dada.
Lição Nº 19 – 30/11/05 e 2/12/2005 Distribuição amostral de diferença de proporções. Intervalo de confiança para a
diferença de proporções. Exemplo de aplicação. Noção de correlação e de regressão.
Diagrama de dispersão. Exemplos. Modelo de regressão linear simples. Método dos
mínimos quadrados. Interpretação dos parâmetros de regressão. Coeficiente de
determinação e coeficiente de correlação. Intervalos de confiança e testes de hipóteses
para os parâmetros da regressão. Predição de novas observações: estimação pontual e
estimação intervalar. Exemplo de aplicação com interpretação de outputs do SPSS.
Lição Nº 20 – 2/12/05 e 5/12/2005 Continuação da aula anterior. Alguns comentários sobre o modelo de regressão linear.
Análise de resíduos. Exemplos de aplicação. Regressão não-linear simples. Exemplos.
Teste de Kolmogorov-Smirnov. Exemplo de aplicação.
Lição Nº 21 – 7/12/05 e 9/12/2005 Testes de hipóteses para o coeficiente de correlação linear. Exemplos. Testes não
paramétricos: importância e aplicação. Teste do qui-quadrado como teste de
ajustamento. Exemplos de aplicação. Tabelas de contingência: teste do qui-quadrado de
Independência. Exemplo de aplicação.
Lição Nº 22 – 14/12/05 e 15/12/2005 Correcção de Yates. Teste de Wilcoxon. Exemplos de aplicação. Breve referência ao
teste do sinal. Teste de Mann-Whitney. Exemplo de aplicação.
Lição Nº 23 – 16/12/05 Algumas considerações sobre matéria dada. Esclarecimento de dúvidas para a terceira
frequência.
Sumários das aulas práticas
Lição Nº 1 – 03/10/05 e 04/10/05 Apresentação genérica da forma e conteúdo das aulas práticas. Considerações gerais
sobre o modo de funcionamento das aulas. Marcação do horário de atendimento aos
alunos. Estatística Descritiva: variáveis discretas. Construção de tábuas de frequências.
Representações gráficas: gráficos de barras. Cálculo de medidas de localização: média,
moda, mediana e quantis. Cálculo de medidas de dispersão: variância e desvio padrão.
Cálculo de medidas de assimetria: comparação entre média, moda e mediana e grau de
assimetria de Pearson. Cálculo de medidas de achatamento: coeficiente percentil de
curtose.
Lição Nº 2 – 10/10/05 e 11/10/05 Gráfico de Caixa-e-bigodes Barreiras Internas e Barreiras Externas. Noção de outlier..
Medidas de concentração: recta de igual distribuição, curva de Lorentz, área de
concentração e índice de Gini.
Estatística Descritiva: variáveis contínuas. Construção de classes. Representações
gráficas: histograma e polígono de frequências. Cálculo de medidas de localização:
média, moda, mediana e quantis. Cálculo de medidas de dispersão: variância e desvio
padrão. Cálculo de medidas de assimetria: comparação entre média, moda e mediana e
grau de assimetria de Pearson. Cálculo de medidas de achatamento: coeficiente percentil
de curtose. Determinação de percentis.
Lição Nº 3 – 11/10/05 e 12/10/05 Probabilidades. Experiência aleatória, espaço de resultados e acontecimentos.
Axiomática da probabilidade. Probabilidade condicional. Independência entre
acontecimentos.
Lição Nº 4 – 17/10/05 e 18/10/05 Teorema da probabilidade total e Teorema de Bayes.
Variáveis aleatórias discretas. Função densidade e função distribuição. Cálculo de
probabilidades.
Lição Nº 5 – 18/10/05 e 19/10/05 Variáveis aleatórias discretas. Cálculo do valor esperado e da variância. Distribuições
de probabilidade discretas. Distribuição Binomial e distribuição geométrica.
Propriedades mais importantes das distribuições.
Lição Nº 6 – 24/10/05 e 25/10/05
Distribuição de Poisson. Variáveis aleatórias contínuas. Função densidade e função
distribuição. Valor esperado e variância. Cálculo de probabilidades.
Distribuição Uniforme.
Lição Nº 7 – 25/10/05 e 26/10/05 Continuação da aula anterior. Distribuição Exponencial. Relação entre a distribuição de
Poisson e a Exponencial. Propriedades da distribuição Exponencial e cálculo de
probabilidades.
Lição Nº 8 – 31/10/05 e 02/11/05
Distribuição Normal. Transformação na distribuição normal reduzida. Utilização de
tabelas de probabilidades. Propriedades da distribuição Normal.
Aproximação da distribuição Binomial e Poisson pela distribuição Normal.
Lição Nº 9 – 07/11/05 e 08/11/05 Variáveis aleatórias bidimensionais discretas. Funções de probabilidade marginais.
Covariância e coeficiente de correlação.
Distribuições de probabilidade t-Student, Qui-Quadrado e F-Snedcor.
Lição Nº 10 – 08/11/05 e 09/11/05
Distribuições amostrais. Distribuição amostral da média, distribuição amostral da média
utilizando o Teorema do Limite Central.
Estimação Pontual. Propriedades dos estimadores: enviesamento, eficiência e
consistência.
Lição Nº 11 – 14/11/05 e 15/11/05 Continuação da aula anterior. Método de estimação dos momentos e método da máxima
verosimilhança.
Lição Nº 12 – 15/11/05 e 16/11/05
Intervalos de confiança para a média, com variância conhecida e desconhecida.
Intervalos de confiança para a média em grandes amostras. Intervalos de confiança para
variância e para a proporção.
Lição Nº 13 – 21/11/05 e 22/11/05 Testes de hipóteses para a média, com variância conhecida. Teste de hipóteses para a
média com variância desconhecida: grandes e pequenas amostram. Cálculo do valor de
prova. Cálculo dos erros de 1ª espécie e de 2ª espécie. Potência do teste.
Lição Nº 14 – 22/11/05 e 23/11/05
Continuação da aula anterior. Teste de hipóteses para a variância. Teste de hipóteses
para a proporção.
Lição Nº 15 – 28/11/05 e 29/11/05 Distribuição amostral da diferença de médias. Intervalos de confiança para a diferença
de médias, com as variâncias desconhecidas e variâncias desconhecidas. Intervalos de
confiança para a razão de variâncias e para a diferença de proporções.
Lição Nº 16 – 29/11/05 e 20/11/05
Teste de hipóteses para a diferença de médias. Teste de hipóteses para a razão de
variâncias e para a diferença de proporções.
Dualidade entre testes de hipóteses e intervalos de confiança. Cálculo do valor de prova.
Lição Nº 17 – 05/12/05 e 06/12/05 Regressão linear e Regressão não linear. Estimação de curvas de regressão. Construção
de testes de hipóteses e intervalos de confiança para os parâmetros da regressão.
Intervalo de predição.
Lição Nº 18 – 06/12/05 e 07/12/05
Aula de laboratório. Utilização do software SPSS em regressão linear simples.
Resolução de problemas com recurso ao SPSS. Modelo de regressão e método de
mínimos quadrados. Coeficiente de correlação e determinação. Testes de hipóteses e
intervalos de confiança para os parâmetros da regressão. Predição de novas
observações: estimação pontual e estimação intervalar.
Lição Nº 19 – 12/12/05 e 13/12/05 Testes não paramétricos. Testes de bondade do ajustamento: teste do qui-quadrado e
teste de Kolmogorov-Smirnov. Tabela de contingência: teste de qui-quadrado de
independência.
Lição Nº 20 – 13/12/05 e 14/12/05
Aula de laboratório. Utilização do software SPSS em testes não paramétricos.
Resolução de problemas com recurso ao SPSS. Teste de Kolmogorov-Smirnov e de qui-
quadrado. Teste de Mann-Whitney e de Wilcoxon.
1. Considere os resultados finais, numa determinada disciplina, obtidos por 20
estudantes de uma dada Universidade:
9 14 12 8 14 12 16 16 8 14
11 12 14 11 11 18 14 18 15 15
a) Determine as frequências absolutas e relativas (simples e acumuladas).
b) Represente graficamente as frequências absolutas e relativas.
c) Calcule a média, a moda e a mediana. Comente.
d) Determine os quartis e interprete os valores obtidos.
e) Calcule a variância e o desvio padrão.
f) Calcule os coeficientes de dispersão e de variação.
g) Calcule o grau de assimetria de Pearson. Que conclui sobre a assimetria da
distribuição?
h) Calcule um coeficiente de curtose. Que conclui sobre o achatamento da
distribuição?
i) Refaça as alíneas anteriores recorrendo ao SPSS.
2. Admita que se realizou um inquérito a um grupo de compradores de 30 carros novos
para determinar quantas reparações ou substituições de peças foram feitas durante o
primeiro ano de utilização dos carros, tendo-se obtido os seguintes resultados:
1 4 1 2 2 3 3 2 1 2
3 2 3 1 0 1 2 7 4 3
5 1 2 4 2 1 3 1 0 1
a) Apresente os dados numa tabela de distribuição de frequências.
b) Calcule e interprete a média, a mediana, a moda e o desvio-padrão.
c) Determine a função de distribuição empírica e represente-a graficamente.
d) Determine os quartis da distribuição e diga qual o seu significado.
e) Represente os dados numa caixa-de-bigodes e interprete.
f) Estude a distribuição quanto à assimetria e ao achatamento.
g) Refaça as alíneas anteriores recorrendo ao SPSS.
3. Considere a seguinte distribuição de frequências, correspondente a áreas (centenas
de metros quadrados) de empresas de um parque industrial:
Áreas n.º de empresas [5, 15) 40 [15, 25) 80 [25, 35) 115 [35, 45) 105 [45, 55) 65 [55, 65) 45 [65, 75) 35 [75, 85) 30
a) Esboce o histograma e o polígono de frequências absolutas.
b) Calcule o desvio padrão.
c) Calcule a mediana, o terceiro quartil e o quinto percentil. Interprete os valores
obtidos.
d) Obtenha outras medidas de dispersão.
e) Calcule o terceiro e o quarto momentos centrais.
f) Comente as proposições:
i) “A distribuição é assimétrica positiva.”.
ii) “A distribuição é platicúrtica.”.
g) Esboce a curva de Lorenz e interprete um ponto qualquer da curva.
h) Calcule o índice de Gini. Comente.
4. Admita que um grupo de 50 analistas financeiros efectuou uma previsão do ganho
por acção, em euros, de uma empresa no próximo ano, sendo os resultados
apresentados em 7 classes de igual amplitude, na tabela seguinte:
Classes
Pontos médios (x’ i)
Número de analistas
Ni
Fi
5 4 0,08
8
[8, 10)
[10, 12) 8 27
13 37 0,74
17 5 1,00
a) Complete a tabela.
b) Calcule a mediana e interprete o seu valor.
c) Diga, sem efectuar cálculos, se as seguintes questões são verdadeiras ou falsas:
Statistics
Volume de vendas72
0
51,1111
47,00
19,93974
94,00
11,00
105,00
25,0000
38,0000
47,5000
62,0000
80,0000
Valid
Missing
N
Mean
Mode
Std. Deviation
Range
Minimum
Maximum
10
25
50
75
90
Percentiles
i) O percentil 74 é igual a 13 euros.
ii) 84% dos analistas previram um ganho por acção superior a 8 euros.
d) Complete a seguinte afirmação:
___ % dos analistas previram um ganho por acção inferior a 12,40 euros.
5. Considere que, numa distribuição de frequências relativa aos gastos energéticos de
80 empresas numa dada actividade, os pontos médios das classes xi e as frequências
relativas fi são os seguintes, respectivamente:
xi= 4, 6, 8, 11, 15 e 21; fi= 0.1375, 0.1875, 0.2500, 0.2000, 0.1000 e 0.1250.
a) Complete a seguinte afirmação: 25 % das empresas têm um consumo energético
superior a ____ unidades.
b) Sabendo que a amplitude total do consumo energético das empresas nesta amostra é
igual a 21,8 unidades e que o menor consumo energético registado é igual a 3,1
unidades, esboce a caixa de bigodes.
c) Admita que um seu colega, depois de calcular o terceiro momento central, tirou a
seguinte conclusão: “A maior parte das empresas tem um consumo energético
inferior à média.”. Suporte a veracidade ou a falsidade desta conclusão.
6. Admita que, relativamente ao volume de vendas anuais, em milhões de euros, de um
conjunto de empresas de um país X, se obteve o seguinte output do SPSS:
a) Esboce a caixa de bigodes, sabendo
que a segunda maior empresa em
volume de vendas realizou 92
milhões de euros.
b) Justifique a falsidade da seguinte
afirmação: “O terceiro momento
centrado é nulo.”.
5. Suponha que numa determina população, 9,8% dos indivíduos são leitores da revista
A, 30% são leitores da revista B e 5% são leitores de ambas. Determine a
probabilidade de uma pessoa escolhida ao acaso:
a) Ser leitor de alguma das revistas.
b) Ser leitor apenas da revista A.
c) Não ser leitor de nenhuma das revistas.
d) Ser leitor da revista A sabendo que também é leitor da revista B.
6. Uma caixa contém 2 bolas vermelhas e 3 azuis. Extraem-se, ao acaso, duas bolas
com reposição. Qual a probabilidade de:
a) Ser vermelha a primeira bola escolhida?
b) Ser vermelha a segunda bola escolhida?
c) Ambas as bolas serem vermelhas?
d) Ser vermelha a primeira e azul a segunda?
e) Refaça as alíneas anteriores, admitindo que se extraem as bolas sem reposição.
7. Sejam A e B acontecimentos tais que P[A] = .2, P[B] = p e P[A∪B] = .6. Calcule p
considerando A e B:
a) mutuamente exclusivos.
b) independentes.
8. Aos armazéns de uma empresa chegam dois lotes de 1000 produtos cada, um de
uma fábrica A e outro de uma fábrica B. Admita que o fornecimento da fábrica A
tem 10% de produtos defeituosos e o da B 20%. Supondo que se misturou ao acaso
os produtos dos 2 lotes e que, extraindo um produto, também ao acaso, se verificou
que era defeituoso, determine a probabilidade do produto ter sido produzido pela
fábrica A.
9. Sejam A e B dois acontecimentos quaisquer. Mostre que
P(A∩B) ≤ P(A) ≤ P(A∪B) ≤ P(A)+P(B).
10. Suponha que existem 3 tipos de vírus duma dada doença, sendo 0,3; 0,5 e 0,2 as
probabilidades de um indivíduo ser atacado por cada um deles. Para a vacina
disponível as probabilidades de imunização são 0,8; 0,9 e 0,95 respectivamente.
a) Qual a probabilidade de um indivíduo vacinado contrair a doença?
b) Se um indivíduo vacinado resistiu ao ataque, qual a probabilidade de ter sido
atacado por um vírus do 2º tipo?
11. O Governo de um determinado país pretende avaliar o crescimento do produto
interno bruto (PIB). Para tal, resolve pedir previsões da evolução de diversos
componentes, em três vertentes distintas, a um economista. Neste caso, 40% das
estimativas são referentes às receitas (vertente em que a probabilidade do
economista estimar correctamente é igual a 0,80), 35% das estimativas são
referentes às despesas (vertente em que a probabilidade do economista estimar
correctamente é igual a 0,20) e 25% das estimativas são referentes às importações e
exportações (vertente em que a probabilidade do economista estimar correctamente
é igual a 0,40).
a) Determine a probabilidade de, escolhida ao acaso uma estimativa referente às
receitas, esta esteja estimada incorrectamente.
b) Relativamente a um dada estimativa verificou-se que estava correcta. Calcule a
probabilidade de ser relativa às importações e exportações.
12. Uma companhia de seguros refere que 30% dos seus clientes são de alto risco, 45%
dos seus clientes são de médio risco e os restantes clientes são de baixo risco. Em
cada caso, a probabilidade de terem acidentes no ano coberto pelo seguro é igual a
0.25, 0.16 e 0.08, respectivamente.
a) Determine a probabilidade de escolher ao acaso um cliente que não seja de alto
risco.
b) Determine a probabilidade de um condutor ser de alto risco, sabendo que não
teve acidentes no ano coberto pelo seguro.
13. Considere a v. a. X com a seguinte função densidade de probabilidade:
( ) < <=
10 x 3
f x 30 caso contrário
a) Represente graficamente a função de densidade de probabilidade.
b) Descreva a função de distribuição de X e represente-a graficamente.
c) Calcule P(X ≤ 2).
d) Calcule E(X) e Var(X).
14. Uma cadeia de hipermercados vende, por semana, uma quantidade de carne
(expressa em toneladas) que admitimos ser uma variável aleatória X com função
densidade de probabilidade dada por:
, 0 3( ) 6
0, caso contrario
+ ≤ ≤=
xk x
f x
a) Obtenha a função distribuição, o valor médio e a mediana de X.
b) Determine a quantidade de carne que deve ser recebida semanalmente para que
em 80% das semanas não haja falta do produto.
c) Qual a probabilidade das vendas semanais de carne da cadeia de hipermercados
ser de pelo menos 2 tonelada? E de vender entre 1 e 2 toneladas?
d) Determine a variância das vendas semanais de carne da cadeia de
hipermercados.
15. Um aluno da Universidade de Évora para se deslocar para as aulas utiliza 2 meios de
transporte, cuja duração conjunta é uma variável aleatória bidimensional (X, Y) com
densidade
(6 ) ; 0<x<2, 2<y<4( , )
0 ; restantes valores
− −=
k x yf x y .
a) Determine a constante k.
b) Calcule o tempo médio de duração do segundo transporte ( Y ).
c) Calcule o tempo mediano de duração do primeiro transporte ( X ).
d) As variáveis X e Y são independentes? Justifique.
16. A função densidade conjunta de duas variáveis aleatórias X e Y contínuas é:
( )cxy 0 x 4 e 1 y 5
f x, y0 c.c.
< < < <=
Determine:
a) O valor da constante c.
b) P(1 < X < 2, 2 < Y < 3).
c) P(X ≥ 3, Y ≤ 2).
d) Função distribuição marginal de X.
e) Função distribuição marginal de Y.
f) E(X), E(Y) e E(XY). Pode afirmar que as variáveis são independentes?
17. O conteúdo de leite de certa marca é uma variável aleatória com distribuição
uniforme entre 0,85 e 1,05 litros.
a) Indique a função densidade de probabilidade correspondente.
b) Qual a probabilidade de um pacote de leite ter um volume inferior a 1 litro?
18. O tempo de funcionamento (em horas) de um certo equipamento é uma v.a com
distribuição exponencial de parâmetro λ=1/2.
a) Determine a função densidade e a função distribuição de X.
b) Calcule a probabilidade de que a 1ª avaria ocorra pelo menos 1 hora depois do
início do funcionamento do equipamento.
c) Calcule a probabilidade de que a 1ª avaria não ocorra depois das primeiras 4h de
funcionamento.
d) Prove que a probabilidade de que equipamento dure mais de 10h sabendo que já
está a funcionar há 3h é igual à probabilidade de que o equipamento dure pelo
menos 7h.
19. Suponha que um dispositivo electrónico tem um tempo de vida X (em unidades de
1000 horas), que é uma v.a. exponencial de média igual a 1 unidade. Admita, ainda,
que o custo de fabrico de um desses dispositivos é igual a 200 € e que o fabricante o
vende por 500€, mas garante o reembolso total se a duração do dispositivo for
menor ou igual a 900 horas. Qual será o lucro que o fabricante espera obter por
dispositivo?
20. O tempo de execução de determinada tarefa é uma variável aleatória com
distribuição Normal, com µ = 72 minutos e σ = 12 minutos.
a) Calcule a probabilidade de que a tarefa:
i) Leve mais de 93 minutos a executar;
ii) Não demore mais de 65 minutos;
iii) Gaste entre 63 e 78 minutos;
b) Determine os valores de a e b tais que:
i) P(X > a) = 0,2525;
ii) P(X < b) = 0,0054.
21. Suponha que a sua nota numa frequência, em unidades padrão é igual a 0,87 e que
se admite que as notas eram normalmente distribuídas. Determine a percentagem de
alunos que se poderia esperar com notas inferiores à sua? E superiores?
22. Admita que uma empresa tem produção constante de 100 toneladas por mês. Sabe-
se que a procura é uma v. a. Normal com média µ = 80 toneladas e desvio-padrão σ
= 10 toneladas.
a) Determine a probabilidade de ocorrer procura excedentária.
b) Para reduzir a probabilidade de ocorrer procura excedentária para 0,0027, a
empresa deve aumentar a sua produção mensal em quantas toneladas.
23. Seja X uma variável aleatória com distribuição Normal de valor médio 10 e
variância 4, representando o comprimento de barras de ferro. Suponha que uma
barra é considerada não defeituosa se {8 ≤ X ≤ 12} e defeituosa em caso contrário.
a) Qual a probabilidade de que uma barra, escolhida ao acaso, do fabrico diário,
seja não defeituosa?
b) Qual a probabilidade de que em dez barras escolhidas aleatoriamente do fabrico
diário, pelo menos duas sejam defeituosas?
24. Admita que os responsáveis de uma determina empresa produtora de açúcar, face a
uma diminuição registada nas vendas do produto, encararam a hipótese de fechar
uma das suas sucursais. De acordo com estudos efectuados, para não encerrar a dita
sucursal, a empresa necessita que a procura semanal (7 dias) seja superior a 65.000
kg. Sabendo que a procura média diária de açúcar se distribui normalmente, com
média 10.000 kg e desvio-padrão 1.000 kg, determine a probabilidade da sucursal
encerrar.
25. A média de um exame final de uma determinada disciplina foi igual 14 e o desvio
padrão igual a 2. Determine a nota mínima que um estudante devia ter para ser
classificado entre os 10% com notas mais altas.
26. Admita que o diâmetro externo de um dado eixo segue uma distribuição normal com
média igual a 4cm e variância igual a 0.01 cm2. Admita, ainda, que de acordo com
as especificações estabelecidas, o diâmetro externo não deve diferir de 4cm por mais
de 0.05 cm. Caso contrário, o fabricante terá um prejuízo igual a 10€ se essa
diferença exceder 0.08 cm e igual a 5€ se essa diferença estiver compreendida entre
0.05cm e 0.08cm. Calcule o prejuízo médio do fabricante.
27. Joga-se uma moeda 1000 vezes ao ar. Determine a probabilidade de o número de
caras não diferir de 500 por mais de 50.
28. Suponha que, em determinadas eleições nacionais com apenas dois candidatos, o
candidato A obteve 60% dos votos. Calcule a probabilidade de, numa mesa de voto
considerada representativa do eleitorado, o candidato A ter tido um número de votos
compreendido entre 590 e 700 (ambos inclusive) num total de 1000 votos atribuídos
aos dois candidatos.
29. O número de defeitos por cada unidade de equipamento electrónico tem distribuição
de Poisson com média igual a 40. Determine a probabilidade de um equipamento
electrónico, escolhido ao acaso, ter entre 30 a 35 defeitos.
30. A produção de chocolate numa dada fábrica tem distribuição normal de valor médio
200 gramas e variância 25 gramas.
a) Calcule P(185 < X < 215).
b) Suponha que um defeito numa das máquinas provoca uma alteração na produção
de chocolates, deslocando a média para 215 gramas. Calcule a probabilidade
anterior.
c) Determine a variância do peso médio de 5 chocolates.
31. O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma
variável aleatória com distribuição normal de média igual a 10 horas e desvio
padrão igual a 2 horas.
a) Determine a probabilidade do gestor demorar entre 9 e 11 horas a avaliar um
determinado projecto.
b) Se ao gestor fosse pedido para prever o tempo necessário para avaliar um dado
projecto, de modo a que a probabilidade do estudo não estar concluído nesse
tempo apenas fosse igual a 0,025, que valor indicaria?
c) O gestor recebe uma compensação monetária sempre que termina a avaliação de
um projecto em menos de 8 horas. Admitindo que o gestor recebeu 7 projectos
distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos
2 projectos.
32. Suponha que a procura semanal, de uma determinada marca de óleo lubrificante,
numa dada estação de serviço, segue uma distribuição normal com valor médio 50
litros e desvio padrão 3 litros.
a) Calcule a probabilidade de numa determinada semana se consumirem entre 45
litros e 65 litros.
b) Comente, sem efectuar cálculos: “Se o stock no início de cada semana for
inferior a 50 litros, então em mais de metade das semanas haverá ruptura de
stock.”.
c) Qual deverá ser o stock de óleo no início de uma determinada semana, de modo
a que a probabilidade de haver ruptura de stock, nessa semana, seja igual a
0.015?
33. Considere a v. a. X com a seguinte função densidade de probabilidade:
( ) < <=
10 x 3
f x 30 caso contrário
a) Represente graficamente a função de densidade de probabilidade.
b) Descreva a função de distribuição de X e represente-a graficamente.
c) Calcule P(X ≤ 2).
d) Calcule E(X) e Var(X).
34. Uma cadeia de hipermercados vende, por semana, uma quantidade de carne
(expressa em toneladas) que admitimos ser uma variável aleatória X com função
densidade de probabilidade dada por:
, 0 3( ) 6
0, caso contrario
+ ≤ ≤=
xk x
f x
a) Obtenha a função distribuição, o valor médio e a mediana de X.
b) Determine a quantidade de carne que deve ser recebida semanalmente para que
em 80% das semanas não haja falta do produto.
c) Qual a probabilidade das vendas semanais de carne da cadeia de hipermercados
ser de pelo menos 2 tonelada? E de vender entre 1 e 2 toneladas?
d) Determine a variância das vendas semanais de carne da cadeia de
hipermercados.
35. Um aluno da Universidade de Évora para se deslocar para as aulas utiliza 2 meios de
transporte, cuja duração conjunta é uma variável aleatória bidimensional (X, Y) com
densidade
(6 ) ; 0<x<2, 2<y<4( , )
0 ; restantes valores
− −=
k x yf x y .
e) Determine a constante k.
f) Calcule o tempo médio de duração do segundo transporte ( Y ).
g) Calcule o tempo mediano de duração do primeiro transporte ( X ).
h) As variáveis X e Y são independentes? Justifique.
36. A função densidade conjunta de duas variáveis aleatórias X e Y contínuas é:
( )cxy 0 x 4 e 1 y 5
f x, y0 c.c.
< < < <=
Determine:
g) O valor da constante c.
h) P(1 < X < 2, 2 < Y < 3).
i) P(X ≥ 3, Y ≤ 2).
j) Função distribuição marginal de X.
k) Função distribuição marginal de Y.
l) E(X), E(Y) e E(XY). Pode afirmar que as variáveis são independentes?
37. O conteúdo de leite de certa marca é uma variável aleatória com distribuição
uniforme entre 0,85 e 1,05 litros.
a) Indique a função densidade de probabilidade correspondente.
b) Qual a probabilidade de um pacote de leite ter um volume inferior a 1 litro?
38. O tempo de funcionamento (em horas) de um certo equipamento é uma v.a com
distribuição exponencial de parâmetro λ=1/2.
a) Determine a função densidade e a função distribuição de X.
b) Calcule a probabilidade de que a 1ª avaria ocorra pelo menos 1 hora depois do
início do funcionamento do equipamento.
c) Calcule a probabilidade de que a 1ª avaria não ocorra depois das primeiras 4h de
funcionamento.
d) Prove que a probabilidade de que equipamento dure mais de 10h sabendo que já
está a funcionar há 3h é igual à probabilidade de que o equipamento dure pelo
menos 7h.
39. Suponha que um dispositivo electrónico tem um tempo de vida X (em unidades de
1000 horas), que é uma v.a. exponencial de média igual a 1 unidade. Admita, ainda,
que o custo de fabrico de um desses dispositivos é igual a 200 € e que o fabricante o
vende por 500€, mas garante o reembolso total se a duração do dispositivo for
menor ou igual a 900 horas. Qual será o lucro que o fabricante espera obter por
dispositivo?
40. O tempo de execução de determinada tarefa é uma variável aleatória com
distribuição Normal, com µ = 72 minutos e σ = 12 minutos.
a) Calcule a probabilidade de que a tarefa:
i) Leve mais de 93 minutos a executar;
ii) Não demore mais de 65 minutos;
iii) Gaste entre 63 e 78 minutos;
b) Determine os valores de a e b tais que:
i) P(X > a) = 0,2525;
ii) P(X < b) = 0,0054.
41. Suponha que a sua nota numa frequência, em unidades padrão é igual a 0,87 e que
se admite que as notas eram normalmente distribuídas. Determine a percentagem de
alunos que se poderia esperar com notas inferiores à sua? E superiores?
42. Admita que uma empresa tem produção constante de 100 toneladas por mês. Sabe-
se que a procura é uma v. a. Normal com média µ = 80 toneladas e desvio-padrão σ
= 10 toneladas.
a) Determine a probabilidade de ocorrer procura excedentária.
b) Para reduzir a probabilidade de ocorrer procura excedentária para 0,0027, a
empresa deve aumentar a sua produção mensal em quantas toneladas.
43. Seja X uma variável aleatória com distribuição Normal de valor médio 10 e
variância 4, representando o comprimento de barras de ferro. Suponha que uma
barra é considerada não defeituosa se {8 ≤ X ≤ 12} e defeituosa em caso contrário.
a) Qual a probabilidade de que uma barra, escolhida ao acaso, do fabrico diário,
seja não defeituosa?
b) Qual a probabilidade de que em dez barras escolhidas aleatoriamente do fabrico
diário, pelo menos duas sejam defeituosas?
44. Admita que os responsáveis de uma determina empresa produtora de açúcar, face a
uma diminuição registada nas vendas do produto, encararam a hipótese de fechar
uma das suas sucursais. De acordo com estudos efectuados, para não encerrar a dita
sucursal, a empresa necessita que a procura semanal (7 dias) seja superior a 65.000
kg. Sabendo que a procura média diária de açúcar se distribui normalmente, com
média 10.000 kg e desvio-padrão 1.000 kg, determine a probabilidade da sucursal
encerrar.
45. A média de um exame final de uma determinada disciplina foi igual 14 e o desvio
padrão igual a 2. Determine a nota mínima que um estudante devia ter para ser
classificado entre os 10% com notas mais altas.
46. Admita que o diâmetro externo de um dado eixo segue uma distribuição normal com
média igual a 4cm e variância igual a 0.01 cm2. Admita, ainda, que de acordo com
as especificações estabelecidas, o diâmetro externo não deve diferir de 4cm por mais
de 0.05 cm. Caso contrário, o fabricante terá um prejuízo igual a 10€ se essa
diferença exceder 0.08 cm e igual a 5€ se essa diferença estiver compreendida entre
0.05cm e 0.08cm. Calcule o prejuízo médio do fabricante.
47. Joga-se uma moeda 1000 vezes ao ar. Determine a probabilidade de o número de
caras não diferir de 500 por mais de 50.
48. Suponha que, em determinadas eleições nacionais com apenas dois candidatos, o
candidato A obteve 60% dos votos. Calcule a probabilidade de, numa mesa de voto
considerada representativa do eleitorado, o candidato A ter tido um número de votos
compreendido entre 590 e 700 (ambos inclusive) num total de 1000 votos atribuídos
aos dois candidatos.
49. O número de defeitos por cada unidade de equipamento electrónico tem distribuição
de Poisson com média igual a 40. Determine a probabilidade de um equipamento
electrónico, escolhido ao acaso, ter entre 30 a 35 defeitos.
50. A produção de chocolate numa dada fábrica tem distribuição normal de valor médio
200 gramas e variância 25 gramas.
a) Calcule P(185 < X < 215).
b) Suponha que um defeito numa das máquinas provoca uma alteração na produção
de chocolates, deslocando a média para 215 gramas. Calcule a probabilidade
anterior.
c) Determine a variância do peso médio de 5 chocolates.
51. O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma
variável aleatória com distribuição normal de média igual a 10 horas e desvio
padrão igual a 2 horas.
a) Determine a probabilidade do gestor demorar entre 9 e 11 horas a avaliar um
determinado projecto.
b) Se ao gestor fosse pedido para prever o tempo necessário para avaliar um dado
projecto, de modo a que a probabilidade do estudo não estar concluído nesse
tempo apenas fosse igual a 0,025, que valor indicaria?
c) O gestor recebe uma compensação monetária sempre que termina a avaliação de
um projecto em menos de 8 horas. Admitindo que o gestor recebeu 7 projectos
distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos
2 projectos.
52. Suponha que a procura semanal, de uma determinada marca de óleo lubrificante,
numa dada estação de serviço, segue uma distribuição normal com valor médio 50
litros e desvio padrão 3 litros.
a) Calcule a probabilidade de numa determinada semana se consumirem entre 45
litros e 65 litros.
b) Comente, sem efectuar cálculos: “Se o stock no início de cada semana for
inferior a 50 litros, então em mais de metade das semanas haverá ruptura de
stock.”.
c) Qual deverá ser o stock de óleo no início de uma determinada semana, de modo
a que a probabilidade de haver ruptura de stock, nessa semana, seja igual a
0.015?
53. Suponha que o peso dos indivíduos de uma determinada população segue uma
distribuição normal de média 60 kg e desvio-padrão 10 kg e que tal população
utiliza um elevador público de tara máxima 300 kg para 4 pessoas.
a) Calcule a probabilidade do peso das 4 pessoas exceder a tara máxima.
b) Calcule a probabilidade do peso médio de 4 pessoas:
i) Exceder 60 kg.
ii) Estar compreendido entre 40 kg e 60 kg.
54. Suponha que o gasto médio em telefone, num conjunto numeroso de empresas do
mesmo ramo de actividade, foi de 12 000 contos/ano com um desvio-padrão de
2000 contos. Considerando 50 quaisquer dessas empresas, qual a probabilidade do
seu gasto médio anual ter sido superior a 12 300 contos?
55. Uma máquina é regulada para revestir uma peça com uma camada média de 3 mm
de espessura de determinada substância. O processo tem uma distribuição normal
com 1 mm de desvio padrão. Qual será a probabilidade de extrair uma amostra de 25
peças com uma média amostral superior a 3,4 mm ?
56. Numa multinacional, o responsável pela comercialização de um produto alimentar,
não sazonal e de procura rígida, apurou que as vendas semanais tinham média 8
toneladas e desvio padrão de 1 tonelada. Qual a probabilidade de ao fim de 60
semanas as vendas totalizarem pelo menos 470 toneladas?
57. Sabendo que 2% das peças produzidas por uma máquina são defeituosas, determine
a probabilidade de, numa remessa de 400 peças, haver:
a) 3%, ou mais, de peças defeituosas.
b) No máximo 2% de peças defeituosas
58. Admitindo que um em cada cinco alunos usa óculos, determine a probabilidade de
observar mais de 30% de alunos com óculos, numa amostra de dimensão 20 e numa
amostra de dimensão 100.
59. Num processo eleitoral, um determinado candidato obteve 45% dos votos.
Determine a probabilidade de, numa secção de voto ter havido uma maioria absoluta
de votos a favor desse candidato, sabendo que o número de votantes foi:
a) 200.
b) 1000.
60. Considere uma população normal, com média µ e desvio-padrão σ, e a seguinte
estatística 1 2X 2XT
2
+= , para amostras aleatórias de dimensão n = 2.
a) Determine a distribuição amostral de T e respectivos parâmetros.
b) Diga se T é um estimador centrado e consistente para µ.
61. Seja X1, X2,...,Xn uma amostra aleatória, com E[X] = µ e Var[X] = σ2. Mostre que o
enviesamento de ( )2
2 1=
−=∑
n
ii
n
X XS
n é dado por
2
−σ
n e que o enviesamento de
( )2
2 11 1
=−
−=
−
∑n
ii
n
X XS
n é nulo.
62. Seja X1, X2,...,Xn uma amostra proveniente de uma população X com função
densidade dada por 1
( ) ,0= < < θθ
f x x , θ real positivo. Mostre que o estimador
2=T X é centrado para o parâmetro θ.
63. Suponha que uma variável aleatória X representa o número de avarias de um
dispositivo durante um período de tempo e que obedece a uma lei de Poisson de
parâmetro λ desconhecido. Para este parâmetro foram sugeridos dois estimadores:
1 11 2
...ˆ ˆ e 2
+ + += =λ λn nX X X X
n
a) Classifique-os quanto ao enviesamento e consistência.
b) Qual dos dois estimadores é mais eficiente? Justifique a sua escolha.
64. Para o parâmetro θ de uma certa população foram indicados dois estimadores:
1 2ˆ ˆθ e θ . Diga qual preferiria, sabendo que k é uma constante e:
1
n 1ˆE θ θn
+ = 1
kˆVar θn
=
2
n 1ˆE θ θn
+ = 2
kˆVar θn 3
= +
65. Suponha que as despesas familiares de um determinado país é uma variável aleatória
com média µ e desvio padrão σ. Para conhecer o montante mensal médio das
despesas familiares, duas empresas de sondagens realizaram inquéritos, simultânea
mas independentemente. A empresa A inquiriu 3025 famílias enquanto a empresa B
inquiriu 1225. Pretendendo realizar o estudo com base na informação conjunta das
duas empresas, qual dos estimadores 3025 12251
X Xˆ
2
+=µ ou 2 4250ˆ X=µ escolheria?
Justifique.
66. Mostre que, se θ é um estimador consistente de θ, então kθ (k≠0) é um estimador
consistente de kθ.
67. Utilizando o método da Máxima Verosimilhança, determine o estimador para o
parâmetro p de uma população de Bernouli. Suponha que a v.a. X é usada para
indicar que uma peça de um determinado lote é ou não defeituosa e que p representa
a probabilidade de uma peça ser defeituosa.
a) Utilizando o método da Máxima Verosimilhança, determine o estimador para o
parâmetro p de uma população de Bernouli.
b) Sabendo que, ao inspeccionar 30 peças se verificou que 5 eram defeituosas,
determine a estimativa de p.
68. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição cuja função densidade
seja
( )1x ;0 x 1, 0
f x0; caso contrário
θ−θ < < θ>=
a) Determine, pelo método dos momentos, o estimador de θ.
b) Determine, pelo método de máxima verosimilhança, o estimador de θ.
69. Seja X uma variável aleatória com a seguinte função massa de probabilidade:
( )
1- , 0, 2, 4
31
| , 1, 3, 5 , com 03
0,
== = ≤ ≤
α
θ α α
x
f x x
outros valores de x
a) Determine, pelo método dos momentos, um estimador para o parâmetro α.
b) Verifique se o estimador encontrado é centrado e consistente.
c) Será melhor o estimador encontrado na alínea a) ou o estimador
1 4ˆ
6
+ −=α nX X
.
d) Considerando a amostra (1, 0, 5, 2, 3, 1, 0, 3, 4, 4, 5, 2) determine uma
estimativa para o parâmetro α pelo método da máxima verosimilhança.
70. O Presidente de um clube de futebol quer avaliar os custos de reparação das
bancadas do estádio na sequência dos distúrbios envolvendo claques em jogos de
risco. Para isso pede os valores das reparações incorridas nos últimos 10 jogos de
risco que se realizaram nesse estádio. Os dados obtidos (em 103 euros) foram:
137,9 176,8 825,3 231,7 275,8
312,1 243,0 143,6 205,3 176,1
Estime pontualmente o valor médio e a variância, admitindo que o modelo adequado
para este tipo de despesas é normal.
71. Encontre o estimador de máxima verosimilhança para o parâmetro λ, com λ > 0, de
uma população com distribuição exponencial.
72. Suponha que o peso dos indivíduos de uma determinada população segue uma
distribuição normal de média 60 kg e desvio-padrão 10 kg e que tal população
utiliza um elevador público de tara máxima 300 kg para 4 pessoas.
a) Calcule a probabilidade do peso das 4 pessoas exceder a tara máxima.
b) Calcule a probabilidade do peso médio de 4 pessoas:
i) Exceder 60 kg.
ii) Estar compreendido entre 40 kg e 60 kg.
73. Suponha que o gasto médio em telefone, num conjunto numeroso de empresas do
mesmo ramo de actividade, foi de 60 000 euros/ano com um desvio-padrão de
10000 euros. Considerando 50 quaisquer dessas empresas, qual a probabilidade do
seu gasto médio anual ter sido superior a 61 500 euros?
74. Uma máquina é regulada para revestir uma peça com uma camada média de 3 mm
de espessura de determinada substância. O processo tem uma distribuição normal
com um desvio padrão igual a 1 mm. Qual será a probabilidade de extrair uma
amostra de 25 peças com uma média amostral superior a 3,4 mm?
75. Numa multinacional, o responsável pela comercialização de um produto alimentar,
não sazonal e de procura rígida, apurou que as vendas semanais tinham média 8
toneladas e desvio padrão de 1 tonelada. Qual a probabilidade de ao fim de 60
semanas as vendas totalizarem pelo menos 470 toneladas?
76. Sabendo que 2% das peças produzidas por uma máquina são defeituosas, determine
a probabilidade de, numa remessa de 400 peças, haver:
a) 3%, ou mais, de peças defeituosas.
b) No máximo 2% de peças defeituosas
77. Admitindo que um em cada cinco alunos usa óculos, determine a probabilidade de
observar mais de 30% de alunos com óculos, numa amostra de dimensão 20 e numa
amostra de dimensão 100.
78. Num processo eleitoral, um determinado candidato obteve 45% dos votos.
Determine a probabilidade de numa secção de voto ter havido uma maioria absoluta
de votos a favor desse candidato, sabendo que o número de votantes foi:
a) 200.
b) 1000.
79. Considere uma população normal, com média µ e desvio-padrão σ, e a seguinte
estatística 1 2X 2XT
2
+= , para amostras aleatórias de dimensão n = 2.
a) Determine a distribuição amostral de T e respectivos parâmetros.
b) Diga se T é um estimador centrado e consistente para µ.
80. Seja X1, X2,...,Xn uma amostra aleatória, com E[X] = µ e Var[X] = σ2. Mostre que o
enviesamento de ( )2
2 1=
−=∑
n
ii
n
X XS
n é dado por
2
−σ
n e que o enviesamento de
( )2
2 11 1
=−
−=
−
∑n
ii
n
X XS
n é nulo.
81. Seja X1, X2,...,Xn uma amostra proveniente de uma população X com função
densidade dada por 1
( ) ,0= < < θθ
f x x , θ real positivo. Mostre que o estimador
2=T X é centrado para o parâmetro θ.
82. Suponha que uma variável aleatória X representa o número de avarias de um
dispositivo durante um período de tempo e que obedece a uma lei de Poisson de
parâmetro λ desconhecido. Para este parâmetro foram sugeridos dois estimadores:
1 11 2
...ˆ ˆ e 2
+ + += =λ λn nX X X X
n
a) Classifique-os quanto ao enviesamento e consistência.
b) Qual dos dois estimadores é mais eficiente? Justifique a sua escolha.
83. Para o parâmetro θ de uma certa população foram indicados dois estimadores:
1 2ˆ ˆθ e θ . Diga qual preferiria, sabendo que k é uma constante e que
1
n 1ˆE θ θn
+ =
2
n 1ˆE θ θn
+ =
1
kˆVar θn
=
2
kˆVar θn 3
= +
84. Suponha que as despesas familiares de um determinado país é uma variável aleatória
com média µ e desvio padrão σ. Para conhecer o montante mensal médio das
despesas familiares, duas empresas de sondagens realizaram inquéritos, simultânea
mas independentemente. A empresa A inquiriu 3025 famílias enquanto a empresa B
inquiriu 1225. Pretendendo realizar o estudo com base na informação conjunta das
duas empresas, qual dos estimadores 3025 12251
X Xˆ
2
+=µ ou 2 4250ˆ X=µ escolheria?
Justifique.
85. Mostre que, se θ é um estimador consistente de θ, então kθ (k≠0) é um estimador
consistente de kθ.
86. Suponha que a v.a. X é usada para indicar que uma peça de um determinado lote é
ou não defeituosa e que p representa a probabilidade de uma peça ser defeituosa.
a) Utilizando o método da Máxima Verosimilhança, determine o estimador para o
parâmetro p de uma população de Bernoulli.
b) Sabendo que ao inspeccionar 30 peças se verificou que 5 eram defeituosas,
determine a estimativa de p.
87. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição com função densidade
dada por
( )1x ;0 x 1, 0
f x0; caso contrário
θ−θ < < θ>=
a) Determine, pelo método dos momentos, o estimador de θ.
b) Determine, pelo método de máxima verosimilhança, o estimador de θ.
88. Seja X uma variável aleatória com a seguinte função massa de probabilidade:
( )
1- , 0, 2, 4
31
| , 1, 3, 5 , com 03
0,
== = ≤ ≤
α
θ α α
x
f x x
outros valores de x
a) Determine, pelo método dos momentos, um estimador para o parâmetro α.
b) Verifique se o estimador encontrado é centrado e consistente.
c) Será melhor o estimador encontrado na alínea a) ou o estimador
1 4ˆ
6
+ −=α nX X
.
d) Considerando a amostra (1, 0, 5, 2, 3, 1, 0, 3, 4, 4, 5, 2), determine uma
estimativa para o parâmetro α pelo método da máxima verosimilhança.
89. O Presidente de um clube de futebol quer avaliar os custos de reparação das
bancadas do estádio na sequência dos distúrbios envolvendo claques em jogos de
risco. Para isso pede os valores das reparações incorridas nos últimos 10 jogos de
risco que se realizaram nesse estádio. Os dados obtidos (em 103 euros) foram:
137,9 176,8 825,3 231,7 275,8
312,1 243,0 143,6 205,3 176,1
Estime pontualmente o valor médio e a variância, admitindo que o modelo adequado
para este tipo de despesas é normal.
90. Encontre o estimador de máxima verosimilhança para o parâmetro λ, com λ > 0, de
uma população com distribuição exponencial.
91. Numa multinacional, o responsável pela comercialização de um produto alimentar,
não sazonal e de procura rígida, apurou que as vendas semanais tinham distribuição
(aproximadamente) normal com média µ toneladas e desvio padrão 1 tonelada e que
ao fim da 30ª semana as vendas totalizaram 235 toneladas.
a) Obtenha um intervalo, com 90% de confiança, para a média µ das vendas
semanais.
b) Qual deve ser a dimensão da amostra para reduzir o erro de estimativa para 0,2?
92. Numa fábrica de computadores a administração pretende uma estimativa para o
tempo médio de vida de um determinado tipo de disco rígido. Para tal, foi
seleccionada uma amostra constituída por 15 computadores. Com base nesta
amostra obteve-se um tempo médio de vida igual a 27 350 horas. Supondo que o
tempo de vida segue uma distribuição normal com σ igual a 3000 horas, construa
um intervalo de confiança a 99% para o tempo médio de vida dos discos rígidos.
93. Com o objectivo de prever a produção de trigo duma certa região dividiu-se a
mesma em pequenos talhões, procedendo-se em seguida ao registo, ao acaso, da
produção de alguns desses talhões. Admita que a quantidade de trigo produzida por
talhão tem distribuição normal com desvio padrão igual a 60 Kg.
a) Determine o número mínimo de talhões que o experimentador deverá analisar se
desejar garantir, com uma confiança de pelo menos 95%, que a média da
amostra difira no máximo 30 Kg do verdadeiro valor da produção média por
talhão.
b) Qual o número mínimo de talhões que será necessário analisar se o nível de
confiança exigido for de 99%?
c) Acha que a hipótese de normalidade é essencial na resolução das alíneas a) e b)?
Justifique a resposta.
94. Um fabricante produz peças que obedecem a uma norma que especifica que o seu
diâmetro deve ser igual a 100 mm. Admita que os diâmetros das peças produzidas
são
N(µ, σ) e que uma amostra aleatória de 20 peças conduziu aos resultados seguintes:
( )20 20 2
1 1
1999,60 e 111,91= =
= − =∑ ∑i ii i
x x x
a) Construa um I. C. a 95% para o diâmetro médio das peças.
b) Construa um I. C. a 95% para a variância do diâmetro das peças.
95. Num determinado período pré eleitoral foi realizada uma sondagem com o objectivo
de analisar a popularidade de dois candidatos A e B num determinado distrito. Para
tal, foram inquiridas 780 pessoas residentes nesse distrito manifestando-se 55% dos
inquiridos a favor do candidato A.
a) Construa um intervalo de confiança a 90%, 95% e 99% para a percentagem de
pessoas do distrito que são a favor do candidato A. Comente as diferenças
obtidas para os três intervalos.
b) Suponha que a percentagem obtida resultou de uma amostra de 1020 pessoas.
Determine um intervalo de confiança a 95% para a percentagem de pessoas a
favor do candidato A. Comente o resultado obtido.
96. Admita que a direcção de determinada Universidade se dispõe a oferecer aos seus
3800 alunos a possibilidade de estes frequentarem aulas ao Sábado de manhã se a
procura para este horário for suficientemente alta. Determine a dimensão apropriada
da amostra de alunos a inquirir para que a amplitude do intervalo de confiança a
95% para a proporção de alunos com interesse por aquele horário não exceda 0.1?
97. Num estudo de mercado quantas pessoas devem ser inquiridas para, com 95% de
confiança, se cometer um erro de estimativa da verdadeira proporção de potenciais
clientes de um novo produto inferior a 3%? E para se cometer um erro de estimativa
inferior a 1%?
98. Considere uma amostra aleatória obtida no mercado de trabalho de uma grande
cidade, constituída por 2000 indivíduos. Das entrevistas efectuadas constatou-se que
165 pessoas responderam não ter emprego.
a) Construa um intervalo de confiança a 95% para a proporção média de indivíduos
desempregados na referida cidade.
b) Caso pretenda reduzir para metade a amplitude do intervalo relativo à alínea
anterior, mantendo o mesmo grau de confiança, qual a dimensão da amostra
adequada? Justifique a resposta.
99. Os empregados de uma determinada empresa deveriam trabalhar, em média, 8h
diárias. De forma a investigar se os empregados estão a trabalhar mais do que as
horas previstas, o sindicato registou o número de horas que 150 trabalhadores
(escolhidos ao acaso) trabalharam num dia qualquer, tendo obtido os seguintes
resultados:
150
1
1498 =
=∑ ii
x ( )2150
1
600=
− =∑ ii
x x
a) Teste ao nível de significância de 5%, se a empresa deverá ser punida por exigir
que os seus empregados trabalhem mais do que deviam.
b) Qual o tipo de erro que pode cometer relativamente à decisão que tomou?
100. Numa determinada empresa pensa-se importar um grande lote de instrumentos
de precisão, para os quais o fabricante garante um peso médio igual a 100 gr. Sendo
o peso uma característica importante para a qualidade do produto, resolveu-se testar
a veracidade da afirmação do fabricante. Para tal, o departamento técnico da
empresa importadora obteve uma amostra de 15 instrumentos, através da qual se
obtiveram os seguintes valores:
15
1
1407 =
=∑ ii
x e ( )15
2
1
1674 =
− =∑ ii
x x
Admitindo a normalidade dos pesos, qual a sua opinião, ao nível de significância de
1%, relativamente à afirmação do fabricante.
101. Suponha que um comerciante recebeu uma remessa de ovos com a garantia de
serem da classe A, isto é, ovos cujo peso segue uma distribuição normal de média
igual a 55gr e desvio padrão igual a 8gr. Como o fornecedor só lhe concede 2 dias
para reclamar, resolve pesar 10 ovos e escolhe para nível de significância 5%.
a) Admitindo que o peso médio dos 10 ovos é igual a 57 gr, qual a decisão que ele
deve tomar?
b) Calcule a probabilidade do erro de 2ª espécie, caso o verdadeiro peso médio dos
ovos seja igual a 50gr.
c) Pretendendo um erro de 2ª espécie β inferior a 10%, mantendo α = 5%, qual
deverá ser o número de ovos que o comerciante deve pesar?
102. Suponha que a média dos volumes de leite de 16 embalagens retiradas
aleatoriamente da linha de produção é igual a 997ml.
a) Admitindo que o desvio padrão da população, considerada normal, é igual a
5ml, teste, ao nível de 5%, a hipótese do volume médio de todos os pacotes de
leite ser igual a 1 litro.
b) Admitindo que a média da população é igual a 998ml, calcule a probabilidade de
aceitar a hipótese testada na alínea anterior.
103. Suponha que, numa determinada produção, o peso de sacos de café é
normalmente distribuído com desvio padrão 10 gramas. Admita, ainda, que a
máquina de enchimento está regulada para sacos de 500 gramas. Nestas condições,
para aferir o funcionamento da máquina analisou-se uma amostra de 9 sacos
aleatoriamente retirados da produção e definiu-se que se rejeitava a hipótese de bom
funcionamento da máquina se X > 510 gramas.
a) Calcule a probabilidade de cometer um erro de 1ª espécie.
b) Se o verdadeiro peso médio dos sacos for igual a 505 gramas, calcule a
probabilidade de aceitar a hipótese de bom funcionamento.
c) Admitindo que o peso médio de todos os sacos é igual a 505 gramas, qual
deverá ser o tamanho da amostra a retirar da população se pretender cometer um
erro de 2ª espécie inferior a 15%, mantendo o mesmo erro de 1ª espécie?
104. Suponha que determinado canal de televisão deseja saber qual tinha sido a
percentagem de pessoas que viram determinado programa. Para tal, realizou uma
sondagem tendo sido inquiridas 220 pessoas, das quais 132 disseram ter visto o
referido programa.
a) Determine um intervalo de confiança de nível 95% para percentagem de pessoas
em toda a população que viu esse programa.
b) Qual deveria ser o número de pessoas inquiridas para se obter um intervalo de
confiança de nível 95% com metade da amplitude do anterior? (Admita que a
proporção das pessoas que viram o programa se mantém.)
c) Poder-se-á afirmar, ao nível de 5%, que mais de metade das pessoas viram o
programa?
105. Determinada marca de óleo para carros afirma que o seu óleo é conhecido por
durar, em média, 5000 km com uma variância igual a 250 000 km2. Admitindo que
o tempo de duração segue uma distribuição normal, teste a afirmação quanto à
variância, a um nível de significância 5%, com base nos seguintes valores do
número de quilómetros que 6 automóveis fizeram antes do óleo se queimar:
5020 6000 4500 5700 5500 4900
106. O administrador de um Hospital pretende estimar as contas em aberto (ainda não
cobradas), referentes a tratamentos e internamentos. Admita que o montante de cada
dívida segue uma distribuição normal e que a experiência de anos anteriores permite
considerar um valor para o desvio padrão igual a 50 euros. Para levar a cabo o seu
objectivo, o administrador seleccionou aleatoriamente 25 dessas contas e avaliou o
seu valor, tendo obtido um total em dívida igual a 1850 euros.
a) Determine um intervalo de confiança a 95% para o montante médio de cada
conta não saldada.
b) Poderá afirmar estatisticamente, ao nível de 1%, que o valor médio de cada
conta não saldada é inferior a 100 euros? Que erro pode estar a cometer com a
sua decisão?
c) Admitindo que o verdadeiro valor médio de cada conta não saldada é igual a 85
euros, calcule a probabilidade de cometer um erro de 2ª espécie.
d) Um valor do desvio padrão amostral, obtido com base nas 25 contas, igual a 60
euros, poderá pôr em causa, ao nível de 10%, o valor de σ considerado
anteriormente?
107. Admita que a direcção comercial de uma determinada empresa pretende lançar
um novo serviço de telecomunicações. De acordo com critérios empresariais, o
serviço só deverá ser lançado no mercado se houver mais de 80% de potenciais
compradores. Assim, para averiguar o eventual lançamento do serviço, a empresa
decidiu efectuar um inquérito a 400 grandes clientes, tendo 340 sido favoráveis à
aquisição do novo serviço.
a) Para um nível significância de 5%, poder-se-á concluir que a empresa
opta pelo lançamento do serviço? E para um nível de significância de
1%?
b) Determine o valor p do teste e interprete-o.
108. As vendas diárias de dois estabelecimentos A e B de certa cadeia são aleatórias.
Suponha que eram conhecidos os seguintes parâmetros:
6250 €; 900 €
7000 €; 750 €A A
B A
µ σ
µ σ
= =
= =
Nestas condições, qual a probabilidade de, em 2 meses de actividade (60 dias), a
média diária de vendas no estabelecimento A se revelar superior à do
estabelecimento B.
109. A esperança média de vida de pessoas do norte de Portugal é igual a 79,5 anos e
a das pessoas do sul é igual a 77,4 anos. Qual a probabilidade de que a diferença das
médias das amostras, às quais correspondem as características abaixo indicadas,
esteja entre –1 e 1?
Região Dimensão da amostra Desvio padrão
Norte 80 SN=5,8
Sul 100 Ss=6,5
110. Admita que uma determinada empresa se dividiu em duas sub-empresas, a B1 e
a B2, tendo colocado à disposição dos subscritores acções, de cada uma dessas
novas empresas, com cotações médias de 5,3 e 6,2 euros e desvio padrão de 3,1 e
2,1 euros, respectivamente.
a) Qual a probabilidade de em 16 dias, a diferença entre as cotações das acções
médias amostrais ser superior a 1 euro? Assuma que as populações são normais.
b) Qual a probabilidade de se obterem em 16 dias consecutivos um quociente dos
desvio padrões amostrais das cotações observadas de B1 e B2 superior a 1 euro?
111. Os pneus da marca P1 andam em média 105,6 (× 1000 km) antes de ficarem
“carecas” e os da marca P2 andam em média 178,5 (× 1000 km) antes de lhes
acontecer o mesmo. Admita que em duas amostras, de dimensão 9 cada, analisando
a distância percorrida com cada pneu até ao desgaste, se obtiveram os desvios-
padrão amostrais iguais a 10,97 e 11,75, para os pneus P1 e P2, respectivamente.
Calcule a probabilidade dos pneus da marca P1 terem percorrido, em média, mais
quilómetros. Admita a normalidade das populações e a igualdade das variâncias
112. O mercado accionista português apresentou estar mais volátil (maior
variabilidade) no ano de 1998 do que no de 1997. Para estudar esta situação,
seleccionaram-se aleatoriamente os valores de fecho do índice PSI-20 (Índice da
Bolsa de Derivados do Porto) para 31 dias de cada um destes anos, tendo sido
obtidos os seguintes valores:
31
,19971
225 180,84=
=∑ ii
x ( )31
2
,1997 19971
34 894 685,79=
− =∑ ii
x x
31
,19981
348 281,9=
=∑ ii
x ( )31
2
,1998 19981
68 483 7000=
− =∑ ii
x x
a) Obtenha um intervalo de confiança a 95% e 99% para a variância de cada um
dos anos.
b) Obtenha um intervalo de confiança a 95% para a razão de variâncias e comente
o resultado obtido.
113. Admita que o gerente de um banco está interessado em analisar a diferença entre
os valores esperados dos saldos das contas à ordem de duas das suas agências. Para
tal, de cada uma delas recolheu uma amostra aleatória de saldos, tendo-se registado
os seguintes resultados:
Agência Dimensão
da amostra
Média
amostral
Desvio-padrão
amostral
A 17 240 euros 13,50 euros
B 13 225 euros 12,05 euros
Admitindo a normalidade dos dados, calcule um intervalo de confiança a 90% e outro a
95% para a diferença entre os saldos médios das contas à ordem das agências A e B.
Admita os pressupostos necessários.
114. Para comparar a eficiência de dois métodos de ensino, uma turma de 24 alunos
foi dividida aleatoriamente em dois grupos, sendo aplicado um método diferente a
cada grupo. Os resultados no fim do semestre, numa escala de 0 a 100, foram os
seguintes:
Grupos Tamanho Amostra Média Variância I 13 74,5 82,6 II 11 71,8 112,6
Assumindo que as populações são normais e com variâncias iguais e desconhecidas,
obtenha um intervalo de confiança a 95% para a diferença entre os valores
esperados das duas populações. Comente.
115. Admita que uma amostra aleatória de 400 domicílios de uma determinada cidade
revelou que 8% destes são casas de aluguer, enquanto que, numa outra cidade, uma
amostra de 270 domicílios revelou que 37 eram casas de aluguer.
a) Construa um intervalo de confiança de nível 99% para a percentagem de casas
de aluguer em cada cidade.
b) Suponha que os intervalos de confiança, obtidos na alínea anterior, sejam
considerados pouco precisos. Qual deverá ser o tamanho das amostras para que
o erro de estimativa não exceda 2%?
c) Poderá afirmar estatisticamente, ao nível de 5%, que há maior percentagem de
casas de aluguer em alguma das duas cidades? Justifique.
116. As pilhas Duramais e Duramuito custam o mesmo preço. De forma a testar se
ambas têm a mesma duração, recolheram-se duas amostras de 100 pilhas de cada
marca, tendo-se obtido os seguintes resultados:
Marca Dimensão
da amostra Média Desvio-padrão
Duramais 100 1180 120
Duramuito 100 1160 40
Que pode concluir a um nível de significância de 5%? E a 1%?
117. Suponha que as produções médias de tecido (em gramas) de dois teares de uma
fábrica se podem considerar normais. Admita, ainda que numa experiência
efectuada com o objectivo de comparar esses dois teares, em termos das suas
produções médias, e obtiveram os seguintes resultados:
8 82 2
1 1
9 92 2
1 1
Tear 1: 80,8 gr 816,664 gr
Tear 2: 96,3 gr 1030,959 gr
= =
= =
= =
= =
∑ ∑
∑ ∑
i ii i
i ii i
x x
y y
a) Ao nível de significância de 5%, teste a igualdade de variância dos teares.
b) Compare, ao nível de significância de 1%, as produções médias dos dois teares.
Admita os pressupostos necessários.
118. Uma repartição de finanças tem dois funcionários a receber declarações de IRS,
o Sr. Vagaroso e o Sr. Caracol. Na semana passada foi destacado um novo Director
para esta repartição. Este, para ter uma ideia do tipo de atendimento ao público
realizado pelos seus funcionários, resolveu consultar o livro amarelo das
reclamações, onde verificou que grande parte das queixas apresentadas eram
respeitantes ao atendimento demasiado moroso do Sr. Vagaroso, especialmente
quando comparado com o tempo de atendimento do Sr. Caracol. Para testar a
veracidade destas afirmações, o director resolveu recolher uma amostra sobre o
tempo de atendimento, em minutos, despendido por cada um destes funcionários
com cada utente. Os resultados amostrais obtidos foram os seguintes:
Funcionário ni ix 'is
Sr. Caracol 16 22 20
Sr. Vagaroso 21 29 12
a) Teste a hipótese de igualdade das variâncias populacionais (considere α = 1%).
b) Supondo que os tempos de atendimento de cada um dos funcionários seguem
uma distribuição normal, construa um intervalo de confiança a 99% para a
diferença entre os tempos médios de atendimento dos dois funcionários.
Comente os resultados a que chegou.
c) Supondo que os tempos de atendimento de cada um dos funcionários seguem
uma distribuição normal, decida se o director deve ou não concordar com as
queixas dos utentes, ao nível de significância de 5%.
d) Teste a hipótese da variância do tempo de atendimento do Sr. Caracol ser igual a
350, ao nível de significância de 1%.
119. Suponha que uma determinada empresa de cigarros enviou para um laboratório
amostras de tabaco tratado por dois processo diferentes, tendo sido obtidos os
seguintes resultados para cinco medições do conteúdo de nicotina, por mg:
Processo A 24 27 26 21 24
Processo B 27 28 23 31 26
Admitindo que os conteúdos de nicotina, por mg, seguem distribuições normais com
desvios padrões iguais a 2 para o processo A e a 2.5 para o processo B, que pode
concluir ao nível de 5%? E ao nível de 1%?
120. Um analista financeiro pretende comparar as rendibilidades de dois activos
financeiros X e Y. Admitindo que as rendibilidades seguem uma distribuição
normal com desvios padrões iguais a 0.7 e 0.5 respectivamente, que poderá concluir,
ao nível de 5%, se numa amostra de dimensão 50 a rendibilidade média de X foi
igual a 0.8 e a de Y igual a 0.6?
121. Uma revista de desporto afirma que as pessoas que assistem aos jogos de futebol
transmitidos na TV são em igual número homens e mulheres. De forma a testar tal
afirmação, recolheu-se uma amostra aleatória de 400 pessoas que assistem a
transmissões futebolísticas na TV, das quais se verificou que 220 eram homens.
a) Que concluir acerca da notícia da revista, a um nível de significância de 10%? E
a 5%?
b) Determine o valor do limiar de significância associado ao teste anterior.
104.
a) 6.341 0.1= +⌢y x
b) Para testar a significância do modelo, testamos as hipóteses 0 2
1 2
: 0
: 0
= ≠
β
β
H
H.
Como ( ) ( )95% 2IC 0,059;0,141β = , rejeita-se H0 ao nível de 5%.
c) R2 = 0.699
d) ( ) ( )95% ˆIC y 4,98;57,70 .=
105.
a) 17,776 2,246y x= +⌢
b) Pretendemos testar as hipóteses0 2 1 2: 0 vs : 0= >H Hβ β . O valor de prova
associado é p=0, logo rejeita-se sempre a hipótese H0.
c) R2 = 0,854
d) 15 horas.
106.
a) ˆ 11,964 12,917y x=− +
b) 190 km
c) ( ) ( )95% 1 2IC 6,448;7,448µ −µ = −
107.
a) ( )32,96 1,42x
y=⌢ e r = 0.9997
b) Não, porque para o ajustamento de 20,6 44,171y x=− +⌢, obtém-se R2 = 0,9298.
c) 544,87.
108.
a) γ = 1,40 e C = 1,60×104.
b) R2 = 0,9972 e r = 0,9986.
c) 25,36.
109.
0
1
:
: , , , :
= = ∃ = ≠
A B C
i j
H p p p
H i j A B C p p
Como 2 6,0χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,996,0 9,21χ χ= < = .
110.
( )0
1
: 0.2
:
∩
∩
H X P
H X ( )0.2
P
Como 2 4,94χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,994,94 9,21χ χ= < = .
111.
Estimando o parâmetro da distribuição exponencial pelo método da máxima verosimilhança, queremos testar:
( )0
1
: 0.2
:
∩
∩
H X Exp
H X ( )xp 0.2
E
Como 2 2,65χ = , não se rejeita H0 ao nível de 5%, pois2 23;0,952,65 7,81χ χ= < = .
112.
Estimando a média e a o desvio padrão através de estimadores centrados, queremos testar:
( )0
1
: 11.73;3.60
:
∩
∩
H X N
H X ( )11.73;3.60
N
Como ( )max{ , } 0,1628 0,05 0,319+ −= = < =tabD d d D , não se rejeita H0 ao nível de
5%. 113.
( )0
1
: 55;8
:
∩
∩
H X N
H X ( )55;8
N
Como ( )max{ , } 0,3530 0,01 0,489tabD d d D+ −= = < = , não se rejeita H0 ao nível de
1%. 114.
Estimando a média e a o desvio padrão através de estimadores de máxima verosimilhança, queremos testar:
( )0
1
: 5.375;5.57
:
∩
∩
H X N
H X ( )5.375;5.57
N
Como 2 1026,8χ = , rejeita-se H0 ao nível de 5%, pois2 23;0,951026,8 7,81χ χ= > = .
115.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2,3,4, 1,2,3
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 19,34χ = , rejeita-se H0 ao nível de 1%, pois2 26;0,9919,38 16,8χ χ= > = .
116.
Estimando o parâmetro da distribuição Poisson pelo método da máxima verosimilhança, queremos testar:
( )0
1
: 3.52
:
∩
∩
H X P
H X ( )3.52
P
Como 2 4,32χ = , não se rejeita H0 ao nível de 5%, pois2 24;0,954,32 9,49χ χ= < = .
117.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2,3, 1,2.
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 3,61χ = , logo não se rejeita H0 ao nível de 5%, pois 2 22;0,953,61 5,99χ χ= < = e
p-value =0,179 > α=0,05. 118.
A hipótese a testar é:0 1 2 3: 0,10; 0,40; 0,50H p p p= = =
Como 2 134=χ , rejeita-se H0 ao nível de 5%.
119.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2, 1,2,3,4
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 4,69χ = , rejeita-se H0 ao nível de significância de 1%.
120.
b) As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2, 1,2,3
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 152,22χ = , rejeita-se H0 ao nível de significância de 5%.
121.
As hipóteses a testar são ( )0
1
: 152.17,28.72
:
∩
∩
H X N
H X ( )152.17,28.72
N.
Pelo valor de prova p=0,985, concluímos que não se rejeita a H0 aos níveis usuais de
significância.
1. c) média=13,1 , mediana=14, moda = 14 d) 1º quartil = 11, 2º quartil = 14, 3ºquartil = 15 e) variância = 8,52, desvio padrão = 2,918 f) coeficiente variação = 22,27% g) g = -0,308, distribuição assimétrica negativa h) k = 0,235,< 0,263 distribuição leptocúrtica. 2. b) média = 2,23, mediana = 2, moda = 1, desvio padrão = 1,407 d) 1º quartil = 1, 2º quartil = 2, 3º quartil = 3 f) g = 0,874, distribuição assimétrica positiva. k = 0,333>0,263, distribuição platicútica 3. b) desvio padrão = 18,89 c) mediana = 37,14 3º quartil = 52,11 5º percentil = 11,44 d) coeficiente de variação = 47,57% e) 3º momento = 3136,53 4º momento = 312890,36 f) i) verdadeiro ii) verdadeito h) G = 0,222 4. b) mediana = 11,5 c) i) F ii) V d) 58% 5. a) 12,5 b) V 6. b) F
7.
a) 0,348 b) 0,048 c) 0,652 d) 0,167
8.
a) 2/5 b) 2/5 c) 4/25 d) 6/25 e) i) 2/5
ii) 2/5 iii) 1/10
iv) 3/10 9.
a) 0,4 b) 0,5
10. 1/3 12.
a) 0,12 b) 0,511
13. a) 0,20 b) 0,20
14. a) 0,70 b) 0,27
15. a) ( )
1/8;x 0
3/8;x 1
P X x 3/8;x 2
1/8;x 3
0;c.c.
= == = = =
c) 1,5
d) P(X ≤1) = 1/2.
e) ( ) ( )
0; x 0
1/8; 0 x 1
F x P X x 4/8; 1 x 2
7 /8; 2 x 3
1; x 3.
< ≤ <= ≤ = ≤ < ≤ < ≥
f) 0,87
16. a) ( )
0,9989;x 0
0,0010;x 5000P X x
0,0001;x 50000
0;c.c.
= == = =
b) 10 euros 17. –0,59 € 18. a) 0,4
b) ( ) ( )
0,1;x 1
0,3;x 2f x P X x
0,5;x 3
0,1;x 4.
= == = = = =
c) E[X] = 2,6; Var[X] = 0,64 d) E[2X] = 5,2; Var[3X] = 5,76
19. a) P(X ≤ 1) = 0,66
b) P(X > 3) = 0,05 c) 1,12 d) 1,202
20. a)
X\Y 0 1 0 0,7 0 1 0 0,2 2 0,1 0
b) ( )0,8;y 0
P Y y 0,2;x 1
0;c.c..
== = =
c) P(X=2 | Y=0) = 0,125 21. a) 0,1
b) Sim, porque as variáveis não são independentes. c) E[Y] = 1,1; Var[Y] = 0,49 d) 7,99
22. a) Sim, porque as variáveis não são independentes.
b) E[X] = 3,49; E[Y] = 1,85 c) E[X | Y=2] = 3,26; E[X | Y=4] = 4
23. a) 0,254 b) 0,733 24. 0,377 25. a) 0,132 b) 0,790 c) 0,165
26. a) ( ) k n k4P X k 0,9 0,1 ;k 0,1,2,3,4
k−
= = =
b) 0,3439 c) 0,9999 27. a) 0,093 b) 0,614 c) 6,67 28 a) 0,983 b) 0,017
c) 0,966 d) i) 0,983 ii) 0,934 iii) 58,8 29. a) 0,929 b) 0,950 30. a) 0,057 b) 0,809 31. a) 0,996 b) 0,607 32. a) 0,143 b) 2 c) 1,78 d) 0,22 33. 0,063
34. b) ( )
0;x 0
xF x ;0 x 3
31;x 3
≤= < < ≥
c) 2/3 d) E[X] = 1,5; Var[X] = 0,75
35. a) ( )2
0;x 0
x xF x ;0 x 3
12 121;x 3
<= + ≤ ≤ >
E[X] = 15/8 Mediana = 2
b) 2,63 c) ( ) ( )P X 2 1/ 2; P 1 X 2 1/3≥ = ≤ ≤ =
d) Var[X] = 39/64 36. a) 1/8
b) E[Y] = 17/6 c) Mediana X = 0,764
d) Não, porque f(x,y) ≠ f(x)f(y)
37. a) 1/96
b) 15/384 c) 21/384
d) ( )2
0;x 0
xF x ;0 x 4
161;x 3
≤= < < ≥
e) ( )2
0;x 1
y 1F y ;1 y 5
24 241;x 5
≤= − < < ≥
f) E[X] = 8/3; E[Y] = 31/9; E[XY] = 248/27. Sim, são independentes pois E[XY] = E[X]E[Y]
38. a) ( )5, 0.85 x 1.05
f x0, c.c
≤ ≤=
b) 0,75
39. a) ( ) ( )0,5t
-0,5t
0, t 05e , t 0f x ; F t
0, t<0 1-e , t>0
− ≤ ≥ = =
b) 0,6065 c) 0,8647 d) 0,0302 40. 3.28 euros. 41. a) i) 0,0401 ii) 0,2810 iii) 0,4649 b) i) a = 79,98 ii) b = 41,40 42. 80,78% com notas inferiores e 19,22% com notas superiores. 43. a) 0,0228 b) Deve aumentar em 7,8 toneladas. 44. a) 0,6826 b) 0,8759 45. 0,0294 46. 16,56 47. 5.20 euros 48. 0,9986 49. 0,7517 50. 0,1904
51. a) 0,9974 b) 0,5 c) 5 52. a) 0,383 b) 13h55m c) 0,31 53. a) 0,95 b) Verdadeira c) 56,51
54. a) P4
1
300=
> ∑ ii
X =0,0013
b) i) ( )60P X > =0,5
ii) ( )40 60P X≤ ≤ =0,5 55. ( )12300P X > =0,1446 56. ( )3,4P X > =0,0228
57. 60
1
470=
≥ ∑ ii
P X =0,9015
58. a) ( )ˆ 0,03≥P p =0,1056
b) ( )ˆ 0,02≤P p =0,5714 59. Caso n=20, ( )ˆ 0,3>P p =0,0808
Caso n=100, ( )ˆ 0,3>P p =0,0043 60. a) ( )ˆ 0,5>P p =0,0681
b) ( )ˆ 0,5>P p =0,0004
61. a) 3 5
,2 2
T N µ σ
∩
b) Como [ ] 3
2E T µ= , T não é um estimador centrado nem consistente.
62. 2 2 2 21
11 e n nE S E S
nσ σ−
= − = , logo 2
nS não é centrado, mas 2 1nS − é centrado.
63. [ ]E T θ= , logo T é centrado para θ.
64. a) 1λ⌢
é um estimador centrado e consistente
2λ⌢
é um estimador centrado, mas não é consistente
b) 1λ⌢
é mais eficiente do que 2λ⌢
.
65. O estimador 2θ⌢
é preferível pois é mais eficiente do que1
⌢θ .
66. O estimador 2µ por ser mais eficiente que o estimador 1µ . 68. a) ˆ =p X b) ˆ 1/ 6=p 69. Para a função 1f (x) x , 0 x 1, 0θ−= θ < < θ > , tem-se:
a) 1
=−
⌢ X
Xθ
b)
( )1
ln=
= −∑
⌢
n
ii
n
xθ
70. a) 1
2
3
Xα −=⌢
c) O melhor estimador é 1α⌢ , pois é mais eficiente do que 2
⌢α .
d) 1 1/ 6α =⌢
71. Tem-se:
( ) ( )( )
n2
i2i 1
1n x22 2 2L , | x 2 .e =
− −µ− σ ∑µ σ = πσ
( ) ( ) ( )n
22 2i2
i 1
1 1ln L , | x n ln 2 ln x
2 2 =
µ σ = − π + σ − − µ σ ∑
( )
( )
n
ii 1
2
n2
ii 1
2 2 4
xd ln L
d
xd ln L n
d 2 2
=
=
− µ=
µ σ − µ
= − + σ σ σ
∑
∑
Consequentemente, ( )22 2272,76 e 187,27= = = =⌢ ⌢X Sµ σ
72. 1
Xλ =⌢
73. a) (7,53; 8,13) b) n ≥ 68 74. (25354,64; 29345,36)
75. a) n ≥ 16 b) n ≥ 27 c) Sim, porque em ambas a dimensão da amostra é inferior a 30. 76. a) (98,84; 101,12) b) (3,40; 12,56) 77.
a)
( )( )( )
90%
95%
99%
(0,521;0,579)
(0,515;0,585)
(0,504;0,596)
=
=
=
IC p
IC p
IC p
b) (0,519; 0,581) 78. n ≥ 385 79. Para 3% vem n ≥ 1068; para 1% vem n ≥ 9604 80. a) (0,07; 0,09) b) Para reduzir a amplitude para 0,01: Se p for conhecido e igual a 0,0825, n ≥ 11632
Se p não for conhecido toma-se p =0,5, vindo n ≥ 38416
81. a) 0
1
: 8
: 8
H
H
µ
µ
= >
Como T=12,13 rejeita-se H0 ao nível de 5%. b) Erro do tipo I.
82. 0
1
: 100
: 100
H
H
µ
µ
= ≠
Como T= -2,20 não se rejeita H0 ao nível de 1%.
83. a) 0
1
: 55
: 55
H
H
µ
µ
= ≠
Como Z= 0,79 não se rejeita H0 ao nível de 5%. b) β=P(Erro Tipo II) = 0,492. c) n ≥27
84. a) 0
1
: 1000
: 1000
H
H
µ
µ
= ≠
Como Z= -2,4 rejeita-se H0 ao nível de 5%. b) β=P(Erro Tipo II) = 0,6406
85. a) α=P(erro Tipo I) = 0,0013 b) β=P(erro Tipo II) = 0,9332 c) n ≥ 66. 86. a) (0,535: 0,665) b) n ≥ 873
c) 0
1
: 0,5
: 0,5
= >
H p
H p
Como Z= 2,97 rejeita-se H0 ao nível de 5%.
87. 2
0
21
: 250000
: 250000
= ≠
H
H
σ
σ
Como χ2= 6,25 não se rejeita H0 ao nível de 5%. 88. a) ( ) ( )95% 54,4;93,6=µIC
b) Erro do tipo I. c) 0,7967
d) 2
0
21
H : 2500
H : 2500
= ≠
σ
σ
Como 2 34.56Χ = , não se rejeita H0 ao nível de 10%.
89.
a) 0
1
H : p 0.8
H : p 0.8
= >
Como Z 2.5= , rejeita-se H0 ao nível de 5% e ao nível de 1%. b) p = 0,0062.
90. ( )0A BP X X− > =0 91. ( )1 21 1P X X− ≤ − ≤ =0,1185 92. a) ( )1 2 1P X X− > =0,0212
b) ( )1 2/ 1P S S > =0,9244 93. ( )1 2 0P X X− > =0 94.
a)
( )( )( )( )
295% 1997
299% 1997
295% 1998
299% 1998
(742440,1; 2077064,6)
(649807,9; 2528600,4)
(14571000,0; 40764107,1)
(12753016,8; 49625869,6)
=
=
=
=
IC
IC
IC
IC
σ
σ
σ
σ
b) (9,48; 40,63)
95. ( )( )
90% 1 2
95% 1 2
(6,92;23,08)
(5,27;24,73)
− =
− =
IC
IC
µ µ
µ µ
96. (-5,64; 11,04) 97.
a) ( ) ( )( ) ( )
99% 1
99% 2
0,045;0,115
0,083;0,191
=
=
IC p
IC p
b) 1
2
1221
1962
≥
≥
n
n
c) 0 1 2
1 1 2
: 0
: 0
− = − ≠
H p p
H p p
Como Z= -2,29 rejeita-se H0 ao nível de 5%.
98. 0 1 2
1 1 2
: 0
: 0
− = − ≠
H
H
µ µ
µ µ
Como Z= 1,58 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%.
99. a) 2 2
0 1 2
2 21 1 2
H :
H :
= ≠
σ σ
σ σ
Como F=1,20 não se rejeita H0 ao nível de 5%.
b) 0 1 2
1 1 2
: 0
: 0
− = − ≠
H
H
µ µ
µ µ
Como T=-4,49 rejeita-se H0 ao nível de 1%.
100. a) 2 2
0 1 2
2 21 1 2
H :
H :
= ≠
σ σ
σ σ
Como F=2,78 não se rejeita H0 ao nível de 1% b) (-21,42; 7,42)
c) 0 1 2
1 1 2
: 0
: 0
− = − <
H
H
µ µ
µ µ
Como T= -1,32 não se rejeita H0 ao nível de 5%.
d) 2
0 1
21 1
: 350
: 350
= ≠
H
H
σ
σ
Como χ2= 17,14 não se rejeita H0 ao nível de 1%.
101. 0
1
: 0
: 0
− = − ≠
A B
A B
H
H
µ µ
µ µ
Como Z= -1,82 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%.
102. 0
1
: 0
: 0
− = − ≠
X Y
X Y
H
H
µ µ
µ µ
Como Z= 1,64 não se rejeita H0 ao nível de 5%. 103.
a) 0 1 2
1 1 2
: 0
: 0
− = − ≠
H p p
H p pou 0
1
: 0,5
: 0,5
= ≠
H p
H p
Como Z=2 rejeita-se H0 ao nível de 5%. b) valor-prova = p = 0,0456.
104.
a) 6.341 0.1= +⌢y x
b) Para testar a significância do modelo, testamos as hipóteses 0 2
1 2
: 0
: 0
= ≠
β
β
H
H.
Como ( ) ( )95% 2IC 0,059;0,141β = , rejeita-se H0 ao nível de 5%.
c) R2 = 0.699
d) ( ) ( )95% ˆIC y 4,98;57,70 .=
105.
a) 17,776 2,246y x= +⌢
b) Pretendemos testar as hipóteses0 2 1 2: 0 vs : 0= >H Hβ β . O valor de prova
associado é p=0, logo rejeita-se sempre a hipótese H0.
c) R2 = 0,854
d) 15 horas.
106.
a) ˆ 11,964 12,917y x=− +
b) 190 km
c) ( ) ( )95% 1 2IC 6,448;7,448µ −µ = −
107.
a) ( )32,96 1,42x
y=⌢ e r = 0.9997
b) Não, porque para o ajustamento de 20,6 44,171y x=− +⌢, obtém-se R2 = 0,9298.
c) 544,87.
108.
a) γ = 1,40 e C = 1,60×104.
b) R2 = 0,9972 e r = 0,9986.
c) 25,36.
109.
0
1
:
: , , , :
= = ∃ = ≠
A B C
i j
H p p p
H i j A B C p p
Como 2 6,0χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,996,0 9,21χ χ= < = .
110.
( )0
1
: 0.2
:
∩
∩
H X P
H X ( )0.2
P
Como 2 4,94χ = , não se rejeita H0 ao nível de 1%, pois2 22;0,994,94 9,21χ χ= < = .
111.
Estimando o parâmetro da distribuição exponencial pelo método da máxima verosimilhança, queremos testar:
( )0
1
: 0.2
:
∩
∩
H X Exp
H X ( )xp 0.2
E
Como 2 2,65χ = , não se rejeita H0 ao nível de 5%, pois2 23;0,952,65 7,81χ χ= < = .
112.
Estimando a média e a o desvio padrão através de estimadores centrados, queremos testar:
( )0
1
: 11.73;3.60
:
∩
∩
H X N
H X ( )11.73;3.60
N
Como ( )max{ , } 0,1628 0,05 0,319+ −= = < =tabD d d D , não se rejeita H0 ao nível de
5%. 113.
( )0
1
: 55;8
:
∩
∩
H X N
H X ( )55;8
N
Como ( )max{ , } 0,3530 0,01 0,489tabD d d D+ −= = < = , não se rejeita H0 ao nível de
1%. 114.
Estimando a média e a o desvio padrão através de estimadores de máxima verosimilhança, queremos testar:
( )0
1
: 5.375;5.57
:
∩
∩
H X N
H X ( )5.375;5.57
N
Como 2 1026,8χ = , rejeita-se H0 ao nível de 5%, pois2 23;0,951026,8 7,81χ χ= > = .
115.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2,3,4, 1,2,3
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 19,34χ = , rejeita-se H0 ao nível de 1%, pois2 26;0,9919,38 16,8χ χ= > = .
116.
Estimando o parâmetro da distribuição Poisson pelo método da máxima verosimilhança, queremos testar:
( )0
1
: 3.52
:
∩
∩
H X P
H X ( )3.52
P
Como 2 4,32χ = , não se rejeita H0 ao nível de 5%, pois2 24;0,954,32 9,49χ χ= < = .
117.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2,3, 1,2.
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 3,61χ = , logo não se rejeita H0 ao nível de 5%, pois 2 22;0,953,61 5,99χ χ= < = e
p-value =0,179 > α=0,05. 118.
A hipótese a testar é:0 1 2 3: 0,10; 0,40; 0,50H p p p= = =
Como 2 134=χ , rejeita-se H0 ao nível de 5%.
119.
As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2, 1,2,3,4
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 4,69χ = , rejeita-se H0 ao nível de significância de 1%.
120.
b) As hipóteses a testar são 0 . .
1 . .
:
: , , : , 1,2, 1,2,3
= × ∃ ≠ = × = =
ij i j
ij i j
H p p p
H i j i j p p p i j
Como 2 152,22χ = , rejeita-se H0 ao nível de significância de 5%.
121.
As hipóteses a testar são ( )0
1
: 152.17,28.72
:
∩
∩
H X N
H X ( )152.17,28.72
N.
Pelo valor de prova p=0,985, concluímos que não se rejeita a H0 aos níveis usuais de
significância.
Aulas Laboratoriais em SPSS
1. Abordagem inicial ao SPSS Conhecimento básico dos Menus
• File, Edit: Menus idênticos aos existentes em qualquer software. Servem para abrir, guardar, imprimir, etc, ficheiros.
• View: Muda a fonte em que se escrevem os dados, permite visualizar o rótulo das variáveis.
• Data: Funções relacionadas com a alteração estrutural do ficheiro de dados. Menu onde se inserem e definem as variáveis a utilizar
• Transform: É usado para calcular novos valores e variáveis e recodificar variáveis, nomeadamente, é utilizado para a construção de classes.
• Analyse: Menu que contém as ferramentas de análise, desde as ferramentas da estatística descritiva, como a construção de distribuições de frequências e a regressão, até à análise dos dados através de análise de variância, séries temporais, análise de sobrevivência, testes não paramétricos, dados categorizados, etc, etc
• Graphs: Construção de todo o tipo de gráficos. 2. Introdução dos dados
• Introduzir dados: File →New→data
o Tipo de variáveis: numéricas, de caracteres, etc. - Data → Define variable o Definição do nome da variável (Só pode ter no máximo 8
caracteres e começar por uma letra) → Variable Name
o Tipo: String, Numeric.. →Type
o Formato: Nominal, Ordinal, Scale. →Measurement
o Rótulos: Nome do rótulo → Labels→ Value Label 0 – Mascluino
1 - Feminino o Gravar ficheiro o Abrir Ficheiro
• De um ficheiro Excel É necessário que o Excel tenha os dados num formato que seja possível o SPSS ler: no ficheiro do psi20 a coluna da data tem de ser alterada para dias, 1, 2, 3... e o nome das variáveis só pode ter, no máximo, oito caracteres. → File → Open →ficheiro do tipo *.xls
• De um ficheiro para SPSS → File → Open →psi20.sav
3. Estatística Descritiva
• Caracterizar a variável na folha Variable View • Analyze → Descriptive Statistic → Frequenceis
- Escolha das variáveis - Quadro de frequências - Analisar as opções: Statistics, Graphs.
• Representações gráficas - Gráficos de barras - Box-Plot - Histogramas
Aula Laboratorial de Regressão Linear Simples
Exercício 1 Os dados seguintes referem-se a uma amostra de observações sobre o número de horas
de estudo para a 3ª frequência de Probabilidades e Estatística (X) e a nota do aluno na
frequência numa escala de 0 a 100 (Y).
Aluno X Y
1 12 45
2 8 40
3 40 95
4 2 15
5 5 23
6 7 32
7 25 75 8 30 89
9 17 76
10 9 48
11 15 67
12 14 39
13 10 31
14 6 23
a) Represente o diagrama de dispersão.
b) Admitindo que a relação entre as variáveis X e Y é linear, estime os parâmetros
β1 e β2 do modelo de regressão correspondente.
c) Interprete o valor de β2.
d) Teste, ao nível de significância de 5%, a significância do modelo de regressão.
e) Obtenha intervalos de confiança a 95% para β1 e β2.
f) Poderá afirmar, estatisticamente ao nível de 5%, que um aluno que não tenha
estudado terá uma nota superior a 0. E superior a 2 valores?
g) Poderá afirmar, estatisticamente ao nível de 1%, que existe uma relação linear
positiva entre X e Y?
h) Determine os coeficientes de correlação e determinação e interprete os seus
valores.
i) Determine uma estimativa pontual e uma estimativa intervalar para a nota de um
aluno que tenha estudado 11 horas.
j) Realize uma análise de resíduos e retire as conclusões que entender
convenientes.
Outputs
Model Summary b
,924a ,853 ,841 10,3499Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Tempo de estudo (em horas)a.
Dependent Variable: Nota na 3ª frequênciab.
Descriptive Statistics
49,8571 25,9492 14
14,2857 10,6730 14
Nota na 3ª frequência
Tempo de estudo(em horas)
Mean Std. Deviation N
Tempo de estudo (em horas)
50403020100
Not
a na
3ª f
requ
ênci
a
100
80
60
40
20
0
Coefficients a
17,776 4,734 3,755 ,003 7,460 28,091
2,246 ,269 ,924 8,350 ,000 1,660 2,832
(Constant)
Tempo de estudo(em horas)
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Dependent Variable: Nota na 3ª frequênciaa.
Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Nota
Observed Cum Prob
1,0,8,5,30,0
Exp
ect
ed C
um
Pro
b
1,0
,8
,5
,3
0,0
Scatterplot
Dependent Variable: Nota
Regression Standardized Predicted Value
3210-1-2
Re
gre
ssio
n S
tan
dard
ized
Res
idu
al
2,0
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
One-Sample Kolmogorov-Smirnov Test
14,0000000
,96076892,156,156
-,102,582,887,837,000
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability
StandardizedResidual
Test distribution is Normal.a.
Calculated from data.b.
Exercício 2: Os dados seguintes referem-se a uma amostra de observações sobre a despesa mensal
em bens e em serviços culturais (Y) e o rendimento mensal per capita (X) de 14
agregados familiares.
Y 0 44 15 52 39 1 40 2 34 46 22 26 1 57
X 50 250 110 480 190 80 210 90 150 310 120 150 70 650
a) Represente o diagrama de dispersão.
rendimento mensal per capita
7006005004003002001000
desp
esa
men
sal e
m b
ens
e s
erv
iços
cul
tura
is
60
50
40
30
20
10
0
-10
b) Teste, ao nível de 1%, a normalidade das populações. Utilize o teste de
Kolmogorov-Smirnov e um método gráfico.
Como os valores de prova para ambas as populações são iguais a p = 0.899, concluímos
que não se rejeitam as hipóteses de normalidade com os parâmetros estimados.
c) Admitindo que a relação entre as variáveis X e Y é linear, estime os parâmetros β1 e
β2 do modelo de regressão correspondente e interprete os seus valores.
O modelo de regressão é y = 6.3412 + 0.0997x. O parâmetro 2β = 0.0997 significa que
por cada acréscimo de uma unidade do rendimento mensal per capita, a despesa mensal
em bens e serviços culturais aumenta, em média, 0.0997 unidades. O parâmetro 1β =
6.3412, neste caso, não tem interpretação, pois não faz grande sentido existir uma
despesa mensal, em média, igual a 6.3412 em serviços e bens culturais quando o
rendimento per capita é nulo.
d) Construa os intervalos de confiança a 95% para β1 e β2. Pela observação do output anterior concluímos que, ao nível de confiança de 95%, os
intervalos de confiança para β1 e β2 são:
e) Teste, ao nível de significância de 5%, se o modelo é significativo. Pretendemos testar a hipótese H0: β2 = 0 vs H1: β2 ≠ 0. Pelos intervalos de confiança,
através do valor de prova (p=0,000<0,05), ou mesmo mediante o valor da estatística de
Coefficients a
6,341 5,015 1,264 ,230 -4,585 17,268
9,973E-02 ,019 ,836 5,275 ,000 ,059 ,141
(Constant)
rendimentomensal per capita
Model1
B Std. Error
UnstandardizedCoefficients
Beta
Standardized
Coefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Dependent Variable: despesa mensal em bens e serviços culturaisa.
( ) ( )( ) ( )
95% 1
95% 2
4,59; 17,27
0,059; 0,141
IC
IC
β
β
= −
=
One-Sample Kolmogorov-Smirnov Test
14 14
207,8571 27,0714
171,02310 20,40537
,209 ,176
,209 ,176
-,178 -,149
,783 ,659
,572 ,778
,899 ,899
,000 ,000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Point Probability
X Y
Test distribution is Normal.a.
Calculated from data.b.
teste (t=5,275), concluímos que ao nível de 5% rejeitamos a hipótese de β2 ser nulo, ou
seja, a regressão entre o rendimento mensal per capita e a despesa mensal em bens e
serviços culturais é significativa.
f) Poderá afirmar, estatisticamente ao nível de 1%, que o declive da recta é positivo,
isto é, que X e Y variam linearmente no mesmo sentido?
Pretendemos testar a hipótese H0: β2 = 0 vs H1: β2 > 0. De acordo com o output da
tabela anterior tem-se p/2=0,000≤α=0,01, pelo que se rejeita H0 ao nível de 1% e
podemos concluir que o rendimento e a despesa mensal se relacionam positivamente.
g) Teste, ao nível de significância de 5%, a hipótese H0: β1 = 0 vs H1: β1 ≠ 0.
Da mesma forma que em d), pela observação do intervalo de confiança, pelo valor de
prova (p=0,230>0,05) ou pela estatística de teste (t=1,264) não rejeitamos a hipótese de
β1 ser nulo, ou seja, de a recta passar pela origem, o que significa que quando o
rendimento mensal per capita é nulo a despesa mensal em bens e serviços culturais
também pode ser considerada nula.
h) Teste, ao nível de significância de 5%, a hipótese H0: β2 = 0.1 vs H1: β2 ≠0.1.
Sob H0 tem-se
02 2n 2
xx
ˆt
QMES
β β−
−∩ onde ( )
n2
xx ii 1
S X X=
= −∑ e
n2i
i 1
eQME
n 2==−
∑
e, atendendo a que xx
QME0,019
S= (desvio padrão de β2)
o valor da estatística de teste é 02 2
xx
ˆ 0,09973 0,1T 0,014
0,019QMES
β β− −= = = , valor que não
pertence à região crítica ( )12, 0.975 12, 0.975Rc , -t t , + = −∞ ∪ ∞ =( ] [ ), -2.179 2.179, +−∞ ∪ ∞ ,
pelo que não se rejeita H0 ao nível de 5%.
A mesma conclusão poderia ter sido obtida através da dualidade entre testes bilaterais e
intervalos de confiança. Observe-se que neste caso não rejeitamos a hipótese nula uma
vez que o valor a testar em H0 (β2=0,1) pertence ao intervalo de confiança a 95% para
β2 ( )0,059; 0,141.
i) Teste, ao nível de significância de 5%, a hipótese H0: β1 = 6 vs H1: β2 >6.
Sob H0 tem-se
01 1n 2
2
xx
ˆt
1 XQME
n S
β β−
−∩
+
e, atendendo a que 2
xx
1 XQME 5,015
n S
+ = (igual ao desvio padrão de β1)
o valor da estatística de teste é 01 1
2
xx
ˆ 6,341 6T 0,068
5,0151 XQME
n S
β β− −= = =
+
, valor que não
pertence à região crítica )12, 0.95Rc t , += ∞ =[ )1.782, +∞ , pelo que não se rejeita H0 ao
nível de 5%.
j) Determine os coeficientes de correlação e determinação e interprete os seus valores.
O valor do coeficiente de correlação é R=0,836, pelo que a associação entre as duas
variáveis é forte e positiva (ao aumento do rendimento per capita corresponde um
aumento da despesa mensal em bens e serviços culturais).
O valor do coeficiente de determinação é R2 = 0.699, o que indica um razoável
ajustamento da recta aos dados, pois a recta de regressão apenas consegue explicar
69.9% da variabilidade das observações. Portanto, com base na amostra considerada,
podemos afirmar que 69.9% da variação total das despesas é explicada pelo rendimento
- os demais factores, que não o rendimento, explicam ainda 30.1% das despesas.
k) Qual a estimativa pontual da despesa mensal em bens e serviços para uma família
que apresenta um rendimento per capita igual a 250?
Com a recta de regressão é dada por y =6,3412 + 0,0997x, se x = 250, tem-se
Model Summary
,836a ,699 ,674 11,6577Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), rendimento mensal per capitaa.
y =6,3412+0,0997*250 = 31,2662
Logo, se o rendimento mensal per capita for igual a 250 espera-se que a despesa mensal
em bens e serviços seja igual a 31,27 unidades.
l) Obtenha um intervalo de predição a 95% para a despesa em bens e serviços para um
rendimento per capita igual a 250. (Utilize os outputs anteriores e o output
seguinte).
Descriptive Statistics
14 27,0714 20,40537
14 207,8571 171,02310
14
despesa mensal embens e serviços culturais
rendimento mensal percapita
Valid N (listwise)
N Mean Std. Deviation
Um intervalo de predição a (1-α)100% é dado pela expressão
( )( ) ( )2 2
0 095% 0 n 2,1 / 2 0 n 2,1 / 2
xx xx
x x x x1 1ˆ ˆIC y y t QME 1 , y t QME 1
n s n sα α− − − −
− − = − + + + + +
⌢
Atendendo a que ( )22xx xs (n 1)s ' 13 171,02310 380235.71= − = × = e a que
ˆ QME 11.6577σ= = , tem-se
( )( ) ( )
( )
2 2
95%
250 207.86 250 207.861 1IC y 31.27 2.179 135.90 1 , 31.27 2.179 135.90 1
14 380235.71 14 380235.71
4.92,57.62
⌢ − − = − + + + + +
=
Podemos concluir, com um nível de confiança de 95%, que a despesa para um
rendimento igual a 250 unidades monetárias se situará entre 4.92 e 57.62.
m) Realize uma análise de resíduos e retire as conclusões que entender convenientes.
3,000002,000001,000000,00000-1,00000
Standardized Predicted Value
1,50000
1,00000
0,50000
0,00000
-0,50000
-1,00000
-1,50000
Sta
ndar
dize
d R
esid
ual
1,00,80,60,40,20,0
Observed Cum Prob
1,0
0,8
0,6
0,4
0,2
0,0
Exp
ecte
d C
um P
rob
Normal P-P Plot of Standardized Residual
One-Sample Kolmogorov-Smirnov Test
14,0000000
,96076892,201,201
-,157,753,622,555,000
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability
StandardizedResidual
Test distribution is Normal.a.
Calculated from data.b.
A análise de resíduos, apesar de confirmar a normalidade (valor p do teste de
Kolmogorov-Smirnov igual a 0,555), sugere que o modelo linear não será o mais
apropriado.
n) Em vez dos valores de X foram utilizados os seus logaritmos. Com base nos
outputs, escreva a equação do modelo de regressão e comente.
2,000001,000000,00000-1,00000-2,00000
Standardized Predicted Value
1,00000
0,00000
-1,00000
-2,00000
Sta
ndar
dize
d R
esid
ual
Foi ajustada uma regressão logarítmica: y = -108.042 + 26.622 ln(x). Podemos
concluir, com base na amostra considerada, que 91,5% da variação total é explicada
pelo modelo, pelo que o ajustamento obtido é bastante melhor que o conseguido através
do modelo de regressão linear.
Neste caso, a análise de resíduos confirma a normalidade dos resíduos (valor p do teste
de Kolmogorov-Smirnov = 0.982) e a sua representação contra os valores estimados de
y não leva a suspeitar de uma heterogeneidade de variâncias.
One-Sample Kolmogorov-Smirnov Test
14,0000000
,96076892,115,110
-,115,431,993,982,000
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Point Probability
StandardizedResidual
Test distribution is Normal.a.
Calculated from data.b.
Coefficients a
-108,042 11,974 -9,023 ,000
26,622 2,337 ,957 11,393 ,000
(Constant)
VAR00003
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: VAR00002a.
Model Summary
,957a ,915 ,908 6,17832Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), VAR00003a.
Aula Laboratorial de Testes não Paramétricos
Exercício 1 Uma determinada empresa com representações no Porto e em Lisboa decide promover
um funcionário para um cargo de chefia. No processo de selecção do funcionário a
empresa pretende, antes de mais, averiguar se existem diferenças entre a competência
dos funcionários do Porto e a competência dos funcionários de Lisboa. Para tal foram
seleccionados ao acaso 10 funcionários de Lisboa e 9 do Porto, tendo estes sido sujeitos
a uma prova cotada de 0 a 20. Os resultados obtidos nas duas cidades foram os
seguintes:
a) Teste, ao nível de 5%, a normalidade das populações. Utilize o teste de
Kolmogorov-Smirnov e um método gráfico.
b) Pretende-se concluir se, ao nível de 5%, existem diferenças significativas entre a
competência dos funcionários de Lisboa e os do Porto.
a. Indique as hipóteses a testar.
b. Realize o teste de Wilcoxon-Mann-Whitney e interprete os resultados
obtidos.
c) Aplique um teste paramétrico para testar a hipótese de as respostas médias ao
teste serem iguais.
d) Determine intervalos de confiança a 95% para os resultados médios em Lisboa e
no Porto e para a diferença média dos resultados.
Exercício 2
Num inquérito sobre a participação de homens e mulheres na aquisição de bens, foram
inquiridos 15 casais, com idades compreendidas entre os 35 e os 55 anos, tendo-lhes
sido pedido que classificassem o seu grau de influência nas compras da casa, numa
escala de 0 a 10. Os resultados obtidos foram os seguintes:
a) Com base num teste não paramétrico adequado, retire as conclusões que achar
convenientes.
b) Aplique um outro teste não paramétrico e compare as conclusões obtidas.
Exercício 3
Como parte de um estudo sobre a necessidade de assistir às aulas teóricas de
Probabilidades e Estatística foi pedido a um grupo de 10 alunos para realizar um
determinado teste antes da matéria ser leccionada na aula teórica. Ao mesmo grupo foi
posteriormente leccionada a aula teórica sobre a matéria do teste e pedido que
efectuasse um teste análogo ao primeiro. As classificações registadas para os dois testes
foram:
Classificação do teste (0-100)
Aluno 1 2 3 4 5 6 7 8 9 10
Antes da aula 18 79 91 75 68 43 33 85 22 56
Depois da aula 85 85 83 71 93 40 55 91 44 82
a) Poderá afirmar, ao nível de 5%, que as classificações obtidas no teste após a
aula são significativamente superiores às classificações obtidas no teste antes da
aula? Utilize um teste não paramétrico para responder a esta questão e indique
os pressupostos admitidos.
b) Utilizando um teste que julgue adequado, poderá concluir, ao nível de 5%, que
a nota mediana depois da aula é superior a 60.
Exercício 4
Recorreu-se a um painel de opinião para avaliar a alteração da base de apoio ao governo
causado pelas alterações legislativas que o Orçamento Geral de Estado introduz nas
deduções ao IRS. Em 250 opiniões registadas, observaram-se os seguintes resultados:
A favor Contra
Antes A favor 94 36
Contra 12 108
a) Indique as hipóteses para testar se houve uma alteração significativa no apoio
do governo, devido às alterações ao Orçamento Geral de Estado.
b) Aplique o teste de McNemar e retire as conclusões que achar convenientes.
Exercício 5
Uma marca de café acaba de lançar um novo lote. Para promover o novo lote
decide oferecer um café aos clientes de um determinado hipermercado, para que estes
fiquem a conhecer o café e possam ficar a conhecer a promoção de lançamento que
oferece uma chávena na compra de duas embalagens. Durante um determinado período
de tempo são observados os clientes a quem é oferecido o café, sendo classificados
quanto ao sexo e quanto à decisão de comprar ou não as duas embalagens com oferta da
chávena. Os resultados obtidos foram os seguintes:
Feminino Masculino
Não 8 20
Sim 35 12
Teste, ao nível de 5%, se existe alguma relação entre o sexo dos clientes e a
decisão em aderir à promoção.
Exercício 1
a)
X- Resultados no teste dos funcionários de Lisboa
Y- Resultados no teste dos funcionários do Porto
0
1
: ( , )
:
∩
∩
H X N
H X
µ σ 0
1
: ( , )
( , ) :
∩
∩
H Y N
N H Y
µ σµ σ ( , )
N µ σ
Os resultados obtidos foram:
One-Sample Kolmogorov-Smirnov Test
10 9
13,9600 13,9556
4,49325 4,96591
,248 ,258
,156 ,155
-,248 -,258
,783 ,775
,572 ,585
,496 ,506
,000 ,000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Point Probability
Resultadosdos
funcionáriosde Lisboa no
teste
Reultadosdos
funcionáriosdo Porto no
teste
Test distribution is Normal.a.
Calculated from data.b.
Analisando os valores de prova, como p=0,496 na amostra de Lisboa e p=0,506 na amostra do Porto, concluímos que não se rejeitam as hipóteses de normalidade com os parâmetros estimados.
Através do método gráfico, obtém-se:
LISBOA: PORTO:
b) Pretende-se concluir se, ao nível de 5%, existem diferenças significativas entre a
competência dos funcionários de Lisboa e os do Porto, pelo que as hipóteses a
testar no caso de uma abordagem não paramétrica são:
0
1
:
:
= ≠
X Y
X Y
H
H
η ηη η
Realizando o teste de Wilcoxon-Mann-Whitney, obtém-se
Ranks
10 9,80 98,00
9 10,22 92,00
19
Atribuição do grupo a quepertencem os resultadosLisboa
Porto
Total
Resultadosglobais no teste
N Mean Rank Sum of Ranks
Normal P-P Plot of Resultados dos funcionários de Lisboa no teste
Observed Cum Prob
1,00,75,50,250,00
Exp
ecte
d C
um P
rob
1,00
,75
,50
,25
0,00
Normal P-P Plot of Reultados dos funcionários do Porto no teste
Observed Cum Prob
1,00,75,50,250,00
Exp
ecte
d C
um P
rob
1,00
,75
,50
,25
0,00
Test Statistics b
43,000
98,000
-,163
,870
,905a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailedSig.)]
Resultadosglobais no
teste
Not corrected for ties.a.
Grouping Variable: Atribuição do grupoa que pertencem os resultados
b.
Pelo que podemos concluir, através do valor de prova (p=0,905>0,05), que
as amostras provêm da mesma população, isto é, não existem diferenças
significativas entre a competência dos funcionários das duas cidades.
c) Pela alínea a) concluímos que as amostras são provenientes de populações
normais, pelo que se deve utilizar a abordagem paramétrica. As hipóteses a
testar são:
0
1
:
:
= ≠
X Y
X Y
H
H
µ µµ µ
Aplicando o teste T, pois os desvios padrões populacionais são desconhecidos,
obtemos:
Group Statistics
10 13,9600 4,49325 1,42089
9 13,9556 4,96591 1,65530
Atribuição do grupo a quepertencem os resultadosLisboa
Porto
Resultadosglobais no teste
N Mean Std. DeviationStd. Error
Mean
Independent Samples Test
,000 ,996 ,002 17 ,998 ,0044 2,16942 -4,57262 4,58151
,002 16,277 ,998 ,0044 2,18151 -4,61375 4,62263
Equal variancesassumed
Equal variancesnot assumed
Resultadosglobais no teste
F Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Como não se rejeita a hipótese de igualdade de variâncias (p=0.996), usamos o teste
t em que se assume a igualdade, pelo que como p=0,998>0,05 concluímos que
devemos manter H0, isto é, não existem diferenças entre os resultados médios dos
testes realizados pelos funcionários de Lisboa e do Porto.
Observe-se que, quer nesta alínea quer na anterior, os valores de prova são muito
próximos de 1 o que permite concluir uma grande evidência amostral a favor de H0.
d) One-Sample Test
9,825 9 ,000 13,96000 10,7457 17,17438,418 8 ,000 13,26667 9,6325 16,9008
LisboaPorto
t df Sig. (2-tailed)Mean
Difference Lower Upper
95% ConfidenceInterval of the
Difference
Test Value = 0
Independent Samples Test
,009 ,927 ,328 17 ,747 ,69333 2,11591 -3,77086 5,15752
,327 16,564 ,748 ,69333 2,12192 -3,79253 5,17919
Equal variancesassumedEqual variancesnot assumed
NotasF Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Exercício 2
X- resultado (numa escala de 0 a 10) da participação do homem na aquisição de
bens.
Y- resultado (numa escala de 0 a 10) da participação das mulheres na aquisição de
bens.
a) As hipóteses a testar são:
0
0
:
:
= ≠
X Y
X Y
H
H
η ηη η
Como temos amostras emparelhadas e é possível obter, além do sinal da diferença, o
valor da diferença, usamos o teste de Wilcoxon para amostras emparelhadas.
Os resultados obtidos foram:
Pelo que não rejeitamos a hipótese nula para níveis de significância inferiores a
0,6%, isto é, para níveis de significância superiores ou iguais a 0,6% podemos
concluir que homens e mulheres têm um grau de influência diferente nas compras de
casa.
Para um teste unilateral direito
0
0
:
:
= >
X Y
X Y
H
H
η ηη η
Como p=0,03≤0,05, rejeitamos H0 ao nível de 5%, pelo que, a este nível de
significância, é possível concluir que os homens acham que têm maior influência do
que as mulheres na aquisição de bens.
b) Aplicando o teste dos sinais, cujas hipóteses também se podem colocar como
Ranks
11a 8,59 94,50
3b 3,50 10,50
3c
17
Negative Ranks
Positive Ranks
Ties
Total
Resultados no teste dasmulheres - Resultadosno teste dos homens
N Mean Rank Sum of Ranks
Resultados no teste das mulheres < Resultados no teste dos homensa.
Resultados no teste das mulheres > Resultados no teste dos homensb.
Resultados no teste dos homens = Resultados no teste das mulheresc.
Test Statistics b
-2,667a
,008
,006
,003
,001
Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Exact Sig. (1-tailed)
Point Probability
Resultadosno teste dasmulheres -Resultadosno teste dos
homens
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
( ) ( )( ) ( )
0
1
:
:
+ = −
+ ≠ −
H P P
H P P
obtemos os resultados seguintes:
Para o teste bilateral, como p=0,057>0,05 não se rejeita H0, sendo a conclusão a
mesma que com o teste anterior. Para o teste unilateral, como p=0,057 /
2=0,0285≤0,05, rejeita-se H0 ao nível de 5%, sendo a conclusão também a mesma
que no teste anterior.
Exercício 3
a) X- nota do aluno antes de assistir às aulas
Y- nota do aluno depois de assistir às aulas
0
1
:
:
= <
X Y
X Y
H
H
η ηη η
Frequencies
11
3
3
17
Negative Differencesa
Positive Differencesb
Tiesc
Total
Resultados no teste dasmulheres - Resultadosno teste dos homens
N
Resultados no teste das mulheres < Resultados noteste dos homens
a.
Resultados no teste das mulheres > Resultados noteste dos homens
b.
Resultados no teste dos homens = Resultados noteste das mulheres
c.
Test Statistics b
,057aExact Sig. (2-tailed)
Resultadosno teste dasmulheres -Resultadosno teste dos
homens
Binomial distribution used.a.
Sign Testb.
Ranks
3a 2,67 8,00
7b 6,71 47,00
0c
10
Negative Ranks
Positive Ranks
Ties
Total
Resultados no testedepois de assistiremàs aulas - Resultadosno teste antes deassistirem às aulas
N Mean Rank Sum of Ranks
Resultados no teste depois de assistirem às aulas < Resultados no testeantes de assistirem às aulas
a.
Resultados no teste depois de assistirem às aulas > Resultados no testeantes de assistirem às aulas
b.
Resultados no teste antes de assistirem às aulas = Resultados no testedepois de assistirem às aulas
c.
Test Statistics b
-1,989a
,047
,047
,023
,005
Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Exact Sig. (1-tailed)
Point Probability
Resultadosno teste
depois deassistirem às
aulas -Resultados
no teste antesde assistirem
às aulas
Based on negative ranks.a.
Wilcoxon Signed Ranks Testb.
Aplicando o teste de Wilcoxon para amostras emparelhadas (estamos a admitir as
distribuições são contínuas e simétricas), obtemos:
Como p=0,023≤0,05, rejeita-se H0 ao nível
de 5%, pelo que podemos concluir que as
classificações obtidas no teste após a aula
são superiores às classificações obtidas no
teste antes da aula.
b) Pretendemos testar
0
1
: 60
: 60
= >
Y
Y
H
H
ηη
Aplicando o teste de Wilcoxon, obtemos:
Ranks
7a 6,43 45,00
3b 3,33 10,00
0c
10
Negative Ranks
Positive Ranks
Ties
Total
Mediana - Resultadosno teste depois deassistirem às aulas
N Mean Rank Sum of Ranks
Mediana < Resultados no teste depois de assistirem às aulasa.
Mediana > Resultados no teste depois de assistirem às aulasb.
Resultados no teste depois de assistirem às aulas = Medianac.
Test Statistics b
-1,784a
,074
,084
,042
,010
Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Exact Sig. (1-tailed)
Point Probability
Mediana -Resultados
no testedepois deassistiremàs aulas
Based on positive ranks.a.
Wilcoxon Signed Ranks Testb.
Como para o teste unilateral direito se obtém p=0,042≤0,05, podemos concluir, ao nível
de 5%, que a nota mediana do teste depois da aula teórica é superior a 60.
Exercício 4
c) Construa as hipóteses para testar se houve uma alteração significativa no apoio
do governo, devido às alterações ao Orçamento Geral de Estado.
( ) ( )( ) ( )
0
1
0
1
: a favor contra contra a favor
: a favor contra contra a favor
: Nao houve mudança de opiniao
H : Houve mudança de opiniao.
→ = →
→ ≠ →
H P P
H P P
ou
H
d) Aplicando o teste de McNemar obtemos:
Rejeita-se H0 para α≥0,001, pelo que podemos concluir, para níveis de significância
superiores ou iguais a 0,1%, que houve mudança de opinião.
Exercício 5 Vamos aplicar o teste Qui-quadrado de independência para testar H0: Existe independência entre o sexo dos clientes e a decisão de aderir à promoção. ou H0: pij = pi. p.j Os resultados obtidos são os seguintes:
Case Processing Summary
75 100,0% 0 ,0% 75 100,0%Decisão * SexoN Percent N Percent N Percent
Valid Missing Total
Cases
Opiniões antes da medida & Opiniões depois da medida
94 36
12 108
Opiniões antes damedida0
1
0 1
Opiniões depois da medida
Test Statistics b
250
11,021
,001
N
Chi-Squarea
Asymp. Sig.
Opiniões antes damedida & Opiniõesdepois da medida
Continuity Correcteda.
McNemar Testb.
Decisão * Sexo Crosstabulation
8 20 28
16,1 11,9 28,0
35 12 47
26,9 20,1 47,0
43 32 75
43,0 32,0 75,0
Count
Expected Count
Count
Expected Count
Count
Expected Count
nao
sim
Decisão
Total
f m
Sexo
Total
Chi-Square Tests
15,110b 1 ,000
13,292 1 ,000
15,448 1 ,000
,000 ,000
75
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Computed only for a 2x2 tablea.
0 cells (,0%) have expected count less than 5. The minimum expected count is11,95.
b.
A amostra apresenta uma evidência estatística muito forte de que existe relação entre o
sexo e a decisão de aderir à promoção (valor p=0,000 associado ao valor da estatística
qui-quadrado de Pearson).
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
1ª Frequência de PROBABILIDADES E ESTATÍSTICA * 29/10/2005
ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO
Duração: 2 horas
Nota: Justifique todas as respostas de uma forma sucinta
1. Considere os salários, em centos de euros, de 80 trabalhadores de uma dada
empresa.
e) Calcule o terceiro quartil e interprete o seu
valor.
f) Sabe-se que a distribuição é mesocúrtica, que o
momento centrado de ordem 4 é 243 e que o
momento ordinário de ordem 1 é 9. Com base
nesta informação, um seu colega concluiu que
o coeficiente de variação é igual a 33,3%. Explique o seu raciocínio.
g) Complete as afirmações:
i) 37,5% dos trabalhadores têm um salário superior a ___ euros.
ii) Os trabalhadores com salário inferior a 1000€ recebem ___% do total
dos salários pagos pela empresa.
2. Admita que o volume de vendas anuais, em milhões de euros, de um conjunto de
empresas do país X foi o seguinte:
20 40 40 45 45 45 50 50 50 50
55 55 60 60 60 60 70 80 85 100
Esboce o diagrama caixa-e-bigodes. Comente.
3. Suponha que existem 3 tipos de vírus duma dada doença, sendo 0,3; 0,5 e 0,2 as
probabilidades de um indivíduo ser atacado por cada um deles. Para a vacina
disponível as probabilidades de imunização são 0,8; 0,9 e 0,95 respectivamente. Se
um indivíduo vacinado resistiu ao ataque, qual a probabilidade de ter sido atacado
por um vírus do 2º tipo?
Classes n i
[2, 4) 5
[4, 6) 10
[6, 8) 15
[8, 10) 20
[10, 12) 15
[12, 14) 9
[14, 16] 6
4. A taxa de juro de um determinado produto financeiro é uma variável aleatória X
com a seguinte função densidade de probabilidade:
( )2x 2
; 0 x 3f x 15
0; c.c.
+ ≤ ≤=
Sabendo que a taxa de juro do produto vai aumentar para um valor não inferior a 2,
determine a probabilidade de a mesma se situar no intervalo 2 a 2,5.
5. Suponha que a procura diária de um certo artigo em determinado estabelecimento é
uma variável aleatória com distribuição de Poisson de média igual a 3.
a) Determine o stock mínimo de artigos no início de cada dia para que haja
procura excedentária no máximo em 20% dos dias?
b) Tomando como referência o stock calculado na alínea anterior (assuma o valor
3 caso não a tenha conseguido resolver), calcule a probabilidade de numa
semana (5 dias úteis) haver no máximo 2 dias com procura excedentária.
c) Calcule a probabilidade de em meio-dia se registar uma procura superior a 3
artigos.
6. Suponha que um dispositivo electrónico tem um tempo de vida X, que é uma v.a.
exponencial de média igual a 1000 horas. Admita, ainda, que o custo de fabrico de
um desses dispositivos é igual a 200 € e que o fabricante garante o reembolso total
se a duração do dispositivo for menor ou igual a 900 horas. Qual deverá ser o preço
de venda do artigo para que o lucro que o fabricante espera obter em 100
dispositivos seja igual a 500€?
Formulário de Apoio:
1ip i i
i
np Nx l R
n−−
= + ×ɶ ( )22
1
1
1
n
i ii
s n x xn =
= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q
[ ] [ ]
[ ]
1
1
, 2,
np np
p
np
x xnp
xx np
+
+
+ ∈= ∉
ℕɶ
ℕ
( )
( ) ( )
3' ' ' '3 3 2 1 1
2 4' ' ' ' ' '4 4 3 1 2 1 1
3 2
4 6 3
m m m m m
m m m m m m m
= − +
= − + −
( )1=
−=∑
kr
i ii
r
n x xm
n ' 1==
∑k
ri i
ir
n xm
n 3
1 3γ =
m
s 4
2 43γ = −
m
s
( ) ( )3 1
3 1
− − −
−
ɶ ɶQ x x Q
Q Q
ˆ−=
x xg
s
( )3 1
90 102
−−
Q Q
P P 1
1
=
=
=∑
∑
i
jj
i k
jj
n
pn
1
1
=
=
=∑
∑
i
i ij
i k
i ij
n x
qn x
1
11
1
1
−
=−
=
= −∑
∑
k
iik
ii
qG
p
( )( ) ( )
( ) ( )1
|| , 1, 2, ..., n
|=
×= =
∑i i
i n
k kk
P A P B AP A B i
P A P B A
( ) ( ) ( )1
|=
=∑n
i ii
P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B
( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B
( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A
( )( ) ; ( ) ( )≤ −∞
= = =∑ ∫k
x
kx x
F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a
( ) ( ) ( )' ' ; = ( )+∞
−∞
= = =∑ ∫µ µk
mm mm k k m
x
E X x P X x x f x dx 1
( ) , = < <−
f x a x bb a
( ) ( ) ( ) ( )( ) ( ) ; ( ) ( )+∞
−∞
= − = − = = − ∑ ∫µ µk
m m m
m k k mx
E X E X x E X P X x x E X f x dx
( ) ( )1 , 0, 1, ..., − = = − =
n kknP X k p p k n
k ( ) ( ) 1
1 , 1,2, ...k
P X k p p k−
= = − =
( ) , 0, 1, ... 0!
−
= = = >λλ
λke
P X k kk
( ) , 0 >0; ( ) 1 , 0 >0− −= ≥ = − ≥λ λλ λ λt tf t e t F t e t
.
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
2ª Frequência de PROBABILIDADES E ESTATÍSTICA * 29/11/2005
ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO
Duração: 2 horas Nota: Justifique todas as respostas de uma forma sucinta
1. Os gastos mensais com formação de pessoal de uma dada empresa têm
distribuição normal com média igual a 25000€ e desvio padrão igual a 3600€.
Admitindo que a empresa tem um orçamento anual de 250000€ para formação,
calcule a probabilidade desta verba ser adequada para o próximo ano. 2. A duração de pequenos comerciais num canal de televisão pode considerar-se
uma variável aleatória com função densidade1
( ) , 0f x x θθ
= < < .
a) Obtenha um estimador para θ pelo método dos momentos.
b) Mostre que o estimador obtido na alínea anterior é consistente. (Caso não
tenha resolvido a alínea anterior, considere ˆ 2Xθ = ) 3. O número de bilhetes de parquímetro emitido numa determinada rua da cidade
de Évora, num dia da semana, tem distribuição de Poisson de parâmetro λ.
Obtenha o estimador de máxima verosimilhança do número médio de bilhetes
emitidos diariamente e uma estimativa de máxima verosimilhança do desvio
padrão, sabendo que em 15 dias foram emitidos 3000 bilhetes. 4. Um determinado Município pretende efectuar uma sondagem junto da
população que vive num bairro mais afastado a fim de determinar a proporção
de pessoas que diariamente utilizam os transportes públicos.
a) Determine o número de munícipes a inquirir de modo a obter um erro de
estimativa máximo igual a 2% para um nível de confiança de 95%.
b) Os meios financeiros disponíveis apenas permitiam inquirir 1000 pessoas,
das quais 150 afirmaram utilizar os transportes públicos regularmente.
Obtenha um intervalo de confiança a 95% para a proporção de munícipes
que utilizam regularmente os transportes públicos. Diga qual o erro de
estimativa associado e comente o resultado.
5. Um determinado fornecedor de acesso à Internet tem um pacote que indica uma
velocidade de download de 2MB. Vinte e cinco dos seus clientes mediram as
suas velocidades de download num período que pode ser considerado de menor
tráfego, registando-se uma velocidade média igual a 1.5Mb e um desvio padrão
igual a 1 Mb. Haverá evidência, ao nível de 1%, para podermos concluir que a
velocidade de download é inferior à indicada por esse fornecedor? Admita os
pressupostos que entender necessários. 6. Suponha que um comerciante recebeu uma remessa de ovos com a garantia de
serem da classe A, isto é, ovos cujo peso segue uma distribuição normal de
média igual a 55gr e desvio padrão igual a 8gr. Como o fornecedor só lhe
concede 2 dias para reclamar, resolve analisar uma amostra de n ovos. Caso
pretenda decidir com um nível de significância igual a 5% e um erro de 2ª
espécie inferior a 10% (quando os ovos fornecidos pertençam a uma população
com peso médio igual a 50 gr.), quantos ovos deverá o comerciante pesar? 7. Comente a proposição: “Num teste de hipóteses unilateral direito para a média,
com desvio padrão conhecido, com um valor igual a 2,1 para a estatística de
teste, o valor de prova deste teste leva à rejeição da hipótese nula para um nível
de significância superior a 1%. ”. 8. Admita que na secção de informática de determinado estabelecimento comercial,
as vendas diárias de impressoras das marcas X e Y têm a seguinte função massa
de probabilidade conjunta:
Verifique se as variáveis são independentes e
calcule a probabilidade de num dado dia se
venderem mais impressoras da marca X.
Formulário de apoio:
(0,1) ; (0,1)(1 )
X np XN N
np p
λλ
− −∩ ∩−
ɺ ɺ ; ( ) ( )i ii
X N , X N n , n∩ µ σ ⇒ ∩ µ σ∑
X\Y 0 1 2
0 1/12 1/6 1/12
1 1/6 1/6
2 1/12 1/6 1/12
( ) ( ) ( ), i i i jj
p x P X x P X x Y y= = = = =∑ ;
( ) ( ) ( ), j j i ji
p y P Y y P X x Y y= = = = =∑
( )( ) ( ) ( ) ( )ov( , ) ( ) ( )XY C X Y E X E X Y E Y E XY E X E Yσ = = − − = −
( ) ( ),i j
i j i jx y
E XY x y P X x Y y= = =∑∑
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
3ª Frequência de PROBABILIDADES E ESTATÍSTICA * 17/12/2005
ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO
Duração: 2 horas • Justifique, embora de uma forma sucinta, todas as respostas.
• Na última página dispõe de um formulário de apoio, bem como de alguns
valores de quantis de probabilidades das distribuições t-student, Qui-quadrado e
F que podem eventualmente ser necessários.
1. Para avaliar a sustentabilidade da construção do novo aeroporto da Ota foi pedido a
13 economistas apoiantes do Governo e a 9 economistas da oposição, para
estimarem o impacto do novo aeroporto no crescimento do PIB, tendo-se obtido os
seguintes resultados:
Média Desvio padrão
Governo 3,5 1,5
Oposição 2,0 2,0
a) Haverá evidência estatística, ao nível de significância de 10%, para concluir que
as previsões médias dos economistas apoiantes do governo são superiores às
previsões médias dos economistas apoiantes da oposição? Admita os
pressupostos necessários para realizar uma abordagem paramétrica.
b) Obtenha um intervalo de confiança a 95% para a razão das variâncias das
previsões. Que pode concluir acerca da validade de um dos pressupostos
admitidos na alínea anterior?
2. Segundo uma sondagem realizada a 300 estudantes de uma dada Universidade
verificou-se que 130 apoiavam a candidatura à Reitoria do candidato A, enquanto
noutra sondagem, em 250 inquiridos 125 apoiavam a candidatura do candidato B.
Com base no valor de prova, teste a hipótese do candidato B ter mais apoiantes que
o candidato A.
3. Para estudar se a duração (em segundos) de chamadas de voz de uma dada empresa
de telecomunicações tem uma distribuição uniforme U (0,150) foram observados
300 chamadas telefónicas, obtendo-se os seguintes resultados: Recorde que a função
distribuição da Uniforme é
( ) ( ) ( ) ( )( ) ( ) ( )/ , e ,F x x a b a a x b P X a b F b F a= − − < < ∈ = − .
Tempo [0,30) [30,60) [60,90) [90,120)
Número chamadas 55 125 85 35
Que pode concluir ao nível de significância de 5%?
4. Para testar a relação entre o desempenho dos docentes nas aulas (avaliados entre 0 e
10) e o número de horas de preparação das aulas foram observados 16 docentes.
Alguns dos resultados obtidos na análise estatística efectuada foram:
Descriptive Statistics
5,1313 3,57598 16
56,3750 28,64699 16
desempenho do docente
preparação das aulasem horas
Mean Std. Deviation N
Model Summary
,926 ,857Model1
R R Square
Coefficients a
-1,383 ,793 -1,745
,116 ,013 9,160
(Constant)
preparação dasaulas em horas
Model1
B Std. Error
UnstandardizedCoefficients
t
Dependent Variable: desempenho do docentea.
a) Interprete o valor dos coeficientes do modelo de regressão linear e avalie a
qualidade do ajustamento efectuado.
b) Teste, ao nível de 5%, se o declive da recta é superior a 0,10.
c) Determine um intervalo de predição a 90% para o desempenho de um docente
que tenha dispendido 80 horas na preparação das aulas.
d) Indique os pressupostos subjacentes ao modelo de regressão linear e diga
sucintamente como poderia avaliar um desses pressupostos.
5. Descreva sucintamente como procederia para realizar um ajustamento do tipo
2x1y eβ= β .
6. Para testar a relação entre a nota final dos alunos no curso de Gestão e o número de
meses que demoram a encontrar o primeiro emprego, numa amostra de 220 alunos
obteve-se o output:
número de meses para encontrar o 1º emprego * nota final no curso de Gestão Crosstabulation
15 45 60 120
46,4 120,0
55 20 25 100
38,6 100,0
70 65 85 220
70,0 65,0 85,0 220,0
Count
Expected Count
Count
Expected Count
Count
Expected Count
<8
>8
número de meses paraencontrar o 1º emprego
Total
10-13 13-16 >16
nota final no curso de Gestão
Total
Com base nos dados obtidos, complete a tabela e conclua ao nível de 5%?
7. Como parte de um estudo sobre a necessidade de assistir às aulas teóricas de
Probabilidades e Estatística foi pedido a um grupo de 10 alunos para realizar um
determinado teste antes da matéria ser leccionada na aula teórica. Ao mesmo grupo
foi posteriormente leccionada a aula teórica sobre a matéria do teste e pedido que
efectuasse um teste análogo ao primeiro. As classificações registadas para os dois
testes e os outputs obtidos foram:
Classificação do teste (0-100)
Aluno 1 2 3 4 5 6 7 8 9 10
Antes da aula 18 79 91 75 68 43 33 85 22 56
Depois da aula 85 85 83 71 93 40 55 91 44 82
Poderá afirmar, ao nível de 5%, que as classificações obtidas no teste após a aula são
significativamente superiores às classificações obtidas no teste antes da aula?
Considere os resultados apresentados da aplicação de um teste não paramétrico
adequado para responder a esta questão e calcule o valor da estatística de teste que
lhe permite obter o valor Z indicado no output.
Cotação:
1a) 2.5 1b) 2.5 2) 1.5 3) 2.5 4a) 1.5 4b) 1.5 4c) 1.5 4d) 1.0 5) 1.5 6) 2.0 7)
2.0
Test Statistics b
-1,989a
,047
,023
Z
Exact Sig. (2-tailed)Exact Sig. (1-tailed)
Resultadosno teste
depois deassistirem às
aulas -Resultados
no teste antesde assistirem
às aulas
Based on negative ranks.a.
Wilcoxon Signed Ranks Testb.
Test Statistics b
-1,989a
,047
,023
Z
Exact Sig. (2-tailed)Exact Sig. (1-tailed)
Resultadosno teste
depois deassistirem às
aulas -Resultados
no teste antesde assistirem
às aulas
Based on negative ranks.a.
Wilcoxon Signed Ranks Testb.
Formulário de apoio
( ) ( ) ( ) ( )* *0 k k 0 k k 1
d d
D max F x F x , F x F x+ −
−
= − − ������� ���������
( ) ( )2 2
0 00 n 2,1 / 2 0 n 2,1 / 2
xx xx
x x x x1 1ˆ ˆy t QME 1 , y t QME 1
n S n S− − − −
− − − × + + + × + + α α
( ) ( )2 2
0 00 n 2,1 / 2 0 n 2,1 / 2
xx xx
x x x x1 1ˆ ˆy t QME , y t QME
n S n S− − − −
− − − × + + × + α α
XY1 2 2
XX
Sˆ ˆ ˆy x; S
β = −β β = ; 0 02 2 1 1
2
XX XX
ˆ ˆT ; T=
QME 1 xQMES n S
β −β β −β=
+
( )
( )
n2
i i2XY E i 1
n2YYxx YY
i ii 1
ˆy yS SQ
r ; r 1 1SS S y y
=
=
−= = − = −
−
∑
∑ ( )
n n2 2 2
xx i ii 1 i 1
S x x x nx= =
= − = −∑ ∑
; ( )( )n n
XY i i i ii 1 i 1
S x x y y x y nxy= =
= − − = −∑ ∑
( )
( )
1 1 2
1 2 1 2
n n n 1U
2Z N(0,1)n n n n 1
12
+ +−
= ∩+ +
ɺ
( )
( )( )
n n 1W
4Z N(0,1)n n 1 2n 1
24
+−
= ∩+ +
ɺ
; Z0.5160 Z0.5199 Z0.5239 Z1.645 Z1.96 Z2.326 F12,8, 0.95 F12,8, 0.975 F8,12, 0.95 F8,12, 0.975
0,04 0,05 0,06 0,95 0,975 0,99 3,28 4,20 2,85 3,51
t14, 0.90 t14, 0.95 t14,
0.975
t16, 0.90 t16, 0.95 t16,
0.975
t20, 0.90 t20, 0.95 t22, 0.90 t22, 0.95
1,345 1,761 2,145 1,337 1,746 2,120 1,325 1,725 1,321 1,717
X26, 0.025 X2
6, 0.05 X26, 0.95 X2
6, 0.975 X22, 0.025 X2
2, 0.05 X22, 0.95 X2
2, 0.975
1,240 1,640 12,600 14,400 0,051 0,103 5,990 7,380
X23, 0.05 X2
3, 0.95 X23, 0.975 X2
4, 0.05 X24, 0. 95 X2
4, 0.975 X25, 0.95 X2
5, 0.975
0,216 7,810 9,350 0,711 9,490 11,100 11,100 12,800
( )( )( )
( )2 2L C k
ij ij2 2 2 2i ik 1 pL 1 C 1
i 1 j 1 i 1ij i
o e o e
e eɺ ɺχ χ − −− −
= = =
− −Χ = ∩ Χ = ∩∑∑ ∑
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
Exame de Época Recurso de PROBABILIDADES E ESTATÍSTICA * 6/01/2006
ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO
Duração: 3 horas
Nota: Justifique todas as respostas de uma forma sucinta.
1. Considere que, numa distribuição de frequências relativa aos gastos energéticos de
80 empresas numa dada actividade, os pontos médios das classes 'ix e as frequências
relativas fi são os seguintes, respectivamente: 'ix = 4, 6, 8, 11, 15 e 21; fi= 0.1375,
0.1875, 0.2500, 0.2000, 0.1000 e 0.1250. Admita que um seu colega, depois de
calcular o terceiro momento central, tirou a seguinte conclusão: “A maior parte das
empresas tem um consumo energético inferior à média.”. Suporte a veracidade ou a
falsidade desta conclusão.
2. Os ganhos percentuais, ao fim de 3 anos, com as obrigações de 16 empresas do
sector industrial foram os seguintes:
10.5 41.0 58.5 60.0 60.0 62.5 65.0 65.0 65.0 67.5
70.0 70.0 72.5 73.8 74.8 75.0 75.2 80.0 85.0 98.9
Esboce o diagrama caixa de bigodes. Comente.
3. Numa determinada semana foram detectados 255 condutores que apresentavam uma
taxa de alcoolemia positiva (superior a 0,5 gramas de álcool por litro de sangue), 87
dos quais foram detidos por apresentarem valor igual ou superior a 1,20 gramas.
Sabe-se, ainda, que 40 dos condutores detidos estiveram envolvidos em acidentes.
Calcule a probabilidade de um determinado condutor ter estado envolvido num
acidente sabendo que tinha uma taxa de alcoolémia superior a 1.2 gramas.
4. O fornecimento mensal de gás natural por parte da empresa GasPor para um país é
uma variável aleatória com função densidade de probabilidade dada por
23( ) , 0 2
8
xf x x= ≤ ≤
Calcule o fornecimento médio mensal de gás natural.
Model Summary
,985a ,971 ,962 ,11461Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Preço do Barril do Petróleoa.
5. Uma determinada empresa tem produção mensal igual a 100 toneladas. Sabendo que
a procura mensal é uma variável aleatória normal com média 80 toneladas e desvio
padrão 10 toneladas calcule a probabilidade de num semestre haver procura
excedentária em pelo menos dois meses.
6. Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição com função densidade
dada por
( )1x ;0 x 1, 0
f x0; caso contrário
θ−θ < < θ>=
Determine, pelo método de máxima verosimilhança, o estimador de θ.
7. A equipa de rally Mits tem dois pilotos e pretende avaliar qual deve ser o seu piloto
principal na maior prova mundial: Lisboa – Dakar. Para isso, realizou um conjunto
de 9 etapas/teste com cada um dos pilotos, registando-se os seguintes resultados (em
horas).
Média Variância
Piloto A 4,31 2,0
Piloto B 4,65 1,1
a) Determine um intervalo de confiança a 95% para a razão de variâncias dos
tempos dos pilotos.
b) Verifique, ao nível de significância de 5%, se existe evidência estatística de que
o piloto A consegue um tempo médio inferior ao piloto B e assim ser o piloto
principal da equipa. Admita os pressupostos necessários.
8. Suponha que se obtiveram 12 observações da taxa de crescimento do PIB de um
dado país por trimestre e do preço médio do barril de petróleo nesse trimestre.
Realizou-se uma análise de regressão utilizando o SPSS e obtiveram-se, entre
outros, os seguintes outputs:
Coefficients a
2,715 ,205 13,252 ,001
-,053 ,005 -,985 -10,057 ,002
(Constant)
Preço do Barrildo Petróleo
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Taxa de Crescimento do PIBa.
a) Interprete o valor dos coeficientes do modelo de regressão linear, avalie a
qualidade do ajustamento efectuado e indique os pressupostos subjacentes.
b) Construa um intervalo de confiança a 95% para β2 e através dele conclua se o
modelo de regressão é significativo.
9. Recolheram-se 16 tempos de entrega de SMS durante o período de Natal de uma
dada operadora TM, com o objectivo de testar se o tempo médio de entrega de cada
SMS é inferior a 30 segundos. Pretendendo realizar uma abordagem paramétrica
testou-se um pressuposto fundamental através do teste de Kolmogorov-Smirnov,
tendo-se obtido os seguintes resultados:
One-Sample Kolmogorov-Smirnov Test
16
27,6875
35,92162
,361
,361
-,229
1,445
,031
,022
,000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Point Probability
TEMPO
Test distribution is Normal.a.
Calculated from data.b.
Indique a hipótese a testar, o valor da estatística de teste e retire as conclusões que
entender convenientes para um nível se significância de 5%. Caso não considere
adequada uma abordagem paramétrica, que teste poderia utilizar?
10. A operadora TM, referida no exercício anterior, pretende estimar a proporção de
clientes totalmente fidelizados. Qual deverá ser a dimensão da amostra a recolher
para obter uma estimativa com erro máximo de 2%, com uma confiança de 95%?
11. Determinada empresa seguradora baseia o seu sistema de prémios para determinado
risco na premissa de que o número de sinistros por apólice tem distribuição Poisson
de parâmetro λ = 0,2. Numa amostra de 1000 apólices referentes ao ano
anterior observou-se:
N.º sinistros por apólice 0 1 2 3
N.º apólices 800 175 21 4
Teste, ao nível de significância de 1%, a hipótese da suposição da empresa
seguradora.
Cotação:
1) 1.5 2) 1.5 3) 1.0 4) 1.5 5) 2.0 6) 1.5 7a) 1.5 7b) 1.5 8a) 2.0 8b) 1.5 9) 1.5 10)
1.5 11) 1.5
Formulário de Apoio:
1ip i i
i
np Nx l R
n−−
= + ×ɶ ( )22
1
1
1
n
i ii
s n x xn =
= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q
[ ] [ ]
[ ]
1
1
, 2,
np np
p
np
x xnp
xx np
+
+
+ ∈= ∉
ℕɶ
ℕ
( )
( ) ( )
3' ' ' '3 3 2 1 1
2 4' ' ' ' ' '4 4 3 1 2 1 1
3 2
4 6 3
m m m m m
m m m m m m m
= − +
= − + −
( )1=
−=∑
kr
i ii
r
n x xm
n ' 1==
∑k
ri i
ir
n xm
n 3
1 3γ =
m
s 4
2 43γ = −
m
s
( ) ( )3 1
3 1
− − −
−
ɶ ɶQ x x Q
Q Q
ˆ−=
x xg
s
( )3 1
90 102
−−
Q Q
P P 1
1
=
=
=∑
∑
i
jj
i k
jj
n
pn
1
1
=
=
=∑
∑
i
i ij
i k
i ij
n x
qn x
1
11
1
1
−
=−
=
= −∑
∑
k
iik
ii
qG
p
( )( ) ( )
( ) ( )1
|| , 1, 2, ..., n
|=
×= =
∑i i
i n
k kk
P A P B AP A B i
P A P B A
( ) ( ) ( )1
|=
=∑n
i ii
P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B
( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B
( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A
( )( ) ; ( ) ( )≤ −∞
= = =∑ ∫k
x
kx x
F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a
( ) ( )1 , 0, 1, ..., − = = − =
n kknP X k p p k n
k
( ) , 0, 1, ... 0!
−
= = = >λλ
λke
P X k kk
; 0 01 1 2 2
2
XX XX
ˆ ˆT ; T=
QME 1 xQMES n S
β −β β −β=
+
( )( )( )
( )2 2L C k
ij ij2 2 2 2i ik 1 pL 1 C 1
i 1 j 1 i 1ij i
o e o e
e eɺ ɺχ χ − −− −
= = =
− −Χ = ∩ Χ = ∩∑∑ ∑
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
Exame de Época Recurso de PROBABILIDADES E ESTATÍSTICA * 6/01/2006
ECONOMIA, GESTÃO, INFORMÁTICA E GESTÃO
Duração: 3 horas Nota: Justifique todas as respostas de uma forma sucinta.
1. Considere que, numa distribuição de frequências relativa aos gastos energéticos de
80 empresas numa dada actividade, os pontos médios das classes 'ix e as frequências
relativas fi são os seguintes, respectivamente: 'ix = 4, 6, 8, 11, 15 e 21; fi= 0.1375,
0.1875, 0.2500, 0.2000, 0.1000 e 0.1250. Suporte a veracidade ou a falsidade da
conclusão: “A maior parte das empresas tem um consumo energético inferior à
média.”.
2. Os ganhos percentuais, ao fim de 3 anos, com as obrigações de 16 empresas do
sector industrial foram os seguintes:
10.5 41.0 58.5 60.0 60.0 62.5 65.0 65.0 65.0 67.5
70.0 70.0 72.5 73.8 74.8 75.0 75.2 80.0 85.0 98.9
Esboce o diagrama caixa de bigodes. Comente.
3. Suponha que as necessidades, nos meses de primavera e verão, de gás natural de um
determinado país podem ser descritas por uma variável aleatória contínua com
função densidade de probabilidade dada por:
23
( ) , 0 28
xf x x= ≤ ≤
Admita que você é o director da empresa fornecedora do país, GasPor, e que o
ministro desse país propôs que nos meses cujo fornecimento não cobrisse as
necessidades a sua empresa fosse penalizada em 100 000€ enquanto no caso
contrário a sua empresa beneficiaria de um prémio de 50 000€. Não sendo possível
assegurar mais que 1.5 unidades por mês no abastecimento de gás ao país, acha que
seria vantajoso para a sua empresa aceitar a proposta do ministro? Justifique.
4. Uma determinada empresa tem produção mensal igual a 100 toneladas. Sabendo que
a procura mensal é uma variável aleatória normal com média 80 toneladas e desvio
Model Summary
,985a ,971 ,962 ,11461Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Preço do Barril do Petróleoa.
Coefficients a
2,715 ,205 13,252 ,001
-,053 ,005 -,985 -10,057 ,002
(Constant)
Preço do Barrildo Petróleo
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Taxa de Crescimento do PIBa.
padrão 10 toneladas, calcule a probabilidade de num semestre haver procura
excedentária no máximo em dois meses.
5. Seja X1, X2, ...,Xn, uma amostra aleatória de uma população com distribuição
exponencial.
Determine, pelo método de máxima verosimilhança, o estimador de λ.
6. Diga, justificando, se é verdadeira ou falsa a seguinte proposição: “Supondo que o
intervalo de confiança a 99% para a diferença de médias é dado por (0.02, 0.15),
então podemos concluir que as médias populacionais diferem ao nível de 5%.”.
7. Numas eleições Presidenciais de determinado país foi realizada uma sondagem à
boca das urnas num dado concelho. Nessa sondagem foram inquiridas 210 pessoas,
78 das quais disseram ter votado no candidato CS.
a) Haverá evidência estatística para concluir, ao nível de 5%, que o candidato CS
obterá nesse Concelho mais de 30% dos votos?
b) As sondagens apresentadas por um canal de televisão, apresentavam o vencedor
com uma votação de 51,5%, com uma confiança de 95% e um erro máximo de
2,23%. Calcule a dimensão da amostra utilizada por esse canal de televisão.
8. Suponha que se obtiveram 12 observações da taxa de crescimento do PIB de um
dado país por trimestre e do preço médio do barril de petróleo nesse trimestre.
Realizou-se uma análise de regressão utilizando o SPSS e obtiveram-se, entre
outros, os seguintes outputs:
c) Interprete o valor dos coeficientes do modelo de regressão linear, avalie a
qualidade do ajustamento efectuado e indique os pressupostos subjacentes.
d) Construa um intervalo de confiança a 95% para a previsão do crescimento da
taxa do PIB por trimestre quando o preço por barril é de 50 dólares, admitindo
uma preço médio por barril de 40 dólares.
9. Recolheu-se uma amostra aleatória de 16 tempos de entrega de SMS, de uma dada
operadora, TM, durante o período de Natal tendo-se obtido uma média igual a 28
segundos e um desvio padrão igual a 36 segundos. Sabendo que, durante o mês de
Outubro, numa amostra de 24 SMS se obteve um valor médio do tempo de entrega
igual a 19 segundos e um desvio padrão igual a 9 segundos, diga se há evidência
estatística, ao nível de significância de 5%, que lhe permita concluir que os tempos
de entrega no Natal são superiores aos tempos de entrega em Outubro? Admita os
pressupostos que entender necessários para realizar uma abordagem paramétrica.
10. No caso descrito no exercício anterior testou-se, para a amostra recolhida no período
de Natal, um dos pressupostos através do teste de Kolmogorov-Smirnov, tendo-se
obtido os seguintes resultados:
One-Sample Kolmogorov-Smirnov Test
16
27,6875
35,92162
,361
,361
-,229
1,445
,031
,022
,000
N
Mean
Std. Deviation
Normal Parametersa,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Exact Sig. (2-tailed)
Point Probability
TEMPO
Test distribution is Normal.a.
Calculated from data.b.
Indique a hipótese que testou quando recorreu a este teste e justifique porque não
deveria ter realizado a abordagem paramétrica. Neste caso, que teste poderia
utilizar? Descreva-o sucintamente.
11. Uma companhia de seguros tem três tipos de clientes – de risco elevado, médio e de
baixo risco. Do histórico dessa companhia, admitia-se que 10% dos clientes
correspondem à primeira categoria e 40% correspondem à segunda. Com base nos
registos actualizados da empresa conclui-se que as apólices se distribuem da
seguinte forma:
Risco
Elevado Médio Baixo
420 980 1100
Poderá concluir, ao nível de 5%, que neste momento já não é correcta a distribuição
proporcional das apólices?
Cotação:
1) 1.5 2) 1.5 3) 1.5 4) 2.0 5) 1.5 6) 1.0 7a) 1.5 7b) 1.5 8a) 2.0 8b) 1.5 9) 1.5 10)
1.5 11) 1.5
Formulário de Apoio:
1ip i i
i
np Nx l R
n−−
= + ×ɶ ( )22
1
1
1
n
i ii
s n x xn =
= −− ∑ [ ]1 33 , 3− +Q IQ Q IQ 3 1= −IQ Q Q
[ ] [ ]
[ ]
1
1
, 2,
np np
p
np
x xnp
xx np
+
+
+ ∈= ∉
ℕɶ
ℕ
( )
( ) ( )
3' ' ' '3 3 2 1 1
2 4' ' ' ' ' '4 4 3 1 2 1 1
3 2
4 6 3
m m m m m
m m m m m m m
= − +
= − + −
( )1=
−=∑
kr
i ii
r
n x xm
n ' 1==
∑k
ri i
ir
n xm
n 3
1 3γ =
m
s 4
2 43γ = −
m
s
( ) ( )3 1
3 1
− − −
−
ɶ ɶQ x x Q
Q Q
ˆ−=
x xg
s
( )3 1
90 102
−−
Q Q
P P 1
1
=
=
=∑
∑
i
jj
i k
jj
n
pn
1
1
=
=
=∑
∑
i
i ij
i k
i ij
n x
qn x
1
11
1
1
−
=−
=
= −∑
∑
k
iik
ii
qG
p
( )( ) ( )
( ) ( )1
|| , 1, 2, ..., n
|=
×= =
∑i i
i n
k kk
P A P B AP A B i
P A P B A
( ) ( ) ( )1
|=
=∑n
i ii
P B P B A P A ( ) ( ) ( )− = − ∩P A B P A P A B
( ) ( ) ( ) ( )∪ = + − ∩P A B P A P B P A B
( ) ( ) ( ) ( ) ( ). | |∩ = =P A B P A P B A P B P A B
( ) ( ) ( ) ( ) ( )1 2 1 2 1 1 1 2 2 2 1 1... | ... | ... ... |− − −= × × × ×n n n n nP A A A P A A A A P A A A A P A A P A
( )( ) ; ( ) ( )≤ −∞
= = =∑ ∫k
x
kx x
F x P X x F x f u du ( ) ( ) ( )< ≤ = −P a X b F b F a
( ) ( )1 , 0, 1, ..., − = = − =
n kknP X k p p k n
k ( )
xe ;x, 0f x
0; caso contrário
−λλ λ>=
( ) , 0, 1, ... 0!
−
= = = >λλ
λke
P X k kk
; 0 01 1 2 2
2
XX XX
ˆ ˆT ; T=
QME 1 xQMES n S
β −β β −β=
+
( )( )( )
( )2 2L C k
ij ij2 2 2 2i ik 1 pL 1 C 1
i 1 j 1 i 1ij i
o e o e
e eɺ ɺχ χ − −− −
= = =
− −Χ = ∩ Χ = ∩∑∑ ∑
UNIVERSIDADE DE ÉVORA - Departamento de Matemática
PROBABILIDADES E ESTATÍSTICA (2003/04)
Formulário de Apoio de Inferência Estatística
DISTRIBUIÇÕES AMOSTRAIS INTERVALOS DE CONFIANÇA ESTATÍSTICA DE TESTE
X N ,n
∩ σ
µ 1 1
2 2
x z , x zn n− −
− × + × α α
σ σ
0XZ
n
−=
µ
σ
n 1
Xt
S'n
−
−∩µ
n 1, 1 n 1, 1
2 2
s ' s 'x t , x t
n n− − − −
− × + × α α
0XT
S'n
−=
µ
( ) 22n 12
n 1 S'−
−∩χ
σ 2 2
1 ,n 1 ,n 12 2
n 1 n 1s ' , s '
− − −
− − α αχ χ
( ) 2
220
n 1 S'−Χ =
σ
( )p 1 pp N p,
n
− ∩ ɺ
( ) ( )1 1
2 2
ˆ ˆ ˆ ˆp 1 p p 1 pˆ ˆp z , p z
n n− −
− − − × + × α α ( )
0
0 0
p pZ
p 1 p
n
−=
−
1 2
2 21 2
n 1,n 12 22 1
S'F
S' − −× ∩σ
σ
1 2 1 2
2 22 22 2n 1,n 1, n 1,n 1, 11 12 2
s ' s 'F , F
s ' s '− − − − −
α α
2122
S'F
S'=
2 21 2
1 2 1 21 2
X X N ,n n
− ∩ − +
σ σµ µ
2 2 2 21 2 1 2
1 2 1 21 1
1 2 1 22 2
x x z , x x zn n n n− −
− − × + − + × + α α
σ σ σ σ
( ) ( )1 2 1 2 0
2 21 2
1 2
X X
n n
− − −
+
µ µ
σ σ
DISTRIBUIÇÕES AMOSTRAIS INTERVALOS DE CONFIANÇA ESTATÍSTICA DE TESTE
( ) ( )
( ) ( )
1 2
1 2 1 2
n n 2
1 2
2 21 1 2 2
1 2
X Xt
1 1S
n n
n 1 S' n 1 S'ˆcom Sn n 2
+ −
− − −∩
+
− + −=
+ −
µ µ
( ) ( )
1 2 1 21 2 1 2
n n 2, 1 n n 2, 11 2 1 22 2
2 21 1 2 2
1 2
1 1 1 1ˆ ˆx x t s , x x t s
n n n n
n 1 s ' n 1 s 'ˆcom s
n n 2
+ − − + − −
− − × + − + × +
− + −=
+ −
α α
( ) ( )1 2 1 2 0
1 2
X XT
1 1S
n n
− − −=
+
µ µ
( ) ( )1 1 2 21 2 1 2
1 2
p 1 p p 1 pˆ ˆp p N p p ,
n n
− − − ∩ − + ɺ
( ) ( ) ( ) ( )1 1 2 2 1 1 2 21 2 1 2
1 11 2 1 22 2
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆp 1 p p 1 p p 1 p p 1 pˆ ˆ ˆ ˆp p z ,p p z
n n n n− −
− − − − − − × + − + × + α α
( ) ( )( ) ( )1 2 1 2 0
1 1 2 2
1 2
ˆ ˆp p p pZ
ˆ ˆ ˆ ˆp 1 p p 1 p
n n
− − −=
− −+
Estimação Pontual
( ) ( )( ) ( ) ( )( )
( )
2
n
n
ˆ ˆEnv E
ˆ ˆ ˆEQM Var Env
limE
limVar 0
→∞
→∞
= −
= + = =
⌢
⌢
θ θ θ
θ θ θ
θ θ
θ
;
( ) ( ) ( )
( )
k
m' r ' rr k k r
x' '
nr r r
i' i 1r
E X x P X x ; = x f (x)dx
m com x
mn
+∞
−∞
=
= = == =
∑ ∫
∑
µ µ
µ ;
( ) ( )
( ) ( )
( ) ( )
n
kk 1
2 2
2 2
L | x f x
dL | x d ln L | x0 ou 0
d d
d L | x d ln L | x0; 0
d d
=
=
= =
< <
∏ θθ
θ θ
θ θ
θ θ
θ θ
Proposta de avaliação do docente e da disciplina
Probabilidades e Estatística 2005/2006 Departamento de Matemática da Universidade de Évora
Caro aluno, Com o objectivo de melhorar a forma e o conteúdo desta disciplina nos próximos anos, muito lhe agradecíamos se pudesse partilhar a sua opinião sobre o conteúdo e a docência desta disciplina. Nos pontos que a seguir se seguem, avalie, por favor, o Docente e a Disciplina, assinalando com uma cruz a sua opção. Use as seguintes categorias de resposta:
A – Muito Bom B – Bom C – Suficiente D – Insuficiente E – Muito insuficiente
Avaliação da disciplina
1. Adequação do número de horas lectivas ____________ A B C D E 2. Acesso à bibliografia recomendada ______________________ A B C D E 3. Coordenação entre os docentes _______ A B C D E 4. Correspondência entre conhecimentos avaliados e matéria leccionada _ A B C D E 5. Adequação dos recursos utilizados para a leccionação desta disciplina A B C D E 6. Considera a sua assiduidade às aulas desta disciplina ______ A B C D E 7. Em média quantas horas de estudo pensa ter dedicado à disciplina por semana ___
Avaliação dos Docentes
Docente: Paulo Infante
7. Preparação, organização e utilização do tempo de aula _______ A B C D E 8. Clareza com que o Docente expõe a matéria __ A B C D E 9. Empenho e o entusiasmo mostrados no ensino _ A B C D E 10. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E 11. Disponibilidade para esclarecer dúvidas __________ A B C D E 12. Respeito, tolerância e honestidade para com os Alunos A B C D E 13. Assiduidade e pontualidade ________ A B C D E 14. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E 15. Classificação global do Docente é:__ A B C D E
Docente: Gonçalo Jacinto
7. Preparação, organização e utilização do tempo de aula _______ A B C D E 8. Clareza com que o Docente expõe a matéria __ A B C D E 9. Empenho e o entusiasmo mostrados no ensino _ A B C D E 10. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E 11. Disponibilidade para esclarecer dúvidas __________ A B C D E 12. Respeito, tolerância e honestidade para com os Alunos A B C D E 13. Assiduidade e pontualidade ________ A B C D E 14. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E 15. Classificação global do Docente é:__ A B C D E
CRÍTICAS / COMENTÁRIOS / SUGESTÕES