Upload
nicole-alerva-reyes
View
25
Download
2
Embed Size (px)
DESCRIPTION
Stat 101
Citation preview
������������������� �����
������������ ��������������������������������������������
NOTES �
��
��
�
��
����������������������
���������� ����������������������
����������������������������
�����!�"�#��
$����
������������ �����%������� ����������&�������������������'
(���������������&��������������������������%� ������������������)����� ����������� ���&�%������*��������������
+���������������&��������������������������%� ������������������)����� �����������������
,���������������&��%� �����������������&������� ���������������-.���/�� ���0��������������&��� ��)��1����%������������&�(���,
������&� ����% ���������� ����������2�)�����)�������������
11
X nx
= �
Population 1Population 1
Population 2
22
X nx
= �
1 2X X−1 2X X−
1X
2X
1 2X X−
������&� ����% ���������� ����������2�)�����)�������������
1 2X X−1 2X X−µ
1 2
12
1
22
2X X n n− = +σ σ σ
1 21 2X X−
= −µ µ µ
1 2X X−1 2X X−µ
1 2
12
1
22
2X X n n− = +σ σ σ
1 21 2X X−
= −µ µ µ
�)�3����������4������������� ������
�)��4������������� ������!�#������&������
��)��3������'
�5'��( 6 7+ ≥≥≥≥ 5��'�7( 6 7+ 8�5
�����3������'
�5'�7( 6 7+ � 5��'�7( 6 7+ 9 5
�)�3������'
�5'�7( 6 7+ :�5��'�7( 6 7+ � 5
αααα αααα/2 αααα/2αααα
-zα -zα/2zα zα/2
��;����5 ���*�8�3*� ��;����5 ���*�9�*� ��;����5 ���*�8�3*�<+���*�9�*�<+
*�=�� ���������� ��������������)�������������
σ���σ�1��)�!�����4�����������������
( ) ( )1 2 1 2
2 21 2
1 2
X Xz
n n
µ µ
σ σ
− − −=
+
�����
#����������4���������-�����µ( 3 µ+���������σ(!�σ+ ����1��)�
( ) ( )2 2 2 2
1 2 1 21 2 1 21 22 2
1 2 1 2
Z ZX X X Xn n n nα ασ σ σ σµ µ− − + ≤ − ≤ − − +
-.����'�����!�4���
� �����������������µ( 3 µ+'�#����(����!�4����������� ��� �������&����
�> ���������������������������)�&����%�����������%��������&��������������?�.�����������@��4����������������&��������� ���&�������������������&�������!����������������&����%�����)�����������)��������������&����%���������%�����!����!�����������
� �����������������µ( 3 µ+'����&�3������#����� �������������
������A(��� ������A+
���!�4���� ���!����
��������B� �( :�(+5�%���� �+ :�C5�%����
���� :�+,D���������������:�+(C������
-.����'�����!�4���
x1x1 ����
2���������������������� ��������&������������!����)����� ����������������������������1��)��σ(:�(D�����������σ+ :�+5��������#������ �����������5�5D������������&����������
*�=�� ���������� ��������������)�������������
�� ≥ ������ ≥ �������������� ���������������
( ) ( )1 2 1 2
2 21 2
1 2
X Xz
s sn n
µ µ− − −=
+
���������������&����� �����������2�)���������'��������&��-.����
������������������������ ������)��)��������� ���������������������������)��������������&����� ���)�&������������������&����&���������������������������&����� ���)�&��������� ����&����&����2��� ���)����������&�����������)������������������������������&��������&������������ ���������������������������)� ���%�'
0:
0:
21
210
≠−=−
µµµµ
AH
H
���������������&����� �����������2�)���������'��������&��-.����
0����������������,+����������&����&����������������������0������1����0������������������������1������,��� ����&����&������������ ���&���������������������������������)��&������'
���������������&����� �����������2�)���������'��������&��-.����
164.264
253.16
700.70
32
2
1
1
1
1
=
=
=
=
SSXn
411.166
900.12
187.62
34
2
2
2
2
2
=
=
=
=
SSXn
Advertising Managers
68.50863.384
59.04593.083
54.27045.652
73.90439.672
57.35165.36080.742
86.74174.19475.932
35.39464.27674.195
69.31967.056103.030
62.48377.24293.261
59.62196.76789.807
67.57465.14596.234
71.11557.79174.256
Advertising Managers
68.50863.384
59.04593.083
54.27045.652
73.90439.672
57.35165.36080.742
86.74174.19475.932
35.39464.27674.195
69.31967.056103.030
62.48377.24293.261
59.62196.76789.807
67.57465.14596.234
71.11557.79174.256
Auditing Managers
63.50861.261
58.65366.359
71.49271.35160.053
67.81472.79048.036
56.47059.50573.065
72.40137.38661.254
71.80467.16099.198
46.39483.84937.194
54.44942.49463.362
59.67654.33557.828
63.36966.03555.052
43.64977.13669.962
Auditing Managers
63.50861.261
58.65366.359
71.49271.35160.053
67.81472.79048.036
56.47059.50573.065
72.40137.38661.254
71.80467.16099.198
46.39483.84937.194
54.44942.49463.362
59.67654.33557.828
63.36966.03555.052
43.64977.13669.962
���������������&����� �����������2�)���������'��������&��-.����
4���������%��!�)����������&�)��������������������������������������&��)�&�����������������&����&����������� ����&����&��E�������������������)�3�������� ������α :�5�5D��2��� ���������������)�3��������!������������)����;��������&��������������������5�5+D�������)�������������)��&���& ��'
���������������&����� �����������2�)���������'��������&��-.����
RejectionRegion
Non Rejection Region
Critical Values
RejectionRegion
96.1−=Zc 0 96.1=Zc
025.2
=α025.2
=α
RejectionRegion
Non Rejection Region
Critical Values
RejectionRegion
96.1−=Zc 0 96.1=Zc
025.2
=α025.2
=α
.Hreject not do 1.96, Z 1.96- If.Hreject 1.96, > or Z 1.96- < ZIf
o
o
≤≤
����������2�)���������'�����&�-.���
1.960z Critical two-tail
0.0189P(Z<=z) two-tail
1.64z Critical one-tail
0.0094P(Z<=z) one-tail
2.35z
0Hypothesized Mean Difference
3432Observations
166.411264.164Known Variance
62.18770.7001Mean
Auditing MgrAdv Mgr
z-Test: Two Sample for Means
1.960z Critical two-tail
0.0189P(Z<=z) two-tail
1.64z Critical one-tail
0.0094P(Z<=z) one-tail
2.35z
0Hypothesized Mean Difference
3432Observations
166.411264.164Known Variance
62.18770.7001Mean
Auditing MgrAdv Mgr
z-Test: Two Sample for Means
#����������4���������-�����µ( 3 µ+)�����( �����+ �������&������σ(!�σ+ ���� �1��)�
( ) ( )1 21
2
1
2
2
21 2 1 2
1
2
1
2
2
2X X S
nSn X X S
nSn
Z Z− − + ≤ − ≤ − − +µ µ
�������������%���
( ) ( )
( ) ( )
1 21
2
1
2
2
21 2 1 2
1
2
1
2
2
2
2 2
1 2
2 2
1 2
2145 246 19650 50
2145 246 19650 50
442 188
346 299 346 299
X X Sn
Sn X X S
nSn
Z Z− − + ≤ − ≤ − − +
− − + ≤ − ≤ − − +
− ≤ − ≤ −
µ µ
µ µµ µ
. . . . . .
. .
. . . .
1
1
1
Regular Gas
50
21.45
3.46
nXS
=
=
=
2
2
2
Premium Gas
50
24.6
2.99
nXS
=
=
=95% Confidence Z = 1.96�
���� �������� ���������������� �����������
� -����������)����� �����������������������% ���
� ����)������������������������
� 0������������������������������!�� 8�,5�
� ������� ������������ �������������������� �1��)��
� ��������������������)����� ������������> ����� σσ 2
2
2
1=
�����
=�� ������������ �������������������0�� ��&� σσ 2
2
2
1=
( ) ( )2 21 1 2 22
1 2
1 1
2p
s n s ns
n n
− + −=
+ −
����������������������������������������������������������������������
( ) ( )1 2 1 2
2
1 2
1 1p
X Xt
sn n
µ µ− − −=
� �+� �
� �
0��4�� �����������#����+�'���������B���� ��� ���&�#�����
Training Method A
56 51 45
47 52 43
42 53 52
50 42 48
47 44 44
Training Method B
59
52
53
54
57
56
55
64
53
65
53
57
1
1
1
2
15
47 73
19 495
nXS
=
=
=
.
.
2
2
2
2
12
56 5
18 273
nXS
=
=
=
.
.
F�������� ��������#����+�!����������������������5�5D������������&����������
-G#-��F � �������������BH�)3-��������������&����%��
t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2Mean 4 7.73 56.5Variance 19.495 18.27Observations 15 12Pooled Variance 18.957Hypothesized Mean Difference 0df 25t Stat - 5.20P(T<=t) one-tail 1.12E-05t Critical one-tail 1.71P(T<=t) two-tail 2.23E-05t Critical two-tail 2.06
t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2Mean 4 7.73 56.5Variance 19.495 18.27Observations 15 12Pooled Variance 18.957Hypothesized Mean Difference 0df 25t Stat - 5.20P(T<=t) one-tail 1.12E-05t Critical one-tail 1.71P(T<=t) two-tail 2.23E-05t Critical two-tail 2.06
#����������4���������-�����µ( 3µ+ )�������������������σ(+ :�σ++
( ) ( ) ( )2 21 1 2 2
1 21 2 1 22
1 2
1 1 1 12
2
s n s nx x t
n n n n
where df n n
α− + −
− ± ++ −
= + −
����3����������������)���������������
)������� %��������&��������������������.�����%��I�� ��������������������&��J
1 2 1 2
2 21 2
1 2
( ) ( )X Xt
s sn n
µ µ− − −=+
22 21 2
1 22 22 2
1 2
1 1 2 2
1 11 1
s sn n
s sn n n n
ν
� �+� �
� �=� � � �
+� � � �− −� � � �
���� �������� ���������������� �����������
������
�����������������µ( 3 µ+'�#����+%
��� �� � �������������� �� � ����������������������� ���������������������� ����� ����� ��������
4�������-��������µ( 3 µ+'�#����+%
�)������������ ������'�������������
� �����������3����������&� ����������������������������������������� ���
� ���������?%�����3���3����@���� ����������������������� ��!�� ��������)���������&�� ���� ������)���!���� ���!�� �����)�������4"������!���
� ���������&������������������������������&������������������������3����������&��%��� ������������%�)���������������������������������� �������������&�������
�)�3�������������������� ������
��)��3������'
�5'�� ≥≥≥≥ 5��'�7 8�5
�����3������'
�5'�7 � 5��'�7 9 5
�)�3������'
�5'�7 :�5��'�7 K 5
αααα αααα/2 αααα/2αααα
-tα -tα/2tα tα/2
��;����5 ����8�3� ��;����5 ����9�� ��;����5 ����8�3�<+����9��<+
�)������������ ������'�������������
difference samplemean = d
difference sample ofdeviation standard =
difference populationmean = D
pairsin difference sample = dpairs ofnumber
1
Sd
=−=
−=
n
ndfn
Ddt
S d
#����������4����������������� ���������������������������
2 2
1
d dD
s sd t d t
n ndf n
α αµ− ≤ ≤ +
= −
0��4�� ������'�������������
� #����������������)��&�� ������)�����������&������ �������������%���������� ����)������������������� ���)���������������)������ %;�����������%���������� ����)������� �������%�������������4������������!���������������������&���
0��4�� ������'�������������
L(D5(�,(+
3(((+5(,(((
L(DC(D((5
�(�M(�DM
3((,N(,LC
M(,L(+CL
3+(N5(N+N
,(�+(,MD
N(�L(�(�
D(�5(,D,
3((�D(�N+
�(,N(,+(
���������� ����������&� %;��
2���������� ���I��&J
0��4�� ������'�������������
�)����� ����������������
�������� �%�&���%����� ��&����� ���
�������������� �!��� ���� ���( :��+ ���������
���)��������I�J��������
1 2
1 2
*Y Y
pn n
+=+
The pooled estimate for the overall proportion is:
where Y1 and Y2 are the number of successes in samples 1 and 2
�)����� ����������������
Hypothesis for Population Proportions
Lower-tail test:
H0: p1 – p2 ≥≥≥≥ 0Ha: p1 – p2 < 0
Upper-tail test:
H0: p1 – p2 � 0Ha: p1 – p2 > 0
Two-tail test:
H0: p1 – p2 = 0Ha: p1 – p2 � 0
αααα αααα/2 αααα/2αααα
-zα -zα/2zα zα/2
Reject H0 if Z < -Zα Reject H0 if Z > Zα Reject H0 if Z < -Zα/2or Z > Zα/2
*�=�� ������������ ���������������� ����������������
( ) ( )1 2 1 2
1 2
1 2
1 2
1 1* (1 *)
*
Z
p pn n
Y Yp
n n
p p p p− − −=
� �− +� �
� �
+=+
�����&���� ���������������� ����������������
�������������4�����������&��������������������������������������)�����������)���%����������)��&����������������������������� �������&������������ ��O�� ��������� ������������ �������&�(55��������MD�)�����0��&������!�+����������)��&���������.����������������������� �������&������������ ����=������)���!������& ���)���,M�� ��������������)���� &������������������������������������&�������������������%�)��������������������)�����������)���%����������)��&����������������������������� �������&������������ ��O�������5�5(������������&����������
#����������4���������-������( 3 �+
( ) ( )1 1 2 2 1 1 2 2
1 2 1 2 1 22 21 2 1 2
(1 ) (1 ) (1 ) (1 )Z Z
p p p p p p p pp p p p p p
n n n nα α
− − − −− − + ≤ − ≤ − + +
�������������%��
1
1
1
1 1
400
48
48.12
4001 .88
nYp
q p
=
=
= =
= − =
2
2
2
2 2
480
187
187.39
480
1 .61
nYp
q p
=
=
= =
= − =
( ) ( )
( ) ( )( ) ( )( ) ( ) ( )( ) ( )( )
1 2 1 21 2 1 2
1 2 1 2 1 22 21 2 1 2
1 2
1 2
1 2
(1 ) (1 ) (1 ) (1 )
.12 .88 .39 .61 .12 .88 .39 .61.12 .39 2.33 .12 .39 2.33
400 480 400 480
.27 .064 .27 .064
.334 .206
p p p pZ Z
p p p pp p p p p p
n n n n
p p
p pp p
α α
− − − −− − + ≤ − ≤ − + +
− − + ≤ − ≤ − + +
− − ≤ − ≤ − +
− ≤ − ≤ −
For a 98% level of confidence, Z = 2.33.
��� �����
MISCELLANEOUS PROBLEMS 1. A record company executive is interested in estimating the difference in the average play
length of rock-and-roll singles and country-and-western singles. To do so she randomly selects 10 country-and-western singles and nine rock-and-roll singles. The play lengths in minutes of the selected singles are as follows:
Country and Western Rock and Roll 3.80 3.88 3.30 4.13 3.43 4.11 3.30 3.98 3.03 3.98 2.18 3.93 3.18 3.92 3.83 3.98 3.22 4.67
3.38
(a) Calculate a 99% confidence interval to estimate the difference in population means for these two types of recordings.
(b) At a 0.01 level of significance, is there evidence to say that there is a significant difference in the average playing length of time of the two populations assuming equal population variances? Use the 8-step procedure.
2. The following data represent the running times of films produced by two motion-picture
companies: Time, in minutes Company I 103 94 110 87 98 Company II 97 82 123 92 175 88 118 Test the hypothesis at the 0.10 level of significance that there is a significant difference
between the average running times of films produced by the two companies, assuming unequal variances for the populations.
3. A consumer test group wants to determine the difference in gasoline mileage of cars
using regular unleaded gas and cars using premium-unleaded gas. Researchers for the group divided a fleet of 100 cars of the same make in half and tested each car on one tank of gas. Fifty of the cars were filled with regular unleaded gas and 50 were filled with premium-unleaded gas. The sample average for the regular gasoline group was 21.45 miles per gallon with a standard deviation of 3.46 miles per gallon. The sample average for the premium gasoline group was 24.6 miles per gallon with the standard deviation of 2.99 miles per gallon. Is there evidence to believe at the 0.05 level of significance that there is a significant difference in the mean gas mileage between the cars using regular gasoline and the cars using premium gasoline?
4. Suppose you own a plumbing repair business and employ 15 plumbers. You are
interested in estimating the difference in the average number of calls completed per day between two of the plumbers. A random sample of 40 days of plumber A’s work results in a sample mean of 5.3 calls, with a variance of 1.99. A random sample of 37 days of plumber B’s work results in a sample mean of 6.5 calls with a variance of 2.36. Use a standard 8-step hypothesis testing procedure to answer this question at the 0.05 level of significance: is there a possibility that, for this population of days, there is no difference in the average number of calls completed between plumber A and plumber B?
5. Suppose that the National Association of Truck Drivers is interested in improving the
public image of truck drivers. They decide to test whether the average speed of trucks traveling on an interstate highway is significantly greater than the average speed of cars. In random samples of 100 cars and 200 trucks checked at one point on the highway, the average speed of the cars is 52 miles per hour and the average speed of the trucks is 54 miles per hour. Assume that the population variance of the cars is 25 and that of the trucks is 16. Test the appropriate hypothesis at a 0.05 level of significance. Follow the standard 8-step procedure used in the lectures.
6. The following represents the Excel printout of a t-test involving the numbers of
newspapers sold by eight randomly selected newsvendors on the east side of the city and by eight randomly selected news vendors on the west side of the city. Carry out a test of the hypothesis at the 0.05 level of significance that the news vendors on the east side of the city sell more newspapers than news vendors on the west side. Follow the standard 8-step procedure used in the lectures.
t-Test: Two-Sample Assuming Equal Variances
East Side West Side
Mean 47.25 38.75
Variance 108.5 141.9286
Observations 8 8
Pooled Variance ?
Hypothesized Mean Difference 0
df ?
t Stat ?
P(T<=t) one-tail 0.075482
t Critical one-tail ?
P(T<=t) two-tail 0.150963
t Critical two-tail ? 7. Ten pregnant women were given an injection of pitocin to induce labor. Their systolic
blood pressures immediately before and after the injection are given in the following Excel spreadsheet.
Patient Before After d t-Test: Paired Two Sample for Means
1 134 140 ? 2 122 130 ? Before After 3 132 135 ? Mean ? ? 4 130 126 ? Variance ? ? 5 128 134 ? Observations ? ? 6 140 138 ? Pearson Correlation 0.830679 7 118 124 ? Hypothesized Mean Difference ? 8 127 126 ? df ? 9 125 132 ? t Stat ?
10 142 144 ? P(T<=t) one-tail 0.022263 SUMMARY STATISTICS t Critical one-tail ? n ? P(T<=t) two-tail 0.044525 d average ? t Critical two-tail ? d stand. Dev. ? Do the data indicate that injection of this drug changes blood pressure? Use a 0.05 level of significance. Follow the standard 8-step procedure used in the lectures. Copy the Excel spreadsheet in your paper and fill in the cells marked “?” with their correct figures. 8. Computer response time is defined as the length of time a user has to wait for the
computer to access information on the disk. Suppose a data center wants to compare the average response times of its two computer disk drives. If µ1 is the mean response time of disk 1 and µ2 is the mean response time of disk 2, we want to detect a difference between these two means, if such a difference exits. Independent random samples of 50 response times for disk 1 and 40 response times for disk 2 were selected. The data (recorded in milliseconds) are as follows:
Disk 1 Disk 2 x1 = 68.2 x2 = 53.8
s1 = 18.6 s2 = 15.8 Is there sufficient evidence to indicate a difference between the mean response times of the two disk drives? Use a level of significance of 0.05 and assume a normal distribution for each with equal variances. Use the 8-step procedure in the lectures. 9. Suppose you want to conduct a study to conduct a study to compare the speed of typing
on a word processor with that on an electric typewriter. You believe word processing is faster than electric typewriting. To test this belief you randomly select 12 secretaries who are familiar with an electric typewriter and who know a particular word processing system. Each secretary is given the same passage to type, types the passage on an electric typewriter, and then types an equivalent passage on a word processor. The typing speeds computed in words per minute are shown in the following table.
Secretary Word Processor
Electric Typewriter
1 62 51 2 49 43 3 70 55 4 65 62 5 49 51 6 96 78 7 66 62 8 63 49 9 69 65
10 88 78 11 59 54 12 41 38
(a) Explain why the concept of matched pairs would apply to this problem. (b) Use a 1% level of significance to test whether word processing is faster than electric typewriting. Follow the 8-step procedure. 10. The Sales Department at Manelli Perfume Comp. is interested in whether there is a
difference in the proportions of younger and older women who would purchase the new Heavenly fragrance if it were marketed. There are two independent populations, a population consisting of the younger women and a population consisting of the older women. Each sampled woman will be asked to smell Heavenly and indicate whether she likes the fragrance well enough to purchase a bottle. A random sample of 100 young women revealed 20 liked the Heavenly fragrance well enough to purchase it. Similarly, a sample of 200 older women revealed 100 liked the fragrance well enough to make a purchase. At a 5% level of significance, test the hypothesis that the proportion of younger women and older women who liked the Heavenly fragrance are the same. Use the 8-step procedure. State the p-value.