33
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Petra Petrovics Descriptive Statistics

Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Petra Petrovics

Descriptive Statistics

Page 2: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

DESCRIPTIVE STATISTICS

• Definition: Descriptive statistics is concerned only

with collecting and describing data

• Methods:

- statistical tables and graphs

- descriptive measures

Descriptive measure – a single number that

provides information about a set of data

Page 3: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Description of a Population

I. Central Tendency

- mean

- mode

- median

II. Percentiles, Quartiles

III. Dispersion

IV. Shape

calculation

location

Page 4: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

I.1. Means

• Arithmetic mean (average)

• Geometric mean – the ratio of any two consecutive

numbers is constant

– e.g. compound interest rate

• Harmonic mean – units of measurement differ

between the numerator and denominator

– e.g. miles per hour

• Quadratic mean

– e.g. the form of standard deviation, mean of differences

Page 5: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Arithmetic Mean

n

x

n

xxxx

n

i

i

n

121 ...

i

n

i

ii

f

xf

x 1

Raw Data Expressions (simple

formula):

Frequency Distribution

Expressions (weighted

formula):

• Typically referred to as mean.

• The most common measure of central tendency.

• It is the only common measure in which all the

values play an equal role.

• Symbol: , called X-barx

Page 6: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Properties of Mean

• The sum of the differences from the mean is 0.

is minimal,

if a=

i=1

n

ix - x = 0

xi di=xi-

100 -100

150 -50

210 +10

240 +40

300 +100

Σ 1000 0

200

x

x

i=1

n

ix - a2

x

Page 7: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

xi xi+50 xi·1,1=y Z=x+y

100 150 110 210

150 200 165 315

210 260 231 441

240 290 264 504

300 350 330 630

Σ 1000 1250 1100 2100

200 250 220 420

x

Properties of Mean 2.

• If you add a

constant ‘a’ to

every xi, the mean

will be a+ x

• If you multiply

every xi by a

constant ‘b’, the

mean will be b*x

• x1, x2, ..., xn →

• y1, y2, ..., yn →

x1 + y1; ...; xn + yn

y

yx

Page 8: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Geometric Mean

The rate of change of a variable over time. The nth root

of the product of n values.

x xg

n

in

i 1

n f

i

n

1ig

ixπx

Raw Data Expressions:

Frequency Distribution Expressions:

Page 9: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

GDP in Hungary

Period Previous quarter = 100%

2008. Q1 100.9

2008. Q2 99.8

2008. Q3 99.0

2008. Q4 98.1

Source: HCSO

%4.99994.0978.0981.099.0998.0009.1 44 gx

Average growth rate:

Page 10: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Harmonic Mean

hx

=

n

xi=1

n

i

1

xh

n

f

xi=1

ni

i

, where n = f

i=1

k

i

=

The harmonic mean of a set of n numbers is found by

adding up the reciprocals of the numbers, and then

dividing n by this sum.

Frequency Distribution Expressions:

Raw Data Expressions:

Page 11: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Relation between the Partitional Ratio

and Dynamic Ratio

FactoriesTurnover (MFt)

Partitional of

turnover (%)

Ratio (%)

t0 t1 t0 (%) t1 (%)

C 30 36 20 19 120

D 40 60 27 32 150

E 70 77 47 41 110

F 10 14.5 6 8 145

Total 150 187.5 100 100 125

0

1

t

t

Page 12: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

25.1

4.1

5.14

1.1

77

5.1

60

2.1

36

5,187

V

A

AV

25.11

45.106.01.147.05.127.02.12.0

B

VBV

25.1150

45.1101.1705.1402.130

B

VBV

25.1150

5.187

B

AV

i

i

i

i

ii

i

ii

Page 13: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Quadratic Mean

n

x

x

n

i

i

q

1

2

k

i

i

k

i

ii

q

f

xf

x

1

1

2

k

i

iiq xgx1

2

Page 14: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

I.2. Median

• Statistic which has an equal number of variates above and below it

• Raw Data Expressions: ranked value

• Independent from extreme values

• Just from data in order

• The „middle term”

2

1n

I.3. Mode

• The value that occurs most frequently

• Typical value

Page 15: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

I.3. Mode

• The value that occurs most frequently

• Typical value

Page 16: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Measurement ScaleBest Measure of the

‘Middle’

Nominal

(Categorical)Mode

Ordinal Median

IntervalSymmetrical data: Mean

Skewed data: Median

RatioSymmetrical data: Mean

Skewed data: Median

Page 17: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

II. Percentiles and Quartiles

• The Pth percentile of a group of members is thatvalue below which lie P% (P percent) of the numbersin the group.

• Q1 (lower quartile): The first quartile is the 25thpercentile. It is that point below which lie ¼ of thedata.

• Q2 (middle quartile): The median is the data belowwhich lie half the data. It is the 50th percentile.

• Q3 (upper quartile): The third quartile is the 75thpercentile point. It is that below which lie 75 percentof the data.

Page 18: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

III. Measures of Dispersion

1. Range

2. Interquartile Range

3. Population and Sample Standard Deviation

4. Population and Sample Variance

5. Coefficient of Variation

Page 19: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

III.1. Range

• The range of a set of observations is the

difference between the largest observation and

the smallest observation.

III.2. IQR

• Interquartile range: difference between the first

and third quartiles.

max minR X X

3 1IQR Q Q

Page 20: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

III.3. Standard Deviation

• The standard deviation is a measure of

dispersion around the mean.

• A low standard deviation indicates that the data

points tend to be very close to the mean, whereas

high standard deviation indicates that the data are

spread out over a large range of values.

• In a normal distribution, 68% of cases fall within

one standard deviation of the mean and 95% of

cases fall within 2 standard deviations.

Page 21: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Properties of Standard Deviation

• 0, if x=constant

• 222 xxq

10 Nx

Page 22: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

xi di=xi- yi = xi+50 di=yi-

100 -100 10 000 150 -100

150 -50 2 500 200 -50

210 +10 100 260 +10

240 +40 1 600 290 +40

300 +100 10 000 350 +100

Σ 1 000 0 24 200 1 250 0

200 250

σ2=4 840 σ2=4 840

σ=69.6 σ=69.6

x

x y2

id

y

Properties of Standard Deviation

• If you add a constant ‘a’ to every xi, the standard deviation will be the same.

Page 23: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

xi di=xi- yi = xi·1.1 di=yi-

100 -100 10 000 110 -110 12 100

150 -50 2 500 165 -55 3 025

210 +10 100 231 +11 121

240 +40 1 600 264 +44 1 936

300 +100 10 000 330 +110 12 100

Σ 1000 0 24 200 1 100 29 282

= 200 = 220

σ2=4 840 σ2=5 856.4

σ=69.6 σ=76.52

x

x y2

id

y

2

id

Properties of Standard Deviation

• If you multiply every xi by a constant ‘b’, the standard deviation will be b*σ

Page 24: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

III.4. Variance

• Variance of a set of observations: the average squared

deviation of the data points from their mean.

• Population variance:

• Sample variance:

2 2

2 1 1

1

( ) ( )n n

i i i

i i

n

i

i

X X f X X

nf

2 2

2 1 1

1

( ) ( )

11

n n

i i i

i i

n

i

i

X X f X X

Sn

f

III.5. Coefficient of Variation

• The measure of dispersion around the mean in %.

VX

sV

X

Page 25: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

IV. Measures of Shape

• Skewness is a measure of the degree of asymmetry

of a frequency distribution.

• Kurtosis is a measure of the flatness (versus

peakedness) of a frequency distribution.

Page 26: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

IV.1.Kurtosis

Positive – cluster

more and have

longer tails

Negative – cluster

less and have

shorter tails

The measure of the extent to which observations cluster around

the central point.

For a normal

distribution, the

value of the

kurtosis statistic

is zero.

Page 27: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Symmetry

Me Mo X Mo Me X

Skewed to the left(long right tail)

Skewed to the right

X Me Mo

IV.2. Skewness

A>0 A<0

X MoA

3 1

3 1

( ) ( )

( ) ( )

Q Me Me QF

Q Me Me Q

Page 28: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Box Plot

• The box plot is a set of five summary

measures of the distributions of the data:

- the median of the data

- the lower quartile

- the upper quartile

- the smallest observation

- the largest observation

+ asymetry

Page 29: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Box&Whiskers

Source: Aczel [1996]

Page 30: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Elements of Box Plot

Source: Aczel [1996]

Page 31: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Source: Aczel [1996]

Page 32: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Box Plot

The least

standard

deviation

The highest

salary

MeQ1

Q3

Page 33: Miskolci Egyetem Gazdaságtudományi Kar Üzleti ...gtk.uni-miskolc.hu/files/11149/L2_desc_stat_Quant.pdfMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási

Miskolci Egyetem Gazdaságtudományi Kar

Üzleti Információgazdálkodási és Módszertani Intézet

Thanks for your attention!