16
Корреляционный анализ Correlation Analysis SixSigmaOnline.ru 2015

Корреляционный анализ

Embed Size (px)

DESCRIPTION

Краткое содержание презентации:1. Понятие корреляции2. Диаграммы рассеяния3. Коэффициент корреляции4. Графический анализ

Citation preview

Page 1: Корреляционный анализ

Корреляционный анализ

Correlation Analysis

SixSigmaOnline.ru 2015

Page 2: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

2

В производственном процессе всегда проводится контроль

тех или иных показателей: параметров конечного продукта

или параметров процесса, количественных или качественных

показателей. Причиной проведения такого контроля может

быть требование заказчика, требование отраслевых

стандартов или перестраховка выпуска брака.

Так или иначе, в ходе проведения контроля накапливается

огромный массив данных. Его исследование с помощью

простейших статистических методов анализа, таких как

корреляционный анализ, может принести много полезных

сведений о процессе без дополнительных затрат на его

изучение.

Page 3: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

3

Термин “корреляция” означает взаимосвязь двух параметров.

Два параметра считаются корреляционно зависимыми, если

изменения одного параметра зависят от изменений другого.

Основной характеристикой корреляционной зависимости

является коэффициент корреляции r, который количественно

характеризует силу связи между двумя параметрами.

На основании его величины судят о наличии или отсутствии

корреляции. При этом не следует забывать, что:

коэффициент характеризует линейную зависимость;

коэффициент сильно подвержен влиянию выбросов.

Page 4: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

4

Наглядно представить взаимосвязь между двумя

переменными и качественно оценить ее помогают

диаграммы рассеяния.

Диаграммы рассеяния отображают данные в виде

точек в координатах, осями которых являются

переменные.

В таблице справа собраны данные о силе,

требуемой для разрыва бумаги, и ее толщине.

Используем эту информацию для построения

диаграммы рассеяния и корреляционного анализа.

№ x y

1 0,2 64

2 0,19 65

3 0,28 69

4 0,26 69

5 0,23 66

6 0,21 65

7 0,24 67

8 0,26 67

9 0,28 70

10 0,25 68

11 0,25 67

12 0,22 66

13 0,18 63

14 0,26 68

15 0,17 62

16 0,3 70

17 0,19 64

18 0,25 68

19 0,29 69

20 0,27 68

21 0,2 63

22 0,19 66

23 0,29 70

24 0,31 72

25 0,24 66

26 0,22 65

27 0,27 69

28 0,23 65

29 0,25 69

30 0,17 61

Page 5: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

5

В пакете Minitab выберите

Graph > Scatterplot > Simple

и укажите переменные x и y

соответственно таблице.

0,3250,3000,2750,2500,2250,2000,1750,150

72

70

68

66

64

62

60

x

y

Scatterplot of y vs x in Minitab 17

А вот так будет выглядеть

диаграмма рассеяния в

пакете “101 инструмент

вашего проекта шести сигм”

Page 6: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

6

Рассчитать величину коэффициента корреляции в пакете

Minitab можно с помощью команды Stat > Basic Statistics >

Correlation:

Correlation: x; y

Pearson correlation of x and y = 0,944

P-Value = 0,000

В пакете “101 инструмент вашего проекта шести сигм”

воспользуйтесь первой таблицей под графиком:

r= 0,94418

r2= 0,89148

p-value= 0,00000

t= 15,16663

Коэффициент корреляции

Значимость или вероятность

Page 7: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

7

Чтобы рассчитать коэффициент корреляции r вручную,

воспользуйтесь формулой:

𝑟 =1

𝑛 − 1 𝑥𝑖 − 𝑥

𝜎𝑥×𝑦𝑖 − 𝑦

𝜎𝑦

𝑛

𝑖=1

где 𝑛 – число опытов,

𝑥𝑖 и 𝑦𝑖 – i-е значения переменных 𝑥 и 𝑦, 𝑥 и 𝑦 – средние арифметические переменных 𝑥 и 𝑦, 𝜎𝑥 и 𝜎𝑦 – стандартные отклонения переменных 𝑥 и 𝑦.

Или используйте функцию Correl (Коррел в русскоязычной

версии) для расчета коэффициента корреляции в MS Excel.

Page 8: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

8

В зависимости от величины коэффициента корреляции

различают три вида корреляционной зависимости:

Y-Axis

X-Axis

Y-Axis

X-Axis

Y-Axis

X-Axis

Строгая отрицательная

корреляция

Строгая положительная

корреляцияОтсутствие корреляции

Page 9: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

9

Если две переменные не связаны между собой, то на

диаграмме рассеяния будет лишь набор случайно

расположенных точек - никакой структуры (выраженной

группы точек) или направления (тренда):

r = 0 – корреляционная

зависимость отсутствует.

Чем ближе r к 0, тем слабее

зависимость между двумя

переменными.

Y-Axis

X-Axis

Page 10: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

10

В случае наблюдения четкого направления или структуры

можно говорить о том, что два фактора корреляционно

зависимы.

r = 1 – сильная положительная корреляция.

Чем ближе r к 1, тем сильнее связь между

двумя факторами.

r = -1 – сильная отрицательная корреляция.

Чем ближе r к -1, тем сильнее связь между

двумя факторами.

Y-Axis

X-Axis

Y-Axis

X-Axis

Page 11: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

11

Если r >0.8 или r < -0.8 – корреляция считается сильной

Если r < 0.2 или r > -0.2 – считается, что корреляция

отсутствует.

Если r находится в пределах 0.2–0.8 или (-0.8)–(-0.2),

считается, что корреляция слабая.

Помните! Оценивая зависимость между двумя

переменными, опираясь лишь на коэффициент корреляции,

можно легко допустить ошибку или упустить из виду

нелинейную зависимость. Поэтому не следует пренебрегать

графическим анализом корреляционной зависимости.

Page 12: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

12

Корреляционной анализ

говорит о сильной

взаимосвязи: Pearson correlation of X1

and Y1 = 0,816

Pearson correlation of X2

and Y2 = 0,816

Pearson correlation of X3

and Y3 = 0,816

Pearson correlation of X4

and Y4 = 0,817

X1 Y1 X2 Y2 X3 Y3 X4 Y4

10 8,04 10 9,14 10 7,46 8 6,58

8 6,95 8 8,14 8 6,77 8 5,76

13 7,58 13 8,74 13 12,74 8 7,71

9 8,81 9 8,77 9 7,11 8 8,84

11 8,33 11 9,26 11 7,81 8 8,47

14 9,96 14 8,1 14 8,84 8 7,04

6 7,24 6 6,13 6 6,08 8 5,25

4 4,26 4 3,1 4 5,39 19 12,5

12 10,84 12 9,13 12 8,15 8 5,56

7 4,82 7 7,26 7 6,42 8 7,91

5 5,68 5 4,74 5 5,73 8 6,89

Ниже приведены четыре набора

числовых данных – “Квартет

Энскомба”

Page 13: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

13

15,012,510,07,55,0

10

8

6

4

X1

Y1

15,012,510,07,55,0

10

8

6

4

X2

Y2

15,012,510,07,55,0

12

10

8

6

4

X3

Y3

201510

12,5

10,0

7,5

5,0

X4

Y4

Scatterplot of Y1 vs X1 Scatterplot of Y2 vs X2

Scatterplot of Y3 vs X3 Scatterplot of Y4 vs X4

В то же время графический

анализ позволяет избежать

опрометчивых выводов

Page 14: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

14

Следующие графики иллюстрируют примеры ошибочного

определения корреляции в наборе не связанных данных:

Y-A

xis

X-Axis

Y-A

xis

X-Axis

Y-A

xis

X-Axis

Y-A

xis

X-Axis

Y-A

xis

X-Axis

Y-A

xis

X-Axis

Page 15: Корреляционный анализ

© Six Sigma Online . ru

Корреляционный анализ

15

Корреляционный анализ в проектах шести сигм применяется:

на стадии измерения (Measure) для сужения круга

исследуемых параметров;

на стадии анализа (Analyze) для поиска зависимости

между параметрами;

на стадии улучшения (Improve)

для анализа результатов

экспериментов (DOE).

605040 320315310 3,02,52,0 140125110

90

60

30

90

60

30

90

60

30

90

60

30

SoldPotTemp

PrehTemp

WaveH

FluxVol

ConvSp

250 Corner

260 Center

270 Corner

SoldPotTemp Point Type

40 Corner

50 Center

60 Corner

PrehTemp Point Type

310 Corner

315 Center

320 Corner

WaveH Point Type

2,0 Corner

2,5 Center

3,0 Corner

FluxVol Point Type

Interaction PlotData Means

Page 16: Корреляционный анализ

Обязательно посетите

SixSigmaOnline.ru