« Модели бинарного выбора »

Preview:

DESCRIPTION

Факультет менеджмента Направление Управление проектами. « Модели бинарного выбора ». Выполнили: Анисимова М. Тесленко В. Шумович А. Группы: 626, 627. НИУ ВШЭ , Москва, 201 3 www.hse.ru. Модели бинарного выбора. - PowerPoint PPT Presentation

Citation preview

Выполнили:Анисимова М.

Тесленко В.Шумович А.

Группы: 626, 627 НИУ ВШЭ , Москва, 2013

www.hse.ru

«Модели бинарного выбора»

Факультет менеджментаНаправление Управление проектами

НИУ ВШЭ , Москва, 2013

Модели бинарного выбора

photo

photo

photo

- модель зависимости бинарной переменной (принимающей всего два значения — 0 и 1) от совокупности факторов

Probit- Logit- Gompit-

izi ep

1

1 zei ep

2

НИУ ВШЭ , Москва, 2013

Алгоритм построения модели

photo

photo

photo

3

Определение зависимой переменной и факторов , построение переменной Z, как линейной комбинации независимых переменных

Построение уравнения для искомой вероятности события

Проведение вычислений (метод максимального правдоподобия)

Интерпретация результатов и исследование качества оценки

Определение зависимой переменной и факторов

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Показатели качества моделей

Показатели

Псевдо-коэффициент детерминации

Информационные критерии

Коэффициент детерминации МакФаддена

Доля правильных прогнозов

Статистика отношения

правдоподобия

4

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Показатели качества моделей

Статистика отношения правдоподобияВводится гипотеза: Н0: b1=b2=…=bn=0

)1ln()(lnln

)ˆln1)(1(ˆln(ln

)ln(ln2

11

110

1

10

nnnn

nnnL

pypyL

LLLR

ii

iii

LnL1 – найденное значение логарифма функции правдоподобияLnL0 – логарифм правдоподобия для тривиальной модели ( с включением только константы)n – количество переменныхn1 – количество переменных со значением 1 pi – вероятность события yi=1 при заданном значении zi

5

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Показатели качества моделей

Псевдо-коэффициент детерминации

Коэффициент детерминации МакФаддена

0

12

0

12

1Pr

lnln

1

ww

Redicted

LL

RMcFadden

nnp

pppp

w

yyn

w

i

i

iii

10

21

ˆ5,0ˆ,ˆ

5,0ˆ,ˆ1

)ˆ(1

0

1

2

ln21

11

LL

n

RPseudo

6

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Показатели качества моделей

Акаике (AIC)

Шварца (SC)

Хэннана-Куинна (HQ)

nk

nLAIC 2ln2

nnk

nLSC

)ln(ln2

nnk

nLHQ )ln(ln2ln2

Информационные критерии:

7

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Преимущества и недостатки моделей:

8

Преимущества Недостатки

1. Дает статистически надежные результаты: исправляет недостатки линейной модели

2. Результаты легко интерпретируются

3. Сравнительно несложный метод анализа.

1. Необходим большой размер выборки (>500)

2. Проблемы мультиколлинеарности

3. Минимум 10 исходов на каждую независимую переменную

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Области применения моделей

9

Области

Медицина

Социология

Маркетинговые исследования

Задачи классификации

(скоринг в банке)

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Области применения моделей: маркетинг

10

Изучение поведения покупателей

Покупка - "1", клиент ушел без покупки - "0".T – время проведенное в магазине;Y – возраст клиента;K – внешняя респектабельность клиента по 5-бальной шкале; еi – отклонения 

Покупкаi = a*Ti+b*Yi+c*Ki+ei

НИУ ВШЭ , Москва, 2013

photo

photo

photo

Пример №1

AIC SC HQ

Logit 1.231 1.297 1.258

Probit 1.232 1.298 1.259

Gompit 1.224 1.290 1.251

Variable Coefficient Std. Error z-Statistic Prob.  

X1 -1.442494 0.317002 -4.550431 0.0000

X3 0.317345 0.151203 2.098804 0.0358

X6 -0.842427 0.442136 -1.905358 0.0567

C 2.043612 0.776225 2.632757 0.0085

McFadden R-squared 0.115382     Mean dependent var 0.402010

S.D. dependent var 0.491541     S.E. of regression 0.458041

Akaike info criterion 1.232344     Sum squared resid 40.91139

Schwarz criterion 1.298541     Log likelihood -118.6182

Hannan-Quinn criter. 1.259136     Deviance 237.2364

Restr. deviance 268.1797     Restr. log likelihood -134.0898

11

НИУ ВШЭ , Москва, 2013

Пример №1

photo

photo

photo

Признак Вероятность принадлежности

Мужчины 0,621

Женщины 0,296

Потребляющие алкоголь 0,732

Не потребляющие алкоголь 0,576

Удовлетворенные местом работы 0,869

Не удовлетворенные местом работы 0,87

321,22,3414,545-3,4446593,03238,010,9881,782

xxxy

0,1222 McFadden

R

12

НИУ ВШЭ , Москва, 2013

Пример №2 (ROC-анализ)

photo

photo

photo

13

Чувствительность (политика рискованных кредитов)

• Доля истинно положительных примеров

Специфичность (консервативная кредитная политика)

• Доля истинно отрицательных примеров, правильно идентифицированных моделью

Чем выше рейтинг клиента, тем выше его кредитоспособность положительный исход – успешное погашение займа, отрицательный – дефолт по кредиту

НИУ ВШЭ , Москва, 2013

Пример №2 (ROC-анализ)

photo

photo

photo

14

Порог Se, % Sp, % Se+Sp |Se-Sp|... ... ... ... ...

0.40 91.3 86.6 177.9 4.70.41 91.1 86.8 177.9 4.70.42 90.4 87.0 177.4 3.40.43 90.4 88.2 178.6 2.20.44 89.8 88.4 178.2 1.40.45 88.6 88.6 177.2 0.00.46 88.0 89.0 177.0 1.00.47 88.0 89.3 177.3 1.30.48 87.6 89.5 177.1 1.90.49 87.6 90.1 177.7 2.50.50 87.0 90.3 177.3 3.30.51 86.2 90.5 176.7 4.30.52 85.8 90.7 176.5 4.90.53 85.6 90.9 176.5 5.30.54 85.4 91.1 176.5 5.7

... ... ... ... ...0.64 80.5 93.7 174.2 13.20.65 79.9 94.1 174.0 14.20.66 78.9 94.1 173.0 15.2

... ... ... ... ...

Чувствительность = 90,4%

• 90,4% благонадежных заемщиков будут выявлены классификатором

Специфичность = 88,2%

• 11,8% недобросовестных заемщиков получат одобрение в выдаче кредитов

НИУ ВШЭ , Москва, 2013

Пример №3

photo

photo

photo

15

Построение моделей оценки вероятности дефолта эмитента строительной отрасли

• Цель: оценка кредитного риска эмитента корпоративных облигаций с применением методов имитационного моделирования.

• Зависимая переменная: вероятность дефолта

• Независимые переменные: финансовые коэффициенты (финансовой устойчивости, ликвидности, деловой активности), внешнеэкономические переменные (динамика цен на недвижимость, процентной ставки, ВВП и т.д)

• Отбор переменных: процедура пошагового включения объясняющих переменных в модель на основе вычисления парных коэффициентов корреляции.

НИУ ВШЭ , Москва, 2013

Пример №3

photo

photo

photo

16

Оцененная логит-модель

K

Где T(Inv_fa) - прогноз годового темпа роста реальных инвестиций в основной капитал;T(MIACR) – прогноз годового прироста процентной ставки на межбанковском рынке от двух до семи дне;FL - уровень финансового рычага на последнюю отчетную дату, определенный как отношение заемного капитала к собственным средствам эмитента.

НИУ ВШЭ , Москва, 2013

photo

photo

photo

17

Спасибо за внимание!

Выполнили:Анисимова М.

Тесленко В.Шумович А.

Группы: 626, 627 «Модели бинарного выбора»

Recommended