Upload
dagmar
View
97
Download
1
Embed Size (px)
DESCRIPTION
Факультет менеджмента Направление Управление проектами. « Модели бинарного выбора ». Выполнили: Анисимова М. Тесленко В. Шумович А. Группы: 626, 627. НИУ ВШЭ , Москва, 201 3 www.hse.ru. Модели бинарного выбора. - PowerPoint PPT Presentation
Citation preview
Выполнили:Анисимова М.
Тесленко В.Шумович А.
Группы: 626, 627 НИУ ВШЭ , Москва, 2013
www.hse.ru
«Модели бинарного выбора»
Факультет менеджментаНаправление Управление проектами
НИУ ВШЭ , Москва, 2013
Модели бинарного выбора
photo
photo
photo
- модель зависимости бинарной переменной (принимающей всего два значения — 0 и 1) от совокупности факторов
Probit- Logit- Gompit-
izi ep
1
1 zei ep
2
НИУ ВШЭ , Москва, 2013
Алгоритм построения модели
photo
photo
photo
3
Определение зависимой переменной и факторов , построение переменной Z, как линейной комбинации независимых переменных
Построение уравнения для искомой вероятности события
Проведение вычислений (метод максимального правдоподобия)
Интерпретация результатов и исследование качества оценки
Определение зависимой переменной и факторов
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Показатели качества моделей
Показатели
Псевдо-коэффициент детерминации
Информационные критерии
Коэффициент детерминации МакФаддена
Доля правильных прогнозов
Статистика отношения
правдоподобия
4
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Показатели качества моделей
Статистика отношения правдоподобияВводится гипотеза: Н0: b1=b2=…=bn=0
)1ln()(lnln
)ˆln1)(1(ˆln(ln
)ln(ln2
11
110
1
10
nnnn
nnnL
pypyL
LLLR
ii
iii
LnL1 – найденное значение логарифма функции правдоподобияLnL0 – логарифм правдоподобия для тривиальной модели ( с включением только константы)n – количество переменныхn1 – количество переменных со значением 1 pi – вероятность события yi=1 при заданном значении zi
5
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Показатели качества моделей
Псевдо-коэффициент детерминации
Коэффициент детерминации МакФаддена
0
12
0
12
1Pr
lnln
1
ww
Redicted
LL
RMcFadden
nnp
pppp
w
yyn
w
i
i
iii
10
21
ˆ5,0ˆ,ˆ
5,0ˆ,ˆ1
)ˆ(1
0
1
2
ln21
11
LL
n
RPseudo
6
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Показатели качества моделей
Акаике (AIC)
Шварца (SC)
Хэннана-Куинна (HQ)
nk
nLAIC 2ln2
nnk
nLSC
)ln(ln2
nnk
nLHQ )ln(ln2ln2
Информационные критерии:
7
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Преимущества и недостатки моделей:
8
Преимущества Недостатки
1. Дает статистически надежные результаты: исправляет недостатки линейной модели
2. Результаты легко интерпретируются
3. Сравнительно несложный метод анализа.
1. Необходим большой размер выборки (>500)
2. Проблемы мультиколлинеарности
3. Минимум 10 исходов на каждую независимую переменную
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Области применения моделей
9
Области
Медицина
Социология
Маркетинговые исследования
Задачи классификации
(скоринг в банке)
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Области применения моделей: маркетинг
10
Изучение поведения покупателей
Покупка - "1", клиент ушел без покупки - "0".T – время проведенное в магазине;Y – возраст клиента;K – внешняя респектабельность клиента по 5-бальной шкале; еi – отклонения
Покупкаi = a*Ti+b*Yi+c*Ki+ei
НИУ ВШЭ , Москва, 2013
photo
photo
photo
Пример №1
AIC SC HQ
Logit 1.231 1.297 1.258
Probit 1.232 1.298 1.259
Gompit 1.224 1.290 1.251
Variable Coefficient Std. Error z-Statistic Prob.
X1 -1.442494 0.317002 -4.550431 0.0000
X3 0.317345 0.151203 2.098804 0.0358
X6 -0.842427 0.442136 -1.905358 0.0567
C 2.043612 0.776225 2.632757 0.0085
McFadden R-squared 0.115382 Mean dependent var 0.402010
S.D. dependent var 0.491541 S.E. of regression 0.458041
Akaike info criterion 1.232344 Sum squared resid 40.91139
Schwarz criterion 1.298541 Log likelihood -118.6182
Hannan-Quinn criter. 1.259136 Deviance 237.2364
Restr. deviance 268.1797 Restr. log likelihood -134.0898
11
НИУ ВШЭ , Москва, 2013
Пример №1
photo
photo
photo
Признак Вероятность принадлежности
Мужчины 0,621
Женщины 0,296
Потребляющие алкоголь 0,732
Не потребляющие алкоголь 0,576
Удовлетворенные местом работы 0,869
Не удовлетворенные местом работы 0,87
321,22,3414,545-3,4446593,03238,010,9881,782
xxxy
0,1222 McFadden
R
12
НИУ ВШЭ , Москва, 2013
Пример №2 (ROC-анализ)
photo
photo
photo
13
Чувствительность (политика рискованных кредитов)
• Доля истинно положительных примеров
Специфичность (консервативная кредитная политика)
• Доля истинно отрицательных примеров, правильно идентифицированных моделью
Чем выше рейтинг клиента, тем выше его кредитоспособность положительный исход – успешное погашение займа, отрицательный – дефолт по кредиту
НИУ ВШЭ , Москва, 2013
Пример №2 (ROC-анализ)
photo
photo
photo
14
Порог Se, % Sp, % Se+Sp |Se-Sp|... ... ... ... ...
0.40 91.3 86.6 177.9 4.70.41 91.1 86.8 177.9 4.70.42 90.4 87.0 177.4 3.40.43 90.4 88.2 178.6 2.20.44 89.8 88.4 178.2 1.40.45 88.6 88.6 177.2 0.00.46 88.0 89.0 177.0 1.00.47 88.0 89.3 177.3 1.30.48 87.6 89.5 177.1 1.90.49 87.6 90.1 177.7 2.50.50 87.0 90.3 177.3 3.30.51 86.2 90.5 176.7 4.30.52 85.8 90.7 176.5 4.90.53 85.6 90.9 176.5 5.30.54 85.4 91.1 176.5 5.7
... ... ... ... ...0.64 80.5 93.7 174.2 13.20.65 79.9 94.1 174.0 14.20.66 78.9 94.1 173.0 15.2
... ... ... ... ...
Чувствительность = 90,4%
• 90,4% благонадежных заемщиков будут выявлены классификатором
Специфичность = 88,2%
• 11,8% недобросовестных заемщиков получат одобрение в выдаче кредитов
НИУ ВШЭ , Москва, 2013
Пример №3
photo
photo
photo
15
Построение моделей оценки вероятности дефолта эмитента строительной отрасли
• Цель: оценка кредитного риска эмитента корпоративных облигаций с применением методов имитационного моделирования.
• Зависимая переменная: вероятность дефолта
• Независимые переменные: финансовые коэффициенты (финансовой устойчивости, ликвидности, деловой активности), внешнеэкономические переменные (динамика цен на недвижимость, процентной ставки, ВВП и т.д)
• Отбор переменных: процедура пошагового включения объясняющих переменных в модель на основе вычисления парных коэффициентов корреляции.
НИУ ВШЭ , Москва, 2013
Пример №3
photo
photo
photo
16
Оцененная логит-модель
K
Где T(Inv_fa) - прогноз годового темпа роста реальных инвестиций в основной капитал;T(MIACR) – прогноз годового прироста процентной ставки на межбанковском рынке от двух до семи дне;FL - уровень финансового рычага на последнюю отчетную дату, определенный как отношение заемного капитала к собственным средствам эмитента.
НИУ ВШЭ , Москва, 2013
photo
photo
photo
17
Спасибо за внимание!
Выполнили:Анисимова М.
Тесленко В.Шумович А.
Группы: 626, 627 «Модели бинарного выбора»