12
ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ СРЕДСТВ ПОД РИСКОМ (EAD) С ПОМОЩЬЮ SAS/STAT® И SAS® ENTERPRISE MINER™ Йейн Браун Перевод с английского – ИЦ Гевисста ВВЕДЕНИЕ На протяжении последних нескольких десятилетий исследования кредитного риска были посвящены главным образом оценке и валидации моделей, предсказывающих вероятность дефолта в кредитном скоринге. Лишь недавно появились работы, посвященные оценке LGD. Однако на сегодняшний день очень мало моделей, в которых оценивается EAD, особенно для розничного кредитования (например, кредитные карты). Тем не менее, и EAD и LGD являются важными параметрами согласно требованиям Базеля II, поскольку они дают формулы для определения необходимого размера капитала в линейном виде (в отличие от PD - показателя, который сравнительно меньше влияет на требования к минимальному размеру капитала, чем LGD и EAD). Поэтому изменения EAD (и LGD) будут оказывать решающее влияние на капитал финансовой организации, а также на ее долгосрочную стратегию. Следовательно, важно разрабатывать устойчивые модели, которые максимально точно оценивают EAD. С точки зрения балансовых статей EAD – это обычно остаток долга за вычетом специальных резервов (резервов на покрытие возможных убытков по конкретному требованию). Для забалансовых статей (например, кредитных карт) EAD оценивается как текущая использованная сумма плюс текущая неиспользованная сумма (т.е. кредитный лимит минус использованная сумма), умноженная на фактор кредитной конверсии (CCF, для США - LEQ). Вычисление CCF очень важно для забалансовых статей, поскольку текущая величина требования не является надежным показателем

Йейн Браун_Построение регрессионных моделей для оценки EAD

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Йейн Браун_Построение регрессионных моделей для оценки EAD

ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ СРЕДСТВ ПОД РИСКОМ (EAD) С ПОМОЩЬЮ SAS/STAT® И SAS® ENTERPRISE MINER™

Йейн Браун Перевод с английского – ИЦ Гевисста

ВВЕДЕНИЕ На протяжении последних нескольких десятилетий исследования кредитного риска были посвящены главным образом оценке и валидации моделей, предсказывающих вероятность дефолта в кредитном скоринге. Лишь недавно появились работы, посвященные оценке LGD. Однако на сегодняшний день очень мало моделей, в которых оценивается EAD, особенно для розничного кредитования (например, кредитные карты). Тем не менее, и EAD и LGD являются важными параметрами согласно требованиям Базеля II, поскольку они дают формулы для определения необходимого размера капитала в линейном виде (в отличие от PD - показателя, который сравнительно меньше влияет на требования к минимальному размеру капитала, чем LGD и EAD). Поэтому изменения EAD (и LGD) будут оказывать решающее влияние на капитал финансовой организации, а также на ее долгосрочную стратегию. Следовательно, важно разрабатывать устойчивые модели, которые максимально точно оценивают EAD. С точки зрения балансовых статей EAD – это обычно остаток долга за вычетом специальных резервов (резервов на покрытие возможных убытков по конкретному требованию). Для забалансовых статей (например, кредитных карт) EAD оценивается как текущая использованная сумма плюс текущая неиспользованная сумма (т.е. кредитный лимит минус использованная сумма), умноженная на фактор кредитной конверсии (CCF, для США - LEQ). Вычисление CCF очень важно для забалансовых статей, поскольку текущая величина требования не является надежным показателем

Page 2: Йейн Браун_Построение регрессионных моделей для оценки EAD

итоговой EAD – по мере приближения к дефолту вероятность того, что клиент осуществит «выборку» кредита, увеличивается. Другими словами, причина вариабельности величины требования – это возможность дополнительных «выборок» кредита в тех случаях, когда лимит это позволяет. Поэтому целью данной статьи будет оценка и валидация фактора кредитной конверсии (CCF) для правильного расчета EAD для забалансовых статей. Также нашей целью является более глубокий анализ переменных, влияющих на прогноз CCF по потребительским кредитам. Для этого наряду с новыми и потенциально значимыми предикторами были спроектированы предикторы, которые уже предлагались исследователями (в частности, Моралем в 2006). Кроме того, нам необходимо определить, можно ли улучшить прогностическую способность регрессии, использовав вместо регрессии по методу наименьших квадратов модели бинарной и кумулятивной логистической регрессии. Причина, по которой мы предлагаем использование этих двух логит-моделей заключается в том, что ССF имеет бимодальное распределение с двумя пиками около 0 и 1 и относительно одинаковое распределение между этими пиками. Поэтому это распределение, отличающееся от нормального, в меньшей степени подходит для моделирования с использованием обычной регрессии по методу наименьших квадратов (OLS). Данная статья построена следующим образом. Ближайшая глава посвящена методам регрессии, которые будут использоваться для оценки CCF. Затем следует глава, детально описывающая настройку параметров и набор данных, использованный для моделирования. В предпоследней главе освещаются результаты регрессии, касающиеся оценки CCF. Наконец, в последней главе подробно приводятся выводы и рекомендации, вытекающие из анализа полученных результатов. ОБЗОР МЕТОДОВ Для методов, применяемых в данной статье, приняты следующие математические обозначения. Скаляр x обозначается обычным шрифтом. Вектор x обозначается жирным шрифтом и предполагается вектором столбца. Соответствующий вектор строки xT получается с помощью транспонирования T. Жирной заглавной буквой обозначается матрица X. Число независимых переменных – n, а число наблюдений (каждое соответствует дефолту по кредитной карте) – I. Наблюдение i обозначается как xi, а переменная j – как xj. Зависимая переменная y (т.е. значение CCF) для наблюдения i обозначается как yi. Для обозначения вероятности мы используем P.

Page 3: Йейн Браун_Построение регрессионных моделей для оценки EAD

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (OLS) Регрессия наименьших квадратов является, вероятно, самым популярным методом для поиска оптимальных параметров bT=[b0,b1,b2,…,bn] в целях подгонки к данным линейной модели следующего вида:

y= bTx, (1) где xT=[1,x1,x2,…,xn]. Регрессия по методу наименьших квадратов решает эту проблему с помощью минимизации суммы квадратов остатков, которая сводится к:

b = (XTX)-1 XTy, (2)

где XT= [x1,x2,…,xI] и y = [y1,y2,…,yI]T. Код SAS, использованный для вычисления регрессии наименьших квадратов: PROC REG DATA = Cohort1 OUTEST = out RSQUARE;

MODEL ccf = {Rating_Grade1 Rating_Grade2 Rating_Grade3

Rating_Grade4}

&inputs /SELECTION = stepwise SLENTRY =0.01 SLSTAY =

0.01 GROUPNAMES = 'Dummy for Rating Grade';

OUTPUT OUT = t STUDENT = res COOKD = cookd PREDICTED = parms;

RUN;

QUIT;

БИНАРНАЯ И КУМУЛЯТИВНАЯ ЛОГИТ-МОДЕЛИ (LOGIT & CLOGIT) Распределение CCF часто характеризуется пиками около CCF=0 и CCF=1 (сравните ниже Рисунки 1 и 2). Данное распределение, отличающееся от нормального, может привести к неточным моделям линейной регрессии. Поэтому мы предлагаем использовать бинарную и кумулятивную логит-модели, пытаясь решить данную проблему с помощью группировки наблюдений CCF на две категории – для бинарной логит-модели и на три категории – для кумулятивной логит-модели. Для бинарной целевой переменной будут использованы два различных способа разбиения: первый производится в соответствии со средним значением распределения ССF

(Класс 0: CCFCCF ; Класс 1: CCFCCF ), а второй основан на том, является ли значение CCF меньше 1 или нет (Класс 0: 1CCF ; Класс 1: 1CCF ). Для кумулятивной логит-модели CCF разбивается на три категории, например, Класс 0: CCF = 0; Класс 1: 0 < CCF < 1; Класс 2: CCF = 1. Для бинарной логит-модели сигмоидальная зависимость между P (class=1) и bTx, преобразована таким образом, что P (class=1) не может быть ниже 0 или выше 1:

Page 4: Йейн Браун_Построение регрессионных моделей для оценки EAD

.1

11)P(class

)xb(T

e

(3)

Код SAS, использованный для вычисления бинарной логит-модели, имеет вид: PROC LOGISTIC DATA=Cohort1 des outmodel=param out=out;

CLASS rating_grade;

MODEL ccf_bin = &inputs Rating_Grade /RSQUARE SELECTION=stepwise

SLENTRY=0.01

SLSTAY=0.01 STB;

OUTPUT PRED=lpredy;

score DATA=Cohort2 out=scored outroc=roc;

RUN;

Кумулятивная логит-модель – это просто расширение бинарной логит-модели, которая позволяет задавать упорядоченную целевую переменную с более чем 2 категориями (k > 2):

,1

1)P(class

)...( 2211 nnj xbxbxbde

j

(4)

j = 1,2,…, k–1 Кумулятивная вероятность, обозначаемая как P(class≤j), - это сумма вероятностей, оцененных по частоте появления категорий отклика. Код SAS для кумулятивной логит-модели представляет собой вариант кода SAS для бинарной логит-модели с включением link=clogit в команду proc logistic.

НАСТРОЙКА ПАРАМЕТРОВ И НАБОР ДАННЫХ

Набор данных, использовавшийся в исследовании, был предоставлен крупным банком в Уральском регионе и содержал ежемесячные данные об использовании кредитных карт в течение 3-летнего периода (январь 2009 – декабрь 2012). Дефолтом по кредитной карте признается списание безнадежной задолженности. Для вычисления CCF исходный набор данных был разбит на 2 когорты с периодом в 12 месяцев. Первая когорта охватывала период с ноября 2010 по октябрь 2011, вторая когорта – период с ноября 2011 по октябрь 2012. Когортный метод группирует дефолтные обязательства по дискретным календарным периодам (в нашем случае по 12-месячным периодам) в соответствии с датой дефолта. Затем собирается информация о факторах риска, соотношении использованной/неиспользо-

Page 5: Йейн Браун_Построение регрессионных моделей для оценки EAD

ванной суммы в начале календарного периода и использованной сумме на момент дефолта. Мы выбрали когорты с ноября по октябрь, поскольку хотели уменьшить влияние сезонных эффектов в расчетах CCF. Характеристики когорт, использованные для оценки эффективности регрессионных моделей, приводятся ниже в ТАБЛИЦЕ 1: Объем данных

(количество дефолтов) Среднее значение CCF

(после округления)

КОГОРТА1 (Ноябрь 2010 – Октябрь 2011)

4039 0,4901

КОГОРТА2 (Ноябрь 2011 – Октябрь 2012)

6232 0,5313

ТАБЛИЦА 1. Характеристики когорт для EAD по историческим данным

КОГОРТА1 будет использоваться для обучения регрессионных моделей, в то время как КОГОРТА2 будет применена для проверки эффективности модели (метод валидации out-of-time). Оба набора данных содержат переменные, детально раскрывающие тип продукта по кредитной карте, по которому произошел дефолт, и следующие переменные, измеряемые ежемесячно: сообщенный клиенту кредитный лимит, текущий баланс, количество дней просрочки и оценка кредитоспособности. Затем по ежемесячным данным в каждой когорте (где td – дата дефолта и tr – отправная дата или начало периода наблюдения в когорте) были вычислены следующие переменные, предложенные Моралем в 2006 году:

Оговоренная сумма, L(tr): сообщенный клиенту кредитный лимит на начало наблюдения в когорте;

Использованная сумма, E(tr): сумма кредитной линии на начало наблюдения в когорте;

Неиспользованная сумма, L(tr) – E(tr): лимит минус сумма кредитной линии на начало наблюдения в когорте;

Процент использования кредита, E(tr)/L(tr): сумма кредитной линии на начало наблюдения, поделенная на сообщенный клиенту кредитный лимит на начало наблюдения;

Время до наступления дефолта, (td – tr): дата дефолта минус отправная дата (в месяцах);

Рейтинговый класс, R(tr): оценка кредитоспособности на начало наблюдения, разбитая на 4 категории: 1: AAA-A; 2: BBB-B; 3: C; 4: UR (нет рейтинга).

Page 6: Йейн Браун_Построение регрессионных моделей для оценки EAD

Целевая переменная вычислялась следующим образом:

Фактор кредитной конверсии, CCFi : вычислялся как разность между фактическим EAD и использованной суммой на начало наблюдения, деленная на разность между кредитным лимитом, сообщенным клиенту, и использованной суммой на начало наблюдения, т.е.:

)()(

)()(

rr

rd

itEtL

tEtECCF

(5)

Вдобавок к вышеупомянутым переменным мы создали дополнительные переменные (переменные-агрегаты), который мог бы увеличить прогностическую способность внедряемой регрессионной модели. Эти переменные включали:

Среднее количество дней просрочки за последние 3 месяца, 6 месяцев, 9 месяцев и 12 месяцев.

Увеличение оговоренной суммы: бинарная переменная, показывающая, было ли увеличение оговоренной суммы, начиная с 12 месяцев до начала наблюдения в когорте.

Неиспользованный процент, )(

)()(

r

rr

tL

tEtL : неиспользованная сумма на

начало наблюдения, деленная на сообщенный клиенту кредитный лимит на начало наблюдения.

Абсолютное изменение использованной, неиспользованной и оговоренной сумм: разность между суммой в момент времени tr и суммой за 3 месяца, 6 месяцев или 12 месяцев до tr .

Относительное изменение использованной, неиспользованной и оговоренной сумм: разность между суммой в момент времени tr и суммой за 3 месяца, 6 месяцев или 12 месяцев до tr , деленная на сумму за 3 месяца, 6 месяцев или 12 месяцев до tr

Предсказательная сила переменных, предложенных в данной статье, будет оцениваться путем вычисления информационного значения (IV), основываясь на их способности разделять CCF на два класса

0: CCFCCF (не-событие); 1: CCFCCF (событие). После категоризации входных переменных с помощью процедуры на основе принципа энтропии, предлагаемой SAS Enterprise Miner, IV переменной с k категорий принимает вид:

k

i Nin

Nin

N

in

N

inIV

1 00

11

0

0

1

1

/)(

/)(ln

)()( (6)

где n0(i), n1(i) обозначают число не-событий и событий в категории i, а N0, N1 – это общее число не-событий и событий в наборе данных соответственно.

Page 7: Йейн Браун_Построение регрессионных моделей для оценки EAD

Данный показатель позволяет нам предварительно оценить относительный потенциальный вклад каждой переменной в прогноз CCF. Распределение исходных значений CCF для первой когорты (КОГОРТЫ1) показано ниже на РИСУНКЕ 1:

РИСУНОК 1 – Распределение исходных значений CCF

График исходных значений CCF показывает существенный пик около 0 и небольшой пик около 1 со значительными хвостами распределений по обе стороны от этих значений. РИСУНОК 2 показывает те же самые значения CCF, округленные в 0 и 1:

РИСУНОК 2 – Распределение округленных значений CCF (0 и 1)

Page 8: Йейн Браун_Построение регрессионных моделей для оценки EAD

Округленные значения CCF (РИСУНОК 2) дают бимодальное распределение с пиками в 0 и 1 и относительно одинаковое распределение между этими пиками. Оно очень похоже на распределения, получаемые в ходе моделирования уровня потерь в случае дефолта (LGD). Для оценки CCF мы будем использовать полученные ограниченные значения CCF в диапазоне от 0 до 1. Модели OLS, LOGIT и CLOGIT были оценены с помощью SAS/STAT. Каждая модель строилась по набору данных первой когорты (КОГОРТА1) и затем тестировалась на наборе данных второй коргорты (КОГОРТА2). Для построения всех трех регрессионных моделей был выбран метод пошагового отбора переменных с тем, чтобы выбрать для оценки CCF только те входные переменные, которые обладали наибольшой прогнозной силой. Для включения и сохранения переменных в модели значение p-значение устанавливалось равным 0.01. Для сравнения моделей применялись показатели эффективности, коэффициент детерминации (R2), коэффициент корреляции Пирсона (r),

коэффициент корреляции Спирмана () и квадратный корень средней ошибки предсказания. РЕЗУЛЬТАТЫ В данной главе мы проанализируем входные переменные и их взаимосвязь с

дихотомизированным CCF (0: CCFCCF ; 1: CCFCCF ). Следующая таблица показывает итоговое информационное значение для переменных с IV больше 0.1, проранжированных по мере убывания прогнозной силы:

Переменная Информационное значение

Процент использования кредита 1,825 Неиспользованный процент 1,825 Неиспользованная сумма 1,581 Относительное изменение неиспользованной суммы (12 месяцев) 0,696 Относительное изменение неиспользованной суммы (6 месяцев) 0,425 Относительное изменение неиспользованной суммы (3 месяца) 0,343 Рейтинговый класс 0,233 Время до наступления дефолта 0,226 Использованная сумма 0,181 Абсолютное изменение использованной суммы (3 месяца) 0,114

ТАБЛИЦА 2 – Информационные значения переменных-агрегатов

Анализируя результаты, мы можем увидеть, что относительные и абсолютные изменения использованной, неиспользованной и оговоренной сумм не обладают одинаковой способности дифференцировать низкие и

Page 9: Йейн Браун_Построение регрессионных моделей для оценки EAD

высокие значения CCF, поскольку исходная переменная измеряется только в отправной точке. Также из результатов ясно, что неиспользованная сумма могла бы быть важной переменной для дифференциации значений CCF. Затем мы тестируем эффективность самих моделей с т.з. прогноза CCF. В следующей таблице (ТАБЛИЦА 3) приводятся оценки параметров и p-значения переменных, использованных в каждой модели. Знаки параметров даны для сравнения. Приводится подробная информация по четырем регрессионым моделям: модель по методу наименьших квадратов, включающая лишь переменные, предложенные Moral, (2006); модель по методу наименьших квадратов, включающая дополнительные переменные после пошагового отбора; бинарная логит-модель; кумулятивная логит-модель. Для бинарной логит-модели зависимая переменная разбивалась на

два класса: 0: CCFCCF ; 1: CCFCCF . Из ТАБЛИЦЫ 3 видно, что наиболее эффективным регрессионным алгоритмом по всем трем показателям является бинарная логит-модель с R2 0.1028. Несмотря на то, что данное значение является низким, оно сопоставимо со значениями, полученными по остальным моделям. Также можно увидеть, что все четыре модели довольно схожи, если сравнить уровни значимости переменных и знаки параметров. Однако, по-видимому, наблюдается некоторое несоответствие по переменной Рейтинговый класс, когда средняя оценка кредитоспособности соответствует наивысшим значениям CCF.

Page 10: Йейн Браун_Построение регрессионных моделей для оценки EAD

Переменные

Регрессионная модель

наименьших квадратов

(переменные, предложенные

Моралем)

Регрессионная модель

наименьших квадратов

(дополнительные переменные)

Бинарная логит-модель

Кумулятивная логит-модель

Оценка

параметра P-знач. Оценка

параметра P-знач. Оценка

параметра P-знач. Оценка

параметра P-знач.

Константа 1 0,1830 <0,0001 0,1365 <0,001 -1,5701 <0,0001 0,6493 <0,0001

Константа 2 -0,5491 <0,001

Процент использования кредита

-0,1220 <0,001 -0,1260 <0,001 -0,5737 <0,001 -1,3220 <0,0001

Оговоренная сумма 1,73E-05 <0,0001 1,76E-05 <0,0001 9,0E-05 <0,0001 8,8E-05 <0,0001

Использованная -8,68E-05 <0,0001 -8,88E-05 <0,0001 -4,7E-04 <0,0001 -3,6E-04 <0,0001

Время до наступления дефолта

0,0334 <0,0001 0,0326 <0,0001 0,1538 <0,0001 0,1009 <0,0001

Рейтинговый класс

Рейтинг 1 (AAA-A) vs. Рейтинг 4 (UR)

0,1735 <0,0001 0,2304 <0,0001 0,4000 0,0069 -0,0772 0,5472

Рейтинг 2 (BBB-B) vs. Рейтинг 4 (UR)

0,2483 <0,0001 0,2977 <0,0001 0,5885 <0,0001 0,6922 <0,0001

Рейтинг 3 (C) vs. Рейтинг 4 (UR)

0,0944 <0,0001 0,1201 <0,0001 -0,2121 0,0043 -0,0157 0,8098

Cреднее количество дней просрочки за последние 6 месяцев

0,0048 <0,0001 0,0216 <0,0001 0,0218 <0,0001

Коэффициент детерминации (R2)

0,0982 0,0960 0,1028 0,0822

Коэффициент корреляции Пирсона

0,3170 0,3144 0,3244 0,2897

Коэффициент корреляции Спирмана

0,2932 0,2943 0,3283 0,2943

Квадратный корень средней ошибки предсказания

0,4393 0,4398 0,4704 0,4432

ТАБЛИЦА 3 – Оценки параметров и p-значения для прогноза CCF,

полученные по данным КОГОРТЫ 2

Из всех дополнительных переменных, которые мы протестировали (например, абсолютное или относительное изменение использованной суммы, кредитного лимита и неиспользованной суммы), лишь «Среднее количество дней просрочки за последние 6 месяцев» вошла в модель в итоге пошагового отбора. Скорее всего это связано с тем, что взаимосвязи дополнительных переменных с CCF уже в значительной мере объяснены основными переменными. Отметим, несмотря на то, что во вторую модель в ходе пошагового отбора вошла одна дополнительная переменная, ее

Page 11: Йейн Браун_Построение регрессионных моделей для оценки EAD

прогностическая способность по сравнению с первоначальной моделью не увеличилась. С помощью спрогнозированных значений CCF, полученных с помощью четырех моделей, можно оценить фактический EAD для каждого наблюдения i в КОГОРТЕ2 следующим образом:

))()(()(rriri

tEtLCCFtEEAD

Это дает нам оцененное «денежное» значение EAD, которое можно сравнить с фактическим значением EAD. Для сравнения также вычисляется консервативная оценка EAD (делается предположение, что CCF=1), а также оценка EAD, в которой используется среднее значение CCF в первой когорте (ТАБЛИЦА 4). Следующая таблица (ТАБЛИЦА 5) показывает эффективность моделей на основе сравнения спрогнозированной суммы EAD c фактической суммой EAD:

Переменные Консервативная оценка EAD

(CCF=1)

Оценка EAD, когда CCF равен среднему значению

CCF в первой когорте

Коэффициент детерминации (R2) 0,5178 0,6486 Коэффициент корреляции Пирсона 0,7588 0,8062 Коэффициент корреляции Спирмана 0,6867 0,7354

ТАБЛИЦА 4 – Прогнозные значения EAD

на основе консервативной и усредненной оценок CCF

Переменные

Регрессионная модель наименьших квадратов (используются только

заранее предложенные переменные)

Регрессионная модель наименьших квадратов (включая среднее количество дней просрочки за

последние 6 месяцев)

Бинарная логит-

модель

Кумулятивная логит-модель

Коэффициент детерминации (R2)

0,6450 0,6431 0,6344 0,6498

Коэффициент корреляции Пирсона

0,8049 0,8038 0,8016 0,8068

Коэффициент корреляции Спирмана

0,7421 0,7405 0,7387 0,7381

ТАБЛИЦА 5 – Сравнение прогнозных значений EAD

на основе оценок CCF с фактическими значениями EAD

Из этих результатов явствует, что несмотря на то, что спрогнозированное значение CCF обладало сравнительно низкой эффективностью, применение этого значения для расчета прогнозного значения EAD могло дать значимое

Page 12: Йейн Браун_Построение регрессионных моделей для оценки EAD

улучшение по сравнению с консервативной моделью. Однако схожих результатов можно было добиться, просто применив усредненное значение CCF. ВЫВОДЫ Данная статья осветила вопросы разработки понятных пользователю и устойчивых регрессионных моделей для оценки величины средств под риском (EAD) по потребительским кредитам с помощью прогнозирования фактора кредитной конверсии (CCF). Также проведен тщательный анализ предикторов, использованных для моделирования CCF, показавший, что ранее предложенные переменные являются значимыми и выявивший ряд дополнительных переменных. Как показывают результаты, незначительного увеличения коээфициента детерминации можно добиться, применив бинарную логит-модель вместо обычной модели по методу наименьших квадратов. Интересно отметить, что кумулятивная логит-модель работает хуже в сравнении с бинарной логит-моделью и регрессией наименьших квадратов. Вероятной причиной этого является размер пиков около 0 и 1 в сравнении с числом наблюдений, лежащих в диапазоне между этими пиками. Это ведет к большей ошибке прогноза CCF, сделанного кумулятивной 3-классовой моделью. Другой интересный вывод заключается в том, что хотя прогностическая способность CCF является слабой, применение его спрогнозированного значения для прогноза фактического значения EAD явно улучшает прогностическую способность модели. Вместе с тем схожей эффективности можно было добиться, применив простую модель с усредненным CCF по первой когорте, показав, что прогноз EAD главным образом зависит от текущего размера кредита. Что касается дополнительных переменных, предложенных для прогнозирования CCF, лишь одна, среднее количество дней просрочки за последние 6 месяцев, имела приемлемое p-значение. Хотя относительные изменения неиспользованной суммы дали вполне допустимые значения IV, эти переменные не подтвердили своей значимости для регрессионных моделей. Это говорит о том, что для прогноза CCF фактические значения на начало наблюдения в когорте в значительной мере отражают предыдущую активность.