14
Искусственный интеллект в кредитном скоринге

Искусственный интеллект в кредитном скоринге

  • Upload
    rusbase

  • View
    104

  • Download
    8

Embed Size (px)

Citation preview

Искусственный интеллект в кредитном скоринге

Что такое искусственный

интеллект?

Роботы?

Программы?

Распознавание

объектов, речи,

etc?

Машинное

обучение?

Искусственный интеллект – совокупность его разделов

«ИИ» в кредитном скоринге

Искусственный интеллект в

кредитном скоринге

Машинное обучение

(application,

behaviour scoring)

Feature Engineering and

Selection

Нейронные сети

Две основные проблемы:

•Проблема качества модели (методология)

•Проблема данных (новых, качественных фич)

Предпосылки исследования:

Черты лица, в свою очередь, зависят от генов.

Согласно Гарвардскому исследованию близнецов: 1/3 поведения формирует генетика,

2/3 - воспитание и характер

Могут ли черты лица влиять на кредитоспособность?

Проверка гипотезы:

На микрофинансовом сегменте: выборка данных – 632 000 займов

Набор переменных: id заемщика, пол, возраст, регион, объем займа, срок займа,

показатели просрочки, фото заемщика, показатели кредитной истории,

макроэкономические переменные и т.д.

Обучающая выборка - 80% от общего объема займов

Тестовая выборка – 20% от общего объема выборки

Обучение

Предсказание

Распознаем лица и опорные точки

Подсчет пропорций

Добавление остальных переменных

Обучение моделей

Отбор лучшего ансамбля

Проверка на тестовой выборке

Распознаём лицо

Добавляем «переменные»

Подаём на вход обученной модели

Получаем результат

Нюансы:

1. Повороты головы

2. Несколько лиц на

фото

3. Разное расстояние до

объекта

4. Низкое качество

Только фото:

Повороты головы негативно сказываются на

прогноз, так как при поворотах приходится

представлять голову (лицо) в 3d, что

негативно влияет на восстановление

расположения основных лицевых фич

Пол+возраст+сумма займа+фото.

С дополнительными

переменными:

Паспорта vs реальные фото

В случае с паспортами мы имеем: унифицированное расстояние,

отсутствие поворотов головы.

… НО

Разный возраст

Отсутствие эмоций и мимики

Плохое качество сканированных копий

Фотография заёмщика при

получении кредита является более

предпочтительной, чем скан

паспорта, ввиду вышеизложенных

факторов

Результаты модели

Общий прирост точности за счет машинного обучения

Прирост точности на 1,5% при включении лицевых фич

Этично или нет?

Любой скоринг при выдаче кредита – дискриминационный процесс, в связи с

вышесказанным - вполне этично.

Перспективы использования

технологии:

Общая просроченная задолженность на 1 января 2017 года –

2,7 триллиона рублей

Потенциал ежегодной экономии по РФ приблизительно 40,5

млрд. рублей

О нас

FscoreLab

data science компания, специализирующаяся на создании

нетривиальных алгоритмов для повышения точности кредитного

скоринга на стыке машинного обучение и компьютерного зрения

Никита Николаев Директор FscoreLab СПБГЭУ, директор бизнес школы Grand School, со-основатель

системы дистанционного обучения Grand Class