tgoop.com/dzis_science/547
Last Update:
Картина И.Репина "Какая глубина деревьев в бустинге?"
Привет всем!
Прошли номинации Alfa Award, поэтому опасение сглазить прошло. Мы не выиграли, проигрыш, отчасти, история политическая, от меня не зависимая, но даже без нее не факт, что бы выиграли. Поэтому можно рассказать об одном из интересных рабочих проектов.
Сегодня расскажу про один из проектов прошлого и текущего года, который активно разрабатывает моя команда - модель выручки юридических лиц (ЮЛ) и индивидуальных предпринимателей (ИП).
- Какую проблематику бизнеса мы решаем?
Всем известно, что любая выдача кредита, особенно в малом и среднем бизнесе, начинается с вопроса "Сколько ты зарабатываешь". Для ЮЛ на данный вопрос довольно неплохо отвечает годовая финансовая отчетность, которая идет в расчет лимита кредитного предложения. Тут все просто, есть вероятность дефолта с PD, есть выручка, на основе нее считаются другие страшные штуки (LGD, EAD) и выставляется ставка и лимит. Больше выручка - выше лимит.
Собственно, в получении годовой выручки есть 2 серьезные проблемы.
Первая проблема: Для ЮЛ, работающих по "упрощенке" (Упрощенная Система Налогообложеня, УСН) и для ИП сдача ежегодной финансовой отчетности не является обязательной (=ее не сдают).
Вторая проблема: Финансовая отчетность на практике может быть достаточно устаревшей. Отчетность появляется плюс минус в апреле текущего года за прошлый год.
Т.е на примере: в марте 2025 года существует в природе отчетность за 2023 календарный год, т.е "свежесть" отчета составляет почти 1.5 года.
- В чем решение?
В первой итерации модели было принято использовать подход решения задачи регрессии, который на основе различных факторов предсказывает годовую выручку за прошлый год. В процессе было принято разделить модель на ЮЛ и ИП, так как для ИП сбор таргета - отдельный вид искусства. На данный момент скажу, что модель успешно применяется, подробнее по структуре модели расписывать не буду, рассчитываю как дойдут руки написать статейку по-серьезнее. Скажу, что это бустинг над решающими деревьями, с глубиной деревьев 2 (картинка поэтому в тему).
-Какие проблемы подхода?
Прежде всего, мы абсолютно не решаем 2 проблему, предсказываем "устаревшую" выручку.
Вторая проблема подхода - инфляционное изменение таргета, которое мы видим из года в год. Выручка, в среднем, растет на величину около инфляции г/г.
Кроме того, в процессе родилось еще одно направление - использование ГСЛ (Группы связанных лиц). Предположим, что к нам пришла кредитоваться ООО "Газпром-ромашка", являющаяся дочкой Газпрома. У нее слабые показатели, которые мы оцениваем в текущих реалиях сейчас независимо.
Однако, зная юридические и финансовые связи ООО с головной компанией, мы можем кредитовать на больший объем, так как знаем, что у нее все будет хорошо в финансовом плане.
-Что мы делаем сейчас?
Прежде всего тестируем различные схемы предсказания выручки (на горизонте 12 месяцев или года вперед), используя различные комбинации. Добавляем новые источники (активно тестируем), рассматриваем варианты учитывания ГСЛ в итоговой выручке клиента. Активная фаза согласований практически закончена, приступаем к улучшению.
Если у вас есть вопросы, пишите в комментариях, с радостью отвечу👇
#трудовые_будни