Еще запомнились деревья решений. Алгоритм ищет такие вопросы, на которые можно четко ответить «да/нет», и разделить данные. Например: «Покупал ли клиент в прошлом месяце?», «Средний чек выше пяти тысяч?». На каждом шаге дерево делится, и чем дальше, тем более конкретные условия мы получаем. В итоге путь по веткам дерева приводит к предсказанию: уйдёт ли клиент, купит ли товар, стоит ли одобрить заявку.
Позже, в аспирантуре, я стал глубже изучать эту тему, и узнал, что на практике это мало где применяется. Точнее, были проекты по прогнозированию социально-экономического развития регионов, но они имели мало общего с реальностью. Чтобы модель давала достоверный результат, нужен большой объем данных. А в ту пору у компаний была лишь базовая автоматизация на уровне 1С бухгалтерии или зачатков CRM.
Такие технологии начинали применяться в банках, федеральных торговых сетях, где транзакции идут каждую секунду. Но даже там прогнозы не учитывали факторы внешней среды, в итоге ИИ-проекты оставались уделом романтиков-математиков, мечтавших алгоритмизировать принятие решений в бизнесе. А также прагматичных менеджеров, которые осваивали бюджеты на инновации, заведомо зная, что проект ляжет в стол.
2010-е годы
В следующем десятилетии ситуация изменилась. Два фактора стимулировали развитие предиктивных технологий:
Во-первых, компании автоматизировали основные процессы, накопили массивы данных за 3–5 лет и более. Уже можно было строить прогнозы, учитывая сезонность и другие тренды.
Во-вторых, серверные мощности стали на порядок доступнее. Добавить сотню гигабайт оперативной памяти или терабайт дискового хранилища стало по карману не только крупным, но и средним компаниям. Плюс развитие облачных дата-центров, где можно быстро арендовать ресурсы.
Тогда основным направлением моей компании было создание корпоративных хранилищ данных, автоматизации отчетности. И мои клиенты действительно стали получать не просто красивые графики на дашборды, а получили возможность углубляться до подробных данных по клиентам, товарам и сотрудникам. А дальше возникал вопрос: «А что, если?..», им хотелось смоделировать разные сценарии, спрогнозировать поведение клиентов.
Наш первый проект в 2014 году был по предсказанию оттока абонентов регионального интернет-провайдера. Идея была в том, чтобы построить «портрет уходящего клиента» и заранее выявлять склонных к уходу, и проводить активности по их удержанию.
Тогда мы использовали технологии IBM SPSS. Загрузили данные по клиентам: активность использования услуг, обращения в поддержку и другие параметры. Данные были без последнего квартала – на них мы затем проверяли достоверность прогноза. Сначала погрешность была существенной, но еще через месяц мы обучили модель на свежих данных, а также добавили статистику по конкурентам (у клиента наконец-то появился повод навести порядок в этих данных).
Точность прогноза была 80%, что по тем временам считалось хорошим результатом, и мы гордо пошли презентовать это коммерческому директору. На что он ответил: «Спасибо, ребята, я и так знаю, что у нас основной сегмент оттока – это коттеджные поселки. Ведь Ростелеком предлагает им больше услуг и вдвое дешевле. Я-то думал, вы спрогнозируете, где нам взять новых клиентов…».
В тот момент я столкнулся с реальностью. Для математиков успех – это точность прогноза (и это не одна метрика, а целый набор критериев). Но для бизнеса – это все бесполезные умные слова. Заказчики, за редким исключением, хотели быстрого результата без вовлечения со своей стороны. А я сфокусировался на теме дашбордов, где клиенты как раз созрели и спрос продолжал расти.
С годами у компаний становилось все больше данных и стал укрепляться новый тренд – Data Science. В основе была все та же матстатистика, но с более современными инструментами. На рынке труда появлялось все больше специалистов, способных работать с ними. И тогда, на рубеже 2017-2018 годов, я снова решил проверить на практике, может ли машина думать за человека.
Завод по производству промышленных смол. Нужно спрогнозировать параметры смолы на выходе из реактора. От этого зависело, куда её можно пустить: либо на деревообрабатывающую сферу, условно для сборки шкафа, либо на производство автомобильных покрышек. Проблема была в том, что заказ шел «под дерево», а на выходе оказывалась партия, подходящая только «под резину».
Клиент уверял, что все данные у него есть, лаборатория автоматизирована. На практике всё упёрлось в сбор достоверных данных: оказалось, часть показателей ведется в бумажных журналах. Мало того, техник мог уйти пораньше и записать в журнал усредненные показатели. В результате реальные отклонения от технологического процесса просто не фиксировались.
Пришлось сделать приложение для ввода данных, но возникли новые барьеры. Дата сайентисты продолжали рассуждать коэффициентами вариации, и не погружались в суть производства. Чтобы проект двинулся, пришлось привлечь химика, кандидата наук, который мог на экспертном уровне спорить с технологами заказчика. Только с таким авторитетом можно было пробить сопротивление консерваторов.
В итоге проект получился не про машинное обучение, а скорее про комплексный консалтинг, когда нужно «поселиться у клиента». А «дата-сайентисты» оказались все теми же программистами-математиками. Это все еще было далеко от тиражирования, управляемого конвейера проектов.
2020-е годы
Шли годы, данных у клиентов становилось все больше, и появлялось все больше сфер для применения. Например, для работы с текстом и извлечением смыслов.
2021 год, промышленный холдинг, свыше 100 000 сотрудников. Мы занимались HR-аналитикой, в том числе исследованиями удовлетворенности. Но помимо расчета eNPS было много текстовых комментариев, в которых и содержались ценные смыслы, не просто количественная, а качественная обратная связь.
Но миллион комментариев вручную не обработать, и мы решили построить модель, которая распределит комментарии по категориям, определит позитивную или негативную тональность.
Сначала заказчик распределил первую тысячу ответов вручную, затем мы обучили модель. Точность была 95%, что технически соответствовало ожиданиям, но когда мы построили дашборд и показали фокус-группе, то это был почти провал. Все ошибки кластеризации попадали на первые экраны или появлялись после 1-2 фильтров. Жалоба на зарплату могла попасть в категорию «условия труда», комментарий про переработки – во «внутреннюю политику». По впечатлению пользователя точность была 50%.
При этом нам было понятно, что надо исправить, как дообучить модель. Но на это надо было 2 недели, а у нас было только 2 дня. Пришлось выгрузить 10 000 проблемных записей и за 2 суток исправить их вручную в авральном режиме. Потом, после презентации, мы дообучили модель, чтобы свежие данные корректно интерпретировались. Но осадочек остался.
Сегодня безграничные вычислительные мощности доступны нам прямо из телефона. Если раньше на обучение модели требовались месяцы и недели, то теперь – часы и минуты. А от идеи до технической реализации проходит несколько дней. Но теперь мы ждем результата обработки запроса не от машины, а от человека. Чтобы осмыслить полученную информацию, обсудить ее с другими людьми и договориться о совместных действиях – нужны все так же дни, недели, а в бюрократизированных организациях – целые месяцы. Но фундаментальный сдвиг уже произошел.
Мы прорабатывали проект по прогнозированию спроса для нашего клиента, мясного производителя. Первый подход был в 2021 году, но тогда ни одно типовое решение им не подошло. Классические регрессионные модели требовали глубокой адаптации под их сезонность и кривизну специфики учета. Бюджет проекта с лицензиями на софт, доработкой и интеграциями с базой превышал 10 млн рублей. Мы хоть и считали экономический эффект, в разы превышавший затраты, клиент счел риски проекта слишком высокими и отложил до лучших времен. А точку заказа так и продолжили считать в Excel.
В 2024 году эти времена и правда настали. К тому времени были доведены до ума процессы и данные, это позволило сделать пилот, используя API Anthropic. Мы провели несколько итераций доработок, а затем организовали стратсессию. На нее позвали руководителей и специалистов из отделов, участвующих в общем процессе: производство, логистика, продажи, маркетинг. На этой сессии мы проверяли гипотезы в моменте, оценивали сценарии развития и на основе данных, и экспертным путем. Это позволило принять решения об изменениях в бизнес-процессах и утвердить нужные бюджеты за один день, а не за три месяца, как раньше.
После пилота модель реализовали уже локально на серверах клиента и масштабировали. Затраты оказались на порядок меньше по сравнению с архитектурой «предыдущего поколения». И в итоге предприятие смогло на 20% увеличить объемы производства и продаж к сезонному пику по сравнению с предыдущим годом.
Если оглянуться на последние 20 лет, то видно, что менялись технологии, названия подходов, но сама логика оставалась прежней. Всегда были завышенные обещания продавцов ИТ-решений. И наивные ожидания бизнеса, что «айтишники поднимут им прибыль». А еще всегда были те, кто грамотно использовал технологии в бизнесе.