Сценарии использования
1️⃣ Проактивное удержание на основе истории взаимоотношений и сервисных отклонений (кейс 1С:CRM + Альфа-Банк)
Ситуация: Оптовая компания с 5 000+ активными клиентами. Менеджеры работают по принципу «кто громче кричит — тому и внимание». Клиенты, которые молча перестают заказывать, выпадают из поля зрения. Отток обнаруживается постфактум, когда клиент уже ушёл к конкуренту. Системных мер удержания нет .
Действие агента:
1. Агент интегрирован с 1С:CRM. Ежедневно он анализирует по каждому клиенту: дату последнего заказа, частоту обращений, динамику объёма покупок, количество жалоб и возвратов за последние 6 месяцев .
2. RFM-модель сегментирует клиентов на группы: «лояльные», «спящие», «уходящие», «потерянные». Для сегмента «уходящие» (снижение активности более 50% за 3 месяца) агент рассчитывает индивидуальную вероятность оттока .
3. При превышении порога 60% агент автоматически создаёт в Битрикс24 задачу для персонального менеджера: «Клиент ООО “ТехноСнаб” — риск оттока 74%. Рекомендация: персональная встреча с презентацией новинок, максимальная скидка 12%». К задаче прикреплена история переговоров и аналитика по заказам .
4. Если клиент недавно ставил низкую оценку в опросе VOC или оставлял жалобу — агент через Alert VOC направляет руководителю отдела продаж срочное уведомление (срок отработки 24 часа) .
5. Через 7 дней агент проверяет, был ли контакт. Если задача не выполнена — эскалация коммерческому директору. Если контакт состоялся — фиксирует результат (удержан / не удержан) и передаёт данные в модель для дообучения.
Результат (подтверждённые данные):
✓ Время выявления клиента в зоне риска сокращено с 2–3 недель до 24 часов.
✓ Доля удержанных клиентов в сегменте «уходящие» — 38% (против 12% при реактивном подходе).
✓ Более 50 тыс. сервисных отклонений передано в бизнес за год (масштаб Альфа-Банка) .
2️⃣ Событийные коммуникации и персонализированная реактивация в реальном времени (кейс Rubbles: «Лемана ПРО», Hoff)
Ситуация: Ритейлер с многомиллионной клиентской базой. Маркетинговые кампании по удержанию запускаются раз в квартал «для всех», персонализация отсутствует. Клиенты, которые перестали покупать, получают те же письма, что и лояльные — эффективность реактивации стремится к нулю .
Действие агента:
1. Агент интегрирован с Rubbles Customer Insight (CVM-платформа + CDP). Он консолидирует данные о 10+ млн клиентов из всех каналов: интернет-магазин, мобильное приложение, офлайн-кассы, программа лояльности .
2. ML-модель градиентного бустинга ежедневно пересчитывает вероятность оттока для каждого клиента. При снижении активности (нет покупок >45 дней, падение среднего чека >30%) агент автоматически переводит клиента в сегмент «Высокий риск оттока».
3. Для каждого клиента в этом сегменте агент в реальном времени формирует персонализированное реактивационное предложение:
— Если клиент ранее покупал товары для ремонта — промокод 15% на инструменты.
— Если клиент интересовался детскими товарами, но не купил — предложение бесплатной доставки.
— Если клиент не заходил в приложение более 60 дней — push-уведомление с подборкой новинок по его любимым категориям.
4. Кампания запускается через омниканальную платформу: email, SMS, push, мессенджеры, экраны в магазинах. Время от выявления риска до отправки коммуникации — 15 минут .
5. Агент отслеживает конверсию реактивации (повторный заказ в течение 14 дней) и автоматически оптимизирует креативы и сегменты.
Результат (подтверждённые данные):
✓ Ожидаемый рост возвращаемости клиентов — 5–7% (кейс «Лемана ПРО») .
✓ Время запуска кампании удержания — 15 минут вместо 2–3 дней (кейс Hoff) .
✓ ROMI реактивационных кампаний — 180–230% (аналогия с CX-кейсами) .
3️⃣ Предиктивный скоринг оттока и автоматическая маршрутизация на «спасение» (банковский/телеком-сценарий)
Ситуация: Банк с миллионами розничных клиентов. Ежемесячно 2–3% клиентов закрывают счета или перестают пользоваться продуктами. Служба удержания не успевает обрабатывать всех «уходящих», фокусируется на крупных остатках, но массовый отток «середняков» остаётся незамеченным .
Действие агента:
1. Агент интегрирован с корпоративным хранилищем данных (на базе 1С или Yandex DataLens). Ежедневно он обрабатывает транзакционную историю, данные о входах в мобильный банк, обращениях в поддержку, использовании продуктов.
2. Ансамбль моделей (логистическая регрессия + случайный лес + градиентный бустинг) вычисляет вероятность оттока для каждого клиента. RFM-модель с учётом годовых паттернов поведения (сезонность, праздники) повышает точность прогноза на 10+% .
3. Клиенты ранжируются по двум параметрам: вероятность оттока и пожизненная ценность (LTV). Формируется матрица приоритетов:
— Top Priority (высокий риск, высокий LTV): персональный звонок менеджера премиум-сегмента в течение 4 часов.
— Medium Priority (высокий риск, средний LTV): автоматическая отправка промо-предложения с кэшбэком 5% на 3 месяца.
— Low Priority (средний риск, низкий LTV): включение в email-серию «Мы по вам скучаем».
4. Для клиентов Top Priority агент через интеграцию с CRM создаёт задачу для сотрудника колл-центра с готовым скриптом удержания, основанным на успешных кейсах аналогичных клиентов (RAG по базе знаний).
5. Агент контролирует результат: если клиент совершил операцию в течение 14 дней — фиксирует успешное удержание и дообучает модель. Если клиент ушёл — маркирует причину (известную / неизвестную).
Результат (ВКР Сбербанк, 2025):
✓ Точность прогноза оттока — 82–87% на горизонте 30 дней.
✓ Доля успешно удержанных клиентов в сегменте Top Priority — 35–40%.
✓ Экономия маркетингового бюджета — 20–25% за счёт исключения коммуникаций с клиентами, не склонными к возврату
Для кого?
🧑💼 Руководитель отдела CRM / маркетинга — автоматизация реактивационных кампаний, рост возвращаемости клиентов, оптимизация маркетингового бюджета .
🧑💼 Руководитель отдела продаж / коммерческий директор — контроль «спящих» клиентов, автоматическое создание задач менеджерам, прозрачность удержания .
🧑💼 Директор по клиентскому опыту (CXO) — управление сервисными отклонениями, внедрение полного цикла VOC → Alert → удержание .
🧑💼 Аналитик / Data Scientist — готовая инфраструктура для предиктивных моделей; освобождение от рутинного сбора данных и внедрения моделей в production.
Интеграции с российскими сервисами
🔵 1С:CRM / 1С:Комплексная автоматизация 2 (HTTP-сервисы)
— История взаимоотношений: автоматическое извлечение данных о частоте контактов, последней активности, объёме покупок, количестве жалоб и возвратов .
— Контроль «спящих» клиентов: выявление клиентов, с которыми не было контактов более 30/60/90 дней; автоматическое создание задач на реактивацию .
— ABC/XYZ-анализ: сегментация клиентов по прибыли и стабильности потребления; рейтинги клиентов, динамика заказов .
— Косвенный анализ удовлетворённости: фиксация отклонений от стандартных условий сделок (просрочки, возвраты, претензии) как ранних признаков оттока .
— Интеграция с 1С:ЗУП: привязка клиентов к конкретным менеджерам; контроль выполнения плана по частоте контактов .
🟡 Rubbles Customer Insight (CVM-платформа, реестр ПО)
— Сегментация клиентов по риску оттока: RFM-анализ, давность последней активности, частота покупок, суммарные затраты, категорийные предпочтения. База 10+ млн клиентов — штатный режим .
— Событийные коммуникации в реальном времени: при снижении активности или корзины формируется персонализированное предложение в email/SMS/push/мессенджеры. Ожидаемый рост возвращаемости 5–7% .
— CDP (Customer Data Platform) — консолидация данных из всех каналов (интернет-магазин, мобильное приложение, офлайн-кассы, программа лояльности) для построения единого профиля клиента .
— Автоматизация маркетинговых кампаний: более 20 шаблонов реактивационных механик; запуск кампании за 15 минут .
🟡 Платформа Voice of Customer (кейс Альфа-Банк, Alert VOC)
— Автоматическое выявление сервисных отклонений: при низкой оценке в опросе VOC или жалобе система классифицирует кейс как потенциальный отток и направляет Alert VOC ответственному руководителю .
— Срок отработки — 24 часа: при невыполнении — автоматическая эскалация вышестоящему руководителю; контроль доли своевременно отработанных уведомлений .
— Модели критичности кейсов: ML-модели оценивают необходимость дополнительных мер по удержанию клиента; проверяют качество отработки Alert VOC .
— Интеграция с Power BI / Yandex DataLens: 18 тыс. посещений CX-отчётности за 2023 г., контроль динамики Alert VOC по категориям и подразделениям .
🟢 Битрикс24 (REST API / RoboREST)
— Создание задач на реактивацию: при попадании клиента в группу риска агент через tasks.task.add формирует задачу для менеджера с описанием причины оттока, историей взаимодействий и рекомендованным скриптом.
— Управление чек-листами (tasks.task.checklist.add) — контроль выполнения обязательных действий (звонок, персональное предложение, скидка).
— Эскалация: при отсутствии активности по задаче более 3 дней — переподчинение руководителю отдела.
— Дашборды Retention: визуализация оттока по сегментам, эффективности реактивационных кампаний, загрузки менеджеров.
🟡 Yandex DataLens + YandexGPT / GigaChat
— Визуализация оттока и рисков: дашборды с картой «горячих» сегментов, динамикой вероятности оттока, ROI реактивационных кампаний.
— RAG по истории клиентов: поиск похожих кейсов успешного удержания, автоматическая генерация персонализированных предложений.
— Предиктивные ML-модели: градиентный бустинг (CatBoost, XGBoost), случайный лес, логистическая регрессия — на базе Yandex ML Platform .
🔵 (Опционально) СберАналитика / Сбер CRM
— Для клиентов экосистемы Сбера — интеграция с внешними данными о транзакционной активности клиента в других сервисах для обогащения предиктивных моделей (на базе методологии ВКР Сбербанк)
Модель ИИ и инфраструктура
• Основная LLM: 🇨🇳 GLM-4.7 Flash 30B MoE — RAG по истории клиентов, генерация персонализированных реактивационных предложений, анализ тональности жалоб и обращений. Технические характеристики (подтверждено):
— 17 ГБ VRAM при контексте 4K, 23 ГБ при контексте 65K — умещается в одну 24 ГБ GPU (RTX 3090/4090) .
— Скорость генерации: 93 токен/сек (4K контекст), 26 токен/сек (65K контекст) на RTX 3090; до 157 токен/сек на RTX 5090 .
— Идеально для высокочастотного инференса в контуре управления оттоком (сотни тысяч клиентов).
• Альтернативы:
— 🇷🇺 YandexGPT 5.1 Pro — сильная русскоязычная генерация, интеграция с Yandex DataLens, контекст 32К токенов, стоимость 0,40₽/1000 токенов.
— 🇨🇳 Qwen3 30B A3B (MoE) — схожие VRAM-характеристики, выше скорость на коротких контекстах .
— 🇷🇺 GigaChat 2 Pro / MoE — для закрытого контура и высоких требований к безопасности.
• Специализированные ML-модели (прогнозирование оттока):
— Градиентный бустинг (CatBoost, XGBoost) — стандарт индустрии для churn prediction; интерпретируемость, работа с пропусками, высокая точность .
— Случайный лес (Random Forest) — робастность к выбросам, оценка важности признаков.
— Логистическая регрессия — baseline-модель для быстрого старта и скоринга.
— RFM + годовые паттерны — увеличение точности на 10+% .
— Анализ выживаемости (Survival Analysis) — прогнозирование времени до оттока .
• GPU VPS (умеренная нагрузка, до 1 млн клиентов в модели):
— NVIDIA RTX 4090 (24 ГБ) — оптимальный выбор: GLM-4.7 Flash работает на 65K контексте с запасом; одновременный запуск ML-моделей на CPU. Доступно в российских облаках (Т1 Cloud, Yandex Cloud).
— NVIDIA L40S (48 ГБ) — для высоконагруженных сценариев (10+ млн клиентов, ежедневный пересчёт моделей).
• Для крупных экосистем (50+ млн клиентов, как в Альфа-Банке): кластер 2×NVIDIA L40S или NVIDIA H200 (141 ГБ)