О современных технологиях ритейла и пользе прогнозной аналитики для сайта shopolog.ru

 «Интерпроком» Дмитрий Сапонов, эксперт по прогнозной аналитике компании «Интерпроком»:

Вот один из кейсов работы с крупным офлайн-ритейлером. У ритейлера были данные и контакты нескольких миллионов клиентов. База была составлена на основе анкет, которые покупатели когда-либо заполнили, чтобы получить карточку программы лояльности.

Ритейлер регулярно проводил различные маркетинговые акции, направленные на стимулирование сбыта товара и повышение лояльности клиентов. Оповещение клиентов происходило через СМС. Компания - ритейлер обратилась к нам с вопросом: а можно ли рассылать меньшее количество СМС без снижения эффекта от рассылки? Ведь это позволит сэкономить на стоимости рассылки.

Оказывается это возможно, если с помощью анализа данных о поведении выявить клиентов, которые с наибольшей вероятностью откликнуться на предложение по акции и рассылать СМС только этим клиентам. Решение было разработано на базе IBM SPSS Modeler.

При отборе наиболее вероятных покупателей учитывали их пол, историю покупок за прошедший год, уровень образования, возраст и еще более 20 параметров. Сегменты с наибольшей вероятностью покупки вычислялись отдельно для каждой модели товара из выбранной категории.

Был проведен сравнительный анализ нескольких алгоритмов, наиболее релевантных для оценки вероятности покупки: логистическая регрессия, деревья классификации и метод ближайшего соседа.

Чаще всего, мы ограничены выбором алгоритма, прогноз которого можно изложить как решающие правила, формируя их как комбинацию исходных признаков. Например, «вероятность покупки вырастет в 1,5 раза, если вашему клиенту от 25 до 35 лет и последнюю покупку он совершил не более месяца назад». Не все алгоритмы предоставляют результат в виде правил, например, логистическая регрессия дает оценку коэффициентов, которые можно подставить в формулу для подсчета вероятности, а метод ближайшего соседа находит клиента, который оказывается самым «похожим» по совокупности признаков на того, чье поведение уже известно.

Оценивая и сравнивая работу разных алгоритмов, мы выбираем тот, который лучше всего работает в нашей ситуации: при такой структуре данных, при такой ситуации на рынке и т.д. Мы оцениваем по одним и тем же правилам ошибку прогноза каждого алгоритма, пробуем комбинации алгоритмов, потому что десять средних алгоритмов могут вместе показать результат лучший, чем один сильный. Алгоритм или «команда» алгоритмов, чья ошибка меньше, признается победителем.

Мы протестировали перечисленные алгоритмы, и по прогнозной мощности был отобран один из алгоритмов деревьев классификации – CHAID, chi-squared automatic interaction detection, дословно - автоматический поиск взаимосвязей с помощью критерия хи-квадрат. Он универсальный и выявляет взаимосвязи путем многократного дробления базы на сегменты по иерархии признаков. CHAID хорошо работает с категориальными признаками и с данными, в которых много пропусков. Модель, построенную с помощью такого алгоритма, можно визуализировать так называемой диаграммой дерева, на которой видно последовательное дробление массива данных на все более мелкие сегменты. Для каждого сегмента можно оценить вероятность покупки и выбрать только те сегменты, где вероятность максимальна.

В результате из миллионов клиентов были отобраны 700 тысяч покупателей, для которых вероятность покупки той или иной модели товара была наиболее высока. У ритейлера появилась возможность таргетировать рассылку и снизить расходы на СМС без потери их эффективности.

Учитывая, что подобные акции проводились часто и стоимость одного СМС была около одного рубля, ожидаемая экономия за год составила порядка 100 миллионов рублей. Одно это окупило вложения в аналитику.


Полная версия материала: shopolog.ru/metodichka/kompanii-i-rynki/151820-povyshenie-effektivnosti-meropriyatiy-po-stimulirovaniyu-sbyta-akciy-skidok/


	
			
Поделиться ссылкой: