«Купите один и получите второй бесплатно… Нажмите здесь, чтобы получить премиум-членство на 2 месяца». Часто ли вы получали такого рода рекламные объявления в своем браузере или электронной почте ibox? Вам интересно, почему вы нацелены на такие рекламные акции?

Может быть, вы занимаетесь маркетингом и пытаетесь разработать стратегию продвижения для увеличения продаж? Взвешиваете ли вы затраты на проведение продвижения и прибыль, полученную от продвижения?

Рекламные акции распространены в компаниях и служат ключевой стратегией стимулирования роста бизнеса. Когда вы проводите рекламные акции, вы хотите ориентироваться только на определенные группы клиентов и избегать тех, кто не реагирует на какие-либо рекламные акции, поскольку рекламные акции также влекут за собой расходы (например, стоимость онлайн-рекламы или стоимость купонов в автономном режиме).

Кроме того, мы также хотим пропустить тех, кто будет покупать независимо от того, получают ли они какие-либо рекламные акции или нет. Одним словом, мы хотим ориентироваться только на тех, кто купит только после того, как получит рекламные акции.

Машинное обучение — хороший метод для разработки такой стратегии продвижения. Мы создадим прогностическую модель, чтобы предсказать, какие клиенты примут предложение после того, как им будет предоставлено какое-либо предложение.

Метрики

Чтобы оценить эффективность лечения (здесь продвижение), мы можем использовать модель поднятия настроения. Из Википедии мы знаем, что моделирование подъема, также называемое постепенным подъемом, представляет собой метод предиктивного моделирования, который напрямую моделирует постепенное влияние лечения (например, прямого маркетингового действия) на поведение человека.

При оценке стратегии продвижения часто используют две метрики. Во-первых, это Инкрементальный коэффициент отклика (IRR), определяемый как отношение количества покупателей в рекламной группе к общему количеству покупателей в группе покупателей минус отношение количества покупателей в неактивной группе. - акционная группа к общему количеству клиентов в не акционной группе.

Второй — Чистый дополнительный доход (NIR), определяемый как общее количество покупателей, получивших рекламную акцию, умноженное на 10, минус количество предоставленных рекламных акций, умноженное на 0,15, минус количество покупателей, которые не дали поощрения раз 10.

Успех стратегии продвижения можно оценить с помощью IRR и NIR.

продвижение Старбакс

Мы используем набор данных продвижения Starbucks в качестве примера, чтобы указать, как мы можем разработать стратегию продвижения с помощью машинного обучения. Набор данных взят из домашнего задания Starbucks. В наборе данных люди случайным образом распределяются по рекламным и нерекламным группам. Сначала мы проведем проверку гипотезы, чтобы увидеть, являются ли результаты статистически значимыми.

Количество лиц

Как видно на рисунке 1, количество людей как в рекламной, так и в нерекламной группе довольно близко, потому что человек случайным образом попадает в рекламную или нерекламную группу.

Результат на рисунке 2 показывает, что людей, которые купили, гораздо меньше, чем тех, кто этого не сделал, с соотношением примерно 1:80.

Т-тест для возрастающей скорости отклика

Мы получаем IRR 0,009 при простом повышении. Чтобы определить, является ли различие статистически значимым, мы провели t-критерий для лиц из двух групп с продвижением по службе и без него.

Промо- и не-промо-группы рассматриваются как лечебная и контрольная группы соответственно. Нулевая гипотеза о том, что IRR в обоих случаях одинакова, отклоняется при уровне значимости 0,05. Таким образом, мы можем сделать вывод, что коэффициент ответов в рекламной группе статистически выше, чем в нерекламной группе.

Статистическая значимость не обязательно означает практическую значимость. Поскольку поощрение продвижения для любого человека также связано с расходами, нам необходимо взвесить затраты и доход от продвижения. Чтобы быть более конкретным, нам нужно знать NIR.

Предположим, что есть одинаковое количество людей как в рекламной, так и в не рекламной группе, тогда для того, чтобы чистый дополнительный доход (nir) был положительным, дополнительный коэффициент ответов должен быть больше 0,015 в соответствии с приведенным выше уравнением nir. Новый t-тест проводится со следующей нулевой гипотезой.

Результаты T-теста показывают, что в предположении, что количество людей в группе с продвижением и без продвижения одинаковое, результат IRR в наборе данных практически незначителен, а чистый дополнительный доход составляет -2334,600.

Для рекламы также нужны деньги, и мы хотим отправлять рекламные акции только тем людям, которые с наибольшей вероятностью совершат покупку, и избегать людей, которые, кажется, не заинтересованы в рекламных акциях.

Построение модели классификации для прогнозирования

Необходимость отправлять рекламные объявления определенным группам напоминает проблему классификации, и мы стремимся создать модель для прогнозирования того, может ли пользователь совершить покупку, чтобы избежать людей, которые могут не будут затронуты, и увеличить чистый дополнительный доход. В результате появилась стратегия продвижения на основе машинного обучения.

Глядя на набор данных Starbucks, мы видим, что есть 7 функций V1-V7, связанных с каждым человеком в наборе данных, и мы не знаем, что представляют собой эти функции. После исследовательского анализа данных мы решили использовать все функции. Все переменные рассматриваются как непрерывные переменные. DecisionTreeClassifier предпочтительнее других классификаторов из-за его эффективности классификации с точки зрения оценки F1.

Мы выбираем 0,205 в качестве порога принятия решения для прогнозируемой вероятности из классификатора дерева решений. NIR составляет около 400, а IRR составляет около 0,019 при использовании продвижения с помощью классификатора дерева решений.

С продвижением на основе машинного обучения мы можем значительно увеличить IRR и NIR по сравнению с продвижением со случайным назначением (IRR с 0,009 до 0,019, NIR с -2335 до 400).

Вы уже впечатлены продвижением на основе машинного обучения? Может быть, создайте классификатор, чтобы прогнозировать, кто может совершить покупку только после того, как они получат какие-либо рекламные акции, и отправляйте свои рекламные акции только им для получения более высокой прибыли!

Если вас интересует набор данных или исходный код для этого поста, нажмите здесь https://github.com/Yuzhe17/Design-of-Starbucks-promotion-strategy.