Анализ рыночной корзины

Анализ рыночной корзины в Data Mining — это поиск устойчивых групп событий, происходящих совместно, в некоторой предметной области. В его основе лежит поиск ассоциативных правил, позволяющий находить закономерности между связанными событиями.

Анализ рыночной корзины используется в розничной торговле для выявления устойчивых наборов товаров, приобретаемых клиентами в супермаркете по одному чеку (например, «картошка, лук и салат», «макароны и кетчуп», «пиво и чипсы», «чай и выпечка» и т.д.), что позволяет оптимизировать товарный ассортимент и размещение товаров в торговом зале с целью «спровоцировать» покупателя на покупку нескольких товаров из набора.

Метод успешно используется и в других областях, например, для анализа посещений веб-страниц, в анализе и прогнозировании сбоев телекоммуникационного оборудования, в медицине и т.д.

Иллюстрация анализа потребительской корзины на примере розничной сети, занимающейся продажей бытовой химии.

Запустить демо

Установить локально

Описание алгоритма

1. Импорт данных

Импорт набора данных

Набор данных насчитывает 5000 чеков. Чек, содержащий список приобретенных товаров, является транзакцией, а каждый товар в чеке — элементом транзакции.

Имя Метка
id Чек
item Товарная позиция

2. Поиск ассоциативных правил

При поиске ассоциативных правил применяется алгоритм FP-Growth.

Загруженные транзакции подаются на входной порт Входной источник данных узла Ассоциативные правила.

Настройка Ассоциативных правил

Установлены следующие настройки для узла Ассоциативные правила:

  • для поля id — назначение Транзакция
  • для поля itemЭлемент
  • флаг Исключать элементы с поддержкой, больше максимальной — установлен
  • значение параметра Максимальная поддержка, % — 20
  • флаг Исключить одиночные наборы — установлен
  • значение параметра Минимальная достоверность правила, % — 25
  • значение параметра Максимальное число следствий — 2

При изменении настроек переобучите модель.

Интерпретация результатов

а) Выходной порт Популярные наборы

Содержит наборы элементов, наиболее часто встречающиеся в транзакциях (частые наборы).

б) Выходной порт Ассоциативные правила

Выявленные ассоциативные правила и их показатели: поддержка, достоверность, лифт.

в) Выходной набор Применение правил

Содержит транзакции входного набора данных, в которых срабатывают выявленные правила.

Для представления результатов используется визуализатор Таблица, настроенный для каждого выходного порта.

В таблице Ассоциативные правила выведены наборы ассоциативных правил и их показатели: поддержка, достоверность, лифт, описывающие поведение покупателей. Среди полученного списка наблюдаются как тривиальные закономерности, например, Кондиционер для белья → Стиральный порошок, так и неочевидные, например, Бумажное полотенце → Освежитель воздуха.

Аналитику необходимо проанализировать каждое полученное правило и выбрать из них по-настоящему ценные.

Скачайте и откройте файл в Loginom. При необходимости Loginom CE можно скачать бесплатно

Скачать демопример

Минимальные требования к системе:

  • Операционная система: Windows 10 и выше
  • CPU x64: 2 core 1
  • Оперативная память: 4 GB
  • Жесткий диск: 10 GB

1 Поддерживается работа на x64 процессорах Intel Core, AMD FX и более новых, содержащих инструкции SSE4.2 (POPCNT, LZCNT).