Анализ рыночной корзины
Анализ рыночной корзины в Data Mining — это поиск устойчивых групп событий, происходящих совместно, в некоторой предметной области. В его основе лежит поиск ассоциативных правил, позволяющий находить закономерности между связанными событиями.
Анализ рыночной корзины используется в розничной торговле для выявления устойчивых наборов товаров, приобретаемых клиентами в супермаркете по одному чеку (например, «картошка, лук и салат», «макароны и кетчуп», «пиво и чипсы», «чай и выпечка» и т.д.), что позволяет оптимизировать товарный ассортимент и размещение товаров в торговом зале с целью «спровоцировать» покупателя на покупку нескольких товаров из набора.
Метод успешно используется и в других областях, например, для анализа посещений веб-страниц, в анализе и прогнозировании сбоев телекоммуникационного оборудования, в медицине и т.д.
Иллюстрация анализа потребительской корзины на примере розничной сети, занимающейся продажей бытовой химии.
Описание алгоритма
1. Импорт данных
Набор данных насчитывает 5000 чеков. Чек, содержащий список приобретенных товаров, является транзакцией, а каждый товар в чеке — элементом транзакции.
Имя | Метка |
---|---|
id | Чек |
item | Товарная позиция |
2. Поиск ассоциативных правил
При поиске ассоциативных правил применяется алгоритм FP-Growth.
Загруженные транзакции подаются на входной порт Входной источник данных узла Ассоциативные правила.
Установлены следующие настройки для узла Ассоциативные правила:
- для поля
id
— назначение Транзакция - для поля
item
— Элемент - флаг Исключать элементы с поддержкой, больше максимальной — установлен
- значение параметра Максимальная поддержка, % — 20
- флаг Исключить одиночные наборы — установлен
- значение параметра Минимальная достоверность правила, % — 25
- значение параметра Максимальное число следствий — 2
При изменении настроек переобучите модель.
Интерпретация результатов
Содержит наборы элементов, наиболее часто встречающиеся в транзакциях (частые наборы).
Выявленные ассоциативные правила и их показатели: поддержка, достоверность, лифт.
Содержит транзакции входного набора данных, в которых срабатывают выявленные правила.
Для представления результатов используется визуализатор Таблица, настроенный для каждого выходного порта.
В таблице Ассоциативные правила выведены наборы ассоциативных правил и их показатели: поддержка, достоверность, лифт, описывающие поведение покупателей. Среди полученного списка наблюдаются как тривиальные закономерности, например, Кондиционер для белья → Стиральный порошок, так и неочевидные, например, Бумажное полотенце → Освежитель воздуха.
Аналитику необходимо проанализировать каждое полученное правило и выбрать из них по-настоящему ценные.
Скачайте и откройте файл в Loginom. При необходимости Loginom CE можно скачать бесплатно
Минимальные требования к системе:
- Операционная система: Windows 10 и выше
- CPU x64: 2 core 1
- Оперативная память: 4 GB
- Жесткий диск: 10 GB
1 Поддерживается работа на x64 процессорах Intel Core, AMD FX и более новых, содержащих инструкции SSE4.2 (POPCNT, LZCNT).