Проект по анализу данных, направленный на исследование поведения клиентов с использованием Python, SQL и Power BI.
Проект охватывает анализ покупок, сегментацию клиентов и выявление ключевых бизнес-инсайтов на основе транзакционных данных.
В рамках проекта проанализировано более 3900 транзакций клиентов с целью выявления:
- закономерностей в расходах
- предпочтений клиентов
- влияния скидок и подписок
- факторов, влияющих на выручку
- сегментов клиентов
Анализ включает полный цикл работы с данными: предобработка (Python) → аналитика (SQL) → визуализация (Power BI)
Файл: customer_shopping_behavior.csv
Датасет содержит 3901 запись с информацией о клиентах, покупках и поведении.
-
Информация о клиентах:
Customer ID,Age,Gender,Location,Subscription Status -
Данные о покупках:
Item Purchased,Category,Purchase Amount (USD),Season,Size,Color -
Поведенческие характеристики:
Discount Applied,Promo Code Used,Previous Purchases,
Frequency of Purchases,Review Rating,Shipping Type,Payment Method
-
Python
- pandas
-
SQL
- PostgreSQL
-
Визуализация
- Power BI
-
Среда разработки
- Jupyter Notebook
- Загрузка данных с использованием pandas
- Обработка пропусков в
Review Rating(заполнение медианой поCategory) - Приведение названий колонок к формату snake_case
- Feature engineering:
age_group— сегментация по возрастуpurchase_frequency_days— перевод частоты покупок в числовой формат
- Проверка качества данных:
- удаление избыточного признака
promo_code_used
- удаление избыточного признака
- Загрузка очищенных данных в PostgreSQL
В рамках анализа были решены следующие задачи:
- Сравнение выручки по
Gender - Выявление клиентов, использующих
Discount Appliedи совершающих покупки выше среднего - Определение топ-5 товаров по
Review Rating - Сравнение среднего чека для разных
Shipping Type - Анализ поведения пользователей с
Subscription Status - Поиск товаров с высокой зависимостью от скидок
- Сегментация клиентов (
New,Returning,Loyal) - Определение самых популярных товаров по
Category - Анализ связи между повторными покупками и подпиской
- Оценка вклада возрастных групп (
age_group) в выручку
Разработан интерактивный дашборд для визуализации результатов анализа.

- Поведение клиентов существенно различается в зависимости от возраста и категории товаров
- Скидки повышают вовлечённость, но не исключают высокий средний чек
- Пользователи с Subscription Status демонстрируют отличающиеся паттерны покупок
- Некоторые товары сильно зависят от скидок
- Лояльные клиенты (повторные покупки) — ключевой сегмент
- Тип доставки влияет на поведение покупателей