Skip to content

mir0yan/customer_behavior_analysis

Repository files navigation

🛍️ Анализ покупательского поведения клиентов

Проект по анализу данных, направленный на исследование поведения клиентов с использованием Python, SQL и Power BI.

Проект охватывает анализ покупок, сегментацию клиентов и выявление ключевых бизнес-инсайтов на основе транзакционных данных.


🚀 О проекте

В рамках проекта проанализировано более 3900 транзакций клиентов с целью выявления:

  • закономерностей в расходах
  • предпочтений клиентов
  • влияния скидок и подписок
  • факторов, влияющих на выручку
  • сегментов клиентов

Анализ включает полный цикл работы с данными: предобработка (Python) → аналитика (SQL) → визуализация (Power BI)


📊 Данные

Файл: customer_shopping_behavior.csv

Датасет содержит 3901 запись с информацией о клиентах, покупках и поведении.

Основные фичи:

  • Информация о клиентах:
    Customer ID, Age, Gender, Location, Subscription Status

  • Данные о покупках:
    Item Purchased, Category, Purchase Amount (USD), Season, Size, Color

  • Поведенческие характеристики:
    Discount Applied, Promo Code Used, Previous Purchases,
    Frequency of Purchases, Review Rating, Shipping Type, Payment Method


🛠️ Стек технологий

  • Python

    • pandas
  • SQL

    • PostgreSQL
  • Визуализация

    • Power BI
  • Среда разработки

    • Jupyter Notebook

🔍 Ход анализа

1. Предобработка данных (Python)

  • Загрузка данных с использованием pandas
  • Обработка пропусков в Review Rating (заполнение медианой по Category)
  • Приведение названий колонок к формату snake_case
  • Feature engineering:
    • age_group — сегментация по возрасту
    • purchase_frequency_days — перевод частоты покупок в числовой формат
  • Проверка качества данных:
    • удаление избыточного признака promo_code_used
  • Загрузка очищенных данных в PostgreSQL

2. Анализ данных (SQL)

В рамках анализа были решены следующие задачи:

  • Сравнение выручки по Gender
  • Выявление клиентов, использующих Discount Applied и совершающих покупки выше среднего
  • Определение топ-5 товаров по Review Rating
  • Сравнение среднего чека для разных Shipping Type
  • Анализ поведения пользователей с Subscription Status
  • Поиск товаров с высокой зависимостью от скидок
  • Сегментация клиентов (New, Returning, Loyal)
  • Определение самых популярных товаров по Category
  • Анализ связи между повторными покупками и подпиской
  • Оценка вклада возрастных групп (age_group) в выручку

📊 Дашборд (Power BI)

Разработан интерактивный дашборд для визуализации результатов анализа. dashboard_customer_behavior


💡 Ключевые инсайты

  • Поведение клиентов существенно различается в зависимости от возраста и категории товаров
  • Скидки повышают вовлечённость, но не исключают высокий средний чек
  • Пользователи с Subscription Status демонстрируют отличающиеся паттерны покупок
  • Некоторые товары сильно зависят от скидок
  • Лояльные клиенты (повторные покупки) — ключевой сегмент
  • Тип доставки влияет на поведение покупателей

About

Pet project focused on customer shopping behavior analysis using Python, SQL and Power BI, including transaction data exploration, customer segmentation and business insights generation.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors