πŸ₯‘ 데이터: https://www.kaggle.com/mkechinov/ecommerce-events-history-in-cosmetics-shop

λ³Έ μ˜ˆμ œλŠ” 데이터에 λŒ€ν•œ μƒμ„Έν•œ 뢄석을 ν•˜κΈ° μœ„ν•΄ 진행을 ν–ˆλ‹€κΈ°λ³΄λ‹€

퍼널 뢄석을 κ°€λ³κ²Œ 데이터 뢄석 츑면으둜 보기 μœ„ν•΄ ν•΄λ³Έκ²ƒμœΌλ‘œ

λ³„λ„μ˜ μ „μ²˜λ¦¬ 과정을 κ±°μΉ˜μ§€ μ•Šμ•„ 데이터 μΈ‘λ©΄μ—μ„œ 뢀쑱함이 많음

πŸ‹ 데이터 뢈러였기

πŸ’ import

import pandas as pd
import numpy as np
import plotly.express as px
import os

πŸ’ 데이터 뢈러였기

df_1910 = pd.read_csv('data/2019-Oct.csv')
df_1911 = pd.read_csv('data/2019-Nov.csv')
df_1912 = pd.read_csv('data/2019-Dec.csv')
df_2001 = pd.read_csv('data/2020-Jan.csv')
df_2002 = pd.read_csv('data/2020-Feb.csv')
df_1910.head()

Untitled

df_1910.shape, df_1911.shape, df_1912.shape, df_2001.shape, df_2002.shape

((4102283, 9), (4635837, 9), (3533286, 9), (4264752, 9), (4156682, 9))

πŸ’ 연도월 컬럼 생성