πŸ“šνŒŒμ΄μ¬ λ¨Έμ‹ λŸ¬λ‹ νŒλ‹€μŠ€ 데이터뢄석 part4. 데이터 μ‹œκ°ν™”

πŸ“„part4 seaborn.ipynb

πŸΏοΈνšŒκ·€μ„ μ΄ μžˆλŠ” 산점도

regplot() ν•¨μˆ˜λŠ” μ„œλ‘œ λ‹€λ₯Έ 2개의 연속 λ³€μˆ˜ μ‚¬μ΄μ˜ 산점도λ₯Ό 그리고 μ„ ν˜•νšŒκ·€λΆ„μ„μ— μ˜ν•œ νšŒκ·€μ„ μ„ λ‚˜νƒ€λƒ„ fit_reg=False μ˜΅μ…˜μ„ μ„€μ •ν•˜λ©΄ νšŒκ·€μ„ μ„ μ•ˆλ³΄μ΄κ²Œ ν•  수 있음

πŸ’ 데이터 뢈러였기(seaborn 데이터셋 ν™œμš©)

import seaborn as sns
import matplotlib.pyplot as plt

titanic=sns.load_dataset('titanic')
titanic.head()

Untitled

# μŠ€νƒ€μΌ ν…Œλ§ˆ μ„€μ • (5가지: darkgrid, whitegrid, dark, white, ticks)
sns.set_style('darkgrid')

# κ·Έλž˜ν”„ 객체 생성 (figure에 2개의 μ„œλΈŒ ν”Œλ‘― 생성)
fig=plt.figure(figsize=(15,5))
ax1=fig.add_subplot(1,2,1)
ax2=fig.add_subplot(1,2,2)

# κ·Έλž˜ν”„ 그리기 - μ„ ν˜• νšŒκ·€μ„  ν‘œμ‹œ (fig_reg=True)
sns.regplot(x='age', # xμΆ• λ³€μˆ˜ 
            y='fare', # yμΆ• λ³€μˆ˜
            data=titanic, # 데이터
           ax=ax1) # axe객체 - 1번째 κ·Έλž˜ν”„

# κ·Έλž˜ν”„ 그리기 - μ„ ν˜• νšŒκ·€μ„  ν‘œμ‹œ (fig_reg=False)
sns.regplot(x='age', # xμΆ• λ³€μˆ˜ 
            y='fare', # yμΆ• λ³€μˆ˜
            data=titanic, # 데이터
           ax=ax2, # axe객체 - 2번째 κ·Έλž˜ν”„
           fit_reg=False,
           color='g') 

plt.show()

Untitled

πŸΏοΈνžˆμŠ€ν† κ·Έλž¨/컀널 밀도 κ·Έλž˜ν”„

λ‹¨λ³€μˆ˜(ν•˜λ‚˜μ˜ λ³€μˆ˜) λ°μ΄ν„°μ˜ 뢄포λ₯Ό 확인할 λ•Œ displot() ν•¨μˆ˜λ₯Ό μ΄μš©ν•¨ κΈ°λ³Έκ°’μœΌλ‘œ νžˆμŠ€ν† κ·Έλž¨κ³Ό μ»€λ„λ°€λ„ν•¨μˆ˜λ₯Ό κ·Έλž˜ν”„λ‘œ 좜λ ₯함

컀널 밀도 ν•¨μˆ˜λŠ” κ·Έλž˜ν”„μ™€ xμΆ• μ‚¬μ΄μ˜ 면적이 1이 λ˜λ„λ‘ κ·Έλ¦¬λŠ” 밀도 뢄포 ν•¨μˆ˜μž„