(다중회귀분석을 배우고 진행한 과제라 숫자가 15인데, 내용은 선형회귀분석 예제임)

✍ 문제

crime_in_Seoul.csv

  1. 살인발생이 가장높은 관서명, 살인발생,살인검거를 출력하시오
  2. 관서별 절도발생,절도검거에 대한 바차트를 그리시오
  3. 절도검거율 컬럼을 추가 하시오
  4. 폭력발생 top5를 구하시오( 관서명, 폭력발생, 폭력검거)
  5. 상관관계 heatmap을 그리시오
  6. 살인발생과 폭력발생의 상관관계를 확인하고 살인 발생이 5건인경우 폭력발생수를 예측하시오 ( 텐서버전, 케라스버전)

🥑 import

import tensorflow as tf
import numpy as np
import pandas as pd
import os

from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam

import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

# 관련 라이브러리 임포트 
import matplotlib.font_manager as fm

#  한글글꼴로 변경
# plt.rcParams['font.family'] = '한글글꼴명'
plt.rcParams['font.size'] = 11.0
# plt.rcParams['font.family'] = 'batang'
plt.rcParams['font.family'] = 'Malgun Gothic'

# 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처
matplotlib.rcParams['axes.unicode_minus'] = False

# 그래프 기본 크기 설정 
plt.rcParams['figure.figsize'] = [10, 6]

🥑 데이터 불러오기

df = pd.read_csv('data/crime_in_Seoul.csv', encoding='cp949',thousands = ',')
df.head(5)

Untitled

df.dtypes
관서명      object
살인 발생     int64
살인 검거     int64
강도 발생     int64
강도 검거     int64
강간 발생     int64
강간 검거     int64
절도 발생     int64
절도 검거     int64
폭력 발생     int64
폭력 검거     int64
dtype: object