Untitled

생선 분류 문제

출처 : https://www.kaggle.com/aungpyaeap/fish-market

  1. 데이터 준비 도미와 방어의 길이와 무게 X, y
  2. 모델 생성 : KNeighborsClassifier
  3. 모델 학습 fit()
  4. 평가 score()
  5. 예측 predict()

✈ 라이브러리, 모듈 설정

import sklearn

from sklearn.metrics import accuracy_score, mean_squared_error
from sklearn.neighbors import KNeighborsClassifier

import numpy as np
import pandas as pd
import os

import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

# 관련 라이브러리 임포트 
import matplotlib.font_manager as fm

#  한글글꼴로 변경
# plt.rcParams['font.family'] = '한글글꼴명'
plt.rcParams['font.size'] = 11.0
# plt.rcParams['font.family'] = 'batang'
plt.rcParams['font.family'] = 'Malgun Gothic'

# 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처
matplotlib.rcParams['axes.unicode_minus'] = False

# 그래프 기본 크기 설정 
plt.rcParams['figure.figsize'] = [10, 6]

🚗 모듈

sklearn.neighbors: 최근접 이웃 알고리즘 제공 (k-NN 등)

✈ 데이터 준비

  1. 도미데이터
bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 
								29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 
								32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 
								35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 
								41.0, 41.0]
bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0,
								450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0,
								700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0,
								700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 
								925.0, 975.0, 950.0]
len(bream_length),len(bream_weight)