## **도미 빙어들의 평균, 분산, 최소, 최대값 구하라**

In [None]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 주어진 데이터
fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0,
                31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0,
                35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8,
                10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]
fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0,
                500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0,
                700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0, 6.7,
                7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]

# DataFrame 생성
fish_df = pd.DataFrame({'length': fish_length, 'weight': fish_weight})

# MinMaxScaler 객체 생성
scaler = MinMaxScaler()

# MinMaxScaler로 데이터 셋 변환. fit()과 transform() 호출
scaler.fit(fish_df)
fish_scaled = scaler.transform(fish_df)

# transform() 시 scale 변환된 데이터셋이 numpy ndarray로 반환되어 이를 DataFrame으로 변환
fish_df_scaled = pd.DataFrame(data=fish_scaled, columns=['length', 'weight'])

# 평균, 분산, 최소, 최대값 출력
print('평균 값')
print(fish_df_scaled.mean())
print('\n분산 값')
print(fish_df_scaled.var())
print('\n최소 값')
print(fish_df_scaled.min())
print('\n최대 값')
print(fish_df_scaled.max())

평균 값
length    0.553048
weight    0.440753
dtype: float64

분산 값
length    0.107778
weight    0.109135
dtype: float64

최소 값
length    0.0
weight    0.0
dtype: float64

최대 값
length    1.0
weight    1.0
dtype: float64


## **MinMaxScaler를 이용해서 도미 빙어를 분류**

In [None]:
from sklearn.preprocessing import MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

# 도미와 빙어 데이터
fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0,
                31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0,
                35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8,
                10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]
fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0,
                500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0,
                700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0, 6.7,
                7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]

# 클래스 레이블 (도미: 1, 빙어: 0)
labels = [1] * 35 + [0] * 14

# 데이터 스케일링 (MinMaxScaler 사용)
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform([[length, weight] for length, weight in zip(fish_length, fish_weight)])

# 훈련 데이터와 테스트 데이터로 분리
train_data, test_data, train_labels, test_labels = train_test_split(scaled_data, labels, test_size=0.2, random_state=42)

# K-최근접 이웃 분류기 객체 생성
knn = KNeighborsClassifier(n_neighbors=3)

# K-최근접 이웃 모델 훈련
knn.fit(train_data, train_labels)

# 예측 수행
predictions = knn.predict(test_data)
print(predictions)

# 정확도 출력
knn.score(test_data, test_labels)


[1 0 0 0 1 1 1 1 1 1]


1.0

# **cross_val_score() 도미 빙어 데이터 평가**

In [None]:
import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import cross_val_score

# 도미와 빙어 데이터
fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0]
fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0, 700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0, 6.7, 7.5, 7.0, 9.7, 9.8, 8.7, 10.0, 9.9, 9.8, 12.2, 13.4, 12.2, 19.7, 19.9]

# 도미 빙어 레이블 생성 (도미: 1, 빙어: 0)
labels = [1] * 35 + [0] * 14

# 데이터와 레이블을 NumPy 배열로 변환
fish_data = np.array(list(zip(fish_length, fish_weight)))
labels = np.array(labels)

# KNeighborsClassifier 객체 생성
knn = KNeighborsClassifier(n_neighbors=3)

# 교차 검증을 통한 모델 평가
scores = cross_val_score(knn, fish_data, labels, cv=5, scoring='accuracy')
print('교차 검증별 정확도:', np.round(scores, 4))
print('평균 검증 정확도:', np.round(np.mean(scores), 4))


교차 검증별 정확도: [1. 1. 1. 1. 1.]
평균 검증 정확도: 1.0
