#### 01 선형회귀 - 샘플 코드

In [1]:
from sklearn.linear_model import LinearRegression

# 특징
X = [[10.0], [8.0], [13.0], [9.0], [11.0], [14.0],
     [6.0], [4.0], [12.0], [7.0], [5.0]]

# 종속 변수
y = [8.04, 6.95, 7.58, 8.81, 8.33, 9.96,
     7.24, 4.26, 10.84, 4.82, 5.68]

# 선형회귀 모델 생성 및 학습
model = LinearRegression()
model.fit(X, y)

print(model.coef_)      # 기울기 출력
print(model.intercept_) # 절편 출력

# x = 0, x = 1일 때 모델의 출력 결과 예측
y_pred = model.predict([[0], [1]])

# x = 0, x = 1일 때 예측한 y값 출력
print(y_pred)

[0.50009091]
3.0000909090909094
[3.00009091 3.50018182]


#### 02 정규화 - 샘플 코드

In [2]:
import numpy as np
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error

# 학습 데이터 개수 설정
train_size = 20

# 검정 데이터 개수 설정
test_size = 12

# 학습 및 검정 데이터의 특징으로 사용할 무작위 표본 추출
train_X = np.random.uniform(low=0, high=1.2, size=train_size)
test_X = np.random.uniform(low=0.1, high=1.3, size=test_size)

# 학습 및 검정 데이터의 종속 변수로 사용할 데이터 정의
train_y = np.sin(train_X * 2 * np.pi) + np.random.normal(0, 0.2, train_size)
test_y = np.sin(test_X * 2 * np.pi) + np.random.normal(0, 0.2, test_size)

poly = PolynomialFeatures(6) # 6차식 생성

# 6차식에서 학습 데이터의 특징으로 학습한 후 결과를 배열로 변환
train_poly_X = poly.fit_transform(train_X.reshape(train_size, 1))
test_poly_X = poly.fit_transform(test_X.reshape(test_size, 1))

# 능형회귀 모델을 생성하고 6차식 학습 결과와 학습 데이터의 종속 변수로 학습
model = Ridge(alpha=1.0)
model.fit(train_poly_X, train_y)

# 학습 및 검정 데이터를 대상으로 능형회귀로 학습해 만든 모델의 출력 결과 예측
train_pred_y = model.predict(train_poly_X)
test_pred_y = model.predict(test_poly_X)

# 학습 및 검정 데이터를 대상으로 예측한 결과와 종속 변수의 평균제곱오차 계산
print(mean_squared_error(train_pred_y, train_y))
print(mean_squared_error(test_pred_y, test_y))

0.2442002705557143
0.31121513825371466


#### 03 로지스틱 회귀 - 샘플 코드

In [3]:
import numpy as np
from sklearn.linear_model import LogisticRegression

# 특징 데이터 생성
X_train = np.r_[np.random.normal(3, 1, size=50),
          np.random.normal(-1, 1, size=50)].reshape((100, -1))

# 종속 변수 데이터 생성
y_train = np.r_[np.ones(50), np.zeros(50)]

# 로지스틱 회귀 모델 생성 및 학습과 예측
model = LogisticRegression(solver='lbfgs')
model.fit(X_train, y_train)
model.predict_proba([[0], [1], [2]])[:, 1]

array([0.12111922, 0.57199779, 0.92836808])

#### 04 서포트 백터 머신 - 샘플 코드

In [4]:
from sklearn.svm import LinearSVC
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 데이터 분류의 중심 위치 정의
centers = [(-1, -0.125), (0.5, 0.5)]

# 특징과 종속 변수 생성
X, y = make_blobs(n_samples=50, n_features=2, centers=centers, cluster_std=0.3)

# 특징과 종속 변수 각각을 학습 데이터와 검증 데이터로 나누기
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# 선형 서포트 벡터 머신 모델 생성
model = LinearSVC()

model.fit(X_train, y_train)    # 학습
y_pred = model.predict(X_test) # 예측
accuracy_score(y_pred, y_test) # 평가

1.0

#### 05 커널 기법을 적용한 서포트 벡터 머신 - 샘플 코드

In [5]:
from sklearn.svm import SVC
from sklearn.datasets import make_gaussian_quantiles
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 특징과 종속 변수 생성
X, y = make_gaussian_quantiles(n_features=2, n_classes=2, n_samples=300)

# 특징과 종속 변수 각각을 학습 데이터와 검증 데이터로 나누기
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# 서포트 벡터 머신 모델 생성
model = SVC(gamma='auto')

model.fit(X_train, y_train)    # 학습
y_pred = model.predict(X_test) # 예측
accuracy_score(y_pred, y_test) # 평가

0.9888888888888889

#### 06 나이브 베이즈 분류 - 샘플 코드

In [6]:
from sklearn.naive_bayes import MultinomialNB

# 특징의 학습 데이터 생성
X_train = [[1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0],
           [0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0],
           [1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0],
           [0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0],
           [0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0],
           [0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 1]]

# 종속 변수의 학습 데이터 생성
y_train = [1, 1, 1, 0, 0, 0]

# 나이브 베이즈 분류 모델 생성
model = MultinomialNB()

model.fit(X_train, y_train) # 학습
model.predict([[1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0]]) # 평가

array([1])

#### 07 랜덤 포레스트 - 샘플 코드

In [7]:
from sklearn.datasets import load_wine
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 와인 데이터세트 불러오기
data = load_wine()

# 특징과 종속 변수 각각을 학습 데이터와 검정 데이터로 나누기
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3)

# 랜덤 포레스트 모델 생성
model = RandomForestClassifier(n_estimators=10)

model.fit(X_train, y_train)    # 학습
y_pred = model.predict(X_test) # 예측
accuracy_score(y_pred, y_test) # 평가

0.9444444444444444

#### 08 신경망 - 샘플 코드

In [8]:
from sklearn.datasets import load_digits
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# NIST 데이터세트 불러오기
data = load_digits()

# 특징 설정
X = data.images.reshape(len(data.images), -1)

# 종속 변수 설정
y = data.target

# 특징과 종속 변수 각각을 학습 데이터와 검정 데이터로 나누기
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# 다층 퍼셉트론 분류 모델 생성
model = MLPClassifier(hidden_layer_sizes=(16, ), max_iter=1000)

model.fit(X_train, y_train)    # 학습
y_pred = model.predict(X_test) # 예측
accuracy_score(y_pred, y_test) # 평가

0.937037037037037

#### 09 k 최근접 이웃 알고리즘 - 샘플 코드

In [9]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import make_moons
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 특징 및 종속 변수 데이터 생성
X, y = make_moons(noise=0.3)

# 특징과 종속 변수 각각을 학습 데이터와 검정 데이터로 나누기
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# kNN 모델 생성
model = KNeighborsClassifier(n_neighbors=5)

model.fit(X_train, y_train)    # 학습
y_pred = model.predict(X_test) # 예측
accuracy_score(y_pred, y_test) # 평가

0.9666666666666667