# 기계학습 homework 1
---
### 개요
본 과제에서는 기계학습에 필수적인 함수나 클래스의 의미와 사용법을 학습하는 것에 의의를 둡니다. 본 과제에서 수행하여야 할 문제는 다음과 같습니다.
1. 명시된 함수나 클래스의 주석을 작성하세요. (필수로 작성해야 하는 것 : 함수의 기능, 함수의 인풋, 함수의 아웃풋, 리스트에 명시되어있는 파라미터의 의미)
2. 명시된 함수나 클래스의 간단한 실행 코드를 작성하세요. (수업에서 제공하는 housing 데이터를 사용할 것)

### 과제를 위한 라이브러리
---
본 과제에서 사용하는 라이브러리는 수업에서 제공된 colab에 설치되어 있는 라이브러리와 동일한 버전을 사용합니다.

In [1]:
# 파이썬 ≥3.5 필수
import sys
assert sys.version_info >= (3, 5)

# 사이킷런 ≥0.20 필수
import sklearn
assert sklearn.__version__ >= "0.20"

# 기본 모듈 임포트
import numpy as np
import os
import pandas as pd
import tarfile
import urllib

# 그래프 관련
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)

# 그림 저장 위치 지정
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "end_to_end_project"
IMAGES_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID)
os.makedirs(IMAGES_PATH, exist_ok=True)

def save_fig(fig_id, tight_layout=True, fig_extension="png", resolution=300):
    path = os.path.join(IMAGES_PATH, fig_id + "." + fig_extension)
    print("그림 저장:", fig_id)
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format=fig_extension, dpi=resolution)

# 불필요한 경고를 무시합니다 (사이파이 이슈 #5998 참조)
import warnings
warnings.filterwarnings(action="ignore", message="^internal gelsd")

DOWNLOAD_ROOT = "https://raw.githubusercontent.com/liganega/handson-ml2/master/notebooks/"
HOUSING_PATH = os.path.join("datasets", "housing")
HOUSING_URL = DOWNLOAD_ROOT + "datasets/housing/housing.tgz"

# tar 파일을 가져와서 지정된 폴더에 압축을 풀면 csv 파일 저장됨.
def fetch_housing_data(housing_url=HOUSING_URL, housing_path=HOUSING_PATH):
    if not os.path.isdir(housing_path):
        os.makedirs(housing_path)
    tgz_path = os.path.join(housing_path, "housing.tgz")
    urllib.request.urlretrieve(housing_url, tgz_path)
    housing_tgz = tarfile.open(tgz_path)
    housing_tgz.extractall(path=housing_path)
    housing_tgz.close()

fetch_housing_data()

In [2]:
def load_housing_data(housing_path=HOUSING_PATH):
    csv_path = os.path.join(housing_path, "housing.csv")
    return pd.read_csv(csv_path)

housing = load_housing_data()

### 과제를 위한 참고 자료
---
1. [`sklearn docs`](https://scikit-learn.org/stable/index.html) : 사이킷런 참고자료
2. [`matplotlib docs`](https://matplotlib.org/stable/) : matplotlib 참고자료
3. [`pandas docs`](https://pandas.pydata.org/pandas-docs/stable/index.html) : 판다스 참고자료


### 제출방법
---
작성한 노트북 파일과 이를 편집한 pdf 파일(실행 사진과 주석)을 제출할 것

제출 파일 : 

기계학습_homework_{회차}\_{학번}\_{이름}.ipynb, 

기계학습_homework_{회차}\_{학번}\_{이름}.pdf


### 과제 리스트
---
```python
class pandas.DataFrame(data=None, index=None, columns=None) 

class pandas.Series(data=None, index=None )

DataFrame.describe()

DataFrame.loc

DataFrame.iloc

DataFrame.values

DataFrame.corr()

DataFrame.isnull()

DataFrame.sum(axis=0)

DataFrame.drop(labels=None, axis=0, columns=None)

DataFrame.dropna(axis=0, inplace=False)

DataFrame.fillna(value=None, inplace=False)

DataFrame.replace(to_replace=None, inplace=False)

DataFrame.to_csv(path_or_buf=None, columns=None, header=True, index=True, index_label=None)

pandas.read_csv(filepath_or_buffer)

sklearn.model_selection.train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True)

class sklearn.model_selection.StratifiedShuffleSplit(n_splits= )

class sklearn.preprocessing.OneHotEncoder(sparse=False)

class sklearn.preprocessing.StandardScaler()

class sklearn.preprocessing.MinMaxScaler()

class sklearn.pipeline.Pipeline(steps)

matplotlib.pyplot.plot(x=, y=, kind=, style=, color=, alpha=)
```

### 예시
---

In [4]:
# 1번 : class pandas.DataFrame(data=None, index=None, columns=None)
################### 예제 코드(수업에서 사용한 housing 데이터 사용할 것) ###################
d = housing
df = pd.DataFrame(data=d)
df
################### dataframe 주석 ######################
'''
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nunc hendrerit lectus eget mollis consectetur.
Donec blandit eu nunc id fringilla.
Vivamus vitae leo molestie tortor faucibus fringilla.
Mauris sit amet odio tortor. Mauris aliquam erat eu nisl gravida auctor.
Nam tristique urna sit amet lorem laoreet efficitur. Morbi et augue.
'''

Unnamed: 0,longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value,ocean_proximity
0,-122.23,37.88,41.0,880.0,129.0,322.0,126.0,8.3252,452600.0,NEAR BAY
1,-122.22,37.86,21.0,7099.0,1106.0,2401.0,1138.0,8.3014,358500.0,NEAR BAY
2,-122.24,37.85,52.0,1467.0,190.0,496.0,177.0,7.2574,352100.0,NEAR BAY
3,-122.25,37.85,52.0,1274.0,235.0,558.0,219.0,5.6431,341300.0,NEAR BAY
4,-122.25,37.85,52.0,1627.0,280.0,565.0,259.0,3.8462,342200.0,NEAR BAY
...,...,...,...,...,...,...,...,...,...,...
20635,-121.09,39.48,25.0,1665.0,374.0,845.0,330.0,1.5603,78100.0,INLAND
20636,-121.21,39.49,18.0,697.0,150.0,356.0,114.0,2.5568,77100.0,INLAND
20637,-121.22,39.43,17.0,2254.0,485.0,1007.0,433.0,1.7000,92300.0,INLAND
20638,-121.32,39.43,18.0,1860.0,409.0,741.0,349.0,1.8672,84700.0,INLAND
