# 코카콜라 주식 가격


### Data

주어진 데이터는 다음과 같습니다.

##### coca-cola.csv: 연도별 코카콜라의 주당 가격을 담은 파일

* Year: 연도
* Average Stock Price: 평균 주당 가격(USD/1주)

##### USDKRW_exchange_rate.csv: 연도별 USD -> KRW 환율을 담은 파일

* Year: 연도
* Average USD/KRW: 평균 환율

### 초기 코드 선택

Python, R 중 본인의 선호 언어에 따라 초기 코드를 선택하세요. Python을 선호한다면 Python 초기 코드를, R을 선호한다면 R 초기 코드만 남기면 됩니다.

In [1]:
# 초기코드 - python
import pandas as pd

# 데이터 로드
coca = pd.read_csv('./data/coca-cola.csv', index_col='Year')
exchange_rate = pd.read_csv('./data/USDKRW_exchange_rate.csv', index_col='Year')

coca.head()

Unnamed: 0_level_0,Average Stock Price
Year,Unnamed: 1_level_1
2019,49.2657
2018,44.2552
2017,41.7697
2016,39.6604
2015,36.3935


In [5]:
coca.describe()

Unnamed: 0,Average Stock Price
count,57.0
mean,11.133204
std,13.678187
min,0.0604
25%,0.2672
50%,3.9693
75%,18.2057
max,49.2657


In [3]:
exchange_rate.head()

Unnamed: 0_level_0,Average USD/KRW
Year,Unnamed: 1_level_1
2019,1159.287025
2018,1100.726341
2017,1130.82345
2016,1160.496416
2015,1132.720611


In [6]:
exchange_rate.describe()

Unnamed: 0,Average USD/KRW
count,60.0
mean,756.706861
std,364.659229
min,63.125
25%,464.118125
50%,788.828702
75%,1103.505736
max,1404.026103


In [None]:
# 초기코드 - R

# 데이터 로드
coca <- read.csv('./data/coca-cola.csv')
exchange_rate <- read.csv('./data/USDKRW_exchange_rate.csv')

head(coca)

# 과제

주어진 데이터를 이용해 1960년부터 2019년까지, 연도별 코카콜라사의 평균 주당 가격을 원화로 나타내려 합니다. 마지막에 보여야 할 결과는 다음과 같습니다.

<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Average Stock Price(KRW)</th>
    </tr>
    <tr>
      <th>Year</th>
      <th></th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>2019</th>
      <td>57113.09</td>
    </tr>
    <tr>
      <th>2018</th>
      <td>48712.86</td>
    </tr>
    <tr>
      <th>2017</th>
      <td>47234.16</td>
    </tr>
    <tr>
      <th>2016</th>
      <td>46025.75</td>
    </tr>
    <tr>
      <th>2015</th>
      <td>41223.67</td>
    </tr>
  </tbody>
</table>

### 할 일

##### 1. 데이터 합치기

위에서 로드한 데이터를 연도(year)를 기준으로 합쳐주세요. 합친 후에는 다음과 같이 나와야 합니다.

<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Average USD/KRW</th>
      <th>Average Stock Price</th>
    </tr>
    <tr>
      <th>Year</th>
      <th></th>
      <th></th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>2019</th>
      <td>1159.287025</td>
      <td>49.2657</td>
    </tr>
    <tr>
      <th>2018</th>
      <td>1100.726341</td>
      <td>44.2552</td>
    </tr>
    <tr>
      <th>2017</th>
      <td>1130.823450</td>
      <td>41.7697</td>
    </tr>
    <tr>
      <th>...</th>
      <td></td>
      <td></td>
    </tr>
    <tr>
      <th>1962</th>
      <td>130.000000</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>1961</th>
      <td>124.791667</td>
      <td>NaN</td>
    </tr>
    <tr>
      <th>1960</th>
      <td>63.125000</td>
      <td>NaN</td>
    </tr>
  </tbody>
</table>

In [7]:
# 코드를 작성해주세요.
df = exchange_rate
df.head()

Unnamed: 0_level_0,Average USD/KRW
Year,Unnamed: 1_level_1
2019,1159.287025
2018,1100.726341
2017,1130.82345
2016,1160.496416
2015,1132.720611


In [11]:
df2 = df.merge(coca, how='left', on='Year')
df2.tail()

Unnamed: 0_level_0,Average USD/KRW,Average Stock Price
Year,Unnamed: 1_level_1,Unnamed: 2_level_1
1964,213.846667,0.0804
1963,130.0,0.0604
1962,130.0,
1961,124.791667,
1960,63.125,


##### 2. 결측치 처리

coca.csv 에는 1960년도부터 1962년까지의 데이터가 없습니다. 따라서 이 결측치를 적절합 값으로 채워야 합니다. 1960년도 ~ 1962년 사이에 `Average Stock Price` 컬럼의 결측치를 `Average Stock Price` 컬럼의 최솟값으로 채워주세요.

결측치를 채운 후에는 다음과 같이 나와야 합니다.

<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Average USD/KRW</th>
      <th>Average Stock Price</th>
    </tr>
    <tr>
      <th>Year</th>
      <th></th>
      <th></th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>2019</th>
      <td>1159.287025</td>
      <td>49.2657</td>
    </tr>
    <tr>
      <th>2018</th>
      <td>1100.726341</td>
      <td>44.2552</td>
    </tr>
    <tr>
      <th>2017</th>
      <td>1130.823450</td>
      <td>41.7697</td>
    </tr>
    <tr>
      <th>...</th>
      <td></td>
      <td></td>
    </tr>
    <tr>
      <th>1962</th>
      <td>130.000000</td>
      <td>0.0604</td>
    </tr>
    <tr>
      <th>1961</th>
      <td>124.791667</td>
      <td>0.0604</td>
    </tr>
    <tr>
      <th>1960</th>
      <td>63.125000</td>
      <td>0.0604</td>
    </tr>
  </tbody>
</table>

In [12]:
coca.min()

Average Stock Price    0.0604
dtype: float64

In [14]:
df3 = df2.fillna(coca.min())
df3

Unnamed: 0_level_0,Average USD/KRW,Average Stock Price
Year,Unnamed: 1_level_1,Unnamed: 2_level_1
2019,1159.287025,49.2657
2018,1100.726341,44.2552
2017,1130.82345,41.7697
2016,1160.496416,39.6604
2015,1132.720611,36.3935
2014,1053.047067,34.9648
2013,1095.113793,32.9671
2012,1127.089744,29.9604
2011,1108.155264,26.1976
2010,1156.650834,21.5905


In [None]:
# 코드를 작성해주세요

##### 3. 연도별 코카콜라 사의 주당 가격을 원화로 구하기

위에서 구한 데이터를 이용해 코카콜라 사의 평균 주당 가격을 원화로 구해주세요. 단, 주당 가격은 소수점 둘째 자리까지 반올림해 보여주셔야 합니다.

In [17]:
# 코드를 작성해주세요
df3['Average Stock Price(KRW)'] = round(df3['Average USD/KRW'] * df3['Average Stock Price'], 2)
df3

Unnamed: 0_level_0,Average USD/KRW,Average Stock Price,Average Stock Price(KRW)
Year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2019,1159.287025,49.2657,57113.09
2018,1100.726341,44.2552,48712.86
2017,1130.82345,41.7697,47234.16
2016,1160.496416,39.6604,46025.75
2015,1132.720611,36.3935,41223.67
2014,1053.047067,34.9648,36819.58
2013,1095.113793,32.9671,36102.73
2012,1127.089744,29.9604,33768.06
2011,1108.155264,26.1976,29031.01
2010,1156.650834,21.5905,24972.67


In [26]:
# df4 = df3
df4 = df3.drop(['Average USD/KRW', 'Average Stock Price'], axis=1)
df4

Unnamed: 0_level_0,Average Stock Price(KRW)
Year,Unnamed: 1_level_1
2019,57113.09
2018,48712.86
2017,47234.16
2016,46025.75
2015,41223.67
2014,36819.58
2013,36102.73
2012,33768.06
2011,29031.01
2010,24972.67


##### 4. 결과 저장

채점을 하기 위해, 위에서 구한 `Year`, `Average Stock Price(KRW)`를 현재 파일과 같은 디렉토리(.ipynb 파일이 있는 디렉토리)에 `cocacola_stock_krw.csv`라는 이름으로 저장해주세요. 이때 `cocacola_stock_krw.csv`는 년도(Year)를 기준으로 내림차순 정렬해주셔야 합니다. 저장할 파일 포맷은 하단의 표와 data 디렉토리의 `cocacola_stock_krw(sample).csv` 파일을 참고하세요.

<table border="1" class="dataframe">
  <thead>
    <tr style="text-align: right;">
      <th></th>
      <th>Average Stock Price(KRW)</th>
    </tr>
    <tr>
      <th>Year</th>
      <th></th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <th>2019</th>
      <td>57113.09</td>
    </tr>
    <tr>
      <th>2018</th>
      <td>48712.86</td>
    </tr>
    <tr>
      <th>2017</th>
      <td>47234.16</td>
    </tr>
    <tr>
      <th>2016</th>
      <td>46025.75</td>
    </tr>
    <tr>
      <th>2015</th>
      <td>41223.67</td>
    </tr>
    <tr>
      <th>...</th>
      <td>...</td>
    </tr>
  </tbody>
</table>

<br/>
<center><저장할 파일 포맷 예시></center>


*주의* 

1. csv 파일의 컬럼은 반드시 Year - Average Stock Price(KRW) 순이어야 합니다.
2. **index 순서(Year 2019 ~ 1960)는 꼭 내림차 순이어야 합니다.**

In [None]:
# 코드를 작성해주세요

In [23]:
# csv 파일 저장 예시 - python
df4.to_csv('cocacola_stock_krw.csv')

In [None]:
# csv 파일 저장 예시 - R
write.csv(coca, file='cocacola_stock_krw.csv')