# **[2-3] CSV 파일 읽어오기**

## **🎯 학습 목표**
**csv 파일로부터 데이터를 읽어오고 데이터를 csv 파일로 저장해봅시다.**

---

Pandas에서는 CSV 파일로부터 데이터프레임(DataFrame)을 읽어올 수 있습니다.

> **✏️ 알아봅시다(NOTE):** CSV(Comma-Seperated Values)가 무엇인가요?  
>
> 표 형태의 데이터를 저장하는 파일 형식입니다.  
> 한 줄이 한 개의 행에 해당하며, 열 사이에는 쉼표(,)를 넣어 구분합니다.
>
> <table>
> <tr>
>     <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_02_12.PNG" width="500"></th>
> </tr>
> <tr>
>     <th>중첩 딕셔너리로 인덱스, 열 설정하여 데이터프레임 만들기</th>
> </tr>
> </table>


> **🔨 함수(FUNCTIONS):**
>
> **`pd.read_csv(파일이름(문자열), encoding = 인코딩방법(문자열))`**  
> 해당 CSV 파일을 읽어 데이터프레임으로 불러옵니다.
>> **매개변수(parameter)**
>>
>> **`encoding`** : 파일의 인코등 방식을 문자열 형태로 전달합니다.  
> (utf-8로 인코딩 된 파일은 encoding 매개변수를 넣어주지 않아도 됩니다.
> ---
> **`DataFrame.to_csv(파일이름(문자열), index = 인덱스포함여부(불))`**  
> 데이터프레임을 CSV 파일로 저장합니다.  
>> **매개변수(parameter)**
>>
>> **`index`** : 인덱스의 포함 여부를 나타냅니다.  
> True면 index 라는 이름을 가진 열을 생성합니다.  
> 따로 매개변수를 설정하지 않으면 True 값을 가집니다.
> ---

> **✏️ 알아봅시다(NOTE):** 인코딩(encoding)이 무엇인가요?
>
> 인코딩(encoding)은 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것입니다.  
> 다양한 방법이 존재하는데 한국어 데이터는 보통 `utf-8`, `cp949` `euc-kr`의 방법으로 인코딩됩니다.




## csv 파일로 데이터프레임 만들기

`read_csv()` 함수를 사용하면 csv 파일을 읽어 데이터프레임을 생성합니다.
이때 인덱스는 0부터 자동으로 생성합니다.

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_02_13.gif" width="750"></th>
</tr>
<tr>
    <th>csv 파일로 데이터프레임 만들기</th>
</tr>
</table>

> **⛔️ 오류(ERROR):**
>
> 파일이 인코딩 방법을 정확하게 넣어주지 않으면 오류가 발생합니다.  

In [None]:
# 예제_1_csv_파일_읽어오기

import pandas as pd

print('\n','#'*30, "{:^15s}".format("pd.read_csv('price_list.csv')") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(pd.read_csv('price_list.csv'))

In [None]:
# 예제_2_파일이_없어서_실패

import pandas as pd

print('\n','#'*30, "{:^15s}".format("pd.read_csv('price_list2.csv')") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
print(pd.read_csv('price_list2.csv'))

## 데이터프레임을 csv 파일로 저장하기

데이터프레임에 `to_csv()` 함수를 사용하면 데이터프레임을 csv로 저장해줍니다.  
이때 index열을 생성해 인덱스 정보를 저장합니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_02_14.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임을 csv 파일로 저장하기</th>
</tr>
</table>

`index = False` 매개변수를 추가하면 index 열을 생성하지 않습니다.  

<table>
<tr>
    <th><img src="https://tmn-bucket-materials-all.s3.ap-northeast-2.amazonaws.com/image/pandas/material_02_15.gif" width="750"></th>
</tr>
<tr>
    <th>데이터프레임을 인덱스 없이 csv 파일로 저장하기</th>
</tr>
</table>


In [None]:
# 예제_3_데이터프레임_csv_파일로_저장하기

import pandas as pd

print('\n','#'*30, "{:^15s}".format("df") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
df = pd.read_csv('price_list.csv')
print(df)
print('\n','#'*30, "{:^15s}".format("df.to_csv('price_list_new.csv')") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
df.to_csv('price_list_new.csv')

In [None]:
# CSV index 없이 저장하는 예시

# 예제_3_데이터프레임_인덱스_없이_csv_파일로_저장하기

import pandas as pd

print('\n','#'*30, "{:^15s}".format("df") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
df = pd.read_csv('price_list.csv')
print(df)
print('\n','#'*30, "{:^15s}".format("df.to_csv('price_list_new.csv', index = False)") , '#' * 30, '\n') # 출력되는 결과들을 분리해서 보여주기 위한 코드입니다.
df.to_csv('price_list_new.csv', index = False)

> **❓ 생각해보기(QUESTION):**
>
> 데이터를 데이터프레임의 형태로 불러오고, 데이터프레임을 데이터로 저장하는 과정이 중요한 이유는 무엇인가요?

### **💯 연습문제를 풀어봅시다**



1. CSV 읽어오는 문제
2. CSV cp949로 읽어오는 문제