# 데이터 파일 불러오기 (1)

* 데이터분석을 하려면 가장 먼저 해야하는 것은 무엇일까? 바로 데이터를 불러오는 것이다.
* 대부분의 데이터는 특정한 포맷에 근거해 만들어져 있고, 이것을 가지고 오는 것은 중요한 작업이다. 
* 여기서는 `.csv`, `.txt`와 같은 정형 데이터를 불러오는 연습을 해보자.

## 1. CSV 파일 불러오기
CSV 파일은 콤마로 구분된 값으로 구성된 파일 형식이다.

In [1]:
# pandas를 사용하여 csv 파일 불러오기
import pandas as pd

# 예시 csv 파일 경로
csv_file_path = 'example.csv'

# csv 파일 읽기
data_csv = pd.read_csv(csv_file_path)
data_csv.head()

## 2. TXT 파일 불러오기
TXT 파일은 일반 텍스트 파일로, 공백이나 탭으로 구분된 데이터가 포함될 수 있다.

In [2]:
# pandas를 사용하여 txt 파일 불러오기
import pandas as pd

# 예시 txt 파일 경로
txt_file_path = 'example.txt'

# txt 파일 읽기 (구분자가 공백 또는 탭일 경우)
data_txt = pd.read_csv(txt_file_path, delimiter='\t')
data_txt.head()

## 3. RData 파일 불러오기
RData 파일은 R에서 저장된 데이터 파일로, Python에서는 rpy2 라이브러리를 사용한다.

In [3]:
# rpy2를 사용하여 RData 파일 불러오기
import rpy2.robjects as robjects
from rpy2.robjects import pandas2ri
pandas2ri.activate()

# 예시 RData 파일 경로
rdata_file_path = 'example.RData'

# RData 파일 읽기
robjects.r['load'](rdata_file_path)

# R 데이터 프레임을 pandas 데이터 프레임으로 변환
data_rdata = pandas2ri.rpy2py(robjects.r['your_r_dataframe_name'])
data_rdata.head()

## 4. XLSX 파일 불러오기
XLSX 파일은 Excel 형식의 파일로, pandas의 read_excel 함수를 사용하여 불러올 수 있다.

In [4]:
# pandas를 사용하여 xlsx 파일 불러오기
import pandas as pd

# 예시 xlsx 파일 경로
xlsx_file_path = 'example.xlsx'

# xlsx 파일 읽기
data_xlsx = pd.read_excel(xlsx_file_path)
data_xlsx.head()