## CSV파일 불러오기
- read_csv_sample.csv 파일 내용
![image.png](attachment:image.png)

In [1]:
import pandas as pd

file_path = './03csv_sample.csv'

df1 = pd.read_csv(file_path)
df1

Unnamed: 0,c0,c1,c2,c3
0,0,1,4,7
1,1,2,5,8
2,2,3,6,9


In [2]:
# 첫 번째 행을 인덱스가 아닌 데이터로 취급하여 불러오기
df2 = pd.read_csv(file_path, header=None)
df2

Unnamed: 0,0,1,2,3
0,c0,c1,c2,c3
1,0,1,4,7
2,1,2,5,8
3,2,3,6,9


In [3]:
# 기본 컬럼 인덱스 사용(default: None)
df3 = pd.read_csv(file_path, index_col=None)
df3

Unnamed: 0,c0,c1,c2,c3
0,0,1,4,7
1,1,2,5,8
2,2,3,6,9


In [4]:
# 컬럼 인덱스를 'c0'로 사용
df3 = pd.read_csv(file_path, index_col='c0')
df3

Unnamed: 0_level_0,c1,c2,c3
c0,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
0,1,4,7
1,2,5,8
2,3,6,9


## Excel 불러오기
- 남북한발전전력량.xlsx 파일 내용
![image.png](attachment:image.png)

In [5]:
import pandas as pd

file_name = './03남북한발전전력량.xlsx'

# 엑셀 파일 불러오기(header옵션 차이 확인, engine='openpyxl')     # engine = 어떤 규칙으로 어떤 버전,형식인지 중요.
df1 = pd.read_excel(file_name, engine='openpyxl')                 # header=0 (default 옵션) 
df2 = pd.read_excel(file_name, engine='openpyxl', header=None)    # header=None 옵션  -> header를 호출하지 않음.

# df1 데이터프레임 출력
df1

Unnamed: 0,전력량 (억㎾h),발전 전력별,1990,1991,1992,1993,1994,1995,1996,1997,...,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016
0,남한,합계,1077,1186,1310,1444,1650,1847,2055,2244,...,4031,4224,4336,4747,4969,5096,5171,5220,5281,5404
1,,수력,64,51,49,60,41,55,52,54,...,50,56,56,65,78,77,84,78,58,66
2,,화력,484,573,696,803,1022,1122,1264,1420,...,2551,2658,2802,3196,3343,3430,3581,3427,3402,3523
3,,원자력,529,563,565,581,587,670,739,771,...,1429,1510,1478,1486,1547,1503,1388,1564,1648,1620
4,,신재생,-,-,-,-,-,-,-,-,...,-,-,-,-,-,86,118,151,173,195
5,북한,합계,277,263,247,221,231,230,213,193,...,236,255,235,237,211,215,221,216,190,239
6,,수력,156,150,142,133,138,142,125,107,...,133,141,125,134,132,135,139,130,100,128
7,,화력,121,113,105,88,93,88,88,86,...,103,114,110,103,79,80,82,86,90,111
8,,원자력,-,-,-,-,-,-,-,-,...,-,-,-,-,-,-,-,-,-,-


In [5]:
# df2 데이터프레임 출력
df2

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,19,20,21,22,23,24,25,26,27,28
0,전력량 (억㎾h),발전 전력별,1990,1991,1992,1993,1994,1995,1996,1997,...,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016
1,남한,합계,1077,1186,1310,1444,1650,1847,2055,2244,...,4031,4224,4336,4747,4969,5096,5171,5220,5281,5404
2,,수력,64,51,49,60,41,55,52,54,...,50,56,56,65,78,77,84,78,58,66
3,,화력,484,573,696,803,1022,1122,1264,1420,...,2551,2658,2802,3196,3343,3430,3581,3427,3402,3523
4,,원자력,529,563,565,581,587,670,739,771,...,1429,1510,1478,1486,1547,1503,1388,1564,1648,1620
5,,신재생,-,-,-,-,-,-,-,-,...,-,-,-,-,-,86,118,151,173,195
6,북한,합계,277,263,247,221,231,230,213,193,...,236,255,235,237,211,215,221,216,190,239
7,,수력,156,150,142,133,138,142,125,107,...,133,141,125,134,132,135,139,130,100,128
8,,화력,121,113,105,88,93,88,88,86,...,103,114,110,103,79,80,82,86,90,111
9,,원자력,-,-,-,-,-,-,-,-,...,-,-,-,-,-,-,-,-,-,-


## JSON 파일
- read_json_sample.json 파일 내용
![image.png](attachment:image.png)

In [6]:
import pandas as pd

file_name = './03json_sample.json'

# JSON 파일 불러오기
df = pd.read_json(file_name)
df

Unnamed: 0,name,year,developer,opensource
pandas,,2008,Wes Mckinneye,True
NumPy,,2006,Travis Oliphant,True
matplotlib,,2003,John D. Hunter,True


In [7]:
df.index

Index(['pandas', 'NumPy', 'matplotlib'], dtype='object')

---

## 데이터프레임을 각각의 파일로 저장하기

### 데이터프레임을 csv파일로 저장하기

In [8]:
import pandas as pd

data = {'name' : [ '홍길동', '이순신', '강감찬'],
        'Python' : [ "A", "A+", "B"],
        'Java' : [ "C", "B", "B+"],
        'C++' : [ "B+", "C", "C+"],
        }

df = pd.DataFrame(data)
df.set_index('name', inplace=True)   #name 열을 인덱스로 지정, inplace로 원본 수정하여 저장
df

Unnamed: 0_level_0,Python,Java,C++
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


In [10]:
# 데이터프레임을 CSV 파일로 저장하기(파일명: ./df_sample.csv)

df.to_csv('./03df_sample.csv', encoding='utf-8-sig')             # 인코딩 작업 바로 진행

- 저장된 파일 내용
![image.png](attachment:image.png)

In [11]:
# 인코딩이 필요한 경우 encoding='utf-8-sig'옵션 추가

- 인코딩을 적용하여 출력된 파일의 내용
![image.png](attachment:image.png)

In [12]:
df

Unnamed: 0_level_0,Python,Java,C++
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


### 데이터프레임을 엑셀파일로 저장

In [13]:
import pandas as pd

data = {'name' : [ '홍길동', '이순신', '강감찬'],
        'Python' : [ "A", "A+", "B"],
        'Java' : [ "C", "B", "B+"],
        'C++' : [ "B+", "C", "C+"],
        }

df = pd.DataFrame(data)
df.set_index('name', inplace=True)   #name 열을 인덱스로 지정
df

Unnamed: 0_level_0,Python,Java,C++
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


In [14]:
# 엑셀 파일로 저장(파일명: ./df_sample.xlsx)

df.to_excel('./03df_sample.xlsx')

- 저장된 엑셀파일 내용
![image.png](attachment:image.png)

### 데이터프레임을 JSON파일로 저장

In [15]:
import pandas as pd

data = {'name' : [ '홍길동', '이순신', '강감찬'],
        'Python' : [ "A", "A+", "B"],
        'Java' : [ "C", "B", "B+"],
        'C++' : [ "B+", "C", "C+"],
        }

df = pd.DataFrame(data)
df.set_index('name', inplace=True)   #name 열을 인덱스로 지정
df

Unnamed: 0_level_0,Python,Java,C++
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


In [16]:
# JSON 파일로 저장(파일명: ./df_sample.json)

df.to_json('./03df_sample.json')

- 저장된 JSON파일의 내용
![image.png](attachment:image.png)

### JSON파일의 데이터 불러오기

In [17]:
df = pd.read_json('./03df_sample.json')
df

Unnamed: 0,Python,Java,C++
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


## 여러 데이터프레임을 하나의 파일로 저장

In [18]:
import pandas as pd

data1 = {'name' : [ '홍길동', '이순신', '강감찬'],
        'Python' : [ "A", "A+", "B"],
        'Java' : [ "C", "B", "B+"],
        'C++' : [ "B+", "C", "C+"],
        }
data2 = {'c0':[1,2,3], 
         'c1':[4,5,6], 
         'c2':[7,8,9], 
         'c3':[10,11,12], 
         'c4':[13,14,15]
        }

In [19]:
df1 = pd.DataFrame(data1)
df1.set_index('name', inplace=True)      #name 열을 인덱스로 지정
df1

Unnamed: 0_level_0,Python,Java,C++
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
홍길동,A,C,B+
이순신,A+,B,C
강감찬,B,B+,C+


In [20]:
df2 = pd.DataFrame(data2)
df2.set_index('c0', inplace=True)        #c0 열을 인덱스로 지정
df2

Unnamed: 0_level_0,c1,c2,c3,c4
c0,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1,4,7,10,13
2,5,8,11,14
3,6,9,12,15


- 엑셀을 sheet로 구분하여 저장하는 방법

In [21]:
# df1을 'sheet1'으로, df2를 'sheet2'로 저장 (엑셀파일명은 "df_excelwriter.xlsx")

# 엑셀로 저장하는 객체 생성(파일명 필요)
writer = pd.ExcelWriter("./03df_excelwriter.xlsx")

# df1을 'sheet1'로 저장
df1.to_excel(writer, sheet_name="Sheet1")    # 파일 이름이 아니라 그 파일에 빨대꽂은 애를 적어줌(객체) + 옵션으로 sheet_name값 설정가능.

# df2을 'sheet2'로 저장
df2.to_excel(writer, sheet_name="Sheet2")

# 파일에 쓰기
writer.save()

  writer.save()


- 저장된 df_excelwriter.xlsx 파일 내용
![image.png](attachment:image.png)