# Pandas Data 핸들링

- list를 DataFrame 변환
```python
# col_name은 ['', '']를 이용하여 직접 입력해줘야함
list_df = pd.DataFrame(list, columns=col_name)
```

- ndarray를 DataFrame 변환
```python
array_df = pd.DataFrame(array, columns=col_name)
```

- dict를 DataFrame 변환
```python
dict = {'test': [1,6], 'test2':[2,11]}
dict_df = pd.DataFrame(dict)
```

- DataFrame을 list 변환

: DataFrame객체의 values 속성을 이용하여 ndarray변환 후, tolist() 이용

- DataFrame을 ndarray 변환

: DataFrame객체의 values 속성을 이용하여 ndarray 변환

- DataFrame을 dict 변환

: DataFrame객체의 to_dict()를 이용

### list / ndarray에서 DataFrame 변환

In [1]:
import numpy as np
import pandas as pd

col_name = ['col1']
list1 = [1,2,3]
array1 = np.array(list1)

print('Shape:', array1.shape)
df = pd.DataFrame(list1, columns=col_name)
print('1차원 리스트로 만든 DataFrame:\n', df)
df = pd.DataFrame(array1, columns=col_name)
print('1차원 ndarray로 만든 DataFrame:\n', df)

Shape: (3,)
1차원 리스트로 만든 DataFrame:
    col1
0     1
1     2
2     3
1차원 ndarray로 만든 DataFrame:
    col1
0     1
1     2
2     3


In [2]:
col_name = ['col1', 'col2', 'col3']

list2 = [[1,2,3], [11,12,13]]
array2 = np.array(list2)

print('Shape:', array2.shape)
df = pd.DataFrame(list2, columns=col_name)
print('2차원 리스트로 만든 DataFrame:\n', df)
df = pd.DataFrame(array2, columns=col_name)
print('2차원 ndarray로 만든 DataFrame:\n', df)

Shape: (2, 3)
2차원 리스트로 만든 DataFrame:
    col1  col2  col3
0     1     2     3
1    11    12    13
2차원 ndarray로 만든 DataFrame:
    col1  col2  col3
0     1     2     3
1    11    12    13


### Dictionary에서 DataFrame 변환

In [3]:
dict1 = {'col1':[1,11], 'col2':[2,12], 'col3':[3,13]}
df = pd.DataFrame(dict1)
print('Dictionary로 만든 DataFrame:\n', df)

Dictionary로 만든 DataFrame:
    col1  col2  col3
0     1     2     3
1    11    12    13


### DataFrame을 ndarray 변환

In [4]:
array3 = df.values
print('df values 타입:', type(array3), '\nShape:', array3.shape)
print(array3)

df values 타입: <class 'numpy.ndarray'> 
Shape: (2, 3)
[[ 1  2  3]
 [11 12 13]]


### DataFrame을 List / Dict로 변환

In [5]:
# List
list3 = df.values.tolist()
print('df values 타입:', type(list3))
print(list3)

# Dictionary
dict3 = df.to_dict('list')
print('df values 타입:', type(dict3))
print(dict3)

df values 타입: <class 'list'>
[[1, 2, 3], [11, 12, 13]]
df values 타입: <class 'dict'>
{'col1': [1, 11], 'col2': [2, 12], 'col3': [3, 13]}


## DataFrame의 컬럼 데이터 셋 Access
DataFrame의 컬럼 데이터 세트 생성과 수정은 `[]` 연산자를 이용하여 쉽게 할 수 있다.<br/>새로운 컬럼에 값을 할당하려면 DataFrame[] 내에 새로운 컬럼명을 입력하고 값을 할당해주기만 하면 된다.

## DataFrame의 데이터 삭제
```python
DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
```
- axis: DataFrame의 row를 삭제할 때는 axis=0, colum 삭제 axis=1 설정
- 원본 DataFrame 유지하고 drop된 DataFrame을 새롭게 객체 변수로 받고 싶다면 `inplace=False`로 설정(default->False)
- 원본 DataFrame에 drop 결과 적용할 경우에는 inplace=True
```python
# 원본 DataFrame 적용 결과는 아래와 같음
df = df.drop('Age_0', axis=1, inplace=False)
# df.drop('Age_0', axis=1, inplace=True)
```

## Index
- Pandas의 index객체는 DataFrame, Series의 레코드를 고유하게 식별하는 객체
  <br/>index는 오직 식별용으로만 사용됨 
- DataFrame, Series에서 Index객체만 추출하려면 DataFrame.index 또는 Series.index 속성을 통해 가능
- reset_index() 메소드를 수행하면 새롭게 인덱스를 연속 숫자형으로 할당하며 기존 인덱스는 'index'라는 새로운 컬럼 명으로 추가됨