## Pandas.DataFrame 클래스 기본

### Pandas.DataFrame 클래스 구조
pandas dataframe 객체는 기본적으로 아래와 같은 클래스로 구성됨

In [5]:
# class pandas.Dataframe(data=None, index=None, columns=None, copy=None)

- pandas.DataFrame으로 생성된 인스턴스는 크기의 변경이 가능한 2차원 배열 (Series는 1차원)
- 데이터 구조에는 레이블이 지정된 축인 행과 열까지 포함되며, 클래스 메서드를 통해 레이블의 수정이 가능

#### Parameter

- data: ndarray, Iterable, dict, DataFrame
    - dict에는 Series, 배열 등등 list와 유사한 오브젝트가 올 수 있음.
    - 데이터가 dict인 경우 열(Columns)의 순서는 삽입 순서를 따름.
- index: 인덱스 또는 배열형태의 객체
    - 인스턴스에 설정되는 행 레이블.
    - 입력하지 않으면 기본 인덱스가 설정됨 (0, 1, 2, 3)
- columns: 인덱스 또는 배열형태의 객체
    - 인스턴스에 설정되는 열 레이블.
    - 입력하지 않으면 기본 인덱스가 설정됨 (0, 1, 2, 3)
- dtype: dtype 데이터 유형을 강제하고자 할 때의 값.
    - 기본값은 None.
    - None일 경우 type이 자동으로 추론됨
- copy: bool
    - True일 경우 Dataframe의 원본 데이터를 수정하더라도 인스턴스가 변경되지 않지만
    - False일 경우 원본데이터를 수정할 시 인스턴스의 값도 바뀌게 됨.
    - 아래외 같이 2x2 Dataframe을 예로 들면

In [10]:
import pandas as pd
import numpy as np

np.random.seed(0)
arr = np.random.randint(10, size=(2, 2)) # 2*2짜리 random array 생성
print(arr)


[[5 0]
 [3 3]]


In [11]:
df1 = pd.DataFrame(arr, copy=False)
df2 = pd.DataFrame(arr, copy=True)

In [14]:
arr[0, 0] = 99
print(df1)

    0  1
0  99  0
1   3  3


In [15]:
print(df2)

   0  1
0  5  0
1  3  3


### Pandas.DataFrame 클래스 예시

#### 예시 01. dictionary로 만들기
- 데이터 자체가 2차원 배열 형태일 경우 data만 설정해주어도 dataframe 객체의 생성이 가능함

In [16]:
data = {'A': [1, 2], 'B': [3, 4]}
df = pd.DataFrame(data=data)
print(df)

   A  B
0  1  3
1  2  4


#### 예시 02. index, column 설정

In [22]:
data = np.array([[1, 2], [3, 4]])
df = pd.DataFrame(data=data, index=['row1', 'row2'], columns=['col1', 'col2'])
print(df)

      col1  col2
row1     1     2
row2     3     4
