### 판다스 패키지
데이터를 시계열이나 표로 표현하기 위한 패키지  
시계열을 표현하는 `Series` 클래스와 `DataFrame` 클래스 존재함  
  
판다스 패키지를 사용하기 위해서는 패키지를 설치해야함
``` bash
pip install pandas
```  
  
패키지를 임포트 할 때는
``` python
import pandas
import pandas as pd
```

pandas 3.0 이상 버전 부터는 Pyarrow 패키지가 지정되어 존재하지 않으면
``` bash
pip install pyarrow
```
로 Pyarrow 설치 권장

In [None]:
import pandas as pd

### 시리즈 클래스
1차원의 시계열 데이터를 표현하고자 할 때 사용하는 클래스로 인덱스 값이 한 쌍으로 나열되있는 형태  
시리즈를 생성하는 방법 : pandas 패키지의 `Series` 클래스의 생성자로 값과 인덱스에 대한 배열 혹은  
리스트를 전달하면 생성할 수 있음

In [None]:
# 인덱스 배열의 요소는 중복이 되어도 됨
scores = pd.Series([85, 70, 100, 90, 55], index = ['스몰더', '미스포츈', '애쉬', '이즈리얼', '베인'])
scores

In [None]:
# index를 지정하지 않으면 0부터 시작하는 정수의 인덱스 값이 자동으로 생성됨
scores = pd.Series([85, 70, 100, 90, 55])
scores

Series 객체의 index와 values 들을 보고자 한다면 `index` 속성과 `values` 속성으로 확인할 수 있음

In [None]:
scores.index

In [None]:
scores.values

`name` 속성으로 values에 대한 이름을 부여할 수 있음  
`index.name` 속성으로 index에 대한 이름을 부여할 수 있음

In [None]:
scores.name = '점수'
scores.index.name = '이름'
scores

#### 시리즈 연산
시리즈도 numpy 배열과 같이 벡터화 연산이 가능함  
단, 연산 작업은 값에만 적용됨

In [None]:
scores * 0.4

In [None]:
scores >= 60

In [None]:
scores2 = pd.Series([60, 100, 90, 70, 95], index = ['스몰더', '미스포츈', '애쉬', '이즈리얼', '베인'])
scores2

In [None]:
scores + scores2

#### 시리즈 인덱싱
시리즈도 리스트나 배열과 같이 인덱스 번호로 접근이 가능  
단, 시리즈는 index 값으로도 접근이 가능  
배열 인덱싱이나 슬라이싱 모두 가능  

In [None]:
scores[1], scores['스몰더']

배열 인덱싱을 사용하여 자료의 순서를 바꾸거나 특정한 자료만 선택하여 시리즈 객체를 생성할 수 있음

In [None]:
scores[['스몰더', '이즈리얼', '미스포츈']]

In [None]:
scores[scores < 70]

시리즈 객체도 슬라이싱이 가능한데 인덱스의 이름(라벨)으로 슬라이싱 할 때는 인덱스 번호로 슬라이싱 할 때와 다르게  
마지막 인덱스 값도 포함해서 반환

In [None]:
# 번호로 슬라이싱 할 때
scores[1:3]

In [None]:
# 이름으로 슬라이싱 할 때
scores['미스포츈': '이즈리얼']

시리즈 객체의 라벨이 영문자로 이루어져 있다면 객체의 속성에 접근하는 것과 같은 방법으로 접근할 수 있음

In [None]:
s0 = pd.Series(range(3), index=['a', 'b', 'c'])
s0

In [None]:
s0.a, s0.b

#### 시리즈와 딕셔너리
시리즈는 인덱스의 이름(라벨)과 값이 한쌍으로 이루어져서 관리되어 지는데, 이는 파이썬의 기본 자료구조인 키와 값을 한 쌍으로 관리하는 딕셔너리와 비슷함  
  
시리즈 객체도 딕셔너리에서 사용가능한 `in` 연산과 `items()` 메서드를 사용할 수 있음

In [None]:
'베인' in scores

In [None]:
'루시안' in scores

In [None]:
for label, value in scores.items():
    print(f'{label} : {value}')

시리즈 객체는 딕셔너리 객체로 직접 생성할 수 있음  
단, 딕셔너리 객체는 순서가 보장되지 않기 때문에 순서를 결정하고 싶다면 `index` 매개변수에 순서를 정한 인덱스 배열 또는 리스트를 전달해야 함

In [None]:
scores2 = pd.Series({'스몰더' : 60, '미스포츈' : 90, '루시안' : 100, '케이틀린' : 75})
scores2

In [None]:
scores2 = pd.Series({'스몰더' : 60, '미스포츈' : 90, '루시안' : 100, '케이틀린' : 75}, index =
                    ['케이틀린','미스포츈','스몰더','루시안'])
scores2

#### 인덱스 기반 연산
두 시리즈 객체간에 연산을 진행하면 인덱스가 같은 데이터에 대해서만 연산을 진행함  
시리즈 모두에 존재하지 않는 인덱스 `NaN`으로 표시됨


In [None]:
score_sums = scores + scores2
score_sums

값들 끼리의 연산에서는 동일하게 존재하는 인덱스 값들에 대해서만 나타남  
(길이가 다른 값들에 대해서는 연산불가)

In [None]:
scores.values + scores2.values

시리즈 객체에서 값이 `NaN`인지 아닌지 구하려면 `notnull()` 메서드를 사용할 수 있음

In [None]:
score_sums.notnull()

In [None]:
score_sums[score_sums.notnull()]

#### 데이터 갱신 추가 삭제
딕셔너리와 같은 방법으로, 데이터를 갱신, 추가, 삭제를 할 수 있음

In [None]:
# 데이터 갱신
score_sums['스몰더'] = 120
score_sums

In [None]:
# 데이터 추가
score_sums['트위치'] = 120
score_sums

In [None]:
# 데이터 삭제
del score_sums['베인']
score_sums

In [None]:
score_sums.pop('이즈리얼')

##### 파이썬으로 다음 연산을 수행한다.

1. 임의로 두 개의 시리즈 객체를 만든다. 모두 문자열 인덱스를 가져야 하며 두 시리즈에 공통적으로 포함되지 않는 라벨이 있어야 한다.

딕셔너리 store1 = {
'apple': 500,
'banana': 3000,
'carrot': 1000
}

딕셔너리 store2 = {
'apple': 800,
'banana': 2500,
'dabai': 5000
}

1. 위에서 만든 두 시리즈 객체를 이용하여 사칙 연산을 한다. 겹치지 않는 인덱스에 대해서 NaN으로 표시하는 시리즈 객체들과 겹치는 인덱스만 표시하는 시리즈 객체를 모두 생성한다.

In [None]:
store1 = {
'apple': 500,
'banana': 3000,
'carrot': 1000
}

store2 = {
'apple': 800,
'banana': 2500,
'dabai': 5000
}

In [None]:
store1_series = pd.Series(store1)
store1

In [None]:
store2_series = pd.Series(store2)
store2

In [None]:
# 겹치지 않는 인덱스에 대해서 NaN으로 표시하는 시리즈 객체
plus_nan_series = store1_series + store2_series
plus_nan_series

In [None]:
# 겹치지 않는 인덱스에 대해서 NaN으로 표시하는 시리즈 객체
minus_nan_series = store1_series - store2_series
minus_nan_series

In [None]:
# 겹치는 인덱스만 표시하는 시리즈 객체
plus_series = plus_nan_series[plus_nan_series.notnull()]
plus_series

In [None]:
# 겹치는 인덱스만 표시하는 시리즈 객체
minus_series = minus_nan_series[minus_nan_series.notnull()]
minus_series