### 판다스 패키지
데이터를 시계열이나 표로 표현하기 위한 패키지
시계열을 표현하는 `Series`클래스와 표로 표현하는 `DataFrame`클래스가 존재한다

판다스 패키스를 사용하기 위해서는 패키지를 설치해야함
```bash
pip install pandas
```

패키지를 임포트할 때는 
```python
import pandas
import pandas as pd
```

pandas 3.0 이상 버전 부터는 Pyarrow 패키지가 필수 의존 패키지로 지정되어 존재하지 않으면
```bash
pip install pyarrow
```
로 Pyarrow를 설치 권장

In [1]:
import pandas as pd

### 시리즈 클래스
1차원의 시계열 데이터를 표현하고자 할 때 사용하는 클래스로 인덱스와 값이 한 쌍으로 나열되 있는
형태
시리즈를 생성하는 방법 : pandas 패키지의 `Series`클래스의 생성자로 값과 인덱스에 대한 배열 혹은
리스트를 전달하면 생성할 수 있음

In [11]:
scores = pd.Series([85,70,100,90,55],index=['홍길동','김철수','이영희','최민수','박지성'])
print(scores)
#index를 지정하지 않으면 0부터 시작하는 정수의 인덱스 값이 자동으로 생성됨
#scores = pd.Series([85,70,100,90,55])
print(scores)

홍길동     85
김철수     70
이영희    100
최민수     90
박지성     55
dtype: int64
홍길동     85
김철수     70
이영희    100
최민수     90
박지성     55
dtype: int64


Series 객체의 index와 values들을 보고자 한다면 `index` 속성과 `values` 속성으로 확인할 수 있음

In [12]:
print(scores.index)
print(scores.values)

Index(['홍길동', '김철수', '이영희', '최민수', '박지성'], dtype='object')


array([ 85,  70, 100,  90,  55], dtype=int64)

`name`속성으로 value에 대한 이름을 부여할 수 있음
`index.name`속성으로 index에 대한 이름을 부여할 수 있음

In [13]:
scores.name='점수'
scores.index.name='이름'
print(scores)

이름
홍길동     85
김철수     70
이영희    100
최민수     90
박지성     55
Name: 점수, dtype: int64


In [14]:
# 인덱스 배열의 요소는 중복이 되어도 된다
scores = pd.Series([85,70,100,90,55],index=['홍길동','김철수','이영희','최민수','홍길동'])
print(scores)
print(scores['홍길동'])

홍길동     85
김철수     70
이영희    100
최민수     90
홍길동     55
dtype: int64


#### 시리즈 연산
시리즈도 numpy 배열과 같이 벡터화 연산이 가능함
단, 연산 작업은 값에만 적용됨

In [19]:
scores * 0.4
print(scores * 0.4)
print(scores >= 0.4)
scores2 = pd.Series([60,100,90,70,95],index=['홍길동','김철수','이영희','최민수','박지성'])
print(scores2)
print(scores)

홍길동    34.0
김철수    28.0
이영희    40.0
최민수    36.0
홍길동    22.0
dtype: float64
홍길동    True
김철수    True
이영희    True
최민수    True
홍길동    True
dtype: bool
홍길동     60
김철수    100
이영희     90
최민수     70
박지성     95
dtype: int64
홍길동     85
김철수     70
이영희    100
최민수     90
홍길동     55
dtype: int64


In [20]:
print(scores+scores2)

김철수    170.0
박지성      NaN
이영희    190.0
최민수    160.0
홍길동    145.0
홍길동    115.0
dtype: float64


####시리즈 인덱싱
시리즈도 리스트나 배열과 같이 인덱스 번호로 접근이 가능
단, 시리즈는 index값으로도 접근이 가능
배열 인덱싱이나 슬라이싱 모두 가능

In [21]:
print(scores[1],scores['김철수'])

70 70


  print(scores[1],scores['김철수'])


배열 인덱싱을 사용하여 자료의 순서를 바꾸거나 특정한 자료만 선택하여 시리즈 객체를 생성할 수 있음

In [30]:
print(scores)
print(scores[[0,3,1]])
print(scores[['홍길동','최민수','김철수']])
print((scores<70))

홍길동     85
김철수     70
이영희    100
최민수     90
홍길동     55
dtype: int64
홍길동    85
최민수    90
김철수    70
dtype: int64
홍길동    85
홍길동    55
최민수    90
김철수    70
dtype: int64
홍길동    False
김철수    False
이영희    False
최민수    False
홍길동     True
dtype: bool


  print(scores[[0,3,1]])


시리즈 객체도 슬라이싱이 가능한데 인덱스의 이름(라벨)으로 슬라이싱할때는 인덱스 번호로 슬라이싱할때
와 다르게 마지막 인덱스 값도 포함되어 반환됨

In [33]:
print(scores)
print(scores[1:3])
print(scores['김철수':'최민수'])

홍길동     85
김철수     70
이영희    100
최민수     90
홍길동     55
dtype: int64
김철수     70
이영희    100
dtype: int64
김철수     70
이영희    100
최민수     90
dtype: int64


시리즈 객체의 라벨이 영문자로 이루어져 있다면 객체의 속성에 접근하는 것과 같은 방법으로 접근할 수 있음

In [35]:
s0 = pd.Series(range(3),index=['a','b','c'])
print(s0)
print(s0.a)
print(s0.b)

a    0
b    1
c    2
dtype: int64
0
1


#### 시리즈와 딕셔너리
시리즈는 인덱스의 이름(라벨)과 값이 한쌍으로 이루어져서 관리되어 지는데, 이는 파이썬의 기본
자료구조인 키와 값을 한 쌍으로 관리하는 딕셔너리와 비슷함

시리즈 객체도 딕셔너리에서 사용가능한 `in`연산과 `items()`메서드를 사용할 수 있음

In [40]:
print('이재용' in scores)
print('홍길동' in scores)
for label,value in scores.items():
    print(f'{label}:{value}')

False
True
홍길동:85
김철수:70
이영희:100
최민수:90
홍길동:55


시리즈 객체는 딕셔너리 객체로 직접 생성할 수 있음
단, 딕셔너리 객체는 순서가 보장되지 않기 때문에 순서를 결정하고 싶다면 `index`매개변수에 순서를 
정한 인덱스 배열 또는 리스트를 전달해야함

In [47]:
scores2 = pd.Series({'홍길동':60,'김철수':90,'이재용':100,'권지용':75})
print(scores2)
scores2 = pd.Series({'홍길동':60,'김철수':90,'이재용':100,'권지용':75},
                    index=['권지용','김철수','이재용','홍길동'])
print(scores2)
scores2 = pd.Series({'홍길동':60,'김철수':90,'이재용':100,'권지용':75},
                    index=['권지용','김철수','이재용','박지성'])
print(scores2)

홍길동     60
김철수     90
이재용    100
권지용     75
dtype: int64
권지용     75
김철수     90
이재용    100
홍길동     60
dtype: int64
권지용     75.0
김철수     90.0
이재용    100.0
박지성      NaN
dtype: float64
