#### 개요
  * pandas와 numpy는 python에서 사용되는 가장 대표적인 라이브러리임
  * pandas 사용해야 하는 이유
    - 대부분의 정제된 데이터들은 테이블 형태로 표현됨, 이런 테이블 형태의 데이터를 분석하기에 가장 최적의 라이브러리
    - numpy처럼 정형화된 데이터 연산에 최적화 되어 있음. 성능이 매우 뛰어남
    - 다양한 정형 데이터를 통합 관리할 수 있음
      - json, html, csv, xlsx, sql... 모두 DataFrame으로 표현될 수 있음
    - 엑셀에서 제공하는 연산 기능을 거의 다 제공함, 편의성 좋음

In [None]:
import numpy as np
import pandas as pd

#### Series
- pandas의 기본 객체 중 하나
- numpy의 ndarray를 기반으로 인덱싱 기능을 추가하여 1차원 배열을 나타냄
- index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based 인덱스 생성, 지정할 경우 명시적으로 지정된 index를 사용

- data로만 생성하기
  - index는 기본적으로 0부터 자동적으로 생성

In [None]:
s1 = pd.Series([1, 2, 3])       # 판다스가 값을 보고 타입을 명시해줌 
print(s1)

0    1
1    2
2    3
dtype: int64


In [None]:
s2 = pd.Series(['a', 'b', 'c'])
s2 

0    a
1    b
2    c
dtype: object

In [None]:
s3 = pd.Series(np.arange(200))
print(s3)

0        0
1        1
2        2
3        3
4        4
      ... 
195    195
196    196
197    197
198    198
199    199
Length: 200, dtype: int64


- data, index 함께 명시하기

In [None]:
s4 = pd.Series([1, 2, 3], [100, 200, 300])
print(s4)

100    1
200    2
300    3
dtype: int64


In [None]:
s5 = pd.Series([1, 2, 3], ['a', 'b', 'c'])
print(s5)

a    1
b    2
c    3
dtype: int64


- data, index, data type 함께 명시하기

In [None]:
s6 = pd.Series(np.arange(5), np.arange(1, 6), dtype=np.int16)     # dtype을 명시하지 않으면 OS에 맞게 dtype을 설정해줌
print(s6)

1    0
2    1
3    2
4    3
5    4
dtype: int16


#### 인덱스 활용하기

In [None]:
s6.index          # index만 가져오는 경우 

Int64Index([1, 2, 3, 4, 5], dtype='int64')

In [None]:
s6.values         # 값만 가져오는 경우 

array([0, 1, 2, 3, 4], dtype=int16)

1. 인덱스를 통한 데이터 접근

In [None]:
# s6[0]           # 에러발생. 0번 인덱스가 현재 없음

In [None]:
s6[2]

1

In [None]:
# s6[10]         # 에러발생. 10번 인덱스가 현재 없음

2. 인덱스를 통한 데이터 업데이트

In [None]:
s6[2]=10
s6

1     0
2    10
3     2
4     3
5     4
dtype: int16

In [None]:
s6[10] = 8          # 업데이트의 경우 해당 인덱스가 없을 경우에는 해당 인덱스를 만듬
s6

1      0
2     10
3      2
4      3
5      4
10     8
dtype: int16

3. 인덱스 재사용

In [None]:
s7 = pd.Series(np.arange(6), s6.index)
s7

1     0
2     1
3     2
4     3
5     4
10    5
dtype: int64