#### 개요
  * pandas와 numpy는 python에서 사용되는 가장 대표적인 라이브러리 
  * pandas를 사용해야 하는 이유 
    - 대부분의 정제된 데이터들은 테이블 형태로 표현됨. 이런 테이블 형태의 데이터를 분석하기에 가장 최적의 라이브러리
    - numpy처럼 정형화된 데이터 연산에 최적화되어 있음. 성능이 매우 뛰어남
    - 다양한 정형 데이터를 통합 관리할 수 있음
      - json, html, csv, xlsx, sql, ..... 모두 DataFrame으로 표현될 수 있음
    - 엑셀에서 제공하는 연산 기능을 거의 다 제공함. 편의성 좋음

In [21]:
import numpy as np
import pandas as pd

####**Series**
- pandas의 기본 객체 중 하나
- numpy의 ndarray를 기반으로 인덱싱 기능을 추가하여 1차원 배열을 나타낸다.
- index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based 인덱스를 생성, 지정 할 경우 명시적으로 지정 된 index를 사용
- data로만 생성하기
  - index는 기본적으로 0부터 자동 생성

In [2]:
s1 = pd.Series([1,2,3])     #판다스가 값을 보고 타입을 명시해줌
s1

0    1
1    2
2    3
dtype: int64

In [3]:
s2 = pd.Series(['a','b','c','d','e','f','g'])
s2

0    a
1    b
2    c
3    d
4    e
5    f
6    g
dtype: object

In [4]:
s3 = pd.Series(np.arange(200))
s3

0        0
1        1
2        2
3        3
4        4
      ... 
195    195
196    196
197    197
198    198
199    199
Length: 200, dtype: int64

- data, index 함께 명시하기
- ([data],[index]) 로 정의

In [5]:
s4 = pd.Series([1,2,3],[100,200,300])
s4

100    1
200    2
300    3
dtype: int64

In [6]:
s5 = pd.Series([1,2,3], ['a','g','k'])
s5

a    1
g    2
k    3
dtype: int64

####**data,index,data type 함께 명시하기**

In [8]:
s6 = pd.Series(np.arange(5), np.arange(100,105), dtype=np.int16)
#dtype을 명시하지 않고 OS에 맞게 타입을 자동 설정해줌
s6

100    0
101    1
102    2
103    3
104    4
dtype: int16

#### **인덱스 활용하기**

In [9]:
s6.index    # index만 가져오는 경우

Int64Index([100, 101, 102, 103, 104], dtype='int64')

In [11]:
s6.values    # 값만 가져오는 경우

array([0, 1, 2, 3, 4], dtype=int16)

1. 인덱스를 통한 데이터 접근

In [13]:
# s6[0]   # 에러 발생, 0번 인덱스가 현재 없음

In [14]:
s6[104]

4

2. 인덱스를 통한 데이터 업데이트

In [17]:
s6[104] = 70
s6

100     0
101     1
102     2
103     3
104    70
dtype: int16

In [19]:
s6[105] = 90    # 업데이트의 경우 해당 인덱스가 없는 경우는 해당 인덱스를 만듬
s6[200] = 80
s6


100     0
101     1
102     2
103     3
104    70
105    90
200    80
dtype: int16

3. 인덱스 재사용

In [20]:
s7 = pd.Series(np.arange(7), s6.index)
s7

100    0
101    1
102    2
103    3
104    4
105    5
200    6
dtype: int64