# Series 생성하기

In [2]:
import numpy as np
import pandas as pd

#### Series
  - 데이터 구조를 표현하는 pandas의 기본 객체 중 하나
  - 1차원 배열
  - index를 지정하지 않으며 0-based 인덱스가 생성됨 
  - index를 지정하면 명시적으로 지정된 index를 사용

#### data로 생성하기
 - index는 기본적으로 0부터 자동적으로 생성됨

In [3]:
s1 = pd.Series([1, 2, 3])   # 앞에 있는게 인덱스, 뒤에 있는게 값(value)
s1

0    1
1    2
2    3
dtype: int64

In [4]:
s2 = pd.Series(['a', 'b', 'c'])   # 앞에 있는게 인덱스, 뒤에 있는게 값(value)
s2

0    a
1    b
2    c
dtype: object

In [5]:
s3 = pd.Series(np.arange(200))   # 앞에 있는게 인덱스, 뒤에 있는게 값(value)
s3

0        0
1        1
2        2
3        3
4        4
      ... 
195    195
196    196
197    197
198    198
199    199
Length: 200, dtype: int32

#### data, index 함께 명시하여 생성하기

In [6]:
s4 = pd.Series([1, 2, 3], [100, 200, 300])   # 인덱스 100, 200, 300
s4

100    1
200    2
300    3
dtype: int64

In [7]:
s5 = pd.Series([1, 2, 3], ['a', 'b', 'c'])  # 인덱스 'a', 'b', 'c'  인덱스를 문자로도 사용할 수 있다.
s5

a    1
b    2
c    3
dtype: int64

#### data, index, data type을 함께 명시하여 생성하기

In [5]:
s6 = pd.Series(np.arange(5), np.arange(100, 105), dtype=np.int16)  # dtype 을 명시하지 않으면 OS의 bit에 맞게 생성함
s6

100    0
101    1
102    2
103    3
104    4
dtype: int16

#### 인덱스 활용하기

In [9]:
s6.index

Int64Index([100, 101, 102, 103, 104], dtype='int64')

In [10]:
s6.values

array([0, 1, 2, 3, 4], dtype=int16)

1. 인덱스를 통한 데이터 접근

In [11]:
s6[104]

4

In [6]:
s6[105]  # 없는 인덱스는 키 에러 발생

KeyError: 105

2. 인덱스를 통한 데이터 추가/업데이트

In [12]:
s6[104] = 70
s6

100     0
101     1
102     2
103     3
104    70
dtype: int16

In [17]:
s6[105] = 90   # 업데이트의 경우 해당 인덱스가 없다면 만들어 넣는다.
s6[200] = 80
s6

100     0
101     1
102     2
103     3
104    70
105    90
200    80
dtype: int64

3. 인덱스 재사용하기

In [18]:
s7 = pd.Series(np.arange(7), s6.index)   # s6의 인덱스 재사용
s7

100    0
101    1
102    2
103    3
104    4
105    5
200    6
dtype: int32