# Series

Series 는 Numpy array 와 매우 유사합니다. 실제로 Numpy array 객체를 활용해서 구현되기도 했습니다. Series 와 Numpy array 의 차이점이라면 Series 는 axis 에 label 을 부여할 수 있어서 숫자로된 인덱스 대신에 인덱스처럼 사용할 수 있습니다. 또한 숫자가 아닌 그외 다른 Python 객체들을 담을 수 있다는 점도 Numpy array 와 다릅니다.

In [2]:
import numpy as np
import pandas as pd

### Creating a Series

Python list, dictionary, numpy array 등을 Series 로 컨버젼합니다.

In [3]:
labels = ['a','b','c']
my_list = [10,20,30]
arr = np.array([10,20,30])
d = {'a':10,'b':20,'c':30}

** Using Lists**

In [4]:
pd.Series(data=my_list)

0    10
1    20
2    30
dtype: int64

In [5]:
pd.Series(data=my_list,index=labels)

a    10
b    20
c    30
dtype: int64

In [6]:
pd.Series(my_list,labels)

a    10
b    20
c    30
dtype: int64

** NumPy Arrays **

In [7]:
pd.Series(arr)

0    10
1    20
2    30
dtype: int64

In [8]:
pd.Series(arr,labels)

a    10
b    20
c    30
dtype: int64

** Dictionary**

In [9]:
pd.Series(d)

a    10
b    20
c    30
dtype: int64

### Data in a Series

pandas Series 는 다양한 타입의 객체를 저장할 수 있습니다.

In [10]:
pd.Series(data=labels)

0    a
1    b
2    c
dtype: object

In [11]:
# 심지어, 함수조차도 저장 가능합니다. 쓸 수가 없어서 문제지...
pd.Series([sum,print,len])

0      <built-in function sum>
1    <built-in function print>
2      <built-in function len>
dtype: object

## Using an Index

Series 사용에 있어서 핵심은 인덱스를 활용함에 있습니다. Pandas 는 인덱스 이름 또는 인덱스 숫자를 통해 빠르게 정보를 확인할 수 있도록 합니다. 그런면에서 해시 테이블 또는 dictionary 객체와 유사합니다.

In [12]:
ser1 = pd.Series([1,2,3,4],index = ['USA', 'Germany','USSR', 'Japan'])                                   

In [13]:
ser1

USA        1
Germany    2
USSR       3
Japan      4
dtype: int64

In [14]:
ser2 = pd.Series([1,2,5,4],index = ['USA', 'Germany','Italy', 'Japan'])                                   

In [15]:
ser2

USA        1
Germany    2
Italy      5
Japan      4
dtype: int64

In [16]:
ser1['USA']

1

Series 에 대한 연산자는 인덱스를 기준으로 실행됩니다.

In [17]:
ser1 + ser2

Germany    4.0
Italy      NaN
Japan      8.0
USA        2.0
USSR       NaN
dtype: float64

다음은 Series 의 확장판인 DataFrame 에 대해서 알아봅시다.