# Series 객체

In [2]:
import pandas as pd
import numpy as np

## 클래스 및 인스턴스

In [4]:
pd.Series()

Series([], dtype: object)

## Series 값 채우기

In [6]:
ice_cream_flavors = [
    "Chocolate",
    "Vanilla",
    "Strawberry",
    "Rum Raisin"
]

pd.Series(ice_cream_flavors)

0     Chocolate
1       Vanilla
2    Strawberry
3    Rum Raisin
dtype: object

In [7]:
# 다음 두 줄은 결과가 같습니다.
pd.Series(ice_cream_flavors)
pd.Series(data = ice_cream_flavors)

0     Chocolate
1       Vanilla
2    Strawberry
3    Rum Raisin
dtype: object

## Series 인덱스 사용자 정의

In [10]:
ice_cream_flavors = [
    "Chocolate",
    "Vanilla",
    "Strawberry",
    "Rum Raisin"
]

days_of_week = ("Mondy", "Wendnesday", "Friday", "Saturday")

# 다음 두 줄은 결과가 동일합니다.
pd.Series(ice_cream_flavors, days_of_week)
pd.Series(data = ice_cream_flavors, index = days_of_week)

Mondy          Chocolate
Wendnesday       Vanilla
Friday        Strawberry
Saturday      Rum Raisin
dtype: object

판다스는 공유 인덱스 위치를 사용하여 ice_cream_flavors 리스트와 days_of_week 튜플의 값을 연결합니다. 판다스는 예를 들어 해당 객체의 인덱스 위치 3과 'Saturday'와 'Rum Raisin'을 연결합니다. 따라서 두 가지 값은 Series에서 함께 연결됩니다.

즉 인덱스는 레이블 "Wednesday" 또는 인덱스 위치 1로 값 "Vanilla"에 접근할 수 있습니다.

그리고 Series는 파이썬의 딕셔너리와 다르게 중복을 혀용합니다.

In [11]:
ice_cream_flavors = [
    "Chocolate",
    "Vanilla",
    "Strawberry",
    "Rum Raisin"
]

days_of_week = ("Monday", "Wednesday", "Friday", "Wednesday")

# 다음 두 줄은 결과가 동일합니다.
pd.Series(ice_cream_flavors, days_of_week)
pd.Series(data = ice_cream_flavors, index = days_of_week)

Monday        Chocolate
Wednesday       Vanilla
Friday       Strawberry
Wednesday    Rum Raisin
dtype: object

중복을 허용하지만 고유 인덱스를 사용하면 라이브러리가 인덱스 레이블을 더 빨리 찾을 수 있으므로 가능한 한 중복을 피하는 것이 좋습니다.

In [12]:
pd.Series(index = days_of_week, data = ice_cream_flavors)

Monday        Chocolate
Wednesday       Vanilla
Friday       Strawberry
Wednesday    Rum Raisin
dtype: object

순서가 바뀌더라고 판다스는 동일한 키워드 인수를 사용하면 동일한 Series를 생성합니다

In [13]:
bunch_of_bools = [True, False, False]
pd.Series(bunch_of_bools)

0     True
1    False
2    False
dtype: bool

In [14]:
stock_prices = [985.32, 950.44]
time_of_day = ["Open", "Close"]
pd.Series(data = stock_prices, index = time_of_day)

Open     985.32
Close    950.44
dtype: float64

In [15]:
lucky_numbers = [4, 8, 15, 16, 23, 42]
pd.Series(lucky_numbers)

0     4
1     8
2    15
3    16
4    23
5    42
dtype: int64

판다스는 데이터 매개변수의 값에서 Series에 적합한 데이터 유형을 추론하기 위해 최선을 다합니다. 생성자의 dtype 매개변수를 사용하면 강제로 다른 유형으로 변환활 수 있습니다.

In [16]:
lucky_numbers = [4, 8, 15, 16, 23, 42]
pd.Series(lucky_numbers, dtype = "float")

0     4.0
1     8.0
2    15.0
3    16.0
4    23.0
5    42.0
dtype: float64

## 결측값이 있는 Series 생성

In [18]:
temperatues = [94, 88, np.nan, 91]
pd.Series(data = temperatues)

0    94.0
1    88.0
2     NaN
3    91.0
dtype: float64

판다스는 nan 값을 반환하면 숫자 값을 정수에서 부동 소수점으로 자동 변환합니다.

## 파이썬 객체에서 Series 생성

In [21]:
calorie_info = {
    "Cereal" : 125,
    "Chocolate Bar" : 406,
    "Ice Cream Sundae" : 342
}

diet = pd.Series(calorie_info)
diet

Cereal              125
Chocolate Bar       406
Ice Cream Sundae    342
dtype: int64

딕셔너리는 키-값 쌍의 모음입니다.

In [22]:
pd.Series(data = ("Red", "Green", "Blue"))

0      Red
1    Green
2     Blue
dtype: object

튜플은 값을 바꿀 수 없는 값입니다. 튜플을 저장하는 Series를 생성하려면 튜플을 리스트로 감싸야 합니다. 튜플은 주소와 같은 여러 부분 요소로 구성된 행의 값을 나타낼 때 적합합니다.

In [23]:
rgb_colors = [(120, 41, 26), (196, 165, 45)]
pd.Series(data = rgb_colors)

0     (120, 41, 26)
1    (196, 165, 45)
dtype: object

집합은 순서가 없는 고유한 값의 컬렉션입니다. 딕셔너리처럼 중괄호로 선언할 수 있습니다. 파이썬은 키-값 쌍의 유무를 기반으로 두 자료구조를 구별합니다.

Series 생성자에서 집합을 전달하면 TypeError을 뛰운다. 집합에는 리스트와 같은 수서 개념이나 딕셔너리와 같은 연관 개념이 없습니다. 따라서 판다스는 집합의 값을 저장하는 순서를 가정할 수 없습니다.

In [25]:
my_set = {"Ricky", "Bobby"}
pd.Series(my_set)

TypeError: 'set' type is unordered

프로그램에 집합이 포함된 경우 Series 생성자에 전달하기 전에 정렬된 자료구조로 변환해야 합니다.

In [26]:
pd.Series(list(my_set))

0    Bobby
1    Ricky
dtype: object

집합은 순서가 없기 때문에 리스트의 요소의 순서를 보장할 수 없습니다.
Series 생성자의 data 매개변수에는 넘파이 ndarry 객체도 사용할 수 있습니다.

In [27]:
random_data = np.random.randint(1, 101, 10)
random_data

array([58, 46, 69, 60, 53, 19, 64, 31, 43, 37])

In [28]:
pd.Series(random_data)

0    58
1    46
2    69
3    60
4    53
5    19
6    64
7    31
8    43
9    37
dtype: int64

## Series의 속성

속성은 객체에 속하는 데이터의 조각입니다. 속성은 객체의 내부 상태에 대한 정보를 나타냅니다. 속성의 값은 다른 객체일 수도 있습니다.

In [30]:
diet.values

array([125, 406, 342])

values 속성으로 값을 저장하는 ndarray 객체에 접근할 수 있다.