# **Series 값 변경**
  - 추가 및 업데이트: 인덱스를 이용
  - 삭제: drop함수 이용
  - inplace=  파라미터 이해


In [1]:
import numpy as np
import pandas as pd

In [4]:
s = pd.Series(np.arange(0, 5), ['가', '나', '다', '라', '마'])
s

가    0
나    1
다    2
라    3
마    4
dtype: int64

#### 값 변경:  해당 index 사용해서 접근

In [5]:
s['가'] = 100   # update!
s

가    100
나      1
다      2
라      3
마      4
dtype: int64

In [6]:
s['바'] = 6 # 생성
s

가    100
나      1
다      2
라      3
마      4
바      6
dtype: int64

#### 삭제: drop()

In [7]:
# 삭제!
s.drop('바')  # index k 가 삭제된 Series 리턴 (원본 변화 없다)

가    100
나      1
다      2
라      3
마      4
dtype: int64

In [8]:
s

가    100
나      1
다      2
라      3
마      4
바      6
dtype: int64

In [7]:
# ★중요★
# drop() 함수는 drop 한'결과' 를 새로 만들어서 리턴한거고
# 원본 데이터 s 는 '변경'하지 않습니다

# numpy , pandas, 그밖의 수많은 데이터 관련 모듈들 에서의
# 대부분의 객체 함수들은 호출한 원본 객체를 '변경'하진 않고
# 원본의 '사본'을 만든뒤 '사본' 에 연산수행하여 그 '사본' 을 리턴하도록 동작 한다  
# (함수마다 조금씩 다르긴 하다)

# 그러나!
# inplace=True 파라미터를 주면 '사본' 을 만들지 않고 '원본'을 변화시키도록 동작한다


In [9]:
s.drop('바', inplace=True)  # 리턴값이 없다!  허걱!  원본 변화발생!

In [10]:
s

가    100
나      1
다      2
라      3
마      4
dtype: int64

In [11]:
s[['나', '다']]

나    1
다    2
dtype: int64

In [13]:
# 여러개의 값을 한꺼번에 update 가능
s[['가', '나']] = 123, 456   # list, tuple, array 
s

가    123
나    456
다      2
라      3
마      4
dtype: int64

# **Slicing**
 - 리스트, ndarray와 동일하게 적용
 - index 가 문자열인 경우 slicing 시 마지막도 포함 (ndarray 와 차이점!)

In [12]:
s1 = pd.Series(np.arange(100, 105))
s1

0    100
1    101
2    102
3    103
4    104
dtype: int32

In [13]:
s1[1:3]   # index 1 부터 2 까지

# 이와 같이 '숫자-base' 인 인덱스는 기존의 slicing 방식대로 사용 가능

1    101
2    102
dtype: int32

In [14]:
# 문자기반의 인덱스는 어떠할까?
s2 = pd.Series(np.arange(100, 105), ['a', 'b', 'c', 'd', 'e'])
s2

a    100
b    101
c    102
d    103
e    104
dtype: int32

In [15]:
s2['b']

101

In [18]:
s2.iloc[1]  # 헐 동작한다???

101

In [19]:
s2[1:3] # 으잉? 된다!!?

b    101
c    102
dtype: int32

In [20]:
# 인덱스가 숫자타입이 아닌경우, 0-base 인덱싱, 슬라이싱 사용 가능

In [21]:
s2 = pd.Series(np.arange(100, 105), ['a', 'c', 'b', 'd', 'e'])  # '순서' 를 변경해 보아도
s2

a    100
c    101
b    102
d    103
e    104
dtype: int32

In [22]:
s2[1:3]   # 0-base 인덱싱 잘 동작

c    101
b    102
dtype: int32

In [23]:
# 문자기반 인덱스 사용시 슬라이싱
s2['c':'d']

# 문자열로 작성된 슬라이싱의 경우, '마지막' 도 포함이 된다!

c    101
b    102
d    103
dtype: int32

In [24]:
s2['b':'c']

Series([], dtype: int32)

In [25]:
s2['b':'c':-1]

b    102
c    101
dtype: int32

# Multi level index

In [15]:
s4 = pd.Series(np.arange(100, 106), ['a', 'a', 'b', 'b', 'c', 'c'])
s4

a    100
a    101
b    102
b    103
c    104
c    105
dtype: int64

In [16]:
s4.index

Index(['a', 'a', 'b', 'b', 'c', 'c'], dtype='object')

In [17]:
s4['a']

a    100
a    101
dtype: int64

In [18]:
s4 = pd.Series(
    np.arange(100, 106),
    index=[
        ['a', 'a', 'b', 'b', 'c', 'c'],
        [1, 2, 1, 2, 1, 2]
    ]
)
s4

a  1    100
   2    101
b  1    102
   2    103
c  1    104
   2    105
dtype: int64

In [28]:
s4['a']

1    100
2    101
dtype: int64

In [29]:
s4['a', 1]

100

In [20]:
s4['a': 'b']

a  1    100
   2    101
b  1    102
   2    103
dtype: int64

In [25]:
s4[['a', 'c']]

a  1    100
   2    101
c  1    104
   2    105
dtype: int64

In [24]:
s4.iloc[2]

102

#### xs() 를 사용한 인덱스
cross-section

axis = 0, level = 0

In [26]:
s4.xs('a')

1    100
2    101
dtype: int64

In [27]:
s4.xs(('a', 1))

100

In [30]:
s4.xs(2) # 레벨 구별이 없으면 일단 첫번째 레벨을 찾는다

KeyError: 2

In [32]:
s4.xs(2, level=-1) # 마지막 레벨에서 찾는다

a    101
b    103
c    105
dtype: int64

In [33]:
s4.xs((2, 'b'), level=(1, 0))

b  2    103
dtype: int64

## Series 에서 level 별 계산 

In [34]:
data = pd.Series(
    np.arange(100, 106),
    index=[
        ['a', 'b', 'b', 'b', 'c', 'c'],
        [1, 1, 2, 3, 1, 2]
    ]
)
data

a  1    100
b  1    101
   2    102
   3    103
c  1    104
   2    105
dtype: int64

In [35]:
data.sum()

615

In [36]:
data.values

array([100, 101, 102, 103, 104, 105])

In [37]:
data.values.sum()

615

In [39]:
np.sum([data, data.values])

1230

In [40]:
data.mean()

102.5

In [44]:
data.sum()

615

In [46]:
data.groupby(level=-1).sum()

1    305
2    207
3    103
dtype: int64

In [47]:
data.groupby(level=-2).sum()

a    100
b    306
c    209
dtype: int64