# **Series 값 변경**
  - 추가 및 업데이트: 인덱스를 이용
  - 삭제: drop함수 이용
  - inplace=  파라미터 이해


In [24]:
import numpy as np
import pandas as pd 

In [26]:
s = pd.Series(np.arange(0, 5), ['가','나','다','라','마'])
s

가    0
나    1
다    2
라    3
마    4
dtype: int32

#### 값 변경:  해당 index 사용해서 접근

In [27]:
s['가'] = 1000 # 있는 index 를 이용하면 값 수정
s

가    1000
나       1
다       2
라       3
마       4
dtype: int32

In [28]:
s['바'] = 10101 # 없는 index 를 이용하면 값 추가
s

가     1000
나        1
다        2
라        3
마        4
바    10101
dtype: int32

#### 삭제: drop()

In [30]:
s.drop('바')

가    1000
나       1
다       2
라       3
마       4
dtype: int32

In [31]:
s = s.drop('바')
s

가    1000
나       1
다       2
라       3
마       4
dtype: int32

* 대부분의 리턴값을 가지는 함수는 원본을 변경하지 않는다.

In [32]:
s.drop('마', inplace=True)

In [33]:
s

가    1000
나       1
다       2
라       3
dtype: int32

In [34]:
s[['가', '나']]

가    1000
나       1
dtype: int32

In [35]:
# 여러개의 값을 수정할때 : tuple, list, array
s[['가','나']] = [123,456]
s

가    123
나    456
다      2
라      3
dtype: int32

In [36]:
s[['가','나']] = (789,123)
s

가    789
나    123
다      2
라      3
dtype: int32

# **Slicing**
 - 리스트, ndarray와 동일하게 적용
 - index 가 문자열인 경우 slicing 시 마지막도 포함 (ndarray 와 차이점!)

In [37]:
s1 = pd.Series(np.arange(100, 105))
s1

0    100
1    101
2    102
3    103
4    104
dtype: int32

In [38]:
# 숫자 index 는 시작:끝-1 이 된다.
s1[1:3]

1    101
2    102
dtype: int32

In [39]:
s2 = pd.Series(np.arange(100, 105), ['a','b','c','d','e'])
s2

a    100
b    101
c    102
d    103
e    104
dtype: int32

In [40]:
s2['b']

101

In [41]:
s2[1]

  s2[1]


101

In [42]:
s3 = pd.Series(np.arange(100, 105), np.arange(100,105))
s3

100    100
101    101
102    102
103    103
104    104
dtype: int32

In [43]:
s3[1]

KeyError: 1

In [44]:
s2[1:3]

b    101
c    102
dtype: int32

In [46]:
# 인덱스가 숫자인 경우에는 0_base 인덱싱이 되지 않고 문자일 때는 사용이 가능하다.
s2 = pd.Series(np.arange(100, 105), ['a','c','e','d','b'])
s2

a    100
c    101
e    102
d    103
b    104
dtype: int32

In [47]:
s2[1:3]

c    101
e    102
dtype: int32

In [48]:
# 숫자로 slicing 을 할 경우 시작:끝-1
# 문자로 slicing 을 할 경우 시작:끝
s2['c':'d']

c    101
e    102
d    103
dtype: int32

In [49]:
s2['d':'e']

Series([], dtype: int32)

In [50]:
s2['d':'e':-1]

d    103
e    102
dtype: int32

# Multi level index

In [51]:
s4 = pd.Series([1,2,3,4,5,6], ['a','a','b','b','c','c'])
s4

a    1
a    2
b    3
b    4
c    5
c    6
dtype: int64

In [52]:
# single level index
s4.index

Index(['a', 'a', 'b', 'b', 'c', 'c'], dtype='object')

In [53]:
s4['a']

a    1
a    2
dtype: int64

In [54]:
# multi level index
s4 = pd.Series(
    np.arange(100, 106),
    index = [
        ['a','a','b','b','c','c'],
        [1,2,1,2,1,2]
    ]
)
s4

a  1    100
   2    101
b  1    102
   2    103
c  1    104
   2    105
dtype: int32

In [55]:
# multi index 는 tuple로 출력
s4.index

MultiIndex([('a', 1),
            ('a', 2),
            ('b', 1),
            ('b', 2),
            ('c', 1),
            ('c', 2)],
           )

In [56]:
s4['a', 1]

100

In [57]:
s4['a']

1    100
2    101
dtype: int32

In [58]:
s4['a':'b']

a  1    100
   2    101
b  1    102
   2    103
dtype: int32

In [60]:
s4[['a', 'c']]

a  1    100
   2    101
c  1    104
   2    105
dtype: int32

In [61]:
s4[1]

  s4[1]


101

#### xs() 를 사용한 인덱스
cross-section

axis = 0, level = 0

In [62]:
# level-0 index
# s4['a']
s4.xs('a')

1    100
2    101
dtype: int32

In [63]:
# s4['a', 1]
s4.xs(('a',1))

100

In [65]:
# level 구별을 하지 않으면 level-0 에서 찾는다.
s4.xs(2)

KeyError: 2

In [64]:
s4.xs(2, level=1)

a    101
b    103
c    105
dtype: int32

In [68]:
# -1 은 마지막 레벨에서 찾는다.
s4.xs(2, level=-1)

a    101
b    103
c    105
dtype: int32

In [69]:
# level 을 여러개 지정 가능하고 순서도 지정할 수 있다.
s4.xs((2, 'b'), level=(1,0))

b  2    103
dtype: int32

## Series 에서 level 별 계산 

In [70]:
data = pd.Series(
    np.arange(100, 106),
    index = [
        ['a','b','b','b','c','c'],
        [1,1,2,3,1,2]
    ]
)
data

a  1    100
b  1    101
   2    102
   3    103
c  1    104
   2    105
dtype: int32

In [71]:
data.sum()

615

In [73]:
data.values

array([100, 101, 102, 103, 104, 105])

In [74]:
data.values.sum()

615

In [75]:
np.sum(data), np.sum(data.values)

(615, 615)

In [76]:
data.mean()

102.5

In [78]:
# level=None : default 
data.sum()

615

In [86]:
data.groupby(level=1).sum()

1    305
2    207
3    103
dtype: int32

In [87]:
data.groupby(level=-1).sum()

1    305
2    207
3    103
dtype: int32

In [88]:
data.groupby(level=-2).sum()

a    100
b    306
c    209
dtype: int32