In [4]:
'''
Series 객체 특징 
 - pandas 1차원 자료구조 
 - DataFrame의 칼럼 구성요소 
 - 수학/통계 함수 제공 
 - 범위 수정, 블럭 연산
 - indexing/slicing 기능 
 - 시계열 데이터 처리  
'''
import pandas as pd # pd.Series()
from pandas import Series # Series()

In [5]:
# 1. Series 생성  

# 1) list 이용 
price = Series([4000, 3000, 3500, 2000])
print(price)

0    4000
1    3000
2    3500
3    2000
dtype: int64


In [6]:
print(price.index)
print(price.values)

RangeIndex(start=0, stop=4, step=1)
[4000 3000 3500 2000]


In [7]:
price.drop(0)

1    3000
2    3500
3    2000
dtype: int64

In [9]:
print(price[1]) # 3000 인덱스에 맞는 value값

3000


In [10]:
price2 = pd.Series([4000, 3000, 3500, 2000],
                  index = ['a', 'b', 'c', 'd'])
print(price2)

a    4000
b    3000
c    3500
d    2000
dtype: int64


In [11]:
print(price2['b']) 

3000


In [12]:
# boolean 조건식 
print(price2[price2 >= 3000])  

a    4000
b    3000
c    3500
dtype: int64


In [13]:
# 2) dict 이용 : key=index, value=value
person = pd.Series({'name':'홍길동', 'age':35, 'addr' : '서울시'})
print(person)

name    홍길동
age      35
addr    서울시
dtype: object


In [14]:
print(person['name'])

홍길동


In [15]:
# 2. indexing : list 동일 
ser = pd.Series([4, 4.5, 6, 8, 10.5])
print(ser[0])
print(ser[:3])
print(ser[3:])
print(ser[:])
#print(ser[-1]) # 주의 : - 속성 안됨 

4.0
0    4.0
1    4.5
2    6.0
dtype: float64
3     8.0
4    10.5
dtype: float64
0     4.0
1     4.5
2     6.0
3     8.0
4    10.5
dtype: float64


In [16]:
# 3. Series 결합과 NA 처리 
p1 = pd.Series([4000, None, 3500, 2000],
                  index = ['a', 'b', 'c', 'd'])
print(p1)
p2 = pd.Series([4000, 3000, 3500, 2000],
                  index = ['a', 'c', 'b', 'e'])
print(p2)

a    4000.0
b       NaN
c    3500.0
d    2000.0
dtype: float64
a    4000
c    3000
b    3500
e    2000
dtype: int64


In [17]:
# Series 결합(join) : index 기준 
result = p1 + p2
print(result)
'''
a    8000.0
b       NaN -> 결측치 
c    6500.0
d       NaN -> p2에는 d가 없어 더할값이 존재하지 않아 결측치가 나옴 
e       NaN -> p2에는 e가 없어 더할값이 존재하지 않아 결측치가 나옴 
'''

a    8000.0
b       NaN
c    6500.0
d       NaN
e       NaN
dtype: float64


In [18]:
# 결측치 처리(평균, 0) 결측치를 평균으로 대체함
result2 = result.fillna(result.mean()) #결측값을 특정 값으로 채우기: df.fillna(0)
print(result2)

a    8000.0
b    7250.0
c    6500.0
d    7250.0
e    7250.0
dtype: float64


In [19]:
result3 = result.fillna(0) #  결측값을 0으로 채움
print(result3)

a    8000.0
b       0.0
c    6500.0
d       0.0
e       0.0
dtype: float64


In [20]:
# 결측치 제외 
#pd.notnull(obj)   ->  누락값이 아닌 경우 검사함 (누락값이 아닌 값들일때 True 누락값일 경우 False)
result4 = pd.notnull(result)
print(result4)

a     True
b    False
c     True
d    False
e    False
dtype: bool


In [21]:
# 결측치 제외 -> subset 생성 
subset = result[pd.notnull(result)] # 결측치가 아닌 값들을 출력
print(subset)

a    8000.0
c    6500.0
dtype: float64


In [22]:
# 결측치 사용 -> subset 생성 
#pd.isnull(obj)
subset = result[pd.isnull(result)] # 결측치가 맞는 값들을 출력
print(subset)

b   NaN
d   NaN
e   NaN
dtype: float64


In [23]:
# 4. series 연산
ser = pd.Series([4, 4.5, 6, 8, 10.5])
print(ser) # 2. index에서 생성 

0     4.0
1     4.5
2     6.0
3     8.0
4    10.5
dtype: float64


In [24]:
# 1) 블럭 수정 
ser[1:4] = 30
print(ser)

0     4.0
1    30.0
2    30.0
3    30.0
4    10.5
dtype: float64


In [25]:
# 3) 수학/통계 함수 
print(ser.mean())
print(ser.sum())
print(ser.max())
print(ser.min())


20.9
104.5
30.0
4.0


In [27]:
# 4) series 객체 멤버 함수 보기 
# abs, add dir() 내장 함수는 어떤 객체를 인자로 넣어주면 해당 객체가 어떤 변수와 메소드(method)를 가지고 있는지 나열해줍니다
dir(ser) 


['T',
 '_AXIS_LEN',
 '_AXIS_NAMES',
 '_AXIS_NUMBERS',
 '_AXIS_ORDERS',
 '_AXIS_REVERSED',
 '_AXIS_TO_AXIS_NUMBER',
 '_HANDLED_TYPES',
 '__abs__',
 '__add__',
 '__and__',
 '__annotations__',
 '__array__',
 '__array_priority__',
 '__array_ufunc__',
 '__array_wrap__',
 '__bool__',
 '__class__',
 '__contains__',
 '__copy__',
 '__deepcopy__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__div__',
 '__divmod__',
 '__doc__',
 '__eq__',
 '__finalize__',
 '__float__',
 '__floordiv__',
 '__format__',
 '__ge__',
 '__getattr__',
 '__getattribute__',
 '__getitem__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__iand__',
 '__ifloordiv__',
 '__imod__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__int__',
 '__invert__',
 '__ior__',
 '__ipow__',
 '__isub__',
 '__iter__',
 '__itruediv__',
 '__ixor__',
 '__le__',
 '__len__',
 '__long__',
 '__lt__',
 '__matmul__',
 '__mod__',
 '__module__',
 '__mul__',
 '__ne__',
 '__neg__',
 '__new__',
 '__nonzero__',
 '__or__',
 '__pos__

In [28]:
ser = pd.Series([4, 4.5, 6, 8, 10.5])
ser2 = ser.add(-10.5) # 각 원소 더하기 
ser2.abs()  # abs는 절대값을 쓰고 싶을때 사용한다.
print(ser2)

0   -6.5
1   -6.0
2   -4.5
3   -2.5
4    0.0
dtype: float64
