## 시리즈(series) 타입 실습
- pandas의 1종류(1차원 배열/세로 백터) 데이터를 저장하는 데이터 타입(Type)

- 생성 : series 객체 생성

In [13]:
# 모듈 로딩
import pandas as pd

# Series 객체 생성
sr = pd.Series([1, 2, 3, 4])

In [14]:
# 생성된 Series 객체 데이터 확인하기
sr

0    1
1    2
2    3
3    4
dtype: int64

In [15]:
# sr 객체의 인덱스 속성 
sr.index

RangeIndex(start=0, stop=4, step=1)

In [16]:
# sr 객체의 값 속성
sr.values

array([1, 2, 3, 4], dtype=int64)

In [17]:
# sr 객체의 차원 속성
sr.ndim

1

In [18]:
# sr 객체의 형 속성
sr.shape

(4,)

In [19]:
# 실제 사용 메모리 byte, 데이터 개수
sr.nbytes, sr.size

(32, 4)

In [20]:
# 여러 타입의 데이터로 Series 객체 생성
sr2 = pd.Series([1, 2, "a", 4.5])
sr2

0      1
1      2
2      a
3    4.5
dtype: object

In [21]:
# Series 객체 속성 읽기
print(f"index => {sr2.index}")
print(f"value => {sr2.values} | value type = {type(sr2.values)}")
print(f"array => {sr2.array}")
print(sr2)

index => RangeIndex(start=0, stop=4, step=1)
value => [1 2 'a' 4.5] | value type = <class 'numpy.ndarray'>
array => <PandasArray>
[1, 2, 'a', 4.5]
Length: 4, dtype: object
0      1
1      2
2      a
3    4.5
dtype: object


In [22]:
# Dict 데이터로 Series 객체 생성
sr3 = pd.Series({"name": "Hong", "age": 12, "loc": "Daegu"})
sr3

name     Hong
age        12
loc     Daegu
dtype: object

In [23]:
# Series 객체 생성
sr2 = pd.Series(['a','b','c'])
sr2

0    a
1    b
2    c
dtype: object

In [24]:
# 인덱스 새로운 값으로 설정 => 객체변수명.속성명 = 새로운값
sr2.index = [11,22,33]
sr2

11    a
22    b
33    c
dtype: object

## 시리즈(Series) 객체의 원소/요소 다루기
- 방법
    - 시리즈 객체[인덱스 번호]
    - 시리즈 객체[인덱스 라벨]

In [32]:
# 1번 원소 읽기
sr2.index

Int64Index([11, 22, 33], dtype='int64')

In [33]:
sr2[22]
# sr2[0] -> 오류발생
# 정수 인덱스가 부여된 상태에서는 원래 정수 인덱스는 작동 안함

'b'

In [34]:
# 문자형 인덱스로 새롭게 설정
sr2.index=['one', 'two', 'three']
sr2.index

Index(['one', 'two', 'three'], dtype='object')

In [37]:
# 문자열 인덱스가 존재할때는 정수인덱스도 따로 부여됨
sr2['two'], sr2[1], sr2['three'], sr2[2]

('b', 'b', 'c', 'c')

In [40]:
sr3 = pd.Series({'name': '홍길동', 'age': 12})
sr3
sr3.index

Index(['name', 'age'], dtype='object')

In [42]:
sr3['name'], sr3[0], sr3['age'], sr3[1]

('홍길동', '홍길동', 12, 12)

In [46]:
sr4 = pd.Series(('2022-06-30', 'Pandas', True, 4.55, 'No Work', 'Coffee', 12345))
sr4.index = ['날짜', '과목', 'bool', '실수', '희망사항', '마실거', '숫자']
sr4

날짜      2022-06-30
과목          Pandas
bool          True
실수            4.55
희망사항       No Work
마실거         Coffee
숫자           12345
dtype: object

In [59]:
# (1) 0번요소, 3번요소, 4번요소 읽어서 출력
print(sr4[0], sr4[3], sr4[4])
print(sr4['날짜'], sr4['실수'], sr4['희망사항'])
print(sr4[[0,3,4]])
print(type(sr4[[0,3,4]]))
print('\n')

# (2) 1번요소부터 끝까지 요소값 출력
print(sr4[1:])
print(sr4['과목':])

2022-06-30 4.55 No Work
2022-06-30 4.55 No Work
날짜      2022-06-30
실수            4.55
희망사항       No Work
dtype: object
<class 'pandas.core.series.Series'>


과목       Pandas
bool       True
실수         4.55
희망사항    No Work
마실거      Coffee
숫자        12345
dtype: object
과목       Pandas
bool       True
실수         4.55
희망사항    No Work
마실거      Coffee
숫자        12345
dtype: object


In [62]:
# (3) 1번요소부터 3번요소까지 요소값 출력
print(sr4[1:4])
print(sr4['과목':'희망사항'])  # 인덱스 라벨은 끝원소로 포함

과목      Pandas
bool      True
실수        4.55
dtype: object
과목       Pandas
bool       True
실수         4.55
희망사항    No Work
dtype: object
