# pandas Series Data type 판다스 시리즈 자료형

## 0. Pandas
- 데이터 처리 및 분석을 위한 라이브러리
- 대용량 데이터를 안정적이면서도 간편하게 처리
- 서로 다른 데이터타입으로 열단위들을 구성할 수 있음
(참고) Numpy : 전체 배열 원소를 동일한 타입으로 제한
- 주요 기능
    - 데이터 입출력 : csv, excel, RDB, JSON 등 다양한 포맷의 데이터를 효율적으로 처리할 수 있는 형식을 사용
    - 데이터 가공 : 분리, 결합, 계층, 피봇 등
    - 통계 분석 처리등

In [2]:
#pandas library, Series, DataFrame namespace 불러오기

import pandas as pd

## 1. Series Data type

- 1차원 배열과 유사한 자료형
    
- 색인(index) : 행 번호
    
    - 각각의 데이터에 부여하는 속성으로 기본값은 0부터 1씩 증가하는 숫자 지정
        
    - index 파라미터를 통해 새로운 값으로 변경 가능
    
    - 리스트, 튜플 타입으로 새로운 값을 전달해야하며 다차원 자료형은 사용할 수 없음
    
    - 전달하는 색인의 개수와 데이터의 개수가 일치해야 함

- 각각의 색인과 데이터가 매핑되어 있으므로 dictionary 자료형과 유사

- dict + index

- 여러 가지 데이터 타입 사용 가능
    
<img src="img/series_example.png" width="250" align="center">

<br>

- Series 생성

In [8]:
pd.Series()

  pd.Series()


Series([], dtype: float64)

### 1.1. Series 생성
- 하나의 값(숫자, 문자) 또는 자료형(리스트, 튜플, np 배열)으로 데이터 전달

### 1.2. Series 속성
- 속성은 소괄호를 붙이지 않음
- index : series 객체의 인덱스 배열을 반환
- values : series 객체의 데이터(값) 배열을 반환
- name : series 객체의 이름을 반환
- dtype : series 객체의 데이터 타입을 반환
- size : series 객체의 데이터 개수(길이)를 반환
- shape : series 객체의 구조(행, 열, 차원)를 반환

<br>

- 숫자 10을 data로 가지고 있는 Series

- data 해석 > 

1. 왼쪽 0: 자동으로 생성되는 기본 index 번호 > 0부터 시작
    
2. 오른쪽 10: 입력한 data value

In [12]:
sre_1 = pd.Series(10)

sre_1

0    10
dtype: int64

In [13]:
# 값을 얻을때는 인덱싱이나 슬라이싱을 활용함
sre_1[0]

10

In [14]:
# data 내부에 저장된  value 확인
sre_1.values

array([10], dtype=int64)

In [15]:
# index 번호 확인
# RangeIndex: dafault로 생성되는 index번호를 사용하는 경우 부여됨
sre_1.index

RangeIndex(start=0, stop=1, step=1)

In [16]:
# 문자
sre_2 = pd.Series("abc")
sre_2

0    abc
dtype: object

In [17]:
# data check
sre_2.values

array(['abc'], dtype=object)

In [18]:
# index check
sre_2.index

RangeIndex(start=0, stop=1, step=1)

In [19]:
# 리스트 자료형 Input
sre_3 = pd.Series([10, 20, 30])
sre_3

0    10
1    20
2    30
dtype: int64

In [20]:
# data check
sre_3.values # NumPy.ndarray

array([10, 20, 30], dtype=int64)

In [21]:
# index check
# 0 이상 3 미만 RangeIndex: 0, 1, 2
sre_3.index

RangeIndex(start=0, stop=3, step=1)

In [22]:
# item data type이 서로 다른 list data type input
sre_4 = pd.Series([10.3, "test", 2000, [1, 2, 3]])
sre_4

0         10.3
1         test
2         2000
3    [1, 2, 3]
dtype: object

In [23]:
# data type 특정지을 수 없을때 > dtype: object

In [24]:
# data check
sre_4.values

array([10.3, 'test', 2000, list([1, 2, 3])], dtype=object)

In [25]:
# index check
sre_4.index

RangeIndex(start=0, stop=4, step=1)

In [26]:
# dict data type > 자동으로 라벨 부여, key > index, value > data
sre_5 = pd.Series({'a':10, 'b':20, 'c':30})
sre_5

a    10
b    20
c    30
dtype: int64

In [27]:
# data check
sre_5.values

array([10, 20, 30], dtype=int64)

In [28]:
# index check
sre_5.index

Index(['a', 'b', 'c'], dtype='object')

In [29]:
# int index 병행 사용 가능
sre_5[0]

10

In [30]:
sre_5['a']

10