# 판다스

* Series: 1차원 배열 구조(index)
* DataFrame: 2차원 배열 구조(행, 열)
* [10 minutes to pandas 사이트](https://pandas.pydata.org/docs/user_guide/10min.html)

# Series 클래스

* 1차원의 배열 구조
* 인덱스 레이블(label)에 이름을 붙여서 처리할 수 있다.
* Series는 판다스 모듈의 가장 기본적인 클래스이다.

## Series 객체 만들기

In [1]:
import pandas as pd

In [2]:
s = pd.Series([1, 2, 3, 4], index=list('abcd'))

In [3]:
s

a    1
b    2
c    3
d    4
dtype: int64

In [4]:
s.values

array([1, 2, 3, 4], dtype=int64)

## 시리즈의 메타 정보 확인

In [5]:
s.index

Index(['a', 'b', 'c', 'd'], dtype='object')

In [6]:
s.shape, s.ndim, s.size  # 형상, 차원, 크기

((4,), 1, 4)

## 색인 검색

In [7]:
# index 이름 또는 index 위치로 원소 조회
s[0], s['a']

(1, 1)

## 슬라이스 검색

In [8]:
# index position으로 조회
s[0:2]

a    1
b    2
dtype: int64

In [9]:
# index name으로 조회
s['a':'c']

a    1
b    2
c    3
dtype: int64

## 슬라이스로 생성한 객체는 사본 객체가 아니다. 같은 메모리를 공유한다.

In [10]:
sv = s['a':'c']

In [11]:
# 같은 데이터를 참조하는지 확인(같은 메모리 공유 여부)
import numpy as np

In [12]:
# True로 판다스는 슬라이스로 생성한 객체는 같은 데이터를 공유한다.
np.may_share_memory(sv, s) 

True

In [13]:
sv

a    1
b    2
c    3
dtype: int64

In [14]:
sv['a'] = 999

In [15]:
sv

a    999
b      2
c      3
dtype: int64

In [16]:
s

a    999
b      2
c      3
d      4
dtype: int64

## 레이블을 사용해서 색인 연산으로 원소 추가 가능하다. 

* numpy, list에서는 불가했다.

In [17]:
# 색인연산으로 원소 추가
s['e'] = 100

In [18]:
s

a    999
b      2
c      3
d      4
e    100
dtype: int64

In [19]:
# 정수 index로 추가는 안된다.
try:
    s[5] = 200
except Exception as e:
    print(e)

index 5 is out of bounds for axis 0 with size 5


## 데이터프레임으로 전환

In [20]:
# 데이터프레임으로 전환하면 하나의 열을 가진 데이터프레임으로 변환한다.
s.to_frame()

Unnamed: 0,0
a,999
b,2
c,3
d,4
e,100
