## Series 자료형

### 1. Pandas 패키지

- 쉽고 직관적인 관계형 또는 분류된 데이터로 작업 할 수 있도록 설계된 빠르고 유연하며 표현이 풍부한 데이터 구조를 제공하는 Python 패키지
- 실용적인 실제 데이터 분석을 수행하기 위한 고수준의 객체를 사용할 수 있다
- 처리하는 데이터 종류: 재무, 통계, 사회 과학 및 다양한 엔지니어링 분야의 일반적인 사용 사례의 데이터

#### 1) Pandas 데이터 구조:
|차원|이름|설명|
|-|-|-|
|1차원|Series|균일한 유형의 배열로 표시된 1차원 데이터|
|2차원|DataFrame|행과 열이있는 크기가 가변적인 테이블 형식의 2차원 데이터|

#### 2) Pandas 사용 범위:
- SQL 테이블 또는 Excel 스프레드 시트에서와 같이 이질적으로 유형이 지정된 열이 있는 테이블 형식 데이터
- 정렬/미정렬 시계열 데이터
- 행/열 테이블이 포함 된 임의의 행렬 데이터
- 일반적인 통계 데이터 세트

### 2. Series 자료형
#### 1) Series 구조:
- pandas 패키지에 포한되어 있는 자료형으로 `list > numpy arrary > series` 순으로 기능이 확장된다
- 인덱스를 `명시적`으로 포함하고 있는 형태이며, 엑셀의 열 하나를 표현하고 있다고 이해할 수 있다

In [2]:
# 필요한 패키지 가져오기
from pandas import Series

In [6]:
# Series 만들기: 리스트나 numpy 배열을 통해 생성 가능 - 시리즈는 리스트 자료형을 가공하여 생성된 데이터 구조

items = [10, 30, 50, 70, 90]
column = Series(items)
column

0    10
1    30
2    50
3    70
4    90
dtype: int64

In [6]:
# 인덱스를 활용한 개별 값 확인
print(column[0])
print(column[2])

10
50


In [7]:
# 시리즈 값만 추출
column.values

array([10, 30, 50, 70, 90])

In [5]:
# 값에 대한 데이터 타입 확인: Numpy 배열임을 알 수 있다
type(column.values)

numpy.ndarray

In [9]:
# list 자료형으로 변환
mylist = list(column.values)
mylist

[10, 30, 50, 70, 90]

In [10]:
# 시리즈의 색인(index)만 추출
column.index

RangeIndex(start=0, stop=5, step=1)

In [11]:
# 색인의 데이터타입 확인
type(column.index)

pandas.core.indexes.range.RangeIndex

In [11]:
# 색인을 리스트로 변환
list(column.index)

[0, 1, 2, 3, 4]

#### 2) 조건 검색
- `이름[이름에 대한 조건식]`

In [15]:
print(column)
in1 = column[column > 30]
print(in1)

0    10
1    30
2    50
3    70
4    90
dtype: int64
2    50
3    70
4    90
dtype: int64


In [13]:
# AND 검색
in2 = column[column <= 70][column > 10]
in2

1    30
2    50
3    70
dtype: int64

In [14]:
# OR 검색
in3 = column[(column<=10) | (column >= 70)]
in3

0    10
3    70
4    90
dtype: int64

#### 3) Series 연산

In [16]:
# 인덱스를 직접 지정하면서 시리즈 만들기 

# -> 지난주 주말에 대한 매출액
week1 = Series([290000, 310000], index = ['sat', 'sun'])
week1

sat    290000
sun    310000
dtype: int64

In [17]:
# -> 이번주 주말에 대한 매출액
week2 = Series([120000, 220000], index=['sun', 'sat'])
week2

sun    120000
sat    220000
dtype: int64

- 시리즈 객체의 사칙연산: `index가 동일한 항목`끼리 연산 수행
    - 순서가 다르게 있어도 index가 동일한 항목끼리 알아서 찾아서 연산을 수행한다

In [20]:
merge = week1 + week2
merge

sat    510000
sun    430000
dtype: int64

#### 4) 시리즈.value.counts()
- `.value_counts()`is used to find the frequencies of a series
- 값별 얼마나 많이 있는지 센다

In [19]:
merge.value_counts()

510000    1
430000    1
Name: count, dtype: int64