<a href="https://colab.research.google.com/github/brian110326/pandas/blob/main/01_Series.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### [참고] <a href="https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf">Pandas Cheat Sheet</a>

## 데이터 타입

### 1.Series(https://pandas.pydata.org/docs/reference/api/pandas.Series.html)

<img src="https://bites-data.s3.us-east-2.amazonaws.com/series_spreadsheet.png" width="300" height="200">

In [None]:
import pandas as pd
import numpy as np
# pandas 장점 : package 설치 필요 X

### 생성
#### 1) 리스트

In [None]:
# list에서 시리즈 생성

series = pd.Series([70,60,80])

In [None]:
# index를 지정하지 않는다면 자동으로 0부터 시작
print(series)

0    70
1    60
2    80
dtype: int64


#### 2) 딕셔너리

In [None]:
series = pd.Series({"a":1, "b":2, "c":3})

In [None]:
# dictionary의 경우 key값이 index로 정의됨
print(series)

a    1
b    2
c    3
dtype: int64


In [None]:

series = pd.Series([70,60,80], index=["국어","영어","수학"])

In [None]:
print(series)

국어    70
영어    60
수학    80
dtype: int64


#### 3) ndarray

In [None]:
series = pd.Series(np.random.randn(4), index=list("abcd"))
print(series)

a    0.443851
b    0.085067
c   -1.189586
d   -0.646307
dtype: float64


#### 4) DataFrame 이용

In [None]:
df = pd.DataFrame({"a":[1,2,3,4], "b":[5,6,7,8]})

In [None]:
print(df)

   a  b
0  1  5
1  2  6
2  3  7
3  4  8


In [None]:
series = pd.Series(df["a"])
print(series)

0    1
1    2
2    3
3    4
Name: a, dtype: int64


### 조회

In [None]:
series = pd.Series([70,60,80], index=["국어","영어","수학"])
print(series)

국어    70
영어    60
수학    80
dtype: int64


In [None]:
# index 조회
series.index

Index(['국어', '영어', '수학'], dtype='object')

In [None]:
# value 조회
series.values

array([70, 60, 80])

In [None]:
# series name 조회
series.name

'점수'

In [None]:
# name 부여
series = series.rename("점수")

In [None]:
print(series)

국어    70
영어    60
수학    80
Name: 점수, dtype: int64


- 인덱싱 가능 (인덱스 번호 혹은 라벨명)

In [None]:
series[0]

70

In [None]:
series["국어"]

70

In [None]:
# 0, 2번 조회
print(series[0:3:2])
print(series[[0,2]])

국어    70
수학    80
Name: 점수, dtype: int64
국어    70
수학    80
Name: 점수, dtype: int64


- 전체 구조 파악

In [None]:
series.shape
# (3,) ==> 3행

(3,)

In [None]:
# head() : 앞쪽 데이터 5행을 가져옴
series.head()

국어    70
영어    60
Name: 점수, dtype: int64

In [None]:
series.head(2)

In [None]:
# tail() : 마지막에서 5개 가져오기
series.tail()

국어    70
영어    60
수학    80
Name: 점수, dtype: int64

In [None]:
series.tail(2)

영어    60
수학    80
Name: 점수, dtype: int64

### 수정
><b>index 수정</b>

In [None]:
series.index = ["미술","음악","체육"]
print(series.index)

Index(['미술', '음악', '체육'], dtype='object')


><b>특정 값 수정</b>

In [None]:
series["미술"] = 77
print(series["미술"])

77


><b>데이터 타입 변경</b>

In [None]:
series1 = pd.Series([1,1,1])
print(series1)

0    1
1    1
2    1
dtype: int64


In [None]:
# astype(변경할타입) ==> 원본이 바뀌지않음
series1.astype("float")

0    1.0
1    1.0
2    1.0
dtype: float64

In [None]:
# 원본 변경
series1 = series1.astype("float")
print(series1)


0    1.0
1    1.0
2    1.0
dtype: float64


**astype 사용 시 주의점 : 변경할 수 없는 데이터가 들어있는 경우**

In [None]:
series1 = pd.Series(["1.1","2.2","3.3"]) # object
series1.astype("float")

0    1.1
1    2.2
2    3.3
dtype: float64

In [None]:
# series1 = pd.Series(["text","2.2","3.3"]) # object
# series1.astype("float")

### 삭제
><b>특정 행 삭제</b>

In [None]:
series

미술    77
음악    60
체육    80
Name: 점수, dtype: int64

In [None]:
del series["체육"]

In [None]:
series

미술    77
음악    60
Name: 점수, dtype: int64