<a href="https://colab.research.google.com/github/twotablepush/OpenCV/blob/main/11_Pandas_%EA%B8%B0%EB%B3%B8_%EC%82%AC%EC%9A%A9%EB%B2%95.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Pandas 란?
- 데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리
- Numpy와 함께 사용되어 다양한 연계적인 기능을 제공
- Index에 따라 데이터를 나열하므로 사전 자료형에 가깝다.
- Series를 기본적인 자료형으로 사용
- Excel과 거의 똑같다.

## Series 란?
- Series는 인덱스(Index)와 값(value)으로 구성


In [None]:
# 시리즈 사용해보기

import pandas as pd

array = pd.Series(['사과', '바나나', '당근'], index=['a', 'b', 'c'])

print(array)
print(array['a'])

a     사과
b    바나나
c     당근
dtype: object
사과


In [None]:
import pandas as pd

data = {
    'a': '사과',
    'b': '바나나',
    'c': '당근'
}

array = pd.Series(data) # Dictionary 자료형을 Series로 바꾸기
print(array['a'])

사과


## 데이터 프레임이란?
- 다수의 Series를 모아 처리하기 위한 목적으로 사용
- 표 형태로 데이터를 손쉽게 출력하고자 할 때 사용할 수 있다.

In [None]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근'
}

frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)

# 이름(Name), 값(Values)
summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency
})

print(summary)

       word  frequency
Apple    사과          3
Banana  바나나          5
Carrot   당근          7


## Series의 연산
- Series를 서로 연산하여 새로운 Series를 만들 수 있다.

In [None]:
import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
}

price_dict = {
    'Apple' : 300,
    'Banana' : 400,
    'Carrot' : 350
}

frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7
}

word = pd.Series(word_dict)
price = pd.Series(price_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word' : word,
    'price' : price,
    'frequency' : frequency
})

amount = summary['price'] * summary['frequency']
summary['amount'] = amount

print(summary)

       word  price  frequency  amount
Apple    사과    300          3     900
Banana  바나나    400          5    2000
Carrot   당근    350          7    2450


In [None]:
# 데이터 프레임의 슬라이싱

import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
    'Durian' : '두리안'
}

price_dict = {
    'Apple' : 300,
    'Banana' : 200,
    'Carrot' : 100,
    'Durian' : 500
}

frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7,
    'Durian' : 2
}

word = pd.Series(word_dict)
price = pd.Series(price_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word' : word,
    'price' : price,
    'frequency' : frequency
})

print(summary)

# 이름을 기준으로 슬라이싱
print(summary.loc['Banana' : 'Carrot', 'frequency' :])

# 인덱스를 기준으로 슬라이싱
print(summary.iloc[1 : 3, 2 :])

       word  price  frequency
Apple    사과    300          3
Banana  바나나    200          5
Carrot   당근    100          7
Durian  두리안    500          2
        frequency
Banana          5
Carrot          7
        frequency
Banana          5
Carrot          7


In [None]:
# 데이터 프레임의 연산

import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근',
    'Durian' : '두리안'
}

price_dict = {
    'Apple' : 300,
    'Banana' : 200,
    'Carrot' : 100,
    'Durian' : 500
}

frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7,
    'Durian' : 2
}

word = pd.Series(word_dict)
price = pd.Series(price_dict)
frequency = pd.Series(frequency_dict)

summary = pd.DataFrame({
    'word' : word,
    'price' : price,
    'frequency' : frequency
})

print(summary)

summary.loc['Apple', 'price'] = 100 # 데이터 변경
summary.loc['Mango'] = ['망고', 400, 10] # 새 데이터 삽입

print(summary)

       word  price  frequency
Apple    사과    300          3
Banana  바나나    200          5
Carrot   당근    100          7
Durian  두리안    500          2
       word  price  frequency
Apple    사과    100          3
Banana  바나나    200          5
Carrot   당근    100          7
Durian  두리안    500          2
Mango    망고    400         10


In [None]:
# 엑셀로 내보내기 / 불러오기

import pandas as pd

word_dict = {
    'Apple' : '사과',
    'Banana' : '바나나',
    'Carrot' : '당근'
}

frequency_dict = {
    'Apple' : 3,
    'Banana' : 5,
    'Carrot' : 7
}

word = pd.Series(word_dict)
frequency = pd.Series(frequency_dict)

# 이름(Name), 값(Values)
summary = pd.DataFrame({
    'word' : word,
    'frequency' : frequency
})

summary.to_csv('summary.csv', encoding='utf-8-sig') # 내보내기
saved = pd.read_csv('summary.csv', index_col=0) # 불러오기
print(summary)

       word  frequency
Apple    사과          3
Banana  바나나          5
Carrot   당근          7
