# Reshape - Pivot, Pivot_table, Melt
- Visual Python: Data Analysis > Reshape

#### 1. Pivot: Long format data --> Wide format data
#### 2. Melt: Wide format data --> Long format data
<img src="./data/reshape.png" width="500"/>

---

## Import Packages
- Visual Python: Data Analysis > Import

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

## 1 Pivot - Long to Wide format data

### Read data
- Visual Python: Data Analysis > File

In [None]:
df1 = pd.read_csv('data/pivot.csv')
df1

### 1.1 Wide format data로 변경 - index='date', columns='item', values='value'

In [None]:
# index, columns, values 는 모두 여러값을 리스트 형태로 지정 가능
df1.pivot(index='date', columns='item', values='value')

### 1.2 Wide format data로 변경 - index='date', columns='item'

In [None]:
# values 생략하면 모든값에 적용
df1.pivot(index='date', columns='item')

## 2 Melt - Wide to Long format data

### Read data
- Visual Python: Data Analysis > File

In [None]:
df2 = pd.read_csv('data/melt.csv')
df2

### 2.1 Long format data로 변경 - id_vars='date'

In [None]:
# value_vars 생략하면 모든 컬럼에 적용
df2.melt(id_vars='date')

### 2.2 Long format data로 변경(id_vars='date'), 생성된 데이터의 컬럼 이름을 'item', 'value1'으로 설정

In [None]:
# value_vars 생략하면 모든 컬럼에 적용
df2.melt(id_vars='date', var_name='item', value_name='value1')

### 2.2 Long format data로 변경 - id_vars='date', value_vars='infl'

In [None]:
# id_vars: 기준 컬럼, value_vars: 행으로 쌓을 컬럼
df2.melt(id_vars='date', value_vars='infl')

### 2.3 Long format data로 변경 - id_vars='date', value_vars='realgdp', 'unemp'

In [None]:
# id_vars, value_vars 는 모두 여러값을 리스트 형태로 지정 가능
df2.melt(id_vars='date', value_vars=['realgdp','unemp'])

## 3 Pivot_table

### Read data
- Visual Python: Data Analysis > File

In [None]:
df3 = pd.read_csv('data/pivot_table.csv')
df3

### 3.1 index='name', columns='subject', values='score', aggfunc='maen'

In [None]:
# Visual Python: Data Analysis > Reshape
df3.pivot_table(index='name', columns='subject', values='score', aggfunc='mean')

## [실습] 직접 해보기

## 실습 1. pivot, melt 데이터로 복습하기

#### 1 [Pivot] df1 데이터를 Wide format data로 변경하세요. (단  index='date', columns='item', values='value')

In [None]:
df1.pivot(index='date', columns='item', values='value')

#### 2 [Melt] df2 데이터를 Long format data로 변경하고 컬럼 이름을 '아이템', '밸류'로 설정하세요. (단 기준 컬럼은 'date', 쌓을 컬럼은 'infl', 'realgdp')

In [None]:
df2.melt(id_vars='date', value_vars=['infl','realgdp'], var_name='아이템', value_name='밸류')

## 실습 2. 새 데이터로 재구조화하기

In [None]:
score = pd.DataFrame({
    'name': ['김말이', '덕복이', '순대희', '김새우', '이우동', '박호'],
    'class': ['A', 'B', 'A', 'A', 'B', 'B'],
    'korean': [90, 80, 95, 88, 60, 75],
    'english': [80, 71, 88, 96, 100, 50],
    'mathematics': [100, 98, 70, 81, 60, 89]
})

#### Q. [melt] score 데이터를 활용해 과목들을 컬럼이 아닌 데이터로 재구조화하세요.
- `name`과 `class`는 그대로 표시하세요.
- `korean`, `english` `mathematics`를 `subject` 컬럼으로, 그 값인 점수를 `score` 컬럼으로 설정하세요.

In [None]:
# Visual Python: Data Analysis > Reshape
score.melt(id_vars=['name','class'], value_vars=['korean','english','mathematics'], var_name='subject', value_name='score')

---

In [None]:
# End of file