# 그래프 종류와 설명


*   선 그래프(Line Plot)
> 선 그래프는 데이터 값이 시간 또는 다른 연속 변수에 따라 어떻게 변하는지 시각적으로 표현하는 데 사용됩니다.
*   막대 그래프(Bar Plot)
> 막대 그래프는 카테고리형 데이터의 빈도나 분포를 시각화하는 데 사용됩니다.
*   히스토그램(Histogram)
> 히스토그램은 수치형 데이터의 분포를 나타내며 데이터를 여러 구간으로 나누고 각 구간에 속한 데이터 포인트 수를 시각적으로 표시합니다.
*   산점도(Scatter Plot)
> 산점도는 두 변수 간의 관계를 시각화하는 데 사용되며 각 데이터 포인트가 독립적으로 표시됩니다.
*   상자 그림 (Box Plot)
> 데이터의 분포와 이상치를 동시에 보여주면서 서로 다른 데이터군을 쉽게 비교할 수 있는 데이터 시각화 유형입니다.
*   원 그래프(Pie Chart)
> 원 그래프는 카테고리의 상대적인 비율을 시각화하는 데 사용됩니다.
*   히트맵 (Heatmap)
> 히트 맵(heat map)은 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합시킨 단어로, 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분포 형태의 비쥬얼한 그래픽으로 출력하는 것이 특징입니다.




---

---


# Pandas
쉽고 직관적인 Python 라이브러리

### Pandas 사용법
1. 임포트
<br>import pandas as pd

2. 데이터 불러오기
<br>df = pd.read_csv('address.csv')
<br>df.head(5)

3. 그래프 선택
<br>(생략)

4. 옵션 설정
<br>df['value'].plot(kind='line', x='date', y='value', title='Air Quality', ...)


### 선 그래프(Line Plot)

In [None]:
import pandas as pd
air_quality_pm25_long = pd.read_csv('https://raw.githubusercontent.com/pandas-dev/pandas/master/doc/data/air_quality_pm25_long.csv', index_col='date.utc', parse_dates=True)
air_quality_pm25_long.head(5)

Unnamed: 0_level_0,city,country,location,parameter,value,unit
date.utc,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2019-06-18 06:00:00+00:00,Antwerpen,BE,BETR801,pm25,18.0,µg/m³
2019-06-17 08:00:00+00:00,Antwerpen,BE,BETR801,pm25,6.5,µg/m³
2019-06-17 07:00:00+00:00,Antwerpen,BE,BETR801,pm25,18.5,µg/m³
2019-06-17 06:00:00+00:00,Antwerpen,BE,BETR801,pm25,16.0,µg/m³
2019-06-17 05:00:00+00:00,Antwerpen,BE,BETR801,pm25,7.5,µg/m³


In [None]:
# 'BETR801' 지역 데이터만 추출
filtered_BETR801 = air_quality_pm25_long[air_quality_pm25_long['location'] == 'BETR801']
filtered_BETR801

# 'date.utc' 컬럼을 datetime 형식으로 변환 후 날짜 형식으로 다시 변환
filtered_BETR801.index = filtered_BETR801.index.strftime('%Y-%m-%d')
filtered_BETR801

# 인덱스 컬럼 이름 변경
filtered_BETR801.index.set_names('date', inplace=True)
filtered_BETR801

# 'date' 열을 기준으로 데이터프레임 정렬
filtered_BETR801 = filtered_BETR801.sort_values(by='date', ascending=True)
filtered_BETR801

Unnamed: 0_level_0,city,country,location,parameter,value,unit
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2019-05-07,Antwerpen,BE,BETR801,pm25,12.5,µg/m³
2019-05-07,Antwerpen,BE,BETR801,pm25,14.0,µg/m³
2019-05-08,Antwerpen,BE,BETR801,pm25,14.0,µg/m³
2019-05-08,Antwerpen,BE,BETR801,pm25,14.5,µg/m³
2019-05-09,Antwerpen,BE,BETR801,pm25,4.5,µg/m³
...,...,...,...,...,...,...
2019-06-17,Antwerpen,BE,BETR801,pm25,7.5,µg/m³
2019-06-17,Antwerpen,BE,BETR801,pm25,16.0,µg/m³
2019-06-17,Antwerpen,BE,BETR801,pm25,18.5,µg/m³
2019-06-17,Antwerpen,BE,BETR801,pm25,6.5,µg/m³


In [None]:
# 'BETR801' 지역의 최저 date.utc 값 찾기
min_date_BETR801 = filtered_BETR801[filtered_BETR801]['date'].min()

# 'BETR801' 지역의 최고 date.utc 값 찾기
max_date_BETR801 = filtered_BETR801[filtered_BETR801]['date'].max()

# 출력
print("BETR801 지역의 최저 date:", max_date_BETR801)
print("BETR801 지역의 최고 date:", max_date_BETR801)

ValueError: ignored

In [None]:
# 볼륨확인
row_count = len(air_quality_pm25_long[air_quality_pm25_long['location'] == 'BETR801'])
print("레코드 수:", row_count)

In [None]:
# 날짜 역순 정렬
air_quality_pm25_long = air_quality_pm25_long.sort_values(by='date.utc', ascending=True)

# 라인차트 옵션
min_date_BETR801.plot(
    kind='line',
    x='date.utc',
    y='value',
    title='Air Quality',
    color='red',
    figsize=(20, 6),
    xlabel='Date',
    ylabel='PM',
    grid=True,
    linestyle='-',
    legend=True,
    label='PM_Value',
    xlim=(0, 1150),
    ylim=(0, 60)
)

### 막대 그래프

In [None]:
# 바 차트 옵션
air_quality_pm25_long.plot(
    kind='bar',
    x='date.utc',
    y='value',
    title='Air Quality',
    color='red',
    figsize=(20, 6),
    xlabel='Date',
    ylabel='PM',
    grid=True,
    legend=True,
    label='PM_Value',
    xlim=(0, 100),
    ylim=(0, 60)
)

### 히스토그램

In [None]:
df['column'].plot(kind='hist')

### 산점도

In [None]:
df.plot(kind='scatter', x='column1', y='column2')

### 박스 플롯

In [None]:
df.boxplot(column='column')



---



# Matplotlib
가장 기본적이고 널리 사용되는 데이터 시각화 라이브러리

### Matplotlib 사용법

In [None]:
# 임포트
import matplotlib.pyplot as plt
# 데이터 적재

# 그래프 선택
(생략)
# 옵션 설정


### 선 그래프(Line Plot)

In [None]:
x = [1, 2, 3, 4, 5]
y = [10, 12, 5, 8, 7]

plt.plot(x, y)
plt.xlabel('X 축')
plt.ylabel('Y 축')
plt.title('선 그래프')
plt.show()

### 산점도(Scatter Plot)

In [None]:
x = [1, 2, 3, 4, 5]
y = [10, 12, 5, 8, 7]

plt.scatter(x, y)
plt.xlabel('X 축')
plt.ylabel('Y 축')
plt.title('산점도')
plt.show()

### 막대 그래프(Bar Plot)

In [None]:
categories = ['A', 'B', 'C', 'D']
values = [30, 45, 15, 25]

plt.bar(categories, values)
plt.xlabel('카테고리')
plt.ylabel('빈도')
plt.title('막대 그래프')
plt.show()

### 히스토그램(Histogram)

In [None]:
data = [1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7]

plt.hist(data, bins=5)
plt.xlabel('값')
plt.ylabel('빈도')
plt.title('히스토그램')
plt.show()

### 원 그래프(Pie Chart)

In [None]:
labels = ['A', 'B', 'C', 'D']
sizes = [20, 30, 25, 15]

plt.pie(sizes, labels=labels, autopct='%1.1f%%')
plt.title('원 그래프')
plt.show()



---



# Seaborn
Seaborn은 Matplotlib을 기반으로한 라이브러리로, 더 간편하고 예쁜 시각화를 위한 고수준 인터페이스를 제공

### Seaborn 사용법

In [None]:
# 임포트
import seaborn as sns
import matplotlib.pyplot as plt
# 데이터 불러오기
tips = sns.load_dataset("tips")
# 그래서 선택
(생략))
# 옵션 설정
sns.set_palette("Set2")   # 팔레트(Color Palette): Set2 팔레트 설정
plt.xlabel("Total Bill")  # 축 레이블과 제목 추가
plt.ylabel("Tip")
plt.title("Scatter Plot of Total Bill vs. Tip")

### 산포도 그래프 (Scatter Plot)

In [None]:
sns.scatterplot(x="total_bill", y="tip", data=tips)

### 히스토그램 (Histogram)

In [None]:
sns.histplot(tips["total_bill"], bins=10, kde=True)

### 상자 그림 (Box Plot)

In [None]:
sns.boxplot(x="day", y="total_bill", data=tips)

### 막대 그래프 (Bar Plot)

In [None]:
sns.barplot(x="day", y="total_bill", data=tips)

### 히트맵 (Heatmap)

In [None]:
correlation_matrix = tips.corr()
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm")



---



# Plotly
Plotly는 대화형 그래프를 생성하는 데 사용되는 라이브러리로, 온라인 플롯을 지원하며 사용자에게 훌륭한 대시보드를 제공


In [None]:
# Plotly 임포트
import plotly.express as px



---



# Bokeh
대화형 웹 기반 시각화를 만드는 데 사용되는 라이브러리

In [None]:
# Bokeh 임포트
from bokeh.plotting import figure, output_file, show



---



# Altair
JSON 형식의 Vega-Lite 사양을 생성하고 이를 시각화하는 Python 라이브러리

In [None]:
# Altair 임포트
import altair as alt



---



# ggplot
R의 ggplot2 패키지를 모방하여 만들어진 라이브러리로, "plotnine"이라고도 알려져 있음

In [None]:
# ggplot 임포트
from plotnine import *




---
---
참고용 데이터셋 출처는 '데이터리안' 입니다.

`#데이터리안` `#판다스공부` `#TIL`