# Matplotlib
Matplotlib vẽ biểu đồ dữ liệu của bạn trên Figure s (ví dụ: windows, tiện ích Jupyter, v.v.), mỗi trong số đó có thể chứa một hoặc nhiều Axes , một khu vực nơi các điểm có thể được chỉ định theo thuật ngữ tọa độ x-y (hoặc theta-r trong biểu đồ cực, x-y-z trong biểu đồ 3D, v.v.). Cách đơn giản nhất để tạo Hình bằng Trục là sử dụng pyplot.subplots . Sau đó chúng ta có thể sử dụng Axes.plot để vẽ một số dữ liệu trên Trục và show để hiển thị hình:
```python
fig, ax = plt.subplots()             # Create a figure containing a single Axes.
ax.plot([1, 2, 3, 4], [1, 4, 2, 3])  # Plot some data on the Axes.
plt.show()                           # Show the figure.
```
vận dụng matplotlib để vẽ biểu đồ. Hãy nhìn vào những câu lệnh ở ví dụ visualization trên. Nếu tinh tế bạn sẽ thấy chúng ta trải qua các bước:

- Khởi tạo figure cho đồ thị: Muốn dựng một đồ thị thì trước tiên ta phải dựng khung cho nó thông qua hàm plt.figure(). Bên trong hàm này chúng ta khai báo kích thước (w, h) của đồ thị thông qua figuresize=(w, h).

- Vẽ biểu đồ: Sau khi đã có khung hình rồi, chúng ta sẽ tiến hành vẽ đồ thị. Tuỳ vào tính chất của dữ liệu mà chúng ta sẽ quyết định lựa chọn loại đồ thị phù hợp như đồ thị barchart, line, scatter, pie, area, boxplot. Bên trong hàm vẽ đồ thị chúng ta sẽ khai báo trục x và y và điều chỉnh các định dạng font chữ, màu sắc, loại đường viền đồ thị cho hài hoà và đẹp mắt.

- Khai báo tiêu đề: Chúng ta có thể tạo tiêu đề cho các trục x, y và tiêu đề của đồ thị.

In [None]:
# ! pip install seaborn imageio plotly-express

In [3]:
import matplotlib.pyplot as plt
import pandas as pd
import os
import numpy as np
import seaborn as sns
import plotly.express as px
# from matplotlib.animation import FuncAnimation
import imageio

# 1. Format chung của một biểu đồ trên matplotlib


In [None]:
plt.figure(figsize=(10, 6))
plt.title("Biểu đồ mẫu")
plt.xlabel("Trục X")
plt.ylabel("Trục Y")
plt.grid(True)

# 2. Các biểu đồ cơ bản trên matplotlib

In [None]:
# Line
x = np.linspace(0, 10, 100)
y = np.sin(x)
plt.plot(x, y, label='sin(x)')
plt.legend()
plt.show()

In [None]:
# Barchart
categories = ['A', 'B', 'C', 'D']
values = [3, 7, 5, 6]
plt.bar(categories, values, color='blue')
plt.title("Biểu đồ cột")
plt.xlabel("Danh mục")
plt.ylabel("Giá trị")
plt.show()

In [None]:
# Pie
labels = ['A', 'B', 'C', 'D']
sizes = [215, 130, 245, 210]
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
plt.title("Biểu đồ tròn")
plt.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.
plt.show()

In [None]:
# Scatter
x = np.random.rand(50)
y = np.random.rand(50)
colors = np.random.rand(50)
area = (30 * np.random.rand(50))**2  # Radius proportional to area
plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.title("Biểu đồ phân tán")
plt.xlabel("Trục X")
plt.ylabel("Trục Y")
plt.show()

# 3. Các biểu đồ nâng cao trên matplotlib

In [None]:
# Boxplot
data = [np.random.normal(0, std, 100) for std in range(1, 4)]
plt.boxplot(data)
plt.title("Biểu đồ hộp")
plt.xlabel("Nhóm")
plt.ylabel("Giá trị")
plt.show()

In [None]:
# Swarm
sns.set(style="whitegrid")
tips = sns.load_dataset("tips")
sns.swarmplot(x="day", y="total_bill", data=tips)
plt.title("Biểu đồ phân tán nón")
plt.show()

In [None]:
# Histogram
plt.hist(x, bins=20, color='green', alpha=0.7)
plt.title("Biểu đồ phân phối")
plt.xlabel("Giá trị")
plt.ylabel("Tần suất")
plt.show()

In [None]:
# Density
sns.kdeplot(x, color='red')
plt.title("Biểu đồ mật độ")
plt.xlabel("Giá trị")
plt.ylabel("Mật độ")
plt.show()

In [None]:
# Heatmap matrix
data = np.random.rand(10, 10)
sns.heatmap(data, annot=True, cmap='YlGnBu')
plt.title("Biểu đồ nhiệt")
plt.show()

# 4. Vẽ nhiều biểu đồ con trên một biểu đồ

In [None]:
fig, axs = plt.subplots(2, 2, figsize=(10, 8))
axs[0, 0].plot(x, y, label='sin(x)')
axs[0, 0].set_title('Line')
axs[0, 1].bar(categories, values, color='blue')
axs[0, 1].set_title('Barchart')
axs[1, 0].scatter(x, y, s=area, c=colors, alpha=0.5)
axs[1, 0].set_title('Scatter')
axs[1, 1].pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
axs[1, 1].set_title('Pie')
axs[1, 1].axis('equal')
plt.tight_layout()
plt.show()

# 5. Biểu đồ động từ gif file

In [None]:
# Tạo dữ liệu cho biểu đồ động
x = np.linspace(0, 2 * np.pi, 100)
y = np.sin(x)

# Tạo các khung hình cho biểu đồ động
frames = []
for i in range(100):
    plt.figure(figsize=(8, 6))
    plt.plot(x[:i], y[:i], label='sin(x)')
    plt.title("Biểu đồ động")
    plt.xlabel("Trục X")
    plt.ylabel("Trục Y")
    plt.legend()
    plt.xlim(0, 2 * np.pi)
    plt.ylim(-1.5, 1.5)
    plt.grid(True)
    filename = f'frame/frame_{i}.png'
    plt.savefig(filename)
    frames.append(imageio.imread(filename))
    plt.close()

# Lưu các khung hình thành file GIF
imageio.mimsave('animation.gif', frames, fps=10)

## Sử dụng plotly để biểu diễn dữ liệu giá phòng trên bản đồ (có thể bấm vào bản đồ để xem giá nhà tại từng điểm)

In [None]:
global relative_path
relative_path = r'data/AB_NYC_2019.csv'
if os.name == 'nt':
    relative_path = os.path.join(os.path.dirname(os.getcwd()), relative_path)
elif os.name == 'posix':
    relative_path = os.path.join(os.getcwd(), relative_path)

df = pd.read_csv(relative_path)

In [None]:
fig = px.scatter_mapbox(
    df,
    lat='latitude',
    lon='longitude',
    hover_name='name',
    hover_data=['room_type', 'price'],
    color='price',
    size='price',
    color_continuous_scale=px.colors.cyclical.IceFire,
    size_max=15,
    zoom=10,
    mapbox_style='carto-positron',
    title='Map of all listings'
)
fig.update_layout(margin=dict(l=0, r=0, t=0, b=0))
fig.update_layout(mapbox_style='carto-positron')
fig.show()
fig.write_html('map.html')