### 3.10 Matplotlib Histograms

**Histogram** (biểu đồ tần suất) dùng để **biểu diễn phân bố dữ liệu liên tục**.

* Biểu đồ chia dữ liệu thành các **khoảng (bins)**.
* Trục **X**: giá trị dữ liệu
* Trục **Y**: số lượng (frequency) dữ liệu rơi vào mỗi khoảng


**3.10.1. Tạo histogram cơ bản**

Hàm: `plt.hist()`

Cú pháp cơ bản:

```python
plt.hist(data, bins=10)
```

* `data`: mảng dữ liệu số
* `bins`: số lượng khoảng chia dữ liệu (mặc định = 10)


In [None]:
import matplotlib.pyplot as plt
import numpy as np

data = np.random.randint(1, 50, 100)  # 100 số ngẫu nhiên từ 1-50

plt.hist(data, bins=10)
plt.show()


* Kết quả: biểu đồ cột, mỗi cột đại diện cho **số điểm dữ liệu rơi vào bin tương ứng**.


**3.10.2. Thay đổi số bins**

In [None]:
plt.hist(data, bins=5)   # ít bin → mỗi cột rộng hơn
plt.hist(data, bins=20)  # nhiều bin → mỗi cột hẹp hơn

**3.10.3 Thay đổi màu cột**

In [None]:
plt.hist(data, bins=10, color="green")  # tất cả cột màu xanh
#Hoặc dùng mã hex
#plt.hist(data, bins=10, color="#ff5733")

**3.10.4. Thêm độ dày viền cột (edgecolor)**

In [None]:
plt.hist(data, bins=10, color="orange", edgecolor="black", linewidth=1.2)

* `edgecolor`: màu viền cột
* `linewidth`: độ dày viền

**3.10.5 Histogram nhiều nhóm (so sánh)**

In [None]:
data1 = np.random.randint(1, 50, 100)
data2 = np.random.randint(1, 50, 100)

plt.hist([data1, data2], bins=10, color=["red", "blue"], label=["Nhóm 1", "Nhóm 2"])
plt.legend()
plt.show()

* Mỗi nhóm sẽ có màu khác nhau để dễ so sánh.

**3.10.6. Thêm title, labels, grid**

In [None]:
plt.hist(data, bins=10, color="skyblue", edgecolor="black")
plt.title("Biểu đồ Histogram")
plt.xlabel("Giá trị")
plt.ylabel("Tần suất")
plt.grid(axis="y", linestyle="--", alpha=0.5)
plt.show()

* `grid(axis="y")`: thường dùng cho trục Y → dễ quan sát tần suất.


**Tham số quan trọng của `plt.hist()`**

| Tham số       | Ý nghĩa                                     |
| ------------- | ------------------------------------------- |
| `x`           | Dữ liệu (mảng số)                           |
| `bins`        | Số khoảng chia dữ liệu                      |
| `color`       | Màu cột                                     |
| `edgecolor`   | Màu viền cột                                |
| `linewidth`   | Độ dày viền                                 |
| `cumulative`  | True → tính tích lũy                        |
| `label`       | Nhãn nhóm (nếu nhiều nhóm)                  |
| `orientation` | `'vertical'` hoặc `'horizontal'`            |
| `density`     | True → chuẩn hóa tần suất thành tỷ lệ (0–1) |


---

### 3.11 Matplotlib Pie Charts


**Pie Chart** (biểu đồ tròn) dùng để **biểu diễn tỷ lệ (%) của các phần tử trong tổng thể**.

* Mỗi **miếng tròn** đại diện cho một nhóm hoặc danh mục.
* Kích thước miếng tỉ lệ thuận với giá trị của nhóm.
* Rất hữu ích để **nhìn nhanh tỷ trọng giữa các nhóm**.


**3.11.1. Tạo Pie Chart cơ bản**
Hàm: `plt.pie()`

Cú pháp cơ bản:
```python
plt.pie(sizes)
```
* `sizes`: mảng dữ liệu giá trị (không cần chuẩn hóa)
* Mỗi phần tử trong `sizes` sẽ được tính tỷ lệ dựa trên tổng.

In [None]:
# Ví dụ

sizes = [15, 30, 45, 10]  # 4 nhóm
plt.pie(sizes)
plt.show()

* Kết quả: 4 miếng tròn, kích thước tỉ lệ 15:30:45:10

**3.11.2. Thêm nhãn (labels)**

In [None]:
labels = ["Nhóm A", "Nhóm B", "Nhóm C", "Nhóm D"]
plt.pie(sizes, labels=labels)
plt.show()

* Mỗi miếng có **tên nhóm** tương ứng.

**3.11.3.  Thêm tỷ lệ phần trăm (autopct)**
* Tham số: `autopct='%1.1f%%'`
* Hiển thị **tỷ lệ phần trăm trên từng miếng**.


In [None]:
plt.pie(sizes, labels=labels, autopct='%1.1f%%')
plt.show()

**3.11.5 Thay đổi màu (colors)**

* Có thể dùng tên màu hoặc mã HEX.

In [None]:
colors = ["red", "green", "blue", "orange"]
plt.pie(sizes, labels=labels, colors=colors, autopct='%1.1f%%')
plt.show()

**3.11.6 Đẩy miếng ra ngoài (explode)**

* Tham số: `explode` — danh sách giá trị, phần tử tương ứng với nhóm, giá trị từ 0 → 1
* Miếng có giá trị >0 sẽ **tách ra khỏi tâm**.

In [None]:
explode = [0, 0.1, 0, 0.2]  # nhóm B hơi tách ra, nhóm D tách nhiều hơn
plt.pie(sizes, labels=labels, autopct='%1.1f%%', explode=explode)
plt.show()

**3.11.7 Thêm shadow (bóng)**
* Tham số: `shadow=True` → tạo bóng dưới miếng tròn, trực quan hơn.


In [None]:
plt.pie(sizes, labels=labels, autopct='%1.1f%%', explode=explode, shadow=True)
plt.show()

**3.11.8 Thay đổi hướng vẽ (startangle)**
* `startangle` thiết lập **góc bắt đầu vẽ miếng đầu tiên** (theo độ, mặc định 0°).

![img](https://www.w3schools.com/python/img_matplotlib_pie_angles.png)

In [None]:
plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
plt.show()

* 90° → miếng đầu tiên nằm trên trục dọc, rất phổ biến để biểu đồ cân đối.


**3.11.9 Tổng hợp ví dụ nâng cao**

In [None]:
sizes = [25, 35, 20, 20]
labels = ["Nhóm A", "Nhóm B", "Nhóm C", "Nhóm D"]
colors = ["gold", "yellowgreen", "lightcoral", "lightskyblue"]
explode = [0.1, 0, 0, 0.05]

plt.pie(
    sizes,
    labels=labels,
    colors=colors,
    autopct='%1.1f%%',
    shadow=True,
    explode=explode,
    startangle=140
)
plt.axis('equal')
plt.title("Tỷ lệ các nhóm")
plt.legend(title = "Các nhóm:")
plt.show()

* Kết quả: biểu đồ tròn đẹp, màu sắc nổi bật, có tỷ lệ phần trăm, có bóng, và một vài miếng tách ra để nhấn mạnh.


**Tham số quan trọng của `plt.pie()`**

| Tham số          | Ý nghĩa                              |
| ---------------- | ------------------------------------ |
| `x` hoặc `sizes` | Mảng giá trị cho từng nhóm           |
| `labels`         | Tên nhóm (hiển thị trên biểu đồ)     |
| `colors`         | Danh sách màu cho từng miếng         |
| `explode`        | Tách miếng khỏi tâm (nhấn mạnh)      |
| `autopct`        | Hiển thị tỷ lệ phần trăm (%)         |
| `shadow`         | True → tạo bóng phía dưới miếng      |
| `startangle`     | Góc bắt đầu vẽ (0° là phía bên phải) |

---