In [None]:
%matplotlib inline

In [None]:
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

### Cơ bản về mô phỏng dữ liệu

Dân số TP. HCM từ 1996 đến 2013 được cung cấp trong file `hcmc_population.dat`.

In [None]:
pop = np.genfromtxt('hcmc_population.dat')

_Yêu cầu:_ Hãy tạo một mảng `year` (`np.array`) gồm các số từ 1996 đến 2013.

In [None]:
# Code

`subplots` là một đối tượng tạo ra một hình ảnh chứa một hoặc nhiều biểu đồ. Nó trả về một tuple gồm đối tượng toàn hình ảnh (`fig`) và các hệ trục tọa độ (`axes`). Tham khảo ví dụ sau:

In [None]:
fig, axes = plt.subplots()
axes.plot(year, pop, 'bs') # Blue, square
axes.set_xlabel('Năm')
axes.set_ylabel('Triệu người')
axes.set_title('Dân số TPHCM qua các năm');

### `xticks` và `yticks`

Nhưng trong ảnh trên, các năm lại không hiển thị theo số nguyên, nhìn mất tự nhiên. Chúng ta sẽ cấu hình lại để đánh dấu cứ hai năm một lần.

In [None]:
axes.set_xticks(year[0::2])
fig

### Dùng hàm để vẽ

_Yêu cầu:_ Gọi $r$ là tỉ lệ tăng dân số trung bình hằng năm từ 1996 đến 2013. Tính $r$.

In [None]:
def cal_avg_rate():
    # Code
    pass

In [None]:
r = 0.02
def f(x):
    return pop[0]*((1+r)**(x - 1995))

fig, axes = plt.subplots()
axes.plot(year, f(year), 'r-') # Red

Đặt tên trục hoành, trục tung, tên biểu đồ cho phù hợp.

In [None]:
# Code

### Bảng chú thích (Legend)

Giờ chúng ta muốn so sánh kết quả này qua phép ngoại suy so với số liệu thực tế bằng cách đặt chồng hai đường này vào một hệ trục. Lúc này đòi hỏi mỗi lần `axes.plot(...)` phải đặt tham số `label`.

Sau cùng dùng lệnh `axes.legend(loc=x)` để hiển thị bảng chú thích, trong đó `x` là vị trí của bảng chú thích trong hệ trục:
- `loc=0`: `matplotlib` tự chọn vị trí tối ưu đặt bảng chú thích
- `loc=1`: Góc phải trên
- `loc=2`: Góc trái trên
- `loc=3`: Góc trái dưới
- `loc=4`: Góc phải dưới

In [None]:
fig, ax = plt.subplots()
ax.plot(year, f(year), 'r', label="Interpolation") # Red
ax.plot(year, pop, 'b', label="Thực tế") # Blue
ax.set_xlabel("Năm")
ax.set_ylabel("Triệu người")
ax.set_title("Dân số TPHCM qua các năm");
ax.set_xticks(year[0::2])
ax.legend(loc=2)
plt.show(fig)

### Định dạng đường

Trong ví dụ trên đưa ra hai loại đường là đỏ và xanh, được gọi trong hàm `axes.plot(...)`. Ngoài ra ta còn có thể truyền vào hàm này nhiều tham số khác:
- `color`: có thể là `red`, `blue`, etc. hoặc `r`, `b`, etc. hoặc mã hex RGB của màu (ví dụ như `#FF3300`)
- `linewidth`, hay `lw`: độ dày của đường, nhận một số thực
- `linestyle`, hay `ls`: kiểu đường, các giá trị có thể là `-`, `--`, `-.`, `:`, `steps`
- `marker`: ký hiệu điểm, có thể là `o`, `+`, `*`, `s`, etc.
- https://matplotlib.org/api/_as_gen/matplotlib.axes.Axes.plot.html

### Định dạng chữ

In [None]:
# Default
matplotlib.rcParams.update({'font.size': 12, 'font.family': 'sans', 'text.usetex': False})

_Yêu cầu:_ Đặt `text.usetex` về `True`. Sau đó hãy thử vẽ đồ thị hàm $y=x^2$ và $y=x+40$ trên cùng một hình giới hạn trục hoành khoảng $[0;10]$. Đặt tên trục hoành, trục tung, và tiêu đề. Tạo bảng chú thích. Quan sát sự khác biệt về kiểu chữ.

In [None]:
# Code

Một điểm đáng tiếc là nếu bạn đặt `text.usetex=true` thì tiêu đề của bạn không được chứa ký tự tiếng Việt.

### Hiển thị nhiều hệ trục trong một figure và các loại biểu đồ khác nhau

Có thể tùy chỉnh `nrows` (số dòng), `ncols` (số cột), và `figsize` (kích thước ảnh).

Nếu `nrows=1` thì `axes` sẽ là mảng một chiều, ngược lại `axes` là mảng hai chiều.

In [None]:
fig, axes = plt.subplots(nrows=2, ncols=3, figsize=(12, 10))
axes[0][0].scatter(x, np.random.randn(50))
axes[0][0].grid(True)

axes[0][1].hist(np.random.randn(50))

axes[0][2].step(x[::10], x[::10]+40)

axes[1][0].plot(x, x**2)

axes[1][1].fill_between(x, 1.0/(x+1), x/5, color="green", alpha="0.2")

axes[1][2].bar(x[::10], 2**x[::10], color="red")

plt.show(fig)

Trên đây là những cái nhìn tổng quát về thư viện `matplotlib`, đủ để bạn tiếp cận và mô phỏng dữ liệu bằng Python. Trong quá trình nghiên cứu nếu xuất hiện thêm những nhu cầu mới bạn có thể Google.