In [None]:
import pandas as pd
import random
import numpy as np
from datetime import datetime, timedelta

# Tham số cho loài Yến núi
species = "Yến núi"
status = "Nguy cơ"
initial_population = 500000

# Dữ liệu thời gian (từ 2004-01-01 đến 2024-12-31, cập nhật mỗi tuần)
start_date = datetime(2018, 1, 1)
end_date = datetime(2024, 12, 31)
dates = pd.date_range(start=start_date, end=end_date, freq='W')  # Cập nhật theo tuần

# Chức năng tạo mẫu dữ liệu với growth_rate ngẫu nhiên và xu hướng thay đổi
def generate_sample(species, date):
    # Tính toán dân số theo tỷ lệ tăng trưởng
    days_diff = (date - start_date).days
    week_diff = days_diff // 7
    
    # Xác định tỷ lệ tăng trưởng theo các giai đoạn
    if date <= datetime(2018, 12, 31):
        growth_rate = random.uniform(0.1, 0.3)  # Tăng trưởng mạnh từ 2004 đến 2012
    elif date <= datetime(2022, 12, 31):
        growth_rate = random.uniform(-0.02, 0.03)  # Zíc zắc từ 2012 đến 2018
    else:
        growth_rate = -0.001  # Giảm mạnh từ 2018 đến 2024, với tăng nhẹ không đáng kể
    
    # Tính toán dân số với tỷ lệ tăng trưởng
    population = int(initial_population * ((1 + growth_rate / 4) ** week_diff))  # Dân số theo tuần

    # Di cư: Ngẫu nhiên chọn từ "Có", "Không", "Một phần"
    migration = random.choice(["Có", "Không", "Một phần"])

    # Tỷ lệ sinh sản: Giá trị ngẫu nhiên từ 1 đến 5
    breeding_rate = round(random.uniform(1, 5), 2)

    # Rủi ro săn mồi: "Thấp", "Trung bình", "Cao"
    predation_risk = random.choice(["Thấp", "Trung bình", "Cao"])

    # Mối đe dọa môi trường: Ngẫu nhiên số từ 1-10
    environmental_threat = random.randint(1, 10)

    # Sách đỏ: "Có" hoặc "Không", dựa trên loài
    red_list_status = "Có" if status == "Sách đỏ" else "Không"

    # Mùa: Xuân, Hạ, Thu, Đông
    season = random.choice(["Xuân", "Hạ", "Thu", "Đông"])

    # Vùng: "Đồng bằng", "Đồi núi", "Trung du"
    region = random.choice(["Đồng bằng", "Đồi núi", "Trung du"])

    # Loại rừng: "Nhiệt đới", "Ôn đới", "Rừng ngập mặn"
    forest_type = random.choice(["Nhiệt đới", "Ôn đới", "Rừng ngập mặn"])

    # Đô thị hóa: Tỷ lệ phần trăm từ 0-100
    urbanization = random.randint(0, 100)

    # Tạo một dict cho mỗi mẫu
    sample = {
        "Tên loài": species,
        "Số lượng": population,
        "Diện tích sinh sống (km²)": random.randint(10, 500),
        "Di cư": migration,
        "Tỷ lệ sinh sản": breeding_rate,
        "Rủi ro săn mồi": predation_risk,
        "Mối đe dọa môi trường": environmental_threat,
        "Sách đỏ": red_list_status,
        "Thời gian": date.strftime("%Y-%m-%d"),
        "Mùa": season,
        "Vùng": region,
        "Loại rừng": forest_type,
        "Đô thị hóa": urbanization
    }

    return sample

# Tạo dữ liệu cho Yến núi từ 2004 tới 2024
samples = []
for date in dates:
    samples.append(generate_sample(species, date))

# Tạo DataFrame
df = pd.DataFrame(samples)

# Xem trước một số mẫu dữ liệu
print(df.head())

# Lưu dữ liệu vào file CSV
df.to_csv("yen_nui_species_data_2004_2024.csv", index=False)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Đọc dữ liệu từ file CSV
df = pd.read_csv("yen_nui_species_data_2004_2024.csv")

# Chuyển cột "Thời gian" thành kiểu datetime
df['Thời gian'] = pd.to_datetime(df['Thời gian'])

# Vẽ đồ thị dân số theo thời gian
plt.figure(figsize=(10, 6))
plt.plot(df['Thời gian'], df['Số lượng'], label="Dân số Yến núi", color='b')
plt.title("Dân số loài Yến núi từ 2004 đến 2024")
plt.xlabel("Năm")
plt.ylabel("Số lượng")
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.legend()
plt.show()