In [None]:
!pip install -r requirements.txt

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pymongo import MongoClient

mongo_01_ip = 'nosql-router-01'
mongo_02_ip = 'nosql-router-02'
mongo_port1 = os.getenv('ROUTER_01_PORT')
mongo_port2 = os.getenv('ROUTER_02_PORT')
mongo_database = os.getenv('DATABASE_NAME')
mongo_user = os.getenv('ROOT_USERNAME')
mongo_password = os.getenv('ROOT_PASSWORD')

mongo_url = f'mongodb://{mongo_user}:{mongo_password}@{mongo_01_ip}:{mongo_port1},{mongo_02_ip}:{mongo_port2}/{mongo_database}?authSource=admin'
db = client[mongo_database]

# Načtení dat z kolekcí
df_addresses = pd.DataFrame(list(db.addresses.find()))
df_departures = pd.DataFrame(list(db.departures.find()))
df_sent_units = pd.DataFrame(list(db.sent_units.find()))

# Převod datumu
df_departures["reportedDateTime"] = pd.to_datetime(df_departures["reportedDateTime"])
df_sent_units["callDateTime"] = pd.to_datetime(df_sent_units["callDateTime"])

# Spojení dat
df = df_departures.merge(df_addresses, on="departure_id", how="left")
df_full = df.merge(df_sent_units.groupby("departure_id").agg({"unit": "count"}).rename(columns={"unit": "units_count"}), on="departure_id", how="left")
df_full["units_count"] = df_full["units_count"].fillna(0)

# -------------------------------
# ANALÝZA A VIZUALIZACE
# -------------------------------

# Počty výjezdů podle typu
plt.figure(figsize=(10,5))
df["type"].value_counts().plot(kind="bar", color="skyblue")
plt.title("Počty výjezdů podle typu")
plt.ylabel("Počet")
plt.xlabel("Typ výjezdu")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Výjezdy v čase (měsíční agregace)
df["month"] = df["reportedDateTime"].dt.to_period("M").astype(str)
monthly_counts = df["month"].value_counts().sort_index()
plt.figure(figsize=(12,6))
monthly_counts.plot(kind="line", marker='o')
plt.title("Počet výjezdů v čase (měsíčně)")
plt.ylabel("Počet výjezdů")
plt.xlabel("Měsíc")
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Průměrný počet jednotek na zásah podle typu výjezdu
avg_units_per_type = df_full.groupby("type")["units_count"].mean().sort_values(ascending=False)
plt.figure(figsize=(10,5))
avg_units_per_type.plot(kind="bar", color="orange")
plt.title("Průměrný počet jednotek na výjezd podle typu")
plt.ylabel("Průměrný počet jednotek")
plt.xlabel("Typ výjezdu")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Výjezdy podle okresu
plt.figure(figsize=(10,5))
df["district_name"] = df["district"].apply(lambda x: x.get("name") if isinstance(x, dict) else None)
df["district_name"].value_counts().plot(kind="bar", color="lightgreen")
plt.title("Počet výjezdů podle okresu")
plt.ylabel("Počet výjezdů")
plt.xlabel("Okres")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Korelace mezi počtem jednotek a typem zásahu (boxplot)
plt.figure(figsize=(10,6))
sns.boxplot(x="type", y="units_count", data=df_full)
plt.title("Rozložení počtu jednotek na výjezd podle typu zásahu")
plt.ylabel("Počet jednotek")
plt.xlabel("Typ zásahu")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()