In [3]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
from sklearn.model_selection import train_test_split
from lightgbm import LGBMRegressor
from sklearn.metrics import mean_absolute_error, r2_score

# 1. Генерація штучних даних та навчання моделі (ці функції залишаються без змін)
def generate_synthetic_data(num_records=1000):
    np.random.seed(42)
    start_date = datetime(2025, 1, 1)

    cities = ['New York', 'Los Angeles', 'Chicago', 'Dallas', 'Houston', 'Atlanta', 'Miami', 'Phoenix']

    data = {
        'route_id': np.random.randint(101, 120, num_records),
        'start_city': np.random.choice(cities, num_records),
        'end_city': np.random.choice(cities, num_records),
        'date': [start_date + timedelta(days=np.random.randint(0, 365)) for _ in range(num_records)],
        'traffic_index': np.random.uniform(0.5, 5.0, num_records),
        'weather_impact': np.random.choice([0, 0.5, 1.0, 1.5, 2.0], num_records, p=[0.7, 0.1, 0.1, 0.05, 0.05]),
        'fuel_price_usd': np.random.uniform(3.0, 4.5, num_records),
        'social_unrest_flag': np.random.choice([0, 1], num_records, p=[0.95, 0.05]),
    }

    df = pd.DataFrame(data)
    df['delay_hours'] = np.maximum(0,
        np.random.normal(loc=2, scale=1.5, size=num_records) +
        df['traffic_index'] * 0.5 +
        df['weather_impact'] * 2 +
        df['social_unrest_flag'] * 5
    )

    return df

synthetic_data = generate_synthetic_data()

X = synthetic_data[['traffic_index', 'weather_impact', 'fuel_price_usd', 'social_unrest_flag']]
y = synthetic_data['delay_hours']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LGBMRegressor(random_state=42)
model.fit(X_train, y_train)


# 2. Функція для аналізу обраного маршруту
def analyze_route(start_city, end_city):
    if start_city == "" or end_city == "":
        print("Помилка: Будь ласка, оберіть місто відправлення та призначення.")
        return

    # Генерація штучних даних для обраного маршруту (для демонстрації)
    # У реальному проекті тут будуть збиратися дані в реальному часі
    np.random.seed(np.random.randint(1, 1000))
    current_data = pd.DataFrame([{
        'traffic_index': np.random.uniform(0.5, 5.0),
        'weather_impact': np.random.choice([0, 0.5, 1.0, 1.5, 2.0]),
        'fuel_price_usd': np.random.uniform(3.0, 4.5),
        'social_unrest_flag': np.random.choice([0, 1])
    }])

    predicted_delay = model.predict(current_data)[0]

    # Визначення факторів ризику
    risk_factors = []
    if current_data.loc[0, 'weather_impact'] > 1.0:
        risk_factors.append("несприятливі погодні умови")
    if current_data.loc[0, 'traffic_index'] > 3.0:
        risk_factors.append("висока інтенсивність трафіку")
    if current_data.loc[0, 'social_unrest_flag'] == 1:
        risk_factors.append("соціальні події (протести, страйки)")
    if not risk_factors:
        risk_factors.append("загальні фактори")

    # Формування та виведення звіту
    report = f"""
=====================================================
    ЗВІТ АНАЛІЗУ РИЗИКІВ ДЛЯ ОБРАНОГО МАРШРУТУ
=====================================================
Маршрут: {start_city} -> {end_city}
Дата аналізу: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}
-----------------------------------------------------
Прогнозована затримка: {predicted_delay:.2f} годин
-----------------------------------------------------
Ключові фактори ризику: {', '.join(risk_factors)}
-----------------------------------------------------
Деталі факторів:
- Інтенсивність трафіку (Індекс): {current_data.loc[0, 'traffic_index']:.2f}
- Вплив погоди (Індекс): {current_data.loc[0, 'weather_impact']:.1f}
- Ціна палива (USD): {current_data.loc[0, 'fuel_price_usd']:.2f}
- Соціальні події (прапор): {'Так' if current_data.loc[0, 'social_unrest_flag'] == 1 else 'Ні'}
=====================================================
"""
    print(report)

# Example usage (replace with your desired start and end cities)
analyze_route("New York", "Los Angeles")

[LightGBM] [Info] Auto-choosing row-wise multi-threading, the overhead of testing was 0.000063 seconds.
You can set `force_row_wise=true` to remove the overhead.
And if memory is not enough, you can set `force_col_wise=true`.
[LightGBM] [Info] Total Bins 517
[LightGBM] [Info] Number of data points in the train set: 800, number of used features: 4
[LightGBM] [Info] Start training from score 4.306833

    ЗВІТ АНАЛІЗУ РИЗИКІВ ДЛЯ ОБРАНОГО МАРШРУТУ
Маршрут: New York -> Los Angeles
Дата аналізу: 2025-09-24 22:54:21
-----------------------------------------------------
Прогнозована затримка: 6.41 годин
-----------------------------------------------------
Ключові фактори ризику: висока інтенсивність трафіку
-----------------------------------------------------
Деталі факторів:
- Інтенсивність трафіку (Індекс): 3.43
- Вплив погоди (Індекс): 0.5
- Ціна палива (USD): 3.37
- Соціальні події (прапор): Ні

