# 📦 Аналіз логістичних даних
# Цей ноутбук аналізує дані перевезень: середні значення, найвигідніші маршрути, найдовші по відстані та будує карту оптимальних маршрутів.

In [6]:
import pandas as pd
import matplotlib.pyplot as plt
import folium
from datetime import datetime
from geopy.geocoders import Nominatim
from tqdm import tqdm
import time
import openrouteservice
from openrouteservice import convert



# 📂 Завантаження Excel-файлу
# Ми зчитуємо файл `Loads 2024.xlsx` з аркуша `DATA`.

In [16]:
ORS_API_KEY = "eyJvcmciOiI1YjNjZTM1OTc4NTExMTAwMDFjZjYyNDgiLCJpZCI6IjRkNDI3MjgwYTJjZDRhYzNhMzVlZjM5ZTY5NmM2N2YyIiwiaCI6Im11cm11cjY0In0="

df = pd.read_excel("Loads 2024.xlsx", sheet_name="DATA")
df.head()

Unnamed: 0,start,end,Type,Load #,Type of load,Status,RC,Broker,From City,From State,To City,To State,Occupancy,Pallets,Material,Temperature,Type of transport,Rate,Miles,RPM
0,1/2/2024,1/8/2024,CONS,T38701,DRY,BILLED,52288462,ECHO,GURNEE,IL,SPARKS,NV,TL,22.0,Huel (Foodstuffs),DRY,ROAD,4000.0,1930.0,2.0725
1,1/2/2024,1/8/2024,CANCEL,T38702,DRY,AVAILABLE,28329665,COYOTE,RANCHO DOMINGUEZ,CA,DEKALB,IL,TL,25.0,,DRY,ROAD,3400.0,2114.0,1.6083
2,1/2/2024,1/8/2024,OTR,T38703,DRY,BILLED,9114765,PAM TRANS,OLD FORT,OH,MURFREESBORO,TN,TL,,FOOD,DRY,ROAD,1600.0,503.0,3.1809
3,1/2/2024,1/8/2024,OTR,T38704,TC,BILLED,10220974,SURGE TRANS,AURORA,IL,CENTER VALLEY,PA,TL,,GROCERY PRODUCTS,RPB,ROAD,2800.0,772.0,3.6269
4,1/2/2024,1/8/2024,OTR,T38705,TC,BILLED,11857671,TTC,EDMOND,OK,JANESVILLE,WI,TL,,liquid eggs,38-40F,ROAD,2400.0,812.0,2.9557


# 🧹 Очищення та передобробка
# Очищаємо дані від пропущених значень і рахуємо тривалість доставки.


In [33]:
df = df.dropna(subset=["Rate", "Miles", "From City", "To City", "Rate", "RPM", "start", "end"])
df["Miles"] = pd.to_numeric(df["Miles"], errors='coerce')
df["Rate"] = pd.to_numeric(df["Rate"], errors='coerce')
df["RPM"] = pd.to_numeric(df["RPM"], errors='coerce')
df["start"] = pd.to_datetime(df["start"])
df["end"] = pd.to_datetime(df["end"])
df["delivery_time_days"] = (df["end"] - df["start"]).dt.days

# 📊 Розрахунок аналітики
# Шукаємо середні значення, найдовший маршрут та найбільш прибутковий.

In [13]:
longest_trip = df.loc[df["Miles"].idxmax()]
most_profitable_trip = df.loc[df["RPM"].idxmax()]
avg_stats = {
    "Середній час доставки (днів)": df["delivery_time_days"].mean(),
    "Середня відстань (милі)": df["Miles"].mean(),
    "Середня оплата (Rate)": df["Rate"].mean(),
    "Середній RPM": df["RPM"].mean(),
    "Середня кількість палет": pd.to_numeric(df["Pallets"], errors='coerce').mean()
}

In [23]:
# Середні значення у вигляді таблиці
pd.DataFrame(avg_stats, index=["Значення"]).T

Unnamed: 0,Значення
Середній час доставки (днів),6.021605
Середня відстань (милі),1525.715057
Середня оплата (Rate),2665.071688
Середній RPM,2.114387
Середня кількість палет,28.138533


In [24]:
# Найвигідніший маршрут
most_profitable_trip = df.loc[df["RPM"].idxmax()]
most_profitable_trip[["From City", "To City", "Miles", "Rate", "RPM"]].to_frame(name="Найвигідніший маршрут")

Unnamed: 0,Найвигідніший маршрут
From City,STOCKTON
To City,STOCKTON
Miles,2.0
Rate,1200.0
RPM,600.0


In [25]:
# Найдовший маршрут
longest_trip = df.loc[df["Miles"].idxmax()]
longest_trip[["From City", "To City", "Miles", "Rate", "RPM"]].to_frame(name="Найдовший маршрут")

Unnamed: 0,Найдовший маршрут
From City,ALAMEDA
To City,VAN BUREN TWP
Miles,23700.0
Rate,2000.0
RPM,0.0844


In [27]:
# Топ  найдорожчих маршрутів
top_by_rate = df.sort_values(by="Rate", ascending=False).head(5)
top_by_rate[["From City", "To City", "Rate", "Miles", "RPM"]]

Unnamed: 0,From City,To City,Rate,Miles,RPM
8083,PATTERSON,LIVONIA,8850.0000,4237.0,2.0887
404,OXNARD,MELROSE PARK,8423.6504,2062.0,4.0852
713,OXNARD,MELROSE PARK,7973.6499,2062.0,3.8669
3301,NORMAL,BELLEVUE,7800.0000,388.0,20.1031
5798,BALDWIN PARK,OAK CREEK,7550.0000,2221.0,3.3994
...,...,...,...,...,...
2861,GROVE CITY,HAYWARD,5300.0000,2437.0,2.1748
5943,SANRA MARIA,MELROSE PARK,5300.0000,2290.0,2.3144
6324,ROMEOVILLE,RENO,5297.4600,1903.0,2.7837
7742,NEW PARIS,RENO,5282.5000,2023.0,2.6112


In [29]:
# Топ маршрутів з найнижчим RPM
top_cheapest = df[df["Rate"] > 0].sort_values(by="RPM").head(5)
top_cheapest[["From City", "To City", "Rate", "Miles", "RPM"]]

Unnamed: 0,From City,To City,Rate,Miles,RPM
1905,Markham,Concord,500.0,,0.0
845,SAN JOSE,GRAND RAPIDS,1880.0,,0.0
952,CAROL STREAM,GRAND PRAIRIE,2800.0,,0.0
7120,SAN JOSE,DALY CITY,450.0,,0.0
137,WASHINGTON,LOCKPORT,900.0,,0.0


# 🗺️ Побудова карти маршрутів (опціонально)
# Цей блок виконує геокодування та побудову маршрутів. **Розкоментуй для виконання.**

In [32]:
geolocator = Nominatim(user_agent="logistics-map")
ors_client = openrouteservice.Client(key=ORS_API_KEY)
m = folium.Map(location=[39.5, -98.35], zoom_start=4)

def geocode(city, state):
    try:
        location = geolocator.geocode(f"{city}, {state}")
        if location:
            return (location.latitude, location.longitude)
    except:
        return None

sample_df = df.head(5)

for _, row in tqdm(sample_df.iterrows(), total=sample_df.shape[0]):
    from_coords = geocode(row["From City"], row["From State"])
    to_coords = geocode(row["To City"], row["To State"])
    time.sleep(1)

    if from_coords and to_coords:
        try:
            coords = [(from_coords[1], from_coords[0]), (to_coords[1], to_coords[0])]
            route = ors_client.directions(coords)
            decoded = convert.decode_polyline(route['routes'][0]['geometry'])
            folium.PolyLine(
                locations=[(lat, lon) for lon, lat in decoded["coordinates"]],
                tooltip=f"{row['From City']} → {row['To City']} ({row['Miles']} mi)",
                color="blue"
            ).add_to(m)
            folium.Marker(location=from_coords, popup="From: " + row["From City"], icon=folium.Icon(color='green')).add_to(m)
            folium.Marker(location=to_coords, popup="To: " + row["To City"], icon=folium.Icon(color='red')).add_to(m)
        except Exception as e:
            print(f"❌ Помилка маршруту: {e}")

m

100%|██████████| 5/5 [00:17<00:00,  3.41s/it]
