# 🏃 Analiza wyników Półmaratonu Wrocław 2024
**Autor:** Roman – *Aspiring Data Scientist & Python Streamlit Developer*

Ten notebook prezentuje szybki EDA na publicznych danych z półmaratonu. 
Można go uruchomić lokalnie po sklonowaniu repozytorium.


In [None]:
# Importy
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams["figure.figsize"] = (10,6)
plt.rcParams["axes.grid"] = True

# Wczytanie danych (ścieżka relatywna do repozytorium)
df = pd.read_csv("data/halfmarathon_wroclaw_2024__final.csv", sep=";")
df.head()

In [None]:
# Przygotowanie czasu w minutach
df['Czas'] = pd.to_datetime(df['Czas'], format='%H:%M:%S', errors='coerce').dt.time
df['Czas_min'] = df['Czas'].apply(lambda x: x.hour * 60 + x.minute + x.second/60 if pd.notnull(x) else np.nan)

# Metryki
total = len(df)
men = int((df['Płeć'] == 'M').sum())
women = int((df['Płeć'] == 'K').sum())

print(f"Liczba zawodników: {total}\nMężczyźni: {men}\nKobiety: {women}")

In [None]:
# Top 10 krajów
ax = df['Kraj'].value_counts().head(10).plot(kind='bar')
ax.set_title('Top 10 krajów uczestników'); ax.set_xlabel('Kraj'); ax.set_ylabel('Liczba zawodników')
plt.tight_layout(); plt.show()

In [None]:
# Histogram czasów
df['Czas_min'].dropna().hist(bins=30)
plt.title('Histogram czasu na mecie (minuty)'); plt.xlabel('Czas [min]'); plt.ylabel('Liczba zawodników')
plt.tight_layout(); plt.show()

In [None]:
# Top 5 zawodników
cols = ['Miejsce','Numer startowy','Imię','Nazwisko','Miasto','Kraj','Czas_min']
df.sort_values('Miejsce')[cols].head(5)

---
**Uwaga:** Jeżeli notebook jest uruchamiany w innym miejscu, upewnij się, że plik CSV znajduje się pod ścieżką `data/halfmarathon_wroclaw_2024__final.csv` lub zaktualizuj ścieżkę.
