In [25]:
import pandas as pd
import plotly.graph_objects as go

# Wczytanie danych z pliku CSV
data = pd.read_csv('men_800m.csv')

# Obliczanie liczby wystąpień każdego kraju
country_counts = data['Country'].value_counts()

# Wybieranie top 10 krajów
top_10_countries = country_counts.head(10)

# Tworzenie wykresu słupkowego
fig = go.Figure(data=[
    go.Bar(x=top_10_countries.index, y=top_10_countries.values)
])

# Dodawanie liczby wystąpień nad słupkami
fig.update_traces(text=top_10_countries.values, textposition='outside')

# Aktualizowanie tytułu i osi
fig.update_layout(
    title='Top 10 Countries in Marathon Data',
    xaxis_title='Country',
    yaxis_title='Count'
)

# Zapisywanie wykresu do pliku HTML
fig.write_html('top_10_countries.html')

In [30]:
import pandas as pd
import plotly.express as px
import re

# Funkcja do usunięcia litery na końcu wartości
def remove_last_character(value):
    pattern = r'[^0-9.]'  # Wzorzec do dopasowania niecyfrowych i nieliterowych znaków
    return re.sub(pattern, '', value)

# Wczytanie danych z pliku CSV
data = pd.read_csv('men_800m.csv')

# Konwersja kolumny 'Event Date' na typ daty
data['Event Date'] = pd.to_datetime(data['Event Date'], format='%d.%m.%Y')

# Usunięcie litery na końcu wartości w kolumnie 'Time'
data['Time'] = data['Time'].apply(remove_last_character)

# Konwersja kolumny 'Time' na liczbę zmiennoprzecinkową
data['Time'] = data['Time'].str.replace(',', '.').astype(float)

# Sortowanie wyników względem daty i czasu
data = data.sort_values(by=['Event Date', 'Time'])

# Inicjalizacja pustej listy do przechowywania najlepszych wyników
best_results = []

# Ustalenie daty początkowej
start_date = pd.to_datetime('1968-10-18', format='%Y-%m-%d')  # Zmiana daty początkowej

# Przeszukiwanie posortowanych danych w celu znalezienia progresji rekordu świata
current_best_time = float('inf')
for _, row in data.iterrows():
    if row['Event Date'] >= start_date:
        if row['Time'] < current_best_time:
            best_results.append(row)
            current_best_time = row['Time']

# Konwersja listy wyników do DataFrame
best_results = pd.DataFrame(best_results)

# Tworzenie wykresu punktowego
fig = px.scatter(best_results, x='Event Date', y='Time', title='Progresja rekordu świata - 800m mężczyzn')
fig.update_traces(mode='markers+lines')  # Dodanie linii łączących punkty

# Zapisywanie wykresu do pliku HTML
fig.write_html("WR_progression.html")