In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import hashlib
import plotly
import plotly.express as px



In [None]:

df = pd.read_csv(r"athlete_events.csv")


In [None]:
print(df['Age'].median())
print(df['Age'].mean())


In [None]:
df = df.fillna({
    'Age': df['Age'].median(),
    'Height': df['Height'].median(),
    'Weight': df['Weight'].median()
})

df = df.astype({'Age': 'uint8', 'Height': 'uint8', 'Weight': 'uint8', 'ID': 'uint32' , 'Year': 'int16'})
df.info()

In [None]:
print(df['Age'].median())
print(df['Age'].mean())


# ITALIA

In [None]:
# Anonymisera namn med SHA-256
df["Name"] = df["Name"].apply(
    lambda x: hashlib.sha256(str(x).encode()).hexdigest()
)

# Fyll tomma medaljer med "None" = ingen medalj
df["Medal"] = df["Medal"].fillna("None")


ita = df[df["NOC"] == "ITA"].copy()

ita.head()


In [None]:
# Top 10 sporter där Italien tagit flest medaljer

# En meddalj per lag, för att få korrekt OS statistik 
ita_medals_unique = (
    ita[ita["Medal"] != "None"]
    .drop_duplicates(subset=["Games", "Event", "Medal"])
)

medals_by_sport = (
    ita_medals_unique
    .groupby("Sport")["Medal"]
    .count()
    .sort_values(ascending=False)
)

fig = px.bar(
    medals_by_sport.head(10),
    title="Top 10 sporter där Italien tagit flest medaljer",
    labels={"index": "Sport", "value": "Antal medaljer"}
)
fig.show()

# Top 5 sporter med flest italienska deltagare

participants_by_sport = (
    ita
    .drop_duplicates(subset=["Games", "ID"])   # en deltagare per sport + OS
    .groupby("Sport")["ID"]
    .count()
    .sort_values(ascending=False)
)

fig = px.bar(
    participants_by_sport.head(5),
    title="Top 5 sporter med flest italienska deltagare",
    labels={"index": "Sport", "value": "Antal deltagare"}
)
fig.show()



In [None]:
# Sommar-OS
ita_summer_unique = (
    ita[
        (ita["Medal"] != "None") &
        (ita["Season"] == "Summer")
    ]
    .drop_duplicates(subset=["Games", "Event", "Medal"])
)

medals_by_games_summer = (
    ita_summer_unique
    .groupby("Games")["Medal"]
    .count()
    .reset_index()
)

fig = px.line(
    medals_by_games_summer,
    x="Games",
    y="Medal",
    title="Medaljer per OS - Italien Sommar",
    markers=True
)
fig.show()

# Vinter-OS
ita_winter_unique = (
    ita[
        (ita["Medal"] != "None") &
        (ita["Season"] == "Winter")
    ]
    .drop_duplicates(subset=["Games", "Event", "Medal"])
)

medals_by_games_winter = (
    ita_winter_unique
    .groupby("Games")["Medal"]
    .count()
    .reset_index()
)

fig = px.line(
    medals_by_games_winter,
    x="Games",
    y="Medal",
    title="Medaljer per OS - Italien Vinter",
    markers=True
)
fig.show()


In [None]:
# Histogram över åldrar för italienska 

fig = px.histogram(
    ita,
    x="Age",
    nbins=30,                     
    title="Åldersfördelning - Italienska OS-idrottare",
    labels={"Age": "Ålder"},
)

fig.show()


In [None]:
fig = px.pie(ita, names="Sex", title="Könsfördelning - Italien")
fig.show()

In [None]:
# Antal deltagare per OS – Sommar 
ita_summer_participants = (
    ita[ita["Season"] == "Summer"]
    .drop_duplicates(subset=["Games", "ID"])     # en deltagare per OS
    .groupby("Games")["ID"]
    .count()
    .reset_index()
)

fig = px.line(
    ita_summer_participants,
    x="Games",
    y="ID",
    title="Antal italienska deltagare per OS - Sommar",
    markers=True,
    labels={"ID": "Antal deltagare"}
)
fig.show()


ita_winter_participants = (
    ita[ita["Season"] == "Winter"]
    .drop_duplicates(subset=["Games", "ID"])     # en deltagare per OS
    .groupby("Games")["ID"]
    .count()
    .reset_index()
)

fig = px.line(
    ita_winter_participants,
    x="Games",
    y="ID",
    title="Antal italienska deltagare per OS - Vinter",
    markers=True,
    labels={"ID": "Antal deltagare"}
)
fig.show()



# Fencing

In [None]:
fencing = ita[ita["Sport"] == "Fencing"].copy()

fencing_unique_medals = (
    fencing[fencing["Medal"] != "None"]
    .drop_duplicates(subset=["Games", "Event", "Medal"])
)


In [56]:
medals_by_type = (
    fencing_unique_medals
    .pivot_table(
        index="Year",
        columns="Medal",
        values="ID",      # bara för count
        aggfunc="count",
        fill_value=0
    )
    .reset_index()
)

fig1 = px.bar(
    medals_by_type,
    x="Year",
    y=["Gold", "Silver", "Bronze"],
    title="Italy Fencing - Medals per Year",
    labels={"value": "Number of Medals", "variable": "Medal Type"},
    color_discrete_map={
    "Gold": "#F6D411",
    "Silver": "#D7D4D4",
    "Bronze": "#CD7532"
}
)
fig1.update_layout(barmode="stack")
fig1.show()

# Beräkna totala medaljer per år
medals_type_cols = [c for c in medals_by_type.columns if c in ["Gold", "Silver", "Bronze"]]
medals_by_type["Total"] = medals_by_type[medals_type_cols].sum(axis=1)

fig2 = px.line(
    medals_by_type,
    x="Year",
    y="Total",
    markers=True,
    title="Italy Fencing - Total Medals per Year",
    labels={"Total": "Total Medals"}
)
fig2.show()


1900–1920 – Uppbyggnadsperiod
Italien har en lång fäktningstradition, men sporten är ännu inte centraliserad nationellt. Träningen sker i lokala fäktskolor och militära akademier, och framgångarna beror främst på individuella mästare snarare än på ett enhetligt system.

1920–1936 – Den stora guldåldern
Under denna period exploderar Italiens OS-framgångar i fäktning. Fascistregimen använder idrott som propaganda och investerar tungt i elitverksamhet. Fäktning prioriteras särskilt eftersom sporten symboliserar disciplin, tradition, kontroll och militär precision, ideal som regimen vill förknippas med.
På 1920- och 30-talet byggs specialiserade träningscenter, fäktning integreras i militär och polis, och italienska tränare utvecklar moderna tekniker som blir internationell standard. Resultatet är att Italien blir världsledande inom framför allt florett och sabel, med flera OS som domineras av italienska fäktare.

1948–1960 – Efterkrigsåterhämtning
Efter andra världskriget faller regimen, men fäktningens struktur finns kvar. Italien har fortfarande ett av världens bästa träningssystem, och nya talangfulla generationer växer fram. Fäktningen stabiliseras på en hög nivå, med återkommande OS-medaljer och flera internationella stjärnor.

1960–1980 – Dipp under “Blyåren” och hård global konkurrens
Under gli anni di piombo  “Blyåren” drabbas Italien av terrorism, politisk extremism, ekonomisk instabilitet och social oro. Idrotten tappar resurser, särskilt individuella tekniska sporter som fäktning. Samtidigt ökar konkurrensen kraftigt: Sovjet, Ungern och andra öststater driver extremt välfinansierade elitprogram.
Italien går dessutom igenom en generationsväxling och saknar tillfälligt samma bredd som under storhetstiden. Tillsammans leder detta till en markant nedgång i OS-resultaten.

1980–Nutid – Modernisering och ny uppbyggnad
Från 1980-talet börjar Italien reformera sina fäktningsförbund och modernisera träningsmetoderna. Nya fäktskolor, förbättrade ungdomsprogram och mer professionell fysisk träning återuppbygger sportens nivå. Under slutet av 80-talet och 90-talet återvänder Italien till medaljtoppen i flera discipliner.

In [55]:
# Fäktning för alla länder
fencing_all = df[df["Sport"] == "Fencing"].copy()

fencing_all_unique_medals = (
    fencing_all[fencing_all["Medal"] != "None"]
    .drop_duplicates(subset=["Games", "Event", "Medal"])
)

medals_country = (
    fencing_all_unique_medals
    .groupby("NOC")["Medal"]
    .count()
    .reset_index()
    .sort_values("Medal", ascending=False)
)

px.bar(
    medals_country.head(20),
    x="NOC",
    y="Medal",
    title="Fencing  Medal Distribution by Country",
    labels={"NOC": "Country", "Medal": "Number of Medals"}
).show()


Italien ligger bland de allra främsta nationerna tillsammans med  Frankrike, Ungern och Ryssland, vilket speglar ländernas långa fäktningstraditioner och välutvecklade tekniska skolor. Grafen visar tydligt hur fäktningen är starkt centrerad till några få, historiskt etablerade fäktningsnationer

In [53]:

fencing = ita[ita["Sport"] == "Fencing"].copy()
fencing["Group"] = "Fencing"

other_sports = ita[ita["Sport"] != "Fencing"].copy()
other_sports["Group"] = "Other sports"

age_compare = pd.concat([fencing, other_sports], ignore_index=True)

# Medelålder per grupp
mean_age = (
    age_compare.groupby("Group")["Age"]
    .mean()
    .reset_index()
    .round(1)
)

fig = px.histogram(
    age_compare,
    x="Age",
    nbins=30,
    histnorm="percent",
    facet_row="Group",
    title="Age Distribution - Fencing vs Other Italian Sports",
    labels={"Age": "Age", "Group": "Group"}
)
fig.update_layout(
    height=700,
    margin=dict(t=80, b=40),
    font=dict(size=14),
)

# Adjust axes to remove the messy right-end overflow
fig.update_xaxes(range=[10, 50])     # adjust if you have older athletes
fig.update_yaxes(matches=None)
fig.show()


fäktare har en större andel aktiva i högre åldrar jämfört med andra sporter. Det speglar att fäktning är en tekniskt krävande sport där erfarenhet, precision och taktiskt kunnande gör att många når sin topp senare i karriären.

In [54]:
# Medaljer per eent
medals_by_event = (
    fencing_unique_medals
    .groupby("Event")["Medal"]
    .count()
    .sort_values(ascending=False)  
    .reset_index()
)

fig = px.bar(
    medals_by_event,
    x="Event",
    y="Medal",
    title="Italy Fencing - Medals per Event",
    labels={"Medal": "Number of Medals", "Event": "Event"}
)

fig.update_xaxes(tickangle=45)
fig.show()
