# Biblioteka Matplotlib

Matplotlib to kompleksowa biblioteka służąca to tworzenia statycznych i animowanych wizualizacji w Pythonie. Umożliwia dostosowanie wykresów pod dowolne wymagania i zapisanie ich w wysokiej jakości.

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib.patches import Patch
from matplotlib.lines import Line2D
from matplotlib.offsetbox import OffsetImage, AnnotationBbox

In [None]:
athlete_events = pd.read_csv('athlete_events.csv', sep=';')

athlete_events.info()

In [None]:
athlete_events.describe()

In [None]:
athlete_events.head()

--------------------
### Histogram

Histogram przedstawia rozłożenie różnych wartości w danej kategorii. Jego wygląd jest podobny do wykresu kolumnowego, jednak jego zastosowanie jest zupełnie inne i wykresy te nie powinny być ze sobą mylone.

##### ⭐ Zadanie 1: 

Przygotuj histogram (`hist`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z parametrami `bins` i `range` oraz dobierz dla nich takie wartości, które wg. Ciebie najlepiej wizualizują dane. Dodatkowo, zapoznaj się z parametrem `density`. Zadbaj o czytelność wykresu (tytuł wykresu oraz podpisy osi). 

In [None]:
fig, ax = plt.subplots(figsize=(10, 8))

n, bins, patches = ax.hist(athlete_events.Age, color='blue', edgecolor='black', linewidth=1, bins=20, range=(0, 100), alpha=1)
for i, patch in enumerate(patches):
    if bins[i] <= 18:
        patch.set_facecolor('green')
    elif 19 <= bins[i] <= 34:
        patch.set_facecolor('yellow')
    elif 35 <= bins[i] <= 60:
        patch.set_facecolor('orange')
    else:
        patch.set_facecolor('grey')

ax.legend(title='Grupy wiekowe', handles=[patches[0], patches[5], patches[10], patches[15]], labels=['niepełnoletni', 'młodzi dorośli', 'dorośli', 'seniorzy'])
ax.grid(axis='y')
ax.set_xlabel('Wiek sportowca', fontsize=12, labelpad=10)
ax.set_ylabel('Liczebność (skala logarytmiczna)', fontsize=12, labelpad=10)
ax.set_xticks(range(int(athlete_events.Age.min()), 101, 10))
ax.set_yscale('log')
ax.set_title('Rozkład wieku wszystkich sportowców', fontsize=14, pad=20)

old = plt.imread('age_gaps/old.png')
image_box = OffsetImage(old, zoom=0.1)
ab = AnnotationBbox(image_box, (85, 100), frameon=False)
ax.add_artist(ab)

adult = plt.imread('age_gaps/adult.png')
image_box = OffsetImage(adult, zoom=0.1)
ab = AnnotationBbox(image_box, (45, 3e4), frameon=False)
ax.add_artist(ab)

young = plt.imread('age_gaps/kids.png')
image_box = OffsetImage(young, zoom=0.1)
ab = AnnotationBbox(image_box, (8, 3e3), frameon=False)
ax.add_artist(ab)

plt.show()

##### ⭐ Zadanie 2:

Przygotuj dwuwymiarowy histogram (`hist2d`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi oraz legenda). 

In [None]:
weight_height = athlete_events.loc[(athlete_events.Sport == 'Swimming') & athlete_events.Weight.notna() & athlete_events.Height.notna(), ['Weight', 'Height']]

plt.hist2d(weight_height.Weight, weight_height.Height, bins=(11, 20), cmap='plasma')
plt.colorbar(label='Liczba pływaków')
plt.xlabel('Waga pływaka (kg)', labelpad=20)
plt.ylabel('Wzrost pływaka (cm)', labelpad=20)
plt.grid(True, linestyle="--", alpha=0.5)
plt.title('Zależność wagi do wzrostu pływaków', fontsize=14, pad=20)

##### ⭐ Zadanie 3:

Przygotuj dwuwymiarowy histogram z heksagonami (`hexbin`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z parametrem `gridsize` oraz dobierz dla niego taką wartość, która wg. Ciebie najlepiej wizualizuje dane. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi oraz legenda). 

In [None]:
plt.hexbin(weight_height.Weight, weight_height.Height, gridsize=15, cmap='plasma')

plt.colorbar(label='Liczba pływaków')
plt.xlabel('Waga pływaka (kg)', labelpad=20)
plt.ylabel('Wzrost pływaka (cm)', labelpad=20)
plt.grid(True, linestyle="--", alpha=0.5)
plt.title('Zależność wagi do wzrostu pływaków', fontsize=14, pad=20)

-------------------
### Wykres słupkowy i kolumnowy (skumulowany) 

Wykres kolumnowy i wykres słupkowy pokazuje jawne wartości dla pojedynczej lub dla wielu serii danych. Oś z wartościami liczbowymi powinna zaczynać się od 0, żeby uniknąć ukrytego przeskoku, który może dawać mylne złudzenie. Podpisy danych muszą być czytelne, zatem często są one umieszczone prostopadle do kolumn / słupków. <br/><br/>
Wykres kolumnowy lub słupkowy skumulowany dodatkowo rozróżnia kolejne serie danych, które są składnikami sumy końcowej dla wyświetlanych wartości. Serie danych najczęściej są rozróżniane kolorem, zatem do ich zrozumienia potrzebna jest legenda. 

##### ⭐ Zadanie 4:

Przygotuj wykres kolumnowy (`bar`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z parametrem `tick_label` i ustawieniami `xticks` oraz dobierz dla nich takie wartości, które wg. Ciebie najlepiej wizualizują dane. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi oraz podpis dla każdej kolumny).

In [None]:
median_men_height_ball = athlete_events.loc[
    (athlete_events.Sport.str.contains('ball')) &
    (athlete_events.Sex == 'M'), ['Height', 'Sport']].groupby(['Sport']).median()
polish = ['Siatkówka', 'Piłka ręczna', 'Piłka nożna', 'Siatkówka plażowa', 'Koszykówka', 'Baseball']

plt.figure(figsize=(10, 5))
plt.bar(
    x=median_men_height_ball.index,
    height=median_men_height_ball.Height,
    tick_label=polish,
    width=0.5,
    color='blue',
    edgecolor='black',
    linewidth=1.5,
    alpha=1,
)

for i in range(len(median_men_height_ball.index)):
    plt.text(i, median_men_height_ball.Height.iloc[i] + 5, median_men_height_ball.Height.iloc[i], ha='center', va='center')

plt.grid(axis='y', alpha=0.9)
plt.title('Mediana wzrostu mężczyzn w sportach z piłką', fontsize=14, pad=20)
plt.xlabel('Dyscyplina sportowa', labelpad=20)
plt.ylabel('Wzrost (cm)', labelpad=20)

ax = plt.gca()
ax.set_yticks(range(0, 226, 25))
ax.set_xticks(range(0, 6))

##### ⭐ Zadanie 5:

Przygotuj wykres słupkowy (`barh`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z funkcją `gca()` oraz ustawieniami `set_yticks` i `set_yticklabels`. Wykorzystaj je, żeby wyeliminować niestandardowe odstępy pomiędzy danymi. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi oraz podpis dla każdego słupka). 

In [None]:
top_10_winter_sports = athlete_events.loc[athlete_events.Season == 'Winter', 'Sport'].value_counts().head(10)
polish = ['Saneczkarstwo', 'Łyżwiarstwo szybkie na krótkim torze', 'Łyżwiarstwo figurowe', 'Skoki narciarskie', 'Bobsleje', 'Biathlon', 'Hokej na lodzie', 'Łyżwiarstwo', 'Narciarstwo alpejskie', 'Narciarstwo biegowe']

plt.figure(figsize=(10, 5))
plt.barh(
    y=top_10_winter_sports.index,
    width=top_10_winter_sports,
    height=0.5,
    color='blue',
    edgecolor='black',
    linewidth=1.5,
    alpha=1,
)

for i in range(len(polish)):
    plt.text(top_10_winter_sports.iloc[i] + 300, i, top_10_winter_sports.iloc[i], ha='center', va='center')

plt.grid(axis='x', alpha=0.9)
plt.title('Dziesięć najpopularniejszych zimowych dyscyplin', fontsize=14, pad=20)
plt.ylabel('Nazwa dyscypliny', labelpad=20)
plt.xlabel('Liczba sportowców', labelpad=20)

ax = plt.gca()
ax.set_xticks(range(0, 10001, 1000))
ax.set_yticks(range(0, 10))
ax.set_yticklabels(el for el in reversed(polish))

##### ⭐ Zadanie 6:

Przygotuj wykres kolumnowy (`bar`) opierając się na danych, które sam wybierzesz w sensowny sposób. Uwzględnij co najmniej 3 serie danych. Zapoznaj się z parametrem `width` oraz dobierz dla niego właściwą wartość mając na uwadze wizualizację określonej liczby serii danych. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi i podpis dla każdej grupy kolumn oraz legenda). 

In [None]:
medal_types = ['Gold', 'Silver', 'Bronze']
poland = (athlete_events.query(
    "NOC == 'POL' and Medal.notna() and Year >= 1948 and Year <= 1988 and Season == 'Summer'"
)[['Year', 'Medal', 'Event']]
          .drop_duplicates()
          .groupby(['Year', 'Medal'])
          .size()
          .unstack(fill_value=0)
          .reindex(columns=medal_types, fill_value=0)
          .stack()
          .reset_index(name='Count')
          )

locations = athlete_events.query("1948 <= Year <= 1988 and Season == 'Summer'")[['City', 'Year']].drop_duplicates()
locations.set_index('Year', inplace=True)
locations = locations.groupby(level=0).agg(lambda row: '\n'.join(map(str, row)))
locations = locations.index.astype(str) + '\n' + locations['City']

width = 0.9
xticks = [poland.Year.unique() - width, poland.Year.unique(), poland.Year.unique() + width]
colors = ['gold', 'silver', 'brown']
legend_elements = [
    Patch(facecolor=colors[0], edgecolor='black', label='złoto'),
    Patch(facecolor=colors[1], edgecolor='black', label='srebro'),
    Patch(facecolor=colors[2], edgecolor='black', label='brąz')
]

plt.figure(figsize=(12, 5))
for i, medal in enumerate(medal_types):
    plt.bar(
        x=xticks[i],
        height=poland.loc[(poland.Medal == medal), 'Count'],
        width=width,
        color=colors[i],
        edgecolor='black',
        linewidth=1.5,
        alpha=1,
    )
plt.legend(handles=legend_elements, title='Medal', loc='upper left')
plt.grid(axis='y', alpha=0.9)
plt.xticks(range(1948, 1989, 4), labels=locations)
plt.title('Medale Polski w czasie PRL na letnich igrzyskach', fontsize=14)
plt.xlabel('Data i miejsce igrzysk')
plt.ylabel('Liczba medali')

##### ⭐ Zadanie 7:

Przygotuj wykres kolumnowy skumulowany (`bar`) opierając się na danych, które sam wybierzesz w sensowny sposób. Uwzględnij co najmniej 3 serie danych. Zapoznaj się z parametrem `bottom` oraz dobierz dla niego właściwą wartość mając na uwadze wizualizację określonej liczby serii danych jako składników sumy. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi i podpis dla każdej kolumn oraz legenda). 

In [None]:
medal_types = ['Gold', 'Silver', 'Bronze']
locations = athlete_events.query("1948 <= Year <= 1988 and Season == 'Summer'")[['City', 'Year']].drop_duplicates()
locations.set_index('Year', inplace=True)
locations = locations.groupby(level=0).agg(lambda row: '\n'.join(map(str, row)))
locations = locations.index.astype(str) + '\n' + locations['City']

bottom = [0 for _ in range(len(locations) - 1)]
width = 0.9
colors = ['gold', 'silver', 'brown']
legend_elements = [
    Patch(facecolor=colors[0], edgecolor='black', label='złoto'),
    Patch(facecolor=colors[1], edgecolor='black', label='srebro'),
    Patch(facecolor=colors[2], edgecolor='black', label='brąz')
]

plt.figure(figsize=(12, 5))
for i, medal in enumerate(medal_types):
    plt.bar(
        x=poland.Year.unique(),
        height=poland.loc[(poland.Medal == medal), 'Count'],
        bottom=bottom,
        width=width,
        color=colors[i],
        edgecolor='black',
        linewidth=1.5,
        alpha=1,
    )
    bottom += poland.loc[(poland.Medal == medal), 'Count'].values
plt.legend(handles=legend_elements, title='Medal', loc='upper left')
plt.grid(axis='y', alpha=0.9)
plt.xticks(range(1948, 1989, 4), labels=locations)
plt.title('Medale Polski w czasie PRL na letnich igrzyskach', fontsize=14)
plt.xlabel('Data i miejsce igrzysk')
plt.ylabel('Liczba medali')

-------------------
### Wykres kołowy

Wykres kołowy przedstawia zależność pomiędzy obiektami, które są częścią całości. Każdy wycinek koła reprezentuje część składową obiektu. Dobrym zwyczajem jest umieszczanie wycinków w kolejności rosnącej lub malejącej, a nie losowej.

##### ⭐ Zadanie 8:

Przygotuj wykres kołowy (`pie`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z parametrami `normalize`, `explode` oraz `autopct`, `pctdistance`, `labels`, `labeldistance` i dobierz dla nich właściwe wartości, które wg. Ciebie najlepiej wizualizują dane. Zadbaj o czytelność wykresu (tytuł wykresu, podpis i wartość procentowa dla każdej części koła). 

In [None]:
counts = athlete_events.loc[athlete_events.Season == 'Summer', 'Sex'].value_counts()
counts['mężczyźni'] = counts.pop('M')
counts['kobiety'] = counts.pop('F')

plt.pie(
    x=counts,
    explode=[0.05, 0.05],
    labels=counts.index,
    colors=['grey', 'purple'],
    autopct='%1.1f%%',
    textprops={'fontsize': 14},
    radius=1,
    startangle=90,
    labeldistance=1.2,
    wedgeprops={'edgecolor': 'black', 'linewidth': 2},
    normalize=True,
    pctdistance=0.5,
    shadow=True,
)
plt.title('Liczebność kobiet i mężczyzn w igrzyskach letnich', fontsize=14)
plt.tight_layout()

##### ⭐ Zadanie 9:

Przygotuj wykres kołowy (`pie`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zastosuj co najmniej 3 serie danych i podziel te informacje na osobne podwykresy (`subplot`) jednego obrazu. Zapoznaj się z obiektami `figure` i `axes`. Zadbaj o czytelność wykresu (tytuł obrazu i każdego wykresu, podpis i wartość procentowa dla każdej części koła). 

In [None]:
last_four_summer_olympics = athlete_events.loc[(athlete_events.Year > 2000) & (athlete_events.Season == 'Summer'), ['Year', 'Sex']].groupby(['Year', 'Sex']).size().reset_index(name='Count')

fig, ax = plt.subplots(nrows=2, ncols=2, figsize=(14, 6))
titles = ['Atenach 2004', 'Pekinie 2008', 'Londynie 2012', 'Rio 2016']
legend_elements = [
    Patch(facecolor='purple', edgecolor='black', label='kobiety'),
    Patch(facecolor='grey', edgecolor='black', label='mężczyźni')
]
fig.legend(title='Płeć', handles=legend_elements, loc='upper center', bbox_to_anchor=(0.5, 0.6), ncol=1, fontsize=14, title_fontsize=14)

for i in range(4):
    x, y = divmod(i, 2)
    ax[x, y].pie(
        x=last_four_summer_olympics.loc[last_four_summer_olympics.Year == 2004 + i * 4, 'Count'],
        explode=[0.05, 0.05],
        colors=['purple', 'grey'],
        autopct='%1.1f%%',
        textprops={'fontsize': 11},
        radius=1,
        startangle=90,
        wedgeprops={'edgecolor': 'black', 'linewidth': 2},
        normalize=True,
        pctdistance=0.5,
        shadow=True,
    )
    ax[x, y].set_title(f'Podział płci podczas igrzysk w {titles[i]}', fontsize=11)

plt.suptitle('Podział płci na czterech letnich igrzyskach 2004–2016', fontsize=14)
plt.subplots_adjust(wspace=0.3, hspace=0.2, top=0.85)

--------------------
### Wykres liniowy

Wykres liniowy jest używany do wyświetlania ilościowych wartości w ciągłym okresie czasu. Idealnie sprawdza się do serii czasowej połączonej krzywą z co najmniej 10 danymi w każdej serii. Możliwe jest zaznaczenie kolejnych punktów na wykresie za pomocą znaczników. Co więcej, możliwe jest także wyłączenie samej linii, dzięki czemu tworzony jest wykres punktowy.

##### ⭐ Zadanie 10: 

Przygotuj wykres liniowy (`plot`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z funkcją `gca()` oraz ustawieniami `xaxis.grid` i `yaxis.grid`. Wykorzystaj je, żeby narysować linie pomocnicze dla wartości na wykresie. Zadbaj o czytelność wykresu (tytuł wykresu i podpisy osi). 

In [None]:
num_of_events_summer = athlete_events.loc[athlete_events.Season == 'Summer', ['Event', 'Year', 'City']].drop_duplicates().groupby(['Year', 'City']).count().reset_index()
num_of_events_summer.rename(columns={'Event': 'Count'}, inplace=True)

fig, ax = plt.subplots(figsize=(14, 6))

plt.plot(
    num_of_events_summer.Year,
    num_of_events_summer.Count,
    marker='o',
    markersize=8,
    linewidth=2,
    color='blue',
    label='Liczba konkurencji'
)

for i, row in num_of_events_summer.iterrows():
    if row['Year'] % 20 == 0 or row['Year'] == num_of_events_summer.Year.max():
        ax.annotate(f"{row['City']}\n({int(row['Count'])})",
                   (row['Year'], row['Count']),
                   xytext=(0, 10),
                   textcoords='offset points',
                   ha='center',
                   fontsize=10,
                   fontweight='bold')

ax.axvspan(1914, 1918, alpha=0.2, color='gray', label='I Wojna Światowa')
ax.axvspan(1939, 1945, alpha=0.2, color='gray', label='II Wojna Światowa')

ax.xaxis.grid(True, which='major', linestyle='-', linewidth=0.8, color='#cccccc')
ax.yaxis.grid(True, which='major', linestyle='-', linewidth=0.8, color='#cccccc')

ax.yaxis.set_major_locator(plt.MultipleLocator(50))
ax.yaxis.set_minor_locator(plt.MultipleLocator(25))
ax.xaxis.set_major_locator(plt.MultipleLocator(20))
ax.xaxis.set_minor_locator(plt.MultipleLocator(4))

plt.title('Ewolucja liczby konkurencji w letnich igrzyskach olimpijskich', fontsize=14, pad=20)
plt.xlabel('Rok', fontsize=12, labelpad=10)
plt.ylabel('Liczba konkurencji', fontsize=12, labelpad=10)

legend_elements = [
    Line2D([0], [0], marker='o', color='blue', label='Liczba konkurencji', markersize=8, linewidth=2),
    Patch(facecolor='gray', edgecolor='gray', alpha=0.2, label='I i II Wojna Światowa'),
    Line2D([0], [0], color='red', lw=1, label='Igrzyska odwołane (X)', linestyle='--')
]

plt.legend(handles=legend_elements, loc='upper left')

cancelled_years = [1916, 1940, 1944]
for year in cancelled_years:
    plt.axvline(x=year, color='red', linestyle='--', alpha=0.7)
    
ww = plt.imread('world-war.png')
image_box = OffsetImage(ww, zoom=0.1)
ab = AnnotationBbox(image_box, (1942, 225), frameon=False)
ax.add_artist(ab)

ww = plt.imread('world-war.png')
image_box = OffsetImage(ww, zoom=0.1)
ab = AnnotationBbox(image_box, (1916, 225), frameon=False)
ax.add_artist(ab)

plt.ylim(bottom=-20)

plt.tight_layout()

##### ⭐ Zadanie 11:

Przygotuj na jednym obiekcie `axes` wykres liniowy (`plot`) i wykres kolumnowy (`bar`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z parametrami `color`, `marker`, `markersize`, `linestyle` i `linewidth` oraz dobierz dla nich niestandardowe wartości. Zadbaj o czytelność wykresu (tytuł wykresu i podpisy osi). 

In [None]:
medals = (athlete_events.query(
    "NOC == 'ESP' and Medal.notna() and Year >= 1988 and Season == 'Summer'"
)[['Year', 'Medal', 'Event']]
          .drop_duplicates()
          .groupby(['Year', 'Medal'])
          .size()
          .reset_index(name='Count')
          ).groupby(['Year']).sum().drop(columns='Medal')

age = athlete_events.query("NOC == 'ESP' and Medal.notna() and Year >= 1988 and Season == 'Summer'")[['Year', 'Age']].groupby(['Year']).mean()

fig, ax1 = plt.subplots()

ax1.plot(
    age.index,
    age,
    marker='o',
    markersize=10,
    linewidth=2,
    color='red'
)
ax1.tick_params(axis='y', labelcolor='red')
ax1.set_ylabel('Średni wiek medalistów', fontsize=12, labelpad=10, color='red')
ax1.set_xticks(range(1988, 2017, 4))
ax1.set_title('Zależność między średnim wiekiem medalistów a liczbą medali zdobytych przez Hiszpanię', fontsize=14, pad=20)
ax1.set_xlabel('Rok igrzysk', fontsize=12, labelpad=10)
ax1.grid(axis='y')

ax2 = ax1.twinx()
ax2.bar(
    x=medals.index,
    height=medals['Count'],
    facecolor='blue',
    alpha=0.5,
    linewidth=1,
)
ax2.tick_params(axis='y', labelcolor='blue')
ax2.set_ylabel('Liczba medali', fontsize=12, labelpad=10, color='blue')
ax2.set_yticks(range(0, 26, 5))

##### ⭐ Zadanie 12:

Przedstaw na jednym obiekcie `axes` wykres liniowy (`plot`) i wykres zamalowujący przestrzeń pomiędzy dwoma horyzontalnymi krzywymi (`fill_between`). Wykorzystaj dane, które sam wybierzesz w sensowny sposób. Na pierwszym wykresie przedstaw średnią wartość, a na drugim wykresie pokaż minimum i maksimum. Zadbaj o czytelność wykresu (tytuł wykresu i podpisy osi). 

In [None]:
mean_height_volleyball = athlete_events.query("Sport == 'Volleyball' and Sex == 'M'")[['Year', 'Height']].groupby('Year').agg(['min', 'mean', 'max']).reset_index()
mean_height_volleyball.rename(columns={'': 'Year'}, inplace=True)
mean_height_volleyball = mean_height_volleyball.droplevel(0, axis=1)

fig, ax = plt.subplots(figsize=(14, 6))

plt.plot(
    mean_height_volleyball.Year,
    mean_height_volleyball['mean'],
    marker='$\U0001F60A$',
    markersize=20,
    linewidth=2,
    color='orange'
)
plt.fill_between(
    x=mean_height_volleyball.Year,
    y1=mean_height_volleyball['min'],
    y2=mean_height_volleyball['max'],
    color='skyblue',
    alpha=0.2
)

plt.axvline(x=1996, color='red', linestyle='--')
plt.axvline(x=1964, color='green', linestyle='--')

legend_elements = [
    Line2D([0], [0], color='red', lw=1, label=f'Najwyższy średni wzrost: {mean_height_volleyball['mean'].max():.2f} cm', linestyle='--'),
    Line2D([0], [0], color='green', lw=1, label=f'Najniższy średni wzrost: {mean_height_volleyball['mean'].min():.2f} cm', linestyle='--'),
    Patch(facecolor='skyblue', alpha=0.2, label='Zakres wzrostu'),
    Line2D([0], [0], color='orange', lw=1, label='Średni wzrost siatkarzy', linestyle='-', marker='$\U0001F60A$', markersize=10),
]

plt.title('Zmiana wzrostu siatkarzy na kolejnych letnich igrzyskach', fontsize=15, pad=20)
plt.xlabel('Rok igrzysk', fontsize=12, labelpad=20)
plt.ylabel('Wzrost (cm)', fontsize=12, labelpad=20)
plt.legend(title='Legenda', loc='upper left', handles=legend_elements)
plt.xticks(range(1964, 2017, 8))
plt.grid(True, linestyle='--', alpha=0.7)

--------------------
### Wykres bąbelkowy i punktowy

Wykres bąbelkowy rozszerza wykres punktowy o trzecią wartość dla danej serii danych, która jest prezentowana za pomocą rozmiaru znacznika. Przy rosnącej
liczbie zależności, konieczne jest umieszczenie dokładnego opisu wykresu razem z legendą.

##### ⭐ Zadanie 13:

Przygotuj wykres bąbelkowy (`scatter`) opierając się na danych, które sam wybierzesz w sensowny sposób. Wykorzystaj rozmiary i kolory markerów do zaprezentowania większej liczby informacji. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi i opis skali koloru). 

In [None]:
# tutaj wpisz swoje rozwiązanie

##### ⭐ Zadanie 14:

Czy wszystkie informacje z zadania 13 można przedstawić za pomocą wykresu punktowego stworzonego jako wykres liniowy (`plot`) bez linii? Jeżeli tak, wykonaj taki wykres. Jeżeli nie, zdecyduj, które dane są najmniej istotne i zrezygnuj z nich przy wykonywaniu takiego wykresu. Zadbaj o czytelność wykresu (tytuł wykresu i podpisy osi). Do swojego rozwiązania dodaj dowolną animację.

In [None]:
# tutaj wpisz swoje rozwiązanie

-------------------
### Mapa ciepła

Mapa ciepła to wizualizacja wielowymiarowa, która wykorzystywana jest do znajdowania wzorców w danych. Dwie kategorie danych umieszczone są w wierszach i kolumnach. Wartości zawarte w macierzy są reprezentowane przez kolory lub nasycenie kolorów, dzięki czemu jawnie odzwierciedlają zależności pomiędzy kategoriami. 

##### ⭐ Zadanie 15:

Przygotuj mapę ciepła (`imshow`, `pcolormesh`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zapoznaj się z dwiema metodami rysowania map ciepła i zdecyduj, która będzie lepsza w twoim rozwiązaniu. Zadbaj o czytelność wykresu (tytuł wykresu, podpisy osi i opis skali koloru). 

In [None]:
from sklearn.preprocessing import LabelEncoder


data = athlete_events.copy(deep=True)
data.drop(columns=['ID', 'Name', 'Team', 'Games', 'Event'], inplace=True)
for col in data.select_dtypes(include=['object']).columns:
    le = LabelEncoder()
    data[col] = le.fit_transform(data[col])

correlation_mat = data.corr(numeric_only=True)
plt.imshow(
    X=correlation_mat,
    cmap='Greys',
    vmax=1,
    vmin=-1,
)
plt.colorbar(label='Wartość korelacji')
plt.xticks(ticks=np.arange(len(correlation_mat.columns)), labels=correlation_mat.columns, rotation=45)
plt.yticks(ticks=np.arange(len(correlation_mat.columns)), labels=correlation_mat.columns)
plt.title('Macierz korelacji dla zbioru sportowców', fontsize=14, pad=20)

for i in range(len(correlation_mat.columns)):
    for j in range(len(correlation_mat.columns)):
        text = f'{correlation_mat.iloc[i, j]:.2f}'
        plt.text(j, i, text, ha='center', va='center', color='black', fontsize=10)

-------------------
### Wykres radarowy

Wykres radarowy przedstawia wiele zmiennych o tej samej skali w formie pojedynczego wielokąta zamkniętego umieszczonego na okręgu. Wierzchołki figury są ułożone zgodnie z wartościami dla kolejnych kategorii.

##### ⭐ Zadanie 16:

Przygotuj wykres radarowy (`polar`) opierając się na danych, które sam wybierzesz w sensowny sposób. Zadbaj o czytelność wykresu (tytuł wykresu i podpisy osi). 

In [None]:
# tutaj wpisz swoje rozwiązanie