In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# параметри виведення
pd.set_option("display.max_columns", 500)  # кількість колонок
pd.set_option("display.max_rows", 1000)  # кількість рядків
pd.set_option("display.max_colwidth", 300)  # ширина колонок
pd.set_option("display.precision", 7)  # кількість знаків після коми

# вимикаємо зайві попередження
import warnings

warnings.filterwarnings("ignore")

# друк всіх результатів в одній комірці а не тільки останнього
from IPython.core.interactiveshell import InteractiveShell

InteractiveShell.ast_node_interactivity = "all"

In [None]:
%matplotlib inline

In [None]:
# https://www.kaggle.com/datasets/cashncarry/fifa-23-complete-player-dataset
data = pd.read_csv("players_fifa23.csv")

In [None]:
data.head()

In [None]:
data.columns

In [None]:
left = data[data["PreferredFoot"] == "Left"].count()[0]
right = data[data["PreferredFoot"] == "Right"].count()[0]

plt.pie([left, right], labels=["Ліва нога", "Права нога"], autopct="%.2f %%"); 
plt.title("Яка нога є основною у футболістів?");

In [None]:
data["Club"].unique()

In [None]:
barcelona = data[data["Club"] == "FC Barcelona"]["Overall"]
madrid = data[data["Club"] == "Real Madrid CF"]["Overall"]
revs = data[data["Club"] == "New England Revolution"]["Overall"]

plt.boxplot(
    [barcelona, madrid, revs],
    labels=["FC Barcelona", "Real Madrid", "NE Revolution"],
)
plt.title("Розподіл рейтингу гравців")
plt.show();

# діаграма типу "ящик з вусами" (boxplot) показує розподіл даних за допомогою квартилів

In [None]:
plt.hist(data["Overall"], bins=20)

plt.title("Розподіл рейтингу гравців")
plt.xlabel("Рейтинг")
plt.ylabel("Кількість гравців")
plt.show();

# Побудова гістаграми 

In [None]:
plt.style.available

# В Matplotlib доступно 26 стилів оформлення графіків.

In [None]:
plt.style.use("fivethirtyeight")
plt.hist(data["Overall"], bins=20)
plt.title("Розподіл рейтингу гравців")
plt.xlabel("Рейтинг")
plt.ylabel("Кількість гравців")
plt.show();

### demo to sns

In [None]:
# відбираю числові ознаки з датасету tips
df = data.select_dtypes(include=["float64", "int64"])
df.columns

In [None]:
df = df[
    [
        "Overall",
        "Age",
        "Height",
        "Weight",
        "PassingTotal",
        "PhysicalityTotal",
        "ShortPassing",
        "Crossing",
        "Finishing",
        "HeadingAccuracy",
        "ShortPassing",
        "Volleys",
    ]
]

In [None]:
# heatmap - це теплова карта
sns.heatmap(df.corr(), cmap="coolwarm", annot=True)

In [None]:
sns.heatmap(df.corr(), cmap="crest_r", annot=True)

In [None]:
# зменшити шрифт анотацій
cmap = sns.diverging_palette(230, 20, as_cmap=True)
sns.heatmap(df.corr(), cmap="crest_r", annot=True, fmt=".0%", annot_kws={"fontsize": 8}) 
# fmt - формат виведення значень   annot_kws - параметри анотацій (розмір шрифту) , cmap - палітра кольорів (https://matplotlib.org/stable/tutorials/colors/colormaps.html)
