# Lekcja 24: Wizualizacja danych w Pythonie

In [None]:
!pip install seaborn

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Wczytanie przykładowych zbiorów danych
iris = sns.load_dataset("iris")  # Klasyczny zbiór dotyczący kwiatów irysów
titanic = sns.load_dataset("titanic")  # Dane pasażerów Titanica
tips = sns.load_dataset("tips")  # Dane dotyczące napiwków w restauracji

## Wykresy liniowe

In [None]:
help(sns.lineplot)

In [None]:
iris['species'].value_counts()

In [None]:
# Przykład
plt.figure(figsize=(8,5))
sns.lineplot(x=iris['sepal_length'], y=iris['sepal_width'], ci=None)
plt.title("Wykres liniowy - długość a szerokość działki kwiatu")
plt.show()

In [None]:
# Przykład
plt.figure(figsize=(8,5))
sns.lineplot(x=iris['sepal_length'], y=iris['sepal_width'], hue=iris['species'], ci=None)
plt.title("Wykres liniowy - długość a szerokość działki kwiatu")
plt.show()

# Alternatywny sposób
plt.figure(figsize=(8,5))
sns.lineplot(x='sepal_length', y='sepal_width', hue = 'species', data=iris, ci=None)
plt.title("Wykres liniowy - długość a szerokość działki kwiatu (alternatywnie)")
plt.show()

### Ćwiczenie: 
Wykonaj wykres liniowy dla zbioru 'tips', pokazujący zależność między dniem tygodnia a średnią wysokością napiwku, używając obu sposobów.

In [None]:
tips

## Wykresy punktowe


In [None]:
# Przykład
plt.figure(figsize=(8,5))
sns.scatterplot(x=iris['sepal_length'], y=iris['sepal_width'], hue=iris['species'])
plt.title("Wykres punktowy - długość a szerokość działki kwiatu")
plt.show()

# Alternatywny sposób
plt.figure(figsize=(8,5))
sns.scatterplot(x='sepal_length', y='sepal_width', hue='species', data=iris)
plt.title("Wykres punktowy - długość a szerokość działki kwiatu (alternatywnie)")
plt.show()


### Ćwiczenie: 
Stwórz wykres punktowy dla zbioru 'tips', pokazujący zależność między 'total_bill' a 'tip', z podziałem na płeć, używając obu sposobów.



## Wykresy słupkowe

In [None]:
titanic

In [None]:
titanic.groupby('sex')[['survived']].sum()

In [None]:
# Przykład
plt.figure(figsize=(8,5))
sns.barplot(x=titanic['sex'], y=titanic['survived'], estimator='mean')
plt.title("Średnia przeżywalność według płci")
plt.show()


### Ćwiczenie: 
Wykonaj wykres słupkowy pokazujący średnie napiwki w zależności od dnia tygodnia.


In [None]:
tips

## Wykresy kołowe

In [None]:
survival_counts.index

In [None]:
# Przykład
survival_counts = titanic['class'].value_counts()
plt.figure(figsize=(6,6))
plt.pie(survival_counts, labels=survival_counts.index, autopct='%1.1f%%', colors=['lightblue', 'lightcoral', 'lightgreen'])
plt.title("Rozkład pasażerów według klasy")
plt.show()

### Ćwiczenie: 
Stwórz wykres kołowy pokazujący rozkład dni tygodnia w zbiorze 'tips'.

## Boxploty

In [None]:
# Przykład
plt.figure(figsize=(8,5))
sns.boxplot(x=iris['species'], y=iris['sepal_length'])
plt.title("Rozkład długości działki kwiatu w zależności od gatunku")
plt.show()

### Ćwiczenie: 
Stwórz wykres pudełkowy dla zbioru 'tips', porównujący napiwki w zależności od płci.

## Dostosowywanie wykresów

In [None]:
help(sns.lineplot)

In [None]:
help(plt.plot)

In [None]:
linestyles = ["solid", "dotted", "dashed", "dashdot"]
markers = ['x, y']

In [None]:
# Przykład - zmiana stylu i dodanie siatki
sns.set_style("darkgrid")
plt.figure(figsize=(8,5))
sns.lineplot(x=iris['sepal_length'], y=iris['sepal_width'], color='red', 
             linestyle='solid', marker='o', markeredgecolor = 'red', markerfacecolor = 'blue')
plt.title("Dostosowany wykres liniowy")
plt.xlabel("Długość działki kwiatu")
plt.ylabel("Szerokość działki kwiatu")
plt.show()

### Ćwiczenie:
 Stwórz wykres słupkowy ze zmienionymi kolorami i tytułem dla średnich napiwków w 'tips' w zależności od dnia tygodnia.