# Uvod u Seaborn Biblioteku

## Seminarski rad - SISJ

### Autor: [Vaše ime]
### Datum: [Datum]

## ---

## 1. Šta je Seaborn?

Seaborn je Python biblioteka za statističku vizualizaciju podataka bazirana na matplotlib-u. Razvio ju je Michael Waskom 2012. godine kao visoko-nivo interfejs za kreiranje atraktivnih i informativnih statističkih grafika.

### Ključne karakteristike:

- **Visoko-nivo interfejs**: Pruža jednostavan API za kreiranje složenih vizualizacija
- **Statistička orijentacija**: Ugrađene funkcije za statističku analizu i vizualizaciju
- **Integracija sa pandas**: Odličo radi sa DataFrame objektima
- **Estetski privlačni grafikoni**: Unapređeni izgled u odnosu na matplotlib
- **Fleksibilnost**: Mogućnost fine podešavanja kroz matplotlib

### Prednosti u odnosu na matplotlib:

1. **Manje koda**: Kompleksni grafikoni se prave sa manje linija koda
2. **Bolje default settings**: Automatski estetski privlačni grafikoni
3. **Statistička funkcionalnost**: Ugrađeni regression plots, distribution plots, etc.
4. **Rad sa kategorijskim podacima**: Bolje rukovanje kategorijskim varijablama

---

## 2. Istorija i razvoj

Seaborn je nastao kao odgovor na potrebu za:
- Jednostavnijim API-jem za statističku vizualizaciju
- Boljim default dizajnom grafika
- Boljom integracijom sa pandas DataFrame-ima
- Statističkim funkcijama ugrađenim u plotting library

Verzija 0.11 (2020) je uvela `seaborn.objects` interfejs - objektno-orijentisani API koji omogućava kompoziciju grafika.


## 3. Instalacija i početno podešavanje

### Instalacija preko pip-a:
```bash
pip install seaborn
```

### Instalacija preko conda:
```bash
conda install seaborn
```

### Potrebne biblioteke:
- pandas (za rad sa podacima)
- numpy (za numeričke operacije)
- matplotlib (base za grafike)
- scipy (za statističke funkcije)


In [None]:
# Uvoz potrebnih biblioteka
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import warnings

# Podešavanje stilova
plt.style.use('default')
sns.set_style("whitegrid")
warnings.filterwarnings('ignore')

# Podešavanje veličine figura
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

# Provera verzije seaborn-a
print(f"Seaborn verzija: {sns.__version__}")
print(f"Matplotlib verzija: {plt.matplotlib.__version__}")
print(f"Pandas verzija: {pd.__version__}")
print(f"NumPy verzija: {np.__version__}")

# Prikaz dostupnih seaborn tema
print("\nDostupni seaborn stilovi:")
print(sns.axes_style().keys())
print("\nDostupni seaborn contexts:")
print(sns.plotting_context().keys())


Matplotlib is building the font cache; this may take a moment.


Seaborn verzija: 0.13.2
Matplotlib verzija: 3.10.3
Pandas verzija: 2.3.1
NumPy verzija: 2.2.6

Dostupni seaborn stilovi:
dict_keys(['axes.facecolor', 'axes.edgecolor', 'axes.grid', 'axes.axisbelow', 'axes.labelcolor', 'figure.facecolor', 'grid.color', 'grid.linestyle', 'text.color', 'xtick.color', 'ytick.color', 'xtick.direction', 'ytick.direction', 'lines.solid_capstyle', 'patch.edgecolor', 'patch.force_edgecolor', 'image.cmap', 'font.family', 'font.sans-serif', 'xtick.bottom', 'xtick.top', 'ytick.left', 'ytick.right', 'axes.spines.left', 'axes.spines.bottom', 'axes.spines.right', 'axes.spines.top'])

Dostupni seaborn contexts:
dict_keys(['font.size', 'axes.labelsize', 'axes.titlesize', 'xtick.labelsize', 'ytick.labelsize', 'legend.fontsize', 'legend.title_fontsize', 'axes.linewidth', 'grid.linewidth', 'lines.linewidth', 'lines.markersize', 'patch.linewidth', 'xtick.major.width', 'ytick.major.width', 'xtick.minor.width', 'ytick.minor.width', 'xtick.major.size', 'ytick.major.size', 'xt

## 4. Osnovni koncepti i terminologija

### 4.1 Glavne komponente seaborn-a:

1. **Figure-level functions**: Kreiraju kompletne figure sa više subplot-ova
   - `sns.relplot()`, `sns.displot()`, `sns.catplot()`
   
2. **Axes-level functions**: Rade sa jednim subplot-om
   - `sns.scatterplot()`, `sns.histplot()`, `sns.boxplot()`

3. **Grid objekti**: Za kreiranje složenih multi-plot displeja
   - `FacetGrid`, `PairGrid`, `JointGrid`

### 4.2 Ključni argumenti:

- **data**: pandas DataFrame sa podacima
- **x, y**: imena kolona za ose
- **hue**: kolona za grupisanje po boji
- **style**: kolona za grupisanje po stilu
- **size**: kolona za grupisanje po veličini
- **col, row**: kolone za kreiranje subplots

### 4.3 Estetske kontrole:

- **palette**: boja paleta
- **style**: stil grafika (darkgrid, whitegrid, dark, white, ticks)
- **context**: kontekst (paper, notebook, talk, poster)
- **font_scale**: skala fontova


## 5. Praktični primer: Matplotlib vs Seaborn

Kreirajmo set podataka za demonstraciju i uporedimo kako isti grafikon izgleda u matplotlib-u i seaborn-u.


In [None]:
# Kreiranje uzornih podataka za demonstraciju
np.random.seed(42)

# Generisanje podataka o prodaji različitih proizvoda u različitim mesecima
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
products = ['Laptop', 'Telefon', 'Tablet']

# Kreiranje realistnih podataka o prodaji
data = []
for product in products:
    for month in months:
        # Dodavanje sezonalnosti i trends
        base_sales = np.random.normal(100, 20)
        if month in ['Dec', 'Jan', 'Feb']:  # Zimski rast
            base_sales *= 1.3
        elif month in ['Jun', 'Jul', 'Aug']:  # Letnji pad
            base_sales *= 0.8
        
        # Različiti proizvodi imaju različite prodajne karakteristike
        if product == 'Laptop':
            base_sales *= 1.5
        elif product == 'Telefon':
            base_sales *= 2.0
        
        data.append({
            'Mesec': month,
            'Proizvod': product,
            'Prodaja': max(0, int(base_sales)),
            'Profit': max(0, int(base_sales * np.random.uniform(0.1, 0.3)))
        })

# Kreiranje DataFrame-a
df = pd.DataFrame(data)
print("Kreiran DataFrame sa podacima o prodaji:")
print(df.head(10))
print(f"\nDimenzije DataFrame-a: {df.shape}")
print(f"\nOsnovne statistike:")
print(df.describe())


In [None]:
# Poređenje matplotlib-a i seaborn-a
fig, axes = plt.subplots(1, 2, figsize=(15, 6))

# MATPLOTLIB pristup
ax1 = axes[0]
colors = ['#1f77b4', '#ff7f0e', '#2ca02c']
for i, product in enumerate(products):
    product_data = df[df['Proizvod'] == product]
    ax1.plot(product_data['Mesec'], product_data['Prodaja'], 
             marker='o', color=colors[i], linewidth=2, label=product)

ax1.set_title('Prodaja po mesecima - Matplotlib', fontsize=14, fontweight='bold')
ax1.set_xlabel('Mesec')
ax1.set_ylabel('Prodaja')
ax1.legend()
ax1.grid(True, alpha=0.3)
ax1.tick_params(axis='x', rotation=45)

# SEABORN pristup
ax2 = axes[1]
sns.lineplot(data=df, x='Mesec', y='Prodaja', hue='Proizvod', 
             marker='o', linewidth=2, ax=ax2)
ax2.set_title('Prodaja po mesecima - Seaborn', fontsize=14, fontweight='bold')
ax2.tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

# Prikaz prednosti seaborn-a
print("PREDNOSTI SEABORN-A U OVOM PRIMERU:")
print("1. Manje koda - jedna linija umesto petlje")
print("2. Automatsko grupisanje po 'hue' parametru")
print("3. Bolje default boje i stil")
print("4. Automatska legenda")
print("5. Bolje rukovanje kategorijskim podacima")


## 6. Ugrađeni datasets u seaborn-u

Seaborn dolazi sa nizom ugrađenih datasets koji su korisni za učenje i testiranje. Ovi datasets su često korišćeni u statistici i data science zajednici.


In [None]:
# Prikaz dostupnih datasets
print("DOSTUPNI SEABORN DATASETS:")
available_datasets = sns.get_dataset_names()
for i, dataset in enumerate(available_datasets):
    print(f"{i+1:2d}. {dataset}")

print(f"\nUkupno dostupnih datasets: {len(available_datasets)}")

# Učitavanje i prikaz nekoliko populārnih datasets
print("\n" + "="*50)
print("PRIMERI PODATAKA:")
print("="*50)

# Tips dataset - o napojnicama
tips = sns.load_dataset('tips')
print("\n1. TIPS dataset (podaci o napojnicama):")
print(f"   Dimenzije: {tips.shape}")
print(f"   Kolone: {list(tips.columns)}")
print(tips.head())

# Iris dataset - klasični ML dataset
iris = sns.load_dataset('iris')
print("\n2. IRIS dataset (karakteristike cvetova):")
print(f"   Dimenzije: {iris.shape}")
print(f"   Kolone: {list(iris.columns)}")
print(iris.head())

# Flights dataset - putnici aviokompanija
flights = sns.load_dataset('flights')
print("\n3. FLIGHTS dataset (putnici aviokompanija):")
print(f"   Dimenzije: {flights.shape}")
print(f"   Kolone: {list(flights.columns)}")
print(flights.head())


## 7. Seaborn stilovi i teme

Seaborn omogućava lako menjanje izgleda grafika kroz različite stilove i kontekste. Ovo je jedna od glavnih prednosti u odnosu na matplotlib.


In [None]:
# Demonstracija različitih seaborn stilova
styles = ['darkgrid', 'whitegrid', 'dark', 'white', 'ticks']
fig, axes = plt.subplots(2, 3, figsize=(18, 12))
axes = axes.flatten()

for i, style in enumerate(styles):
    sns.set_style(style)
    ax = axes[i]
    
    # Kreiranje istog grafikona u različitim stilovima
    sns.scatterplot(data=tips, x='total_bill', y='tip', hue='time', ax=ax)
    ax.set_title(f'Stil: {style}', fontsize=14, fontweight='bold')
    ax.legend(title='Vreme')

# Poslednji subplot - prikaz paleta
ax = axes[5]
sns.set_style('whitegrid')

# Prikaz različitih paleta
palettes = ['deep', 'muted', 'bright', 'pastel', 'dark', 'colorblind']
for i, palette in enumerate(palettes):
    colors = sns.color_palette(palette, n_colors=3)
    for j, color in enumerate(colors):
        ax.scatter(j, i, c=[color], s=100, label=f'{palette}' if j == 0 else '')
        
ax.set_xlim(-0.5, 2.5)
ax.set_ylim(-0.5, len(palettes) - 0.5)
ax.set_xlabel('Boja u paleti')
ax.set_ylabel('Tip palete')
ax.set_title('Seaborn palete boja', fontsize=14, fontweight='bold')
ax.set_yticks(range(len(palettes)))
ax.set_yticklabels(palettes)

plt.tight_layout()
plt.show()

# Vraćanje na default stil
sns.set_style('whitegrid')


In [None]:
# Demonstracija različitih konteksta (scaling)
contexts = ['paper', 'notebook', 'talk', 'poster']
fig, axes = plt.subplots(2, 2, figsize=(15, 12))
axes = axes.flatten()

for i, context in enumerate(contexts):
    sns.set_context(context)
    ax = axes[i]
    
    # Kreiranje istog grafikona u različitim kontekstima
    sns.boxplot(data=tips, x='day', y='total_bill', hue='time', ax=ax)
    ax.set_title(f'Kontekst: {context}', fontsize=14, fontweight='bold')
    ax.legend(title='Vreme')

plt.tight_layout()
plt.show()

# Vraćanje na default kontekst
sns.set_context('notebook')

print("KONTEKSTI U SEABORN-U:")
print("1. paper - za naučne radove (mali font)")
print("2. notebook - za jupyter notebook (default)")
print("3. talk - za prezentacije")
print("4. poster - za postere (veliki font)")


## 8. Zaključak

U ovom notebook-u smo prošli kroz osnovne koncepte Seaborn biblioteke:

### Što smo naučili:
- **Definiciju i svrhu** Seaborn biblioteke
- **Prednosti** u odnosu na matplotlib
- **Instalaciju i osnovne imports**
- **Praktične primere** poređenja sa matplotlib-om
- **Ugrađene datasets** za vežbanje
- **Stilove i teme** za lepši izgled grafika
- **Kontekste** za različite namene

### Ključne prednosti Seaborn-a:
1. **Jednostavnost** - manje koda za kompleksne grafike
2. **Estetika** - automatski lepi grafikoni
3. **Statistička orijentacija** - ugrađene statističke funkcije
4. **Integracija** - odličo radi sa pandas
5. **Fleksibilnost** - može se kombinovati sa matplotlib

### Sledeći koraci:
U narednim notebook-ima ćemo detaljno istražiti:
- Specifične plotting funkcije
- Strukture podataka za seaborn
- Objektno-orijentisani interfejs
- Napredne statistické vizualizacije

---

**Napomena**: Ovaj notebook služi kao uvod u seaborn. Za dublje razumevanje, proučite naredne notebook-ove u seriji.
