# Uvod u Seaborn Biblioteku

## Seminarski rad - SISJ

**Autor:** Mihajlovic Luka 2020/0136, Ilic Andrija 2020/0236 
**Datum:** 23.07.2025.

---

### 1. **Šta je Seaborn?**

> **Zvanična dokumentacija:** [https://seaborn.pydata.org/](https://seaborn.pydata.org/)

Seaborn je **moderna Python biblioteka** za statističku vizualizaciju podataka, izgrađena na vrhu matplotlib-a. Razvio ju je Michael Waskom 2012. godine kao visoko-nivo interfejs za kreiranje atraktivnih i informativnih statističkih grafika. Zeleo je da omoguci korisnicima da sa sto manje koda dobiju profesionalne grafikone, sa automatskim stilizovanjem i naprednim statistickim mogucnostima. 
Posebno je popularan u **Data Science** zajednici.

### **Glavne karakteristike Seaborn-a:**

- **Visoko-nivo interfejs**: Jednostavniji API za rad sa podacima
- **Statistička orijentacija**: Ugrađene funkcije za statističku analizu i vizualizaciju
- **Integracija sa pandas**: Odličo radi sa DataFrame objektima
- **Estetika**: Unapređeni izgled u odnosu na matplotlib
- **Fleksibilnost**: Mogućnost podešavanja kroz matplotlib

---


In [None]:
# Uvoz potrebnih biblioteka
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

### 2. Matplotlib vs Seaborn:

Matplotlib je osnovna biblioteka za vizualizaciju, ali zahteva više koda i ručno podešavanje za dobijanje lepih grafika. Seaborn koristi matplotlib u pozadini, ali omogućava mnogo jednostavnije i brže kreiranje profesionalnih grafika.

- Kreirajmo set podataka za demonstraciju i uporedimo kako isti grafikon izgleda u matplotlib-u i seaborn-u.

In [None]:
# Kreiranje uzornih podataka za demonstraciju
np.random.seed(42)

# Generisanje podataka o prodaji različitih proizvoda u različitim mesecima
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
products = ['Laptop', 'Telefon', 'Tablet']

# Kreiranje realistnih podataka o prodaji
data = []
for product in products:
    for month in months:
        # Dodavanje sezonalnosti i trends
        base_sales = np.random.normal(100, 20)
        if month in ['Dec', 'Jan', 'Feb']:  # Zimski rast
            base_sales *= 1.3
        elif month in ['Jun', 'Jul', 'Aug']:  # Letnji pad
            base_sales *= 0.8
        
        # Različiti proizvodi imaju različite prodajne karakteristike
        if product == 'Laptop':
            base_sales *= 1.5
        elif product == 'Telefon':
            base_sales *= 2.0
        
        data.append({
            'Mesec': month,
            'Proizvod': product,
            'Prodaja': max(0, int(base_sales)),
            'Profit': max(0, int(base_sales * np.random.uniform(0.1, 0.3)))
        })

# Kreiranje DataFrame-a
df = pd.DataFrame(data)

# Osiguravanje pravilnog redosleda meseci
month_order = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
df['Mesec'] = pd.Categorical(df['Mesec'], categories=month_order, ordered=True)

print("Kreiran DataFrame sa podacima o prodaji:")
print(df.head(10))
print(f"\nDimenzije DataFrame-a: {df.shape}")
print(f"\nOsnovne statistike:")
print(df.describe())

### Prikaz razlike grafikona izmedju matplotlib-a i seaborn-a

In [None]:
# Poređenje matplotlib-a i seaborn-a
fig, axes = plt.subplots(1, 2, figsize=(16, 7))

# MATPLOTLIB pristup
ax1 = axes[0]
colors = ['#1f77b4', '#ff7f0e', '#2ca02c']
for i, product in enumerate(products):
    product_data = df[df['Proizvod'] == product].sort_values('Mesec')
    ax1.plot(product_data['Mesec'], product_data['Prodaja'], 
             marker='o', color=colors[i], linewidth=2.5, label=product, markersize=6)

ax1.set_title('Prodaja po mesecima - Matplotlib', fontsize=16, fontweight='bold', pad=20)
ax1.set_xlabel('Mesec', fontsize=12)
ax1.set_ylabel('Prodaja', fontsize=12)
ax1.legend(fontsize=11, frameon=True, shadow=True)
ax1.grid(True, alpha=0.3)
ax1.tick_params(axis='x', rotation=45, labelsize=10)
ax1.tick_params(axis='y', labelsize=10)

# SEABORN pristup
ax2 = axes[1]
sns.lineplot(data=df, x='Mesec', y='Prodaja', hue='Proizvod', 
             marker='o', linewidth=2.5, markersize=6, ax=ax2)
ax2.set_title('Prodaja po mesecima - Seaborn', fontsize=16, fontweight='bold', pad=20)
ax2.set_xlabel('Mesec', fontsize=12)
ax2.set_ylabel('Prodaja', fontsize=12)
ax2.tick_params(axis='x', rotation=45, labelsize=10)
ax2.tick_params(axis='y', labelsize=10)

# Poboljšana legenda za seaborn
legend = ax2.legend(title='Proizvod', fontsize=11, title_fontsize=12, 
                    frameon=True, shadow=True)

plt.tight_layout()
plt.show()

# Dodavanje kvantitativne analize razlike
print("\\n=== VIZUELNA ANALIZA RAZLIKE ===")
print("Matplotlib pristup:")
print("+ Više kontrole nad svakim elementom")
print("+ Custom boje i stilovi")
print("- Više koda potrebno")
print("- Ručno podešavanje legende")

print("\\nSeaborn pristup:")
print("+ Automatsko grupisanje po 'hue' parametru") 
print("+ Lepše default boje i stilovi")
print("+ Automatska legenda sa naslovom")
print("+ Manje koda - jedna linija")
print("+ Bolje handling kategorijskih podataka")

### Prednosti Seaborn-a u ovom primeru:

1. **Manje koda**: Jedna linija umesto petlje
2. **Bolje default settings**: Automatsko grupisanje po 'hue' parametru
3. **Bolje default boje i stil**
4. **Automatska legenda**
5. **Rad sa kategorijskim podacima**: Bolje rukovanje kategorijskim varijablama
---

## 3. Seaborn stilovi i teme

Seaborn omogućava lako menjanje izgleda grafika kroz različite stilove i kontekste. Ovo je jedna od glavnih prednosti u odnosu na matplotlib.


In [None]:
# Demonstracija različitih seaborn stilova
# Prvo učitavamo potreban dataset
tips = sns.load_dataset('tips')

# Kreiranje figure za stilove - 2 reda
styles = ['darkgrid', 'whitegrid', 'dark', 'white', 'ticks']
fig, axes = plt.subplots(2, 3, figsize=(18, 12))
axes = axes.flatten()

for i, style in enumerate(styles):
    sns.set_style(style)
    ax = axes[i]
    
    # Kreiranje istog grafikona u različitim stilovima
    sns.scatterplot(data=tips, x='total_bill', y='tip', hue='time', 
                   s=60, alpha=0.7, ax=ax)
    ax.set_title(f'Stil: {style}', fontsize=14, fontweight='bold', pad=15)
    ax.legend(title='Vreme', title_fontsize=11, fontsize=10)
    ax.set_xlabel('Total Bill ($)', fontsize=11)
    ax.set_ylabel('Tip ($)', fontsize=11)

# Poslednji subplot - demonstracija paleta boja
ax = axes[5]
sns.set_style('whitegrid')
ax.clear()  # Očisti postojeći sadržaj

# Kreiranje elegantnog prikaza paleta
palettes = ['deep', 'muted', 'bright', 'pastel', 'dark', 'colorblind']
y_positions = range(len(palettes))

for i, palette in enumerate(palettes):
    colors = sns.color_palette(palette, n_colors=5)  # 5 boja po paleti
    for j, color in enumerate(colors):
        ax.scatter(j, i, c=[color], s=120, edgecolor='white', linewidth=1)
        
# Poboljšano formatiranje
ax.set_xlim(-0.5, 4.5)
ax.set_ylim(-0.5, len(palettes) - 0.5)
ax.set_xlabel('Pozicija u paleti', fontsize=11)
ax.set_ylabel('Tip palete', fontsize=11)
ax.set_title('Seaborn palete boja', fontsize=14, fontweight='bold', pad=15)
ax.set_yticks(range(len(palettes)))
ax.set_yticklabels(palettes)
ax.set_xticks(range(5))
ax.grid(True, alpha=0.3)

plt.tight_layout(pad=3.0)
plt.show()

# Vraćanje na default stil
sns.set_style('whitegrid')

print("=== OBJAŠNJENJE STILOVA ===")
print("• darkgrid - tamna pozadina sa grid linijama (za prezentacije)")
print("• whitegrid - bela pozadina sa grid linijama (univerzalno)")  
print("• dark - tamna pozadina bez grid linija (minimalistično)")
print("• white - bela pozadina bez grid linija (clean look)")
print("• ticks - bela pozadina sa tick marks (tradicionalno)")

print("\\n=== OBJAŠNJENJE PALETA ===")
print("• deep - žive, duboke boje (default)")
print("• muted - prigušene, profesionalne boje")
print("• bright - svetle, kontrastne boje")
print("• pastel - blede, soft boje")
print("• dark - tamne, elegantne boje")  
print("• colorblind - prilagođene za daltoniste")

In [None]:
# Demonstracija različitih konteksta (scaling)
contexts = ['paper', 'notebook', 'talk', 'poster']
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
axes = axes.flatten()

for i, context in enumerate(contexts):
    sns.set_context(context)
    ax = axes[i]
    
    # Kreiranje istog grafikona u različitim kontekstima
    sns.boxplot(data=tips, x='day', y='total_bill', hue='time', ax=ax)
    ax.set_title(f'Kontekst: {context}', fontweight='bold', pad=15)
    ax.legend(title='Vreme', loc='upper right')
    ax.set_xlabel('Dan u sedmici')
    ax.set_ylabel('Total Bill ($)')

plt.tight_layout(pad=3.0)
plt.show()

# Vraćanje na default kontekst
sns.set_context('notebook')

print("=== KONTEKSTI U SEABORN-U ===")
print(\"📄 paper - za naučne radove i publikacije (mali font, kompaktno)\")
print(\"📓 notebook - za Jupyter notebook i analizu (default, srednji font)\")
print(\"🎤 talk - za prezentacije i konferencije (veliki font)\")
print(\"🖼️  poster - za postere i velike displaye (vrlo veliki font)\")

print(\"\\n=== PRAKTIČNI SAVETI ===")
print(\"• Za prezentacije: koristite 'talk' ili 'poster' kontekst\")
print(\"• Za publikacije: koristite 'paper' kontekst\")
print(\"• Za istraživanje: 'notebook' je optimalan\")
print(\"• Kontekst utiče na font size, line width, element size\")
print(\"• Možete kombinovati različite stilove i kontekste\")

## 4. Zaključak

U ovom notebook-u smo prošli kroz osnovne koncepte Seaborn biblioteke:

### Što smo naučili:
- **Definiciju i svrhu** Seaborn biblioteke
- **Prednosti** u odnosu na matplotlib
- **Praktične primere** poređenja sa matplotlib-om
- **Stilove i teme** za lepši izgled grafika
- **Kontekste** za različite namene

### Ključne prednosti Seaborn-a:
1. **Jednostavnost** - manje koda za kompleksne grafike
2. **Estetika** - automatski lepi grafikoni
3. **Statistička orijentacija** - ugrađene statističke funkcije
4. **Integracija** - odličo radi sa pandas
5. **Fleksibilnost** - može se kombinovati sa matplotlib

### Sledeći koraci:
U narednim notebook-ima ćemo detaljno istražiti:
- Specifične plotting funkcije
- Strukture podataka za seaborn
- Objektno-orijentisani interfejs
- Napredne statistické vizualizacije

---

**Napomena**: Ovaj notebook služi kao uvod u seaborn. Za dublje razumevanje, proučite naredne notebook-ove u seriji.
