# Giorno 5 - Pratica: Multimedia AI

## Obiettivi
- Generare immagini con Stable Diffusion
- Analizzare immagini con Claude Vision
- Creare una mini-storia visuale

**Durata:** 3h 30min

---
## Setup

In [None]:
# Installazione librerie
!pip install anthropic pillow requests

In [None]:
import os
import base64
import requests
from io import BytesIO
from PIL import Image
from anthropic import Anthropic
from dotenv import load_dotenv

load_dotenv()
client = Anthropic()

print("Setup completato!")

In [None]:
# Funzioni di utilit√†

def encode_image_from_path(image_path: str) -> str:
    """Codifica un'immagine locale in base64."""
    with open(image_path, "rb") as f:
        return base64.standard_b64encode(f.read()).decode("utf-8")

def encode_image_from_url(url: str) -> str:
    """Scarica e codifica un'immagine da URL."""
    response = requests.get(url)
    return base64.standard_b64encode(response.content).decode("utf-8")

def analyze_image(image_data: str, prompt: str, media_type: str = "image/jpeg") -> str:
    """Analizza un'immagine con Claude Vision."""
    response = client.messages.create(
        model="claude-3-haiku-20240307",
        max_tokens=1024,
        messages=[{
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data
                    }
                },
                {"type": "text", "text": prompt}
            ]
        }]
    )
    return response.content[0].text

def display_image_from_url(url: str, width: int = 400):
    """Scarica e mostra un'immagine da URL."""
    response = requests.get(url)
    img = Image.open(BytesIO(response.content))
    aspect_ratio = img.height / img.width
    img = img.resize((width, int(width * aspect_ratio)))
    return img

print("Funzioni caricate!")

---
## Parte 1: Generazione Immagini con Stable Diffusion (1h)

Useremo Hugging Face Spaces per generare immagini gratuitamente.

### 1.1 Accesso a Stable Diffusion

1. Vai su [Hugging Face Stable Diffusion XL](https://huggingface.co/spaces/stabilityai/stable-diffusion)
2. Oppure usa [Playground AI](https://playground.com/) (richiede registrazione gratuita)

### 1.2 Esercizio: Prompt Progressivi

Genera la stessa immagine con prompt sempre pi√π dettagliati.

**Prompt 1 - Base:**
```
a cat
```

**Prompt 2 - Con stile:**
```
a fluffy orange cat, digital art style
```

**Prompt 3 - Con dettagli:**
```
a fluffy orange tabby cat sitting on a cozy armchair by a fireplace,
digital art style, warm lighting
```

**Prompt 4 - Completo:**
```
a fluffy orange tabby cat with emerald green eyes sitting on a 
vintage burgundy armchair by a crackling fireplace, cozy living room
with bookshelves in the background, digital art style, warm golden
lighting, highly detailed, 4k quality, artstation trending
```

### Le mie osservazioni

| Prompt | Qualit√† (1-5) | Note |
|--------|---------------|------|
| Base | | |
| Con stile | | |
| Con dettagli | | |
| Completo | | |

### 1.3 Esercizio: Stili Artistici

Genera lo stesso soggetto in stili diversi.

**Soggetto base:** `a medieval castle on a hill`

**Stili da provare:**
1. `oil painting style, renaissance`
2. `watercolor illustration, soft colors`
3. `pixel art, 16-bit video game style`
4. `anime style, studio ghibli`
5. `photorealistic, professional photography`
6. `neon cyberpunk style, futuristic`

**I miei risultati:**

| Stile | Risultato | Note |
|-------|-----------|------|
| Oil painting | | |
| Watercolor | | |
| Pixel art | | |
| Anime | | |
| Photorealistic | | |
| Cyberpunk | | |

### 1.4 Esercizio: Negative Prompts

Usa negative prompts per migliorare i risultati.

**Prompt positivo:**
```
a professional portrait photo of a business executive, 
high quality, studio lighting
```

**Negative prompt:**
```
blurry, low quality, distorted, deformed face, 
extra fingers, ugly, amateur
```

**Confronto:**
- Senza negative prompt: ___
- Con negative prompt: ___
- Differenze notate: ___

---
## Parte 2: Analisi Immagini con Claude Vision (1h)

### 2.1 Analisi Base

In [None]:
# Test con un'immagine di esempio
# Usa un'immagine che hai generato o scaricata

# Opzione 1: Da URL
test_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/4/4f/Felis_silvestris_catus_lying_on_rice_straw.jpg/1200px-Felis_silvestris_catus_lying_on_rice_straw.jpg"

# Mostra l'immagine
display(display_image_from_url(test_url))

# Analizza
image_data = encode_image_from_url(test_url)
result = analyze_image(image_data, "Descrivi questa immagine in dettaglio.")
print(result)

### 2.2 Esercizio: Domande Specifiche

Fai domande specifiche sulla stessa immagine.

In [None]:
# Domande diverse sulla stessa immagine
questions = [
    "Che animale √® presente nell'immagine? Che razza potrebbe essere?",
    "Descrivi l'ambiente e l'atmosfera.",
    "Quali colori dominano l'immagine?",
    "Che emozione trasmette questa foto?",
    "Crea un alt text per accessibilit√† (max 125 caratteri)."
]

for q in questions:
    print(f"\n‚ùì {q}")
    print(f"üí¨ {analyze_image(image_data, q)}")

### 2.3 Esercizio: Estrazione Testo (OCR)

In [None]:
# Usa uno screenshot con testo o un'immagine con testo
# Esempio: salva uno screenshot del tuo browser come 'screenshot.png'

# Se hai uno screenshot locale:
# image_data = encode_image_from_path("screenshot.png")

# Oppure usa un'immagine con testo da Wikipedia
text_image_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/7/7e/Lorem_ipsum_text.svg/800px-Lorem_ipsum_text.svg.png"

display(display_image_from_url(text_image_url, 600))

image_data = encode_image_from_url(text_image_url)
result = analyze_image(image_data, """Estrai tutto il testo visibile in questa immagine.
Trascrivi esattamente come appare.""")
print(result)

### 2.4 Esercizio: Analisi Grafici

In [None]:
# Creiamo un grafico da analizzare
import matplotlib.pyplot as plt
import numpy as np

# Dati di esempio
months = ['Gen', 'Feb', 'Mar', 'Apr', 'Mag', 'Giu']
sales_2023 = [45, 52, 48, 63, 71, 68]
sales_2024 = [51, 58, 62, 75, 82, 89]

plt.figure(figsize=(10, 6))
x = np.arange(len(months))
width = 0.35

plt.bar(x - width/2, sales_2023, width, label='2023', color='steelblue')
plt.bar(x + width/2, sales_2024, width, label='2024', color='coral')

plt.xlabel('Mese')
plt.ylabel('Vendite (migliaia ‚Ç¨)')
plt.title('Confronto Vendite 2023 vs 2024')
plt.xticks(x, months)
plt.legend()
plt.grid(axis='y', alpha=0.3)

plt.savefig('chart.png', dpi=100, bbox_inches='tight')
plt.show()
print("Grafico salvato come 'chart.png'")

In [None]:
# Analizza il grafico con Claude Vision
chart_data = encode_image_from_path("chart.png")

analysis_prompt = """
Analizza questo grafico e rispondi:

1. Che tipo di grafico √®?
2. Quali dati sono rappresentati?
3. Qual √® il trend principale?
4. In quale mese c'√® stata la crescita maggiore year-over-year?
5. Quali conclusioni business si possono trarre?
"""

result = analyze_image(chart_data, analysis_prompt, "image/png")
print(result)

### 2.5 Esercizio: Confronto Immagini

In [None]:
# Confronta due immagini
# Puoi usare due immagini generate con prompt diversi

def compare_images(image1_data: str, image2_data: str, prompt: str) -> str:
    """Confronta due immagini con Claude Vision."""
    response = client.messages.create(
        model="claude-3-haiku-20240307",
        max_tokens=1024,
        messages=[{
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {"type": "base64", "media_type": "image/jpeg", "data": image1_data}
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {"type": "base64", "media_type": "image/jpeg", "data": image2_data}
                },
                {"type": "text", "text": prompt}
            ]
        }]
    )
    return response.content[0].text

# Esempio con due immagini di Wikipedia
cat1_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Cat03.jpg/1200px-Cat03.jpg"
cat2_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/4/4d/Cat_November_2010-1a.jpg/1200px-Cat_November_2010-1a.jpg"

cat1_data = encode_image_from_url(cat1_url)
cat2_data = encode_image_from_url(cat2_url)

comparison = compare_images(cat1_data, cat2_data, 
    "Confronta questi due gatti. Descrivi le differenze in: colore, posizione, espressione, ambiente.")
print(comparison)

---
## Parte 3: Mini-Progetto Creativo - Storia Visuale (1h 30min)

Crea una breve storia visuale combinando generazione e analisi di immagini.

### Obiettivo
Creare una storia di 4-5 scene con:
1. Immagini generate (via Stable Diffusion)
2. Descrizioni/narrazione (via Claude)
3. Un tema coerente

### Template Storia

### Scena 1: Introduzione

**Prompt per generazione immagine:**
```
[Il tuo prompt per Stable Diffusion]
```

**Immagine generata:** [Salva come scene1.jpg]

**Narrazione:** [Chiedi a Claude di scrivere la narrazione basandosi sull'immagine]

In [None]:
# Dopo aver generato e salvato scene1.jpg
# Analizza e genera narrazione

# scene1_data = encode_image_from_path("scene1.jpg")
# narration1 = analyze_image(scene1_data, 
#     """Questa √® la prima scena di una storia.
#     Scrivi un paragrafo di narrazione (50-100 parole) che:
#     - Introduce il protagonista
#     - Descrive l'ambientazione
#     - Crea atmosfera
#     Stile: narrativa per ragazzi, avvincente.""")
# print(narration1)

### Scena 2: Sviluppo

**Prompt per generazione immagine:**
```
[Il tuo prompt - deve mostrare uno sviluppo della storia]
```

**Immagine generata:** [Salva come scene2.jpg]

**Narrazione:**

In [None]:
# scene2_data = encode_image_from_path("scene2.jpg")
# narration2 = analyze_image(scene2_data,
#     f"""Questa √® la seconda scena. Prima √® successo:
#     {narration1}
#     
#     Continua la narrazione (50-100 parole) descrivendo cosa succede ora.""")
# print(narration2)

### Scena 3: Conflitto/Sfida

**Prompt per generazione immagine:**
```
[Il tuo prompt - mostra una sfida o conflitto]
```

**Immagine generata:** [Salva come scene3.jpg]

**Narrazione:**

### Scena 4: Risoluzione

**Prompt per generazione immagine:**
```
[Il tuo prompt - mostra la risoluzione]
```

**Immagine generata:** [Salva come scene4.jpg]

**Narrazione:**

### Assemblaggio Finale

In [None]:
# Funzione per creare la storia completa
def create_visual_story(scenes: list[dict]) -> str:
    """Crea una storia visuale formattata.
    
    Args:
        scenes: Lista di dict con 'image_path' e 'narration'
    """
    story = "# La Mia Storia Visuale\n\n"
    
    for i, scene in enumerate(scenes, 1):
        story += f"## Scena {i}\n\n"
        story += f"![Scena {i}]({scene['image_path']})\n\n"
        story += f"{scene['narration']}\n\n"
        story += "---\n\n"
    
    return story

# Esempio (decommentare e completare con le tue scene)
# scenes = [
#     {"image_path": "scene1.jpg", "narration": narration1},
#     {"image_path": "scene2.jpg", "narration": narration2},
#     {"image_path": "scene3.jpg", "narration": narration3},
#     {"image_path": "scene4.jpg", "narration": narration4},
# ]
# story = create_visual_story(scenes)
# 
# # Salva come markdown
# with open("my_story.md", "w") as f:
#     f.write(story)
# print("Storia salvata in my_story.md!")

---
## Riflessione Finale

### Cosa ho imparato:

**Generazione immagini:**
1. 
2. 
3. 

**Analisi immagini:**
1. 
2. 
3. 

**Sfide incontrate:**
1. 
2. 

**Possibili applicazioni future:**
1. 
2. 
3. 

---
## Bonus: Batch Processing Immagini

In [None]:
def batch_analyze_images(image_paths: list[str], prompt: str) -> list[dict]:
    """Analizza multiple immagini in batch.
    
    Args:
        image_paths: Lista di percorsi immagini
        prompt: Prompt da usare per ogni immagine
    
    Returns:
        Lista di dict con path e analisi
    """
    results = []
    
    for path in image_paths:
        try:
            # Determina il media type
            ext = path.lower().split('.')[-1]
            media_type = {
                'jpg': 'image/jpeg',
                'jpeg': 'image/jpeg',
                'png': 'image/png',
                'gif': 'image/gif',
                'webp': 'image/webp'
            }.get(ext, 'image/jpeg')
            
            image_data = encode_image_from_path(path)
            analysis = analyze_image(image_data, prompt, media_type)
            
            results.append({
                "path": path,
                "analysis": analysis,
                "success": True
            })
            
        except Exception as e:
            results.append({
                "path": path,
                "error": str(e),
                "success": False
            })
    
    return results

# Esempio di utilizzo
# results = batch_analyze_images(
#     ["scene1.jpg", "scene2.jpg", "scene3.jpg"],
#     "Genera un alt text per accessibilit√† (max 125 caratteri)"
# )
# 
# for r in results:
#     print(f"{r['path']}: {r.get('analysis', r.get('error'))}")