#  PikaPikaGenerator - Introduction and Exploration of the Dataset
# 
**Progetto:** Generative Synthesis of Pokémon Sprites from Textual Descriptions  
 **Corso:** Deep Learning - Politecnico di Bari  
 **Studente:** Pasquale Alessandro Denora  
 **Professore:** Vito Walter Anelli 

##  Indice

1. [Panoramica del Progetto](#1-panoramica-del-progetto)
2. [Motivazioni e Obiettivi](#2-motivazioni-e-obiettivi)
3. [Dataset e Risorse](#3-dataset-e-risorse)
4. [Roadmap dei Notebook](#4-roadmap-dei-notebook)

---


# 1. Panoramica del Progetto

 Obiettivo Principale

**PikaPikaGenerator** è un sistema avanzato di **text-to-image generation** che utilizza tecniche di deep learning per generare sprite di Pokémon partendo da descrizioni testuali del Pokédx. Il progetto implementa un'architettura encoder-decoder con meccanismi di attention per l'allineamento semantico tra testo e immagine.

 Architettura di Alto Livello

Il sistema è composto da tre componenti principali:

1. **Text Encoder**: Modello BERT pre-addestrato per la comprensione del linguaggio naturale
2. **Attention Mechanism**: Sistema di attenzione per l'allineamento testo-immagine
3. **Image Generator**: Rete CNN generativa per la sintesi delle sprite

  Caratteristiche Innovative

- **Transfer Learning**: Utilizzo di BERT pre-addestrato per encoding testuale
- **Attention Visualization**: Meccanismi interpretabili per analisi qualitativa
- **Controlled Generation**: Controllo della variabilità tramite rumore gaussiano
- **Comprehensive Evaluation**: Valutazione con metriche quantitative e qualitative
- **Interactive Demo**: Interfaccia web per testing e dimostrazione

---

 # 2. Motivazioni e Obiettivi

 Obiettivi Didattici

Il progetto affronta diverse sfide fondamentali del deep learning moderno:

 **Multimodal Learning**
- Integrazione di informazioni testuali e visuali
- Allineamento semantico cross-modale
- Rappresentazioni condivise per diversi tipi di dati

 **Generative Modeling**
- Reti neurali generative avanzate
- Controllo della qualità e diversità
- Stabilità del training in domini specifici

 **Attention Mechanisms**
- Implementazione di attention multi-head
- Interpretabilità dei modelli neurali
- Visualizzazione dei pattern di attenzione

 Contributi Scientifici

 **Metodologici**
- Adattamento di architetture text-to-image per domini specifici
- Strategie di training per datasets di dimensioni limitate
- Tecniche di evaluation per generazione condizionale

 **Tecnici**
- Pipeline end-to-end ottimizzata per sprite generation
- Sistema di attention interpretabile e visualizzabile
- Framework modulare per facile estensione e sperimentazione

 Applicazioni Pratiche

- **Game Development**: Prototipazione rapida di asset visivi
- **Content Creation**: Automazione della generazione di artwork
- **AI Research**: Studio dell'allineamento multimodale
- **Educational Tools**: Dimostrazione pratica di concetti avanzati

---

# 3. Dataset e Risorse

 The Complete Pokédex Dataset

Il progetto utilizza il **"Complete Pokédx Dataset"** che rappresenta una risorsa comprensiva per la ricerca su Pokémon:

**Fonte**: [GitHub - cristobalmitchell/pokedex](https://github.com/cristobalmitchell/pokedex/)

#  Struttura del Dataset

In [None]:
dataset/
├── data/
│   └── pokemon.csv              # Metadati completi (898 Pokémon)
│       ├── national_number      # Numero identificativo
│       ├── english_name         # Nome in inglese
│       ├── description          # Descrizione del Pokédx
│       ├── primary_type         # Tipo primario
│       ├── secondary_type       # Tipo secondario (opzionale)
│       └── ... (altre features)
│
└── images/
├── small_images/            # Sprite 215×215 pixel (training)
├── large_images/            # Sprite alta risoluzione
├── alt_images/              # Forme alternative
└── type_icons/              # Icone dei tipi elementali

 Caratteristiche del Dataset

| **Aspetto** | **Dettaglio** |
|-------------|---------------|
| **Copertura** | Generazioni I-VIII (898 Pokémon) |
| **Qualità Immagini** | Sprite ufficiali ad alta risoluzione |
| **Descrizioni** | Testi ufficiali del Pokédex |
| **Metadati** | Tipi, statistiche, abilità complete |
| **Formato** | PNG per immagini, CSV per metadati |

**Vantaggi**
- **Dominio Chiuso**: Universo ben definito con regole consistenti
- **Alta Qualità**: Sprite ufficiali con stile artistico uniforme
- **Ricchezza Semantica**: Descrizioni dettagliate e variegate
- **Dimensione Gestibile**: Scala appropriata per esperimenti accademici
- **Diversità Visiva**: Ampia varietà di forme, colori e caratteristiche

 **Sfide**
- **Dimensione Limitata**: ~900 campioni richiedono strategie specifiche
- **Sbilanciamento**: Alcuni tipi più rappresentati di altri
- **Variabilità Stilistica**: Sprite di epoche diverse con stili leggermente diversi


## 4. Roadmap dei Notebook

Serie Completa dei Notebook

La documentazione del progetto PikaPikaGenerator è organizzata in una serie progressiva di **6 notebook specializzati**, ciascuno focalizzato su un aspetto specifico dello sviluppo del sistema. 
Questa struttura modulare permette un apprendimento graduale e una comprensione approfondita di ogni componente.


**Notebook 1: Introduzione e Esplorazione Dataset**  

**Notebook 2: Preprocessing dei Dati**  

**Notebook 3: Architettura del Modello**  

**Notebook 4: Training del Modello**  

**Notebook 5: Valutazione del Modello**  

**Notebook 6: Demo Interattiva**  