# Progetto - Complementi di Basi di Dati A.A. 2022/2023

## Consegna Progetto

#### Introduzione

L'obiettivo del progetto è condurre un'analisi dettagliata di un DB a scelta, possibilmente evitando i DBMS visti a lezione (i.e., MongoDB, Neo4J, Elasticsearch).

Un'analisi approfondita del DB è fondamentale per comprenderne le caratteristiche, identificare eventuali problemi e suggerire soluzioni per migliorare le prestazioni complessive.

Il progetto può essere svolto in due modalità:

1. Creando un file *docker-compose.yml* con all'interno l'indicazione di un servizio relativo al DBMS che avete scelto;
2. Installare il DBMS sulla vostra macchina.

Non essendo **Docker** un argomento del corso, non è obbligatorio il suo utilizzo per lo svolgimento del progetto. Per chi fosse interessato, sulla pagina del corso mettiamo a disposizione il materiale dei laboratori come esempio di utilizzo di Docker (Ricordiamo che è possibile cercare le immagini Docker all'interno di [Docker Hub](https://hub.docker.com/)).

La connessione e le query verranno svolte utilizzando il linguaggio **Python** all'interno di questo file **Jupyter**.

Il progetto deve affrontare i seguenti:

1. Introduzione e Descrizione del DBMS scelto;
2. Libreria/e DBMS;
3. Creazione e Connessione al DB;
4. Operazioni CRUD;
5. Comparazione con i DBMS visti a lezione;
6. Esempi di query;
7. Analisi delle tempistiche delle query.

#### Consegna

E'richiesto l'invio del file Jupyter.

Per le celle contenenti il codice, l'output dovrà essere presente nel file di consegna.

#### Nota

Di seguito riportiamo le indicazioni da seguire per lo svolgimento del progetto.

### Introduzione e descrizione del DBMS scelto

Questa sezione ha lo scopo di descrivere il DBMS scelto per lo svolgimento del progetto:

- Descrizione del DBMS;
- Caratteristiche del DBMS;
- Installazione su Windows, MacOS e Linux.
- Pro e Contro;
- Analisi di servizi/prodotti che utilizzano il DBMS in analisi.

### Libreria/e DBMS

Descrivere la libreria o le librerie necessarie per connettersi al DBMS scelto (analogamente a **pymongo** per MongoDB e **py2neo** per Neo4J):
- Caratteristiche della libreria (e.g., nome, modalità di installazione);
- Indicazione del link alla documentazione.



### Creazione e connessione al DB

Mostrare come creare un'istanza del DBMS e come effettuare la connessione al DB in modo da gestire i dati (utilizzando le librerie installate e descritte sopra).

L'istanza creata dovrà essere utilizzata per gestire i dati nelle prossime sezioni.

### Operazioni CRUD

Mostrare come vengono affrontate le operazioni CRUD nel DB in analisi, evidenziando sia la sintassi, sia esempi concreti per ogni operazione:

1. **Create**: Aggiunta dei dati sia in modalità singola che multipla. Quindi come viene aggiunto un singolo dato e un insieme di dati al DB (analogo alla *insert_one* e *insert_many* di MongoDB);
2. **Read**: Lettura dei dati dal DB. In questo caso devono essere mostrati i metodi base per la lettura dei dati:
    - Lettura di tutti i dati;
    - Una semplice query di selezione a vostro piacere.
3. **Update**: Aggiornamento dei dati presenti nel database. Mostrare due query che aggiornano i dati inseriti precedentemente;
4. **Delete**: Eliminazione dei dati sia in modalità singola che multipla. Mostrare una eliminazione singola e una multipla.

### Comparazione con i DBMS visti a lezione

Mostrare le principali differenze con i DB visti a lezione:

- Differenze rispetto a come vengono salvati i dati nel DB in analisi;
- Differenze nella struttura delle query, ad esempio se è più o meno intuitiva rispetto ai linguaggi di interrogazione visti a lezione;
- Analisi sulla documentazione (e.g., più o meno intuitiva e semplice rispetto ai DB visti a lezione).

### Esempi di Query

Definire 5 query che ritenete rilevanti dopo aver osservato i dati inseriti all'interno del database e mostrare i risultati nelle celle in output. 

Almeno due delle 5 query devono risultare più complesse. La complessità che si prenderà in considerazione comprende queste caratteristiche:

- Query che aggregano dei dati;
- Query che contengono query innestate;
- Query che effettuano più operazioni.

### Analisi delle tempistiche delle Query

Riportare le tempistiche delle query svolte nella sezione sopra. Per farlo è possibile procedere in con due modalità:

1. Attraverso un metodo (o un parametro) presente nel DBMS che restituisce il tempo di esecuzione;
2. Attraverso la libreria [time](https://docs.python.org/3/library/time.html) presente in Python per calcolare il lasso di tempo di esecuzione della query

Inserire un commento in merito ai tempi di esecuzione con eventuale indicazione dei metodi applicabili per il loro miglioramento.

### Contributors

I contributors, o contributori, ovvero gli studenti che hanno partecipato all'attività di progetto. Per ognuno di essi riportare **Nome**, **Cognome** e **Matricola**.