# P2. Les vues SQL

## Définition d'une vue SQL  

Une vue n'est rien de plus qu'une instruction SQLite qui est stockée dans la base de données avec un nom associé. Il s'agit en fait d'une composition d'une table sous la forme d'une requête SQLite prédéfinie.

Une vue peut contenir toutes les lignes d'une table ou des lignes sélectionnées d'une ou plusieurs tables. Une vue peut être créée à partir d'une ou plusieurs tables qui dépendent de la requête SQLite écrite pour créer une vue.

## Code utilitaire

In [1]:
import os
import sqlite3
import pandas as pd   

In [2]:
from pathlib import Path

In [3]:
# Ouvre connection vers SQLite db
chemin_bdd = Path('db') / 'chinook.db'
conn = sqlite3.connect(chemin_bdd)

In [4]:
# Fonction permettant d'exécuter un requête SQL sur une BDD définie par sa connexion conn
def executer_requete(requete_sql, conn):
    try:
        cursor = conn.cursor()
        cursor.execute(requete_sql)
        conn.commit()
    except sqlite3.Error as e:
        print("Erreur lors de l'execution de la requête")
        print(e)
        return
    cursor.close()


## Example de vue SQL: v_albums

La requête suivante permet d'obtenir une liste (simplifiée) des albums / artistes correspondants:  

In [None]:
# Requete sur les tables albums & artists
requete = """
    SELECT AlbumId,
           Title,
           a.Name AS Artist
    FROM albums
    JOIN artists a on albums.ArtistId = a.ArtistId
    ORDER BY Artist;
"""

albums = pd.read_sql_query(requete, conn)
albums.head(5)

Le code ci-dessous permet de créer une vue correspondant à la requête ci-dessous :    
Référence vue sous SQLite : https://www.sqlite.org/lang_createview.html

In [None]:
# creation vue albums avec artistes
creation_vue_albums = """
    CREATE VIEW v_albums (
        AlbumId,
        Title,
        Artist)
    AS
        SELECT AlbumId,
               Title,
               a.Name AS Artist
        FROM albums
        JOIN artists a on albums.ArtistId = a.ArtistId
        ORDER BY Artist, Title;
"""

executer_requete(creation_vue_albums, conn)

Une fois la vue créé, on peut la réutiliser dans des requêtes SQL comme une table:  

In [None]:
# Utilisation de la vue v_albums
albums = pd.read_sql_query("SELECT * FROM v_albums LIMIT 10;", conn)
albums.head(5)

In [None]:
# Utilisation de la vue v_albums avec une clause WHERE
albums = pd.read_sql_query("SELECT * FROM v_albums WHERE Artist = 'U2';", conn)
albums

In [None]:
# Utilisation de la vue v_albums avec une autre jointure
requete = """
    SELECT a.AlbumId,
           a.Title,
           a.Artist,
           count(t.TrackId) as Tracks
    FROM v_albums a
    JOIN tracks t ON a.AlbumId = t.AlbumId
    GROUP BY 1, 2, 3
    ORDER BY 3, 2;
"""
albums = pd.read_sql_query(requete, conn)
albums.head()

In [None]:
# Effacer une vue
executer_requete("DROP VIEW IF EXISTS v_albums;", conn)

### Question: Avantages & Inconvénients des vues SQL

#### Les avantages

Voici les avantages de l'utilisation des vues dans SQL:

- Si nous devons conserver des informations sensibles en fournissant un accès limité aux utilisateurs, des vues sont utilisées à cette fin. Les vues sont utilisées pour afficher uniquement les données requises aux utilisateurs en protégeant les données sensibles.

- Comme une vue de base de données est associée à de nombreuses tables sur lesquelles la vue est créée, elle simplifie la complexité de la requête.

- La vue est utilisée pour cacher aux utilisateurs finaux la complexité des tables sous-jacentes utilisées dans une base de données.

- Les vues sont utiles en cas de re-conception de la base de données afin de ne pas affecter les autres applications utilisant la même base de données.

- Les données des colonnes calculées peuvent être calculées très facilement lorsque nous interrogeons les données de la vue, car les vues permettent les colonnes calculées.

#### Les inconvénients

Malgré les nombreux avantages qu'offre la vue, elle présente toujours certains inconvénients, comme indiqué ci-dessous:

- L'un des principaux inconvénients de l'utilisation de la vue apparaît dans l'image lorsque nous modifions fréquemment les structures de table sur lesquelles la vue est créée. Ainsi, lorsque les structures de table sont modifiées, la vue doit également être modifiée.

- En outre, l'utilisation de la vue ralentit les performances des requêtes.

#### Conclusion

Les vues sont largement utilisées pour leurs nombreux avantages. Elles ajoutent une couche de sécurité supplémentaire à la base de données, ce qui est très essentiel pour tout système de gestion de base de données relationnelle.
Les vues sont flexibles en cas d'exposition des données aux utilisateurs finaux en affichant uniquement les données nécessaires, par exemple en utilisant des vues en lecture seule pour limiter les privilèges aux utilisateurs.
Mais les vues peuvent également être désavantageuses si les structures de table sous-jacentes changent beaucoup / fréquemment, augmentant ainsi la complexité du changement des vues en fonction des structures de table.
Ainsi, avec de nombreux avantages dans l'image, les vues sont un peu moins recommandées lorsque les performances de la requête de données sont vitales pour l'entreprise. Il dépend de nous de choisir l'utilisation de la vue dans notre base de données en validant correctement l'exigence métier afin de tirer plus d'avantages des vues afin d'augmenter les performances du système.

[Source](https://fr.photo-555.com/5751867-sql-views)

---

## Exercices de création / mise en oeuvre de vues

### Vue 1: caractéristiques complètes des Albums  
A partir de l'exemple de vue ci-dessus, créer et exploiter une nouvelle vue v_albums reprenant pour chaque album:  
- AlbumId
- Title
- Artist
- nb de pistes
- Durée totale de l'album (en minutes)
- Prix de l'album

In [5]:
# creation vue albums
creation_vue_albums = """
    CREATE VIEW v_albums (
        AlbumId,
        Title,
        Artist,
        'Nb de pistes',
        'Durée totale de l''album (min.)',
        'Prix de l''album')
    AS
        SELECT al.AlbumId,
               al.Title,
               ar.Name AS Artist,
               COUNT(t.TrackId) AS 'Nb de pistes',
               ROUND(SUM(t.Milliseconds)/60000., 2) AS 'Durée Totale de l''album (min.)',
               SUM(t.UnitPrice) AS 'Prix de l'' album'
        FROM albums al
         INNER JOIN artists ar ON al.ArtistId = ar.ArtistId
            LEFT JOIN tracks t ON al.AlbumId = t.AlbumId
        GROUP BY Title    
        ORDER BY Artist, Title;
"""

executer_requete(creation_vue_albums, conn)

In [6]:
# Utilisation de la vue v_albums
albums = pd.read_sql_query("SELECT * FROM v_albums LIMIT 10;", conn)
albums.head(5)

Unnamed: 0,AlbumId,Title,Artist,Nb de pistes,Durée totale de l'album (min.),Prix de l'album
0,1,For Those About To Rock We Salute You,AC/DC,10,40.01,9.9
1,4,Let There Be Rock,AC/DC,8,40.89,7.92
2,296,"A Copland Celebration, Vol. I",Aaron Copland & London Symphony Orchestra,1,3.3,0.99
3,267,Worlds,Aaron Goldberg,1,4.45,0.99
4,280,The World of Classical Favourites,Academy of St. Martin in the Fields & Sir Nevi...,2,7.75,1.98


In [None]:
# Effacer une vue
executer_requete("DROP VIEW IF EXISTS v_albums;", conn)

### Vue 2: caractéristiques détaillées des pistes
Créer et exploiter une nouvelle vue v_tracks reprenant pour chaque piste:  
- TrackId
- Name
- Genre
- Album
- Artist
- Composer
- Temps (en seconde)
- MediaType

In [7]:
# creation vue albums avec artistes
creation_vue_tracks = """
    CREATE VIEW v_tracks (
        TrackId,
        Name,
        Genre,
        Album,
        Artist,
        Composer,
        'Temps (en secondes)',
        MediaType)
    AS
        SELECT
	t.TrackId,
	t.Name,
	g.Name AS Genre,
	al.Title AS Album,
	ar.Name AS Artist,
	t.Composer AS Composer,
	(t.Milliseconds)/1000 AS 'Temps (en seconde)',
	mt.Name AS MediaType
FROM
	tracks t
LEFT JOIN albums al ON
	al.AlbumId = t.AlbumId
LEFT JOIN artists ar ON
	al.ArtistId = ar.ArtistId
LEFT JOIN genres g ON
	g.GenreId = t.GenreId 
LEFT JOIN media_types mt ON
	mt.MediaTypeId = t.MediaTypeId
ORDER BY
	Artist;
"""

executer_requete(creation_vue_tracks, conn)

In [8]:
# Utilisation de la vue v_tracks
albums = pd.read_sql_query("SELECT * FROM v_tracks LIMIT 25;", conn)
albums.head(25)

Unnamed: 0,TrackId,Name,Genre,Album,Artist,Composer,Temps (en secondes),MediaType
0,1,For Those About To Rock (We Salute You),Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",343,MPEG audio file
1,6,Put The Finger On You,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",205,MPEG audio file
2,7,Let's Get It Up,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",233,MPEG audio file
3,8,Inject The Venom,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",210,MPEG audio file
4,9,Snowballed,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",203,MPEG audio file
5,10,Evil Walks,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",263,MPEG audio file
6,11,C.O.D.,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",199,MPEG audio file
7,12,Breaking The Rules,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",263,MPEG audio file
8,13,Night Of The Long Knives,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",205,MPEG audio file
9,14,Spellbound,Rock,For Those About To Rock We Salute You,AC/DC,"Angus Young, Malcolm Young, Brian Johnson",270,MPEG audio file


In [None]:
# Effacer une vue
executer_requete("DROP VIEW IF EXISTS v_tracks;", conn)

### Vue 3: Vue augmentée invoices
A. Créer une nouvelle vue v_invoices à partir de la table invoices ajoutant 3 nouveaux attributs basés sur l'attribut `InvoiceDate`:  
- semaine de la transaction
- mois de la transaction
- année de la transaction

In [9]:
# creation vue augemntée invoices
creation_vue_invoices = """
    CREATE VIEW v_invoices (
        InvoiceId,
        CustomerId,
        InvoiceDate,
        BillingAddress,
        BillingCity,
        BillingState,
        BillingCountry,
        BillingPostalCode,
        Total,
        N_Week,
        Month,
        Year)
    AS
        SELECT*,
	   STRFTIME('%m', InvoiceDate) AS "Month",
	   STRFTIME('%W',InvoiceDate)+1 AS "Week_N",
	   STRFTIME('%Y',InvoiceDate) AS "Year"
    FROM invoices;
"""

executer_requete(creation_vue_invoices, conn)

In [10]:
# Utilisation de la vue v_invoices
albums = pd.read_sql_query("SELECT * FROM v_invoices LIMIT 10;", conn)
albums.head(10)

Unnamed: 0,InvoiceId,CustomerId,InvoiceDate,BillingAddress,BillingCity,BillingState,BillingCountry,BillingPostalCode,Total,N_Week,Month,Year
0,1,2,2009-01-01 00:00:00,Theodor-Heuss-Straße 34,Stuttgart,,Germany,70174,1.98,1,1,2009
1,2,4,2009-01-02 00:00:00,Ullevålsveien 14,Oslo,,Norway,0171,3.96,1,1,2009
2,3,8,2009-01-03 00:00:00,Grétrystraat 63,Brussels,,Belgium,1000,5.94,1,1,2009
3,4,14,2009-01-06 00:00:00,8210 111 ST NW,Edmonton,AB,Canada,T6G 2C7,8.91,1,2,2009
4,5,23,2009-01-11 00:00:00,69 Salem Street,Boston,MA,USA,2113,13.86,1,2,2009
5,6,37,2009-01-19 00:00:00,Berger Straße 10,Frankfurt,,Germany,60316,0.99,1,4,2009
6,7,38,2009-02-01 00:00:00,Barbarossastraße 19,Berlin,,Germany,10779,1.98,2,5,2009
7,8,40,2009-02-01 00:00:00,"8, Rue Hanovre",Paris,,France,75002,1.98,2,5,2009
8,9,42,2009-02-02 00:00:00,"9, Place Louis Barthou",Bordeaux,,France,33000,3.96,2,6,2009
9,10,46,2009-02-03 00:00:00,3 Chatham Street,Dublin,Dublin,Ireland,,5.94,2,6,2009


In [None]:
# Effacer une vue
executer_requete("DROP VIEW IF EXISTS v_invoices;", conn)

B. Exploiter la vue v_invoices ainsi crée pour déterminer les ventes annuelles par pays.

In [11]:
# Utilisation de la vue v_albums avec une autre jointure
requete = """
    SELECT 
        STRFTIME('%Y',InvoiceDate) AS "Year",
        i.BillingCountry AS 'Country',
        SUM(ii.Quantity) AS 'Nbr de titres vendus',
        SUM(ii.UnitPrice) AS 'income'
    FROM 
        v_invoices i
    JOIN invoice_items ii ON
        i.InvoiceId = ii.InvoiceId
    GROUP BY 
        Year, Country 
    ORDER BY
        1 DESC, SUM(ii.UnitPrice) DESC;
"""
albums = pd.read_sql_query(requete, conn)
albums.head(25)

Unnamed: 0,Year,Country,Nbr de titres vendus,income
0,2013,USA,86,85.14
1,2013,Canada,73,72.27
2,2013,France,41,40.59
3,2013,Brazil,38,37.62
4,2013,Czech Republic,25,36.75
5,2013,United Kingdom,29,28.71
6,2013,Portugal,25,24.75
7,2013,Argentina,25,24.75
8,2013,Netherlands,16,15.84
9,2013,Finland,16,15.84


### Vue 4: A vous de jouer
Créer et exploiter une nouvelle vue de votre choix  

In [12]:
# creation vue genres
creation_vue_genres = """
    CREATE VIEW v_genres (
        'ID Genre',
        Genre,
        'Nombre de pistes',
        'Durée totale (en minutes)',
        'Prix total par genre',
        'Coût moyen par genre')
    AS
        SELECT 
		g.GenreId as 'ID Genre',
		g.Name as 'Genre',
		COUNT(t.TrackId) as 'Nombre de pistes',
		SUM(t.Milliseconds)/60000 as 'Durée Totale (en minutes)',
		SUM(t.UnitPrice) as 'Prix Total par genre',
		AVG(t.UnitPrice) as 'Coût moyen par genre'
	FROM genres g
		LEFT JOIN tracks t ON g.GenreId = t.GenreId
	GROUP BY g.GenreId, g.Name
	ORDER BY g.Name;
"""

executer_requete(creation_vue_genres, conn)

In [13]:
# Utilisation de la vue v_invoices
albums = pd.read_sql_query("SELECT * FROM v_genres LIMIT 10;", conn)
albums.head(10)

Unnamed: 0,ID Genre,Genre,Nombre de pistes,Durée totale (en minutes),Prix total par genre,Coût moyen par genre
0,23,Alternative,40,176,39.6,0.99
1,4,Alternative & Punk,332,1296,328.68,0.99
2,6,Blues,81,364,80.19,0.99
3,11,Bossa Nova,15,54,14.85,0.99
4,24,Classical,74,362,73.26,0.99
5,22,Comedy,17,449,33.83,1.99
6,21,Drama,64,2746,127.36,1.99
7,12,Easy Listening,24,75,23.76,0.99
8,15,Electronica/Dance,30,151,29.7,0.99
9,13,Heavy Metal,28,138,27.72,0.99


In [None]:
# Effacer une vue
executer_requete("DROP VIEW IF EXISTS v_genres;", conn)