# Base de données: interroger une base de données MySQL

## Imports

In [1]:
import os # exécuter du bash dans l'os?
import sqlite3 # exécuter du sql avec python grâce à sqlite3
import zipfile # pour dézipper
from pathlib import Path # se promener dans l'arborescence des fichiers
import requests # pour adresser sur le web

# Créer un dossier data avec 'mkdir' si le chemin n'existe pas encore

if not os.path.exists("../data"):
    os.mkdir("../data")

## Créer une base de données SQLite

In [2]:
# Créer un répertoire DB s'il n'existe pas encore

db_path = '../data/db'
nom_variable = '../data/essai'

if not os.path.exists(nom_variable):
    os.mkdir(nom_variable)

In [5]:
# Récupérer le fichier ZIP qui contient la DB de test

url = "https://www.sqlitetutorial.net/wp-content/uploads/2018/03/chinook.zip"

filename = url.split("/")[-1] # préparer le nom du fichier à partir de l'url en parcourant à l'envers et en prenant le dernier élément après avoir spliter l'url à l'aide du "/"
filename2 = url.split("/")[-2]

print(filename)
print(filename2)

# Récupérer le fichier zip dans la RAM

response = requests.get(url) # adressage avec 'get'

chinook.zip
03


In [6]:
# Ecrire le fichier sur le disque avec la méthode 'open' qui joint le nom du fichier à l'endroit d'écriture

with open(os.path.join(db_path, filename), 'wb') as f: # fonction définie comme 'f' pour écrire le contenu de 'response' qui chope le contenu à l'endroit de l'url
    f.write(response.content)

In [7]:
# help(open) # 'w' pour écrire le contenu, 'b' en mode binaire

In [8]:
# Extraire le zip pour obtenir la db

with zipfile.ZipFile(os.path.join(db_path, filename), 'r') as zip_ref: # lire le contenu du fichier zip et extraire le contenu dans le dossier 'db' et lui donner le nom du fichier voulu
    zip_ref.extractall(db_path)

## Schéma de la base de données

<img src="https://cdn.sqlitetutorial.net/wp-content/uploads/2015/11/sqlite-sample-database-color.jpg" />

## Se connecter à la base de données

In [9]:
conn = sqlite3.connect(os.path.join(db_path, "chinook.db")) # stocker la requête de connexion dans une variable
c = conn.cursor() # nommer le curseur 

## Trouver l'identifiant de Miles Davis

In [21]:
artist = 'Miles Davis'

query1 = f"""
    SELECT
        artistId
    FROM
        artists
    WHERE
        name = '{artist}';
"""
# écrire la requête dans un f-string 

ad = c.execute(query1)
artist_id = c.fetchone()[0]

print(ad)
print(artist_id)

<sqlite3.Cursor object at 0x7f480434f650>
68


In [22]:
help(c.fetchone())

Help on NoneType object:

class NoneType(object)
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __repr__(self, /)
 |      Return repr(self).
 |  
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.



## Trouver le nom du premier artiste de la DB

In [38]:
query1b = f"""
    SELECT
        name
    FROM
        artists
    WHERE
        artistId = 1;
"""
c.execute(query1b)
name = c.fetchone()[0]

print(name)

AC/DC


## Trouver les identifiants et les titres d'albums de Miles Davis

In [39]:
query2 = f"""
    SELECT
        albumId, title
    FROM 
        albums 
    WHERE 
        artistId = '{artist_id}';
"""
albums_ids = []
title = []

for row in c.execute(query2):
    albums_ids.append(str(row[0]))
    title.append(row[1]) # sélectionner la 2e donnée de la matrice générée par la requête

print(albums_ids)
print(title)

['48', '49', '157']
['The Essential Miles Davis [Disc 1]', 'The Essential Miles Davis [Disc 2]', 'Miles Ahead']


## Trouver les morceaux des albums de Miles Davis

In [40]:
query3 = f"""
    SELECT
        name,
        albumId
    FROM
        tracks
    WHERE 
        albumId IN ({",".join(albums_ids)});
"""

songs = set()
for row in c.execute(query3):
    songs.add(row[0])

print(f"\n{len(songs)} distinct songs found:\n")
for song in sorted(songs):
    print(song)


36 distinct songs found:

'Round Midnight
Black Satin
Blues For Pablo
Blues For Pablo (Alternate Take)
Bye Bye Blackbird
Compulsion
E.S.P.
Generique
I Don't Wanna Be Kissed (By Anyone But You)
I Don't Wanna Be Kissed (By Anyone But You) (Alternate Take)
Jean Pierre (Live)
Jeru
Lament
Little Church (Live)
Miles Ahead
Miles Runs The Voodoo Down
My Funny Valentine (Live)
My Ship
Nefertiti
New Rhumba
Now's The Time
Petits Machins (Little Stuff)
Portia
So What
Someday My Prince Will Come
Springsville
Springsville (Alternate Take)
Summertime
Tempus Fugit
The Duke
The Maids Of Cadiz
The Meaning Of The Blues
The Meaning Of The Blues/Lament (Alternate Take)
The Pan Piper
Time After Time
Walkin'


## En une seule requête...

In [10]:
query4 = f"""
    SELECT
        tracks.name,
        tracks.albumId
    FROM
        artists
        JOIN albums ON artists.artistId = albums.artistId
        JOIN tracks ON albums.albumId = tracks.albumId
    WHERE 
        artists.name = '{artist}';
"""

songs = set()
for row in c.execute(query4):
    songs.add(row[0])

print(f"\n{len(songs)} distinct songs found:\n")
for song in sorted(songs):
    print(song)


36 distinct songs found:

'Round Midnight
Black Satin
Blues For Pablo
Blues For Pablo (Alternate Take)
Bye Bye Blackbird
Compulsion
E.S.P.
Generique
I Don't Wanna Be Kissed (By Anyone But You)
I Don't Wanna Be Kissed (By Anyone But You) (Alternate Take)
Jean Pierre (Live)
Jeru
Lament
Little Church (Live)
Miles Ahead
Miles Runs The Voodoo Down
My Funny Valentine (Live)
My Ship
Nefertiti
New Rhumba
Now's The Time
Petits Machins (Little Stuff)
Portia
So What
Someday My Prince Will Come
Springsville
Springsville (Alternate Take)
Summertime
Tempus Fugit
The Duke
The Maids Of Cadiz
The Meaning Of The Blues
The Meaning Of The Blues/Lament (Alternate Take)
The Pan Piper
Time After Time
Walkin'


## Pour en savoir plus

- Tutoriel SQLite : https://www.sqlitetutorial.net/