Cours : SQL pour Débutant(e)s Jour 3 - Approfondissement des Requêtes SQL
Lien : https://www.youtube.com/watch?v=4Ro69oqZ20s

Github le coin stat : https://github.com/LeCoinStat/LeCoinStat/tree/main/Bien_Debuter_SQL
Fichiers Github récupérés : https://github.com/LeCoinStat/LeCoinStat/tree/main/Bien_Debuter_SQL/Jour3


In [27]:
import duckdb
from duckdb.typing import BOOLEAN, VARCHAR
from skimpy import skim
import re

In [28]:
# Fonction pour effectuer des requêtes SQL avec du REGEX
def regexp(pattern: str, string: str) -> bool:
    return bool(re.search(pattern, string))

In [29]:
# Création d'une BD virtuelle
conn = duckdb.connect()

In [30]:
# Enregistrement de la fonction ci-avant pour les requêtes SQL
conn.create_function("regexp", regexp, [VARCHAR, VARCHAR], BOOLEAN)

<duckdb.duckdb.DuckDBPyConnection at 0x25838615cf0>

## Fichier des produits

In [31]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
products_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Produits.csv', header=True)
    """
).df()

In [32]:
# Stats de la DF
skim(products_df)

In [33]:
# Enregistrement de la DF ci-avant dans une BD virtuelle
conn.register('products_df', products_df)

<duckdb.duckdb.DuckDBPyConnection at 0x25838615cf0>

## Fichier des clients

In [34]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
customers_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Clients.csv', header=True)
    """
).df()

In [35]:
# Données stats de la DF
skim(customers_df)

In [36]:
# Enregistrement de la DF ci-avant en BD virtuelle (SQL : requête CTE)
conn.register('customers_df', customers_df)

<duckdb.duckdb.DuckDBPyConnection at 0x25838615cf0>

## Requêtes SQL

Liste des produits qui contiennent 'TV' avec LIKE

In [37]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM products_df
    -- Filtre
    WHERE Description LIKE '%TV%'
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,2,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",129,51
1,7,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",85,72
2,12,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,4
3,16,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",699,50
4,29,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,80
5,33,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,49
6,35,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,47
7,38,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,22
8,44,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,40
9,48,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",699,24


Liste des produits qui contiennent 'TV' avec REGEXP

In [38]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM products_df
    -- Filtre avec pour argument : pattern, colonne ciblée
    WHERE regexp('TV', NomProduit)
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,2,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",129,51
1,7,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",85,72
2,12,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,4
3,16,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",699,50
4,29,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,80
5,33,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,49
6,35,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,47
7,38,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",799,22
8,44,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",399,40
9,48,Samsung TV 55',"55-inch 4K UHD Smart TV with HDR, Crystal Disp...",699,24


Liste des produits dont le nom commence par la lettre D avec LIKE

In [39]:
conn.execute(
    """
    -- Champs récupérés
    SELECT *
    FROM products_df
    -- Filtre
    WHERE NomProduit LIKE 'D%'
    -- Trie
    ORDER BY NomProduit ASC
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,41,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,13
1,6,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,28
2,98,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,799,33
3,89,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,86
4,71,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,85,90
5,67,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,32
6,22,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,129,93
7,24,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,34
8,65,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,8
9,31,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,2


Liste des produits dont le nom commence par la lettre D avec REGEXP

In [40]:
conn.execute(
    """
    -- Champs récupérés
    SELECT *
    FROM products_df
    -- Filtre avec en argument : patter, nom de la colonne ciblée
    WHERE regexp('^D', NomProduit)
    -- Trie
    ORDER BY NomProduit ASC
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,41,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,13
1,6,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,28
2,98,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,799,33
3,89,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,86
4,71,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,85,90
5,67,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,299,32
6,22,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,129,93
7,24,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,34
8,65,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,8
9,31,Dell XPS 13,13.4-inch FHD+ laptop with 10th Gen Intel Core...,999,2


Liste des produits qui se termine par la lettre M avec LIKE

In [41]:
conn.execute(
    """
    -- Champs récupérés
    SELECT *
    FROM products_df
    -- Filtre
    WHERE NomProduit LIKE '%m'
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,5,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,999,58
1,10,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,699,47
2,11,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,999,39
3,14,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,799,82
4,19,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,13
5,28,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,129,84
6,34,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,92
7,36,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,85,15
8,40,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,95
9,42,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,13


Liste des produits qui se termine par la lettre M avec REGEXP

In [42]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM products_df
    -- Filtre avec pour arguments : patern, nom de la colonne ciblée
    WHERE regexp('m$', NomProduit)
    """
).df()

Unnamed: 0,ProduitID,NomProduit,Description,PrixUnitaire,FournisseurID
0,5,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,999,58
1,10,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,699,47
2,11,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,999,39
3,14,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,799,82
4,19,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,13
5,28,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,129,84
6,34,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,92
7,36,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,85,15
8,40,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,95
9,42,Dyson Vacuum,Cordless vacuum cleaner with strong suction po...,59,13


Liste des clients dont le numéro du téléphone commence par '05' ou '04' avec LIKE

In [43]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre
    WHERE NumeroTelephone LIKE '04%' OR NumeroTelephone LIKE '05%'
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,1,Thompson,Shannon,"384 Howard Parks, New Tony, DE 67522",thompson.shannon@gmail.com,425163679
1,6,Scott,Jacob,"474 Rogers Fork Apt. 821, Chelseabury, MO 72167",scott.jacob@gmail.com,461756294
2,12,Smith,Jeremy,"USCGC Taylor, FPO AE 79668",smith.jeremy@gmail.com,458994501
3,14,Sylvia,Nicole,"68737 Beasley Fall Apt. 435, Lake Kennethshire...",sylvia.nicole@gmail.com,408607465
4,18,Soto,Holly,"48506 Foster Falls Apt. 055, Lake Cameronton, ...",soto.holly@gmail.com,403071718
5,37,Glenn,Monica,"3183 Albert Wall Suite 990, New Timothymouth, ...",glenn.monica@gmail.com,471358315
6,47,Griffith,Becky,"PSC 6521, Box 4152, APO AA 74450",griffith.becky@gmail.com,404708413
7,55,Rogers,Ms.,"60258 Smith Corner Suite 604, North Kelly, FL ...",rogers.ms.@gmail.com,407353811
8,70,Martin,Wayne,"PSC 5886, Box 9105, APO AA 83417",martin.wayne@gmail.com,453697559
9,77,Trujillo,Angela,"2554 Barbara Ramp Suite 917, Lake Josephton, D...",trujillo.angela@gmail.com,468557877


Liste des clients dont le numéro de téléphone commence par '05' ou '04' avec REGEXP

In [44]:
conn.execute(
    """
    -- Récupération des champs
    SELECT *
    FROM customers_df
    -- Filtre avec pour arguments : pattern, nom de la colonne ciblée
    WHERE regexp('^04|^05', NumeroTelephone)
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,1,Thompson,Shannon,"384 Howard Parks, New Tony, DE 67522",thompson.shannon@gmail.com,425163679
1,2,Pham,Benjamin,"15250 Anita Pine Apt. 887, New Kristenport, AR...",pham.benjamin@gmail.com,544573781
2,6,Scott,Jacob,"474 Rogers Fork Apt. 821, Chelseabury, MO 72167",scott.jacob@gmail.com,461756294
3,12,Smith,Jeremy,"USCGC Taylor, FPO AE 79668",smith.jeremy@gmail.com,458994501
4,14,Sylvia,Nicole,"68737 Beasley Fall Apt. 435, Lake Kennethshire...",sylvia.nicole@gmail.com,408607465
5,18,Soto,Holly,"48506 Foster Falls Apt. 055, Lake Cameronton, ...",soto.holly@gmail.com,403071718
6,27,Brown,Danielle,"732 Joshua Ways, Jamesfort, OH 72222",brown.danielle@gmail.com,590619668
7,29,Jimenez,Susan,"8140 Susan Port Suite 208, West Christopher, N...",jimenez.susan@gmail.com,578759133
8,37,Glenn,Monica,"3183 Albert Wall Suite 990, New Timothymouth, ...",glenn.monica@gmail.com,471358315
9,40,Johnson,Stephanie,"386 Jermaine Plain Apt. 929, Williamsville, NM...",johnson.stephanie@gmail.com,557240325


Donner la liste des clients dont le numéro de téléphone commence par 05 ou se termine par 94 avec LIKE

In [45]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre
    WHERE NumeroTelephone LIKE '05%' OR NumeroTelephone LIKE '%94'
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,2,Pham,Benjamin,"15250 Anita Pine Apt. 887, New Kristenport, AR...",pham.benjamin@gmail.com,544573781
1,27,Brown,Danielle,"732 Joshua Ways, Jamesfort, OH 72222",brown.danielle@gmail.com,590619668
2,29,Jimenez,Susan,"8140 Susan Port Suite 208, West Christopher, N...",jimenez.susan@gmail.com,578759133
3,40,Johnson,Stephanie,"386 Jermaine Plain Apt. 929, Williamsville, NM...",johnson.stephanie@gmail.com,557240325
4,42,Coleman,Dennis,"925 Robertson Springs Suite 489, Port Jeffreyb...",coleman.dennis@gmail.com,516922641
5,45,Pitts,Ronald,"26300 Rodriguez Mission Apt. 754, Port Joel, N...",pitts.ronald@gmail.com,589602136
6,62,Williams,Yesenia,"PSC 6015, Box 6383, APO AA 64305",williams.yesenia@gmail.com,535311132
7,78,Mcdaniel,Randall,"40675 Keith Neck Apt. 957, Thomastown, MI 92257",mcdaniel.randall@gmail.com,503119093
8,84,Jordan,Lynn,"617 Shelby Ranch Apt. 091, Amyburgh, CO 46872",jordan.lynn@gmail.com,523192390
9,86,Wilson,Lonnie,"95457 Matthews Court Suite 976, Caldwellside, ...",wilson.lonnie@gmail.com,537920637


Donner la liste des clients dont le numéro de téléphone commence par 05 ou se termine par 94 avec REGEXP

In [46]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre avec pour arguments : pattern, nom de la colonne ciblée
    WHERE regexp('^05|94$', NumeroTelephone)
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,2,Pham,Benjamin,"15250 Anita Pine Apt. 887, New Kristenport, AR...",pham.benjamin@gmail.com,544573781
1,6,Scott,Jacob,"474 Rogers Fork Apt. 821, Chelseabury, MO 72167",scott.jacob@gmail.com,461756294
2,27,Brown,Danielle,"732 Joshua Ways, Jamesfort, OH 72222",brown.danielle@gmail.com,590619668
3,29,Jimenez,Susan,"8140 Susan Port Suite 208, West Christopher, N...",jimenez.susan@gmail.com,578759133
4,40,Johnson,Stephanie,"386 Jermaine Plain Apt. 929, Williamsville, NM...",johnson.stephanie@gmail.com,557240325
5,42,Coleman,Dennis,"925 Robertson Springs Suite 489, Port Jeffreyb...",coleman.dennis@gmail.com,516922641
6,45,Pitts,Ronald,"26300 Rodriguez Mission Apt. 754, Port Joel, N...",pitts.ronald@gmail.com,589602136
7,62,Williams,Yesenia,"PSC 6015, Box 6383, APO AA 64305",williams.yesenia@gmail.com,535311132
8,78,Mcdaniel,Randall,"40675 Keith Neck Apt. 957, Thomastown, MI 92257",mcdaniel.randall@gmail.com,503119093
9,84,Jordan,Lynn,"617 Shelby Ranch Apt. 091, Amyburgh, CO 46872",jordan.lynn@gmail.com,523192390


Donner la liste des clients dont le nom contient la lettre 'R' 
suivi de n'importe quelle autre lettre et suivi de la lettre 'C'  avec LIKE

In [67]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre
    WHERE Nom LIKE 'R%_c%'
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,46,Richardson,Cheyenne,"70396 George Trafficway, New Laurie, KS 05583",richardson.cheyenne@gmail.com,639669352


Donner la liste des clients dont le nom contient la lettre 'R' 
suivi de n'importe quelle autre lettre et suivi de la lettre 'C'  avec REGEXP

In [70]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre avec en arguments : patter, nom de la colonne ciblée
    WHERE regexp('^R.c', Nom) 
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,46,Richardson,Cheyenne,"70396 George Trafficway, New Laurie, KS 05583",richardson.cheyenne@gmail.com,639669352


Liste des clients dont le nom commence par 'R' et se termine par 'A' avec LIKE

In [73]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre
    WHERE Nom LIKE 'R%%a'
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,85,Rivera,Deborah,"390 Danielle Valley, Martinezberg, SD 64539",rivera.deborah@gmail.com,168181172


Liste des clients dont le nom commence par 'R' et se termine par 'A' avec REGEXP

In [74]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre avec en arguments : pattern, nom de la colonne ciblée
    WHERE regexp('^R.*a$', Nom)
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,85,Rivera,Deborah,"390 Danielle Valley, Martinezberg, SD 64539",rivera.deborah@gmail.com,168181172


Liste des clients dont le nom contient 'it' ou 'ie' ou 'il' ou 'is' avec REGEXP

In [76]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre avec en arguments : pattern, nom de la colonne ciblée
    WHERE regexp('i[elst]', Nom)
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,10,Wilkins,Patricia,"400 Tate Glen, Port Kristenfurt, OH 07250",wilkins.patricia@gmail.com,888856897
1,12,Smith,Jeremy,"USCGC Taylor, FPO AE 79668",smith.jeremy@gmail.com,458994501
2,15,Smith,Cynthia,"382 Daniel Groves Suite 995, East Sherryfurt, ...",smith.cynthia@gmail.com,219759485
3,17,Carrillo,Brianna,"543 Austin Rest Apt. 109, East Amystad, FL 57767",carrillo.brianna@gmail.com,670055675
4,20,Smith,Justin,"603 Daniel Lakes Apt. 472, New Sandra, CT 81632",smith.justin@gmail.com,843655697
5,22,Harris,Charles,"443 Berry Rapid, Medinaberg, AL 66035",harris.charles@gmail.com,261705373
6,24,Schmitt,Rebecca,"75186 Brian Extension Apt. 693, Howardtown, RI...",schmitt.rebecca@gmail.com,265024027
7,33,Davis,Cheryl,"USNV Chavez, FPO AA 64898",davis.cheryl@gmail.com,253815877
8,45,Pitts,Ronald,"26300 Rodriguez Mission Apt. 754, Port Joel, N...",pitts.ronald@gmail.com,589602136
9,47,Griffith,Becky,"PSC 6521, Box 4152, APO AA 74450",griffith.becky@gmail.com,404708413


Liste des clients dont le nom contient la lettre 'i' suivi d'une lettre comprise entre 'f' et 't' avec REGEXP

In [77]:
conn.execute(
    """
    -- Champs à récupérer
    SELECT *
    FROM customers_df
    -- Filtre avec en arguments : pattern, nom de la colonne ciblée
    WHERE regexp('i[f-t]', Nom)
    """
).df()

Unnamed: 0,ClientID,Nom,Prenom,Adresse,Email,NumeroTelephone
0,3,Rodriguez,Bonnie,"515 Henderson Coves Apt. 298, Lewismouth, OR 1...",rodriguez.bonnie@gmail.com,956054323
1,7,Rodriguez,Megan,"12744 Daniel Tunnel, Millerside, HI 91891",rodriguez.megan@gmail.com,55426480
2,8,Collins,Alexander,"231 Eric Spring, Paulahaven, SD 79669",collins.alexander@gmail.com,878299289
3,10,Wilkins,Patricia,"400 Tate Glen, Port Kristenfurt, OH 07250",wilkins.patricia@gmail.com,888856897
4,12,Smith,Jeremy,"USCGC Taylor, FPO AE 79668",smith.jeremy@gmail.com,458994501
5,15,Smith,Cynthia,"382 Daniel Groves Suite 995, East Sherryfurt, ...",smith.cynthia@gmail.com,219759485
6,17,Carrillo,Brianna,"543 Austin Rest Apt. 109, East Amystad, FL 57767",carrillo.brianna@gmail.com,670055675
7,19,Cunningham,Anthony,"525 Harmon Knoll Apt. 882, Browntown, OK 97421",cunningham.anthony@gmail.com,805308143
8,20,Smith,Justin,"603 Daniel Lakes Apt. 472, New Sandra, CT 81632",smith.justin@gmail.com,843655697
9,22,Harris,Charles,"443 Berry Rapid, Medinaberg, AL 66035",harris.charles@gmail.com,261705373
