# L'opérateur CASE WHEN
---

Cours : SQL pour Débutant(e)s Jour 5 - Jointures, Sous-Requêtes, CASE
Lien : https://www.youtube.com/watch?v=kawRFZMQ-60

Github le coin stat : https://github.com/LeCoinStat/LeCoinStat/tree/main/Bien_Debuter_SQL
Fichiers Github récupérés : https://github.com/LeCoinStat/LeCoinStat/tree/main/Bien_Debuter_SQL/Jour5


> Syntaxe :
> ```
> SELECT colonnes,
>        CASE
>           WHEN condition THEN resultat1
>            ELSE resultat2
>        END AS nom_colonne_resultat
> FROM table;
> ```
> <br>

---
Explications : 

- CASE WHEN condition THEN resultat1 ELSE resultat2 END : applique une logique conditionnelle sur les données récupérées. 

Si la condition est vraie, alors le 'resultat1' est retourné. Sinon, le 'resultat2' est utilisé.
- END AS nom_colonne_resultat : attribue un nom à la colonne résultante de l'expression CASE.

Cette instruction est utile pour transformer des données en fonction de conditions spécifiques directement dans la requête SQL, permettant de simplifier la logique de traitement des données et de réduire le besoin de logique 
conditionnelle dans l'application cliente.

In [1]:
import duckdb
from skimpy import skim

In [2]:
# Connection à la librairie duckdb
conn = duckdb.connect()

## Fichier des produits

In [3]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
products_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Produits.csv', header=True);
    """
).df()

In [4]:
# Stats de la DF
skim(products_df)

In [5]:
# Enregistrement de la DF dans une BD virtuelle (requête SQL : VIEW)
conn.register('products_db', products_df)

<duckdb.duckdb.DuckDBPyConnection at 0x254772f7530>

## Fichier des employés

In [6]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
employees_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Employes.csv', header=True);
    """
).df()

In [7]:
# Stats de la DF
skim(employees_df)

In [8]:
# Enregistrement de la DF dans une BD virtuelle (requête SQL : VIEW)
conn.register('employees_db', employees_df)

<duckdb.duckdb.DuckDBPyConnection at 0x254772f7530>

## Fichier des ventes

In [9]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
sales_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Ventes.csv', header=True);
    """
).df()

In [10]:
# Stats de la DF
skim(sales_df)

In [11]:
# Enregistrement de la DF dans une BD virtuelle (requête SQL : VIEW)
conn.register('sales_db', sales_df)

<duckdb.duckdb.DuckDBPyConnection at 0x254772f7530>

## Fichier des clients

In [12]:
# Requête SQL : récupération de toutes les données du fichier .csv en DF
customers_df = conn.execute(
    """
    SELECT *
    FROM read_csv_auto('data/indexE/Clients.csv', header=True);
    """
).df()

In [13]:
# Stats de la DF
skim(customers_df)

In [14]:
# Enregistrement de la DF dans une BD virtuelle (requête SQL : VIEW)
conn.register('customers_db', customers_df)

<duckdb.duckdb.DuckDBPyConnection at 0x254772f7530>

## Requêtes SQL

Écrire une requête SQL permettant de classifier pour chaque produit sa catégorie :
- "Petit Budget" si le prixUnitaire est < 200 euros
- "Moyen Budget" si le prixUnitaire est compris entre 200 et 500
- "Grand Budget" si le prix unitaire est supérieur à 500 

In [15]:
conn.execute(
    """
    -- Colonnes à récupérer
    SELECT
        p.ProduitID
        , p.NomProduit AS "Nom du produit"
        , p.PrixUnitaire AS "Prix unitaire"
        -- Conditions
        , CASE
            WHEN "Prix unitaire" < 200 THEN 'Petit budget'
            WHEN "Prix unitaire" BETWEEN 200 AND 500 THEN 'Moyen budget'
            ELSE 'Grand budget'
        END AS Classification
    -- BD à récupérer
    FROM products_db p
    -- Trie
    ORDER BY 
        "Prix unitaire" ASC
        , ProduitID ASC;
    """
).df()

Unnamed: 0,ProduitID,Nom du produit,Prix unitaire,Classification
0,9,Samsung Galaxy S21,59,Petit budget
1,13,Nike Air Max,59,Petit budget
2,19,Dyson Vacuum,59,Petit budget
3,34,Dyson Vacuum,59,Petit budget
4,40,Dyson Vacuum,59,Petit budget
...,...,...,...,...
95,87,Samsung Galaxy S21,999,Grand budget
96,88,iPhone 12,999,Grand budget
97,91,Samsung Galaxy S21,999,Grand budget
98,97,iPhone 12,999,Grand budget


Écrire une requête permettant d'afficher pour chaque employe, son nom, son prénom, ainsi que le nombre de ventes réalisée et une variable qui indique si le nombre de vente est inférieur à 1, ou compris entre 1 et 2, ou supérieur à 2

In [16]:
conn.execute(
    """
    -- Colonnes à récupérer
    SELECT
        e.Nom
        , e.Prenom
        , COUNT(s.VenteID) AS "Nombre de ventes"
        -- Conditions
        , CASE
            WHEN "Nombre de ventes" < 1 THEN 'Looser'
            WHEN "Nombre de ventes" BETWEEN 1 AND 2 THEN '🙄'
            ELSE 'Winners'
        END AS Classification
    -- BD à récupérer
    FROM employees_db e
    JOIN sales_db s
    ON e.EmployeID = s.EmployeID
    -- TCD
    GROUP BY
        e.Nom
        , e.Prenom
    -- Trie
    ORDER BY
        "Nombre de ventes" DESC
        , e.Nom ASC;
    """
).df()

Unnamed: 0,Nom,Prenom,Nombre de ventes,Classification
0,Ball,Alyssa,3,Winners
1,Edwards,Kirsten,3,Winners
2,Gordon,Gabriella,3,Winners
3,Graham,Mr.,3,Winners
4,Liu,Timothy,3,Winners
...,...,...,...,...
60,Thompson,Travis,1,🙄
61,Torres,Ricky,1,🙄
62,Weaver,Brandon,1,🙄
63,Willis,Teresa,1,🙄


Créer une requête qui donne le nom du client, son prénom :
- Si le montant total des achats du client < 1 000 € : SILVER
- Entre 1 000 € et 5 000 € : GOLD
- Supérieur à 5 000 € : PREMIUM

In [17]:
conn.execute(
    """
    -- Récupération des colonnes
    SELECT
        c.Nom
        , c.Prenom
        , COALESCE(ROUND(SUM(s.MontantTotal), 0), 0) AS "Total des achats"
        -- Conditions
        , CASE
            WHEN "Total des achats" > 5000 THEN 'PREMIUM'
            WHEN "Total des achats" BETWEEN 1000 AND 5000 THEN 'GOLD'
            WHEN "Total des achats" BETWEEN 100 AND 999 THEN 'SILVER'
            ELSE 'RADIN'
        END AS Classification
    -- BD à récupérer
    FROM customers_db c
    JOIN sales_db s
    ON c.ClientID = s.ClientID
    -- TCD
    GROUP BY
        c.Nom
        , c.Prenom
    -- Trie
    ORDER BY
        "Total des achats" DESC
        , c.Nom ASC;
    """
).df()

Unnamed: 0,Nom,Prenom,Total des achats,Classification
0,Martin,Wayne,78547.0,PREMIUM
1,Sanders,Tracy,67698.0,PREMIUM
2,Smith,Cynthia,55288.0,PREMIUM
3,Williams,Yesenia,48398.0,PREMIUM
4,Williams,Angelica,48229.0,PREMIUM
5,Horne,Matthew,45999.0,PREMIUM
6,Vazquez,Melissa,42599.0,PREMIUM
7,Soto,Holly,38149.0,PREMIUM
8,Perez,Stephanie,35608.0,PREMIUM
9,Scott,Jacob,30099.0,PREMIUM
