# Leçon SQL 11: Requêtes avec des agrégats (Pt. 2)

Nos requêtes deviennent assez complexes, mais nous avons presque introduit toutes les parties importantes d'une requête SELECT. Une chose que vous avez peut-être remarqué est que si la clause GROUP BY est exécutée après la clause WHERE (qui filtre les lignes à grouper), comment filtrer exactement les lignes groupées?

Heureusement, SQL nous permet de le faire en ajoutant une clause **HAVING** supplémentaire qui est utilisée spécifiquement avec la clause **GROUP BY** pour nous permettre de filtrer les lignes groupées de l'ensemble de résultats.



Sélectionnez la requête avec la contrainte HAVING
``` mysql 
SELECT group_by_column, AGG_FUNC(column_expression) AS aggregate_result_alias, …
FROM mytable
WHERE condition
GROUP BY column
HAVING group_condition;
```

Les contraintes de la clause **HAVING** sont écrites de la même manière que les contraintes de la clause **WHERE** et sont appliquées aux lignes groupées. 

Avec nos exemples, cela peut ne pas sembler être une construction particulièrement utile, mais si vous imaginez des données avec des millions de lignes avec des propriétés différentes, il est souvent nécessaire de pouvoir appliquer des contraintes supplémentaires pour donner rapidement un sens aux données.

**Le saviez-vous?** Si vous n'utilisez pas la clause `GROUP BY`, une simple clause` WHERE` suffira.

## Exercice

Pour cet exercice, vous allez approfondir les données des **employes** du studio de cinéma. Pensez aux différentes clauses que vous souhaitez appliquer pour chaque tâche.

In [13]:
import pandas as pd

def to_df(s):
    l= [elt.split(';') for elt in s.replace("	", ";").split('\n')]
    return pd.DataFrame(l[1:], columns=l[0])

In [14]:
from pandasql import sqldf

In [28]:
x="""Role	Name	Building	Years_employed
Engineer	Becky A.	1e	4
Engineer	Dan B.	1e	2
Engineer	Sharon F.	1e	6
Engineer	Dan M.	1e	4
Engineer	Malcom S.	1e	1
Artist	Tylar S.	2w	2
Artist	Sherman D.	2w	8
Artist	Jakob J.	2w	6
Artist	Lillia A.	2w	7
Artist	Brandon J.	2w	7
Manager	Scott K.	1e	9
Manager	Shirlee M.	1e	3
Manager	Daria O.	2w	6"""

In [29]:
employes = to_df(x) #employees

Unnamed: 0,Role,Name,Building,Years_employed
0,Engineer,Becky A.,1e,4
1,Engineer,Dan B.,1e,2
2,Engineer,Sharon F.,1e,6
3,Engineer,Dan M.,1e,4
4,Engineer,Malcom S.,1e,1
5,Artist,Tylar S.,2w,2
6,Artist,Sherman D.,2w,8
7,Artist,Jakob J.,2w,6
8,Artist,Lillia A.,2w,7
9,Artist,Brandon J.,2w,7


1. Trouvez le nombre d'artistes dans l'atelier (sans clause HAVING )


In [17]:
QUERY1 = "SELECT Count(Role) FROM employes WHERE Role = 'Artist';"

In [18]:
sqldf(QUERY1)

Unnamed: 0,Count(Role)
0,5


2. Trouvez le nombre d'employés de chaque rôle dans le studio

In [27]:
QUERY2 = "Select Role, Count(Name) FROM employes GROUP BY Role;"

In [28]:
sqldf(QUERY2)

Unnamed: 0,Role,Count(Name)
0,Artist,5
1,Engineer,5
2,Manager,3


3. Trouvez le nombre total d'années d'emploi de tous les ingénieurs

In [33]:
QUERY3 = "Select Role, SUM(Years_employed) FROM employes GROUP BY Role Having Role='Engineer';"

In [34]:
sqldf(QUERY3)

Unnamed: 0,Role,SUM(Years_employed)
0,Engineer,17
