# Mais sobre `SELECT`: agrupamentos

## Introdução

Vamos continuar nossa investigação sobre o comando `SELECT`. Desta vez usaremos a base de dados `'sakila'`, uma famosa base de dados de teste construída pelos autores do MySQL. 

Abra a URL [**https://dev.mysql.com/doc/sakila/en/**](https://dev.mysql.com/doc/sakila/en/) para conhecer melhor esta base de dados, que modela uma locadora de DVDs (riam, vocês também serão velhos um dia!).

Se você não possui esta base, siga as instruções de instalação na página ou faça o download direto pelo link [**https://downloads.mysql.com/docs/sakila-db.zip**](https://downloads.mysql.com/docs/sakila-db.zip)

Vamos também construir nosso objeto auxiliar para conectar com a base de dados, como fizemos na última aula.

In [1]:
from functools import partial
from dotenv import load_dotenv
import insperautograder.jupyter as ia
import mysql.connector
import os

load_dotenv(override=True)

connection = mysql.connector.connect(
    host=os.getenv("MD_DB_SERVER"),
    user=os.getenv("MD_DB_USERNAME"),
    password=os.getenv("MD_DB_PASSWORD"),
    database="sakila",
)


def run_db_query(connection, query, args=None):
    with connection.cursor() as cursor:
        print("Executando query:")
        cursor.execute(query, args)
        for result in cursor:
            print(result)


db = partial(run_db_query, connection)

## Exercícios para entrega

Esta aula tem atividade para entrega, confira os prazos e exercícios

In [2]:
ia.tasks()

|    | Atividade    | De                  | Até                 |
|---:|:-------------|:--------------------|:--------------------|
|  0 | newborn      | 2025-02-01 00:00:00 | 2025-05-30 00:00:00 |
|  1 | select01     | 2025-02-05 00:00:00 | 2025-02-15 23:59:59 |
|  2 | ddl          | 2025-02-19 00:00:00 | 2025-02-26 23:59:59 |
|  3 | dml          | 2025-02-24 00:00:00 | 2025-03-09 23:59:59 |
|  4 | agg_join     | 2025-02-26 00:00:00 | 2025-03-09 23:59:59 |
|  5 | group_having | 2025-03-10 00:00:00 | 2025-03-16 23:59:59 |

In [3]:
ia.grades(task="group_having")

|    | Atividade    | Exercício   |   Peso |   Nota |
|---:|:-------------|:------------|-------:|-------:|
|  0 | group_having | ex01        |      1 |      0 |
|  1 | group_having | ex02        |      4 |      0 |
|  2 | group_having | ex03        |      4 |      0 |
|  3 | group_having | ex04        |      4 |      0 |
|  4 | group_having | ex05        |      4 |      0 |
|  5 | group_having | ex06        |      8 |      0 |
|  6 | group_having | ex07        |      6 |      0 |
|  7 | group_having | ex08        |      6 |      0 |
|  8 | group_having | ex09        |     12 |      0 |
|  9 | group_having | ex10        |     10 |      0 |
| 10 | group_having | ex11        |     10 |      0 |
| 11 | group_having | ex12        |      6 |      0 |
| 12 | group_having | ex13        |     12 |      0 |

## Aquecimento

**Exercício 1**: Quais os nomes das categorias de filme? Ordene de forma crescente.

In [5]:
sql_ex01 = """
SELECT
	name
FROM
	category
ORDER BY
	name
ASC;
"""

db(sql_ex01)

Executando query:
('Action',)
('Animation',)
('Children',)
('Classics',)
('Comedy',)
('Documentary',)
('Drama',)
('Family',)
('Foreign',)
('Games',)
('Horror',)
('Music',)
('New',)
('Sci-Fi',)
('Sports',)
('Travel',)


In [6]:
ia.sender(answer="sql_ex01", task="group_having", question="ex01", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex01', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 2**: Quais atores tem as iniciais "J.D."? Exiba todos os atributos. Ordene de forma crescente pelo primeiro nome.

In [7]:
sql_ex02 = """
SELECT
	*
FROM
	actor as a
WHERE
	first_name LIKE 'J%'
    AND last_name LIKE 'D%'
ORDER BY
	first_name
ASC;
"""

db(sql_ex02)

Executando query:
(4, 'JENNIFER', 'DAVIS', datetime.datetime(2006, 2, 15, 4, 34, 33))
(41, 'JODIE', 'DEGENERES', datetime.datetime(2006, 2, 15, 4, 34, 33))
(35, 'JUDY', 'DEAN', datetime.datetime(2006, 2, 15, 4, 34, 33))
(123, 'JULIANNE', 'DENCH', datetime.datetime(2006, 2, 15, 4, 34, 33))


In [8]:
ia.sender(answer="sql_ex02", task="group_having", question="ex02", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex02', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 3**: Liste as cidades brasileiras presentes na base de dados. Ordene de forma decrescente.

In [9]:
sql_ex03 = """
SELECT
	city
FROM
	city, country
WHERE
	city.country_id = country.country_id
    AND country.country = 'Brazil'
ORDER BY
	city
DESC;
"""

db(sql_ex03)

Executando query:
('Vitória de Santo Antão',)
('Vila Velha',)
('Sorocaba',)
('São Leopoldo',)
('São Bernardo do Campo',)
('Santo André',)
('Santa Bárbara d´Oeste',)
('Rio Claro',)
('Poços de Caldas',)
('Poá',)
('Maringá',)
('Luziânia',)
('Juiz de Fora',)
('Juazeiro do Norte',)
('Ibirité',)
('Guarujá',)
('Goiânia',)
('Brasília',)
('Boa Vista',)
('Blumenau',)
('Belém',)
('Bagé',)
('Araçatuba',)
('Aparecida de Goiânia',)
('Angra dos Reis',)
('Anápolis',)
('Alvorada',)
('Águas Lindas de Goiás',)


In [10]:
ia.sender(answer="sql_ex03", task="group_having", question="ex03", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex03', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 4**: *Quantas* cidades brasileiras tem na base de dados? Renomeie para `qt_city`

In [11]:
sql_ex04 = """
SELECT
	COUNT(*) as qt_city
FROM
	city, country
WHERE
	city.country_id = country.country_id
    AND country.country = 'Brazil';
"""

db(sql_ex04)

Executando query:
(28,)


In [12]:
ia.sender(answer="sql_ex04", task="group_having", question="ex04", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex04', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 5**: Liste os filmes do ator (fictício) "Dan Harris". Ordene de forma crescente. Renomeie para `movie_title`.

In [13]:
sql_ex05 = """
SELECT
	film.title as movie_title
FROM
	film, film_actor, actor
WHERE
	film.film_id = film_actor.film_id
    AND actor.actor_id = film_actor.actor_id
    AND actor.first_name = UPPER('Dan')
    AND actor.last_name = UPPER('Harris')
ORDER BY
	film.title
ASC;
"""

db(sql_ex05)

Executando query:
('BEDAZZLED MARRIED',)
('BOONDOCK BALLROOM',)
('DESTINY SATURDAY',)
('DIVINE RESURRECTION',)
('EYES DRIVING',)
('FELLOWSHIP AUTUMN',)
('GHOST GROUNDHOG',)
('GROOVE FICTION',)
('HILLS NEIGHBORS',)
('HOLIDAY GAMES',)
('INDEPENDENCE HOTEL',)
('INSIDER ARIZONA',)
('JADE BUNCH',)
('LIES TREATMENT',)
('MONTEREY LABYRINTH',)
('REUNION WITCHES',)
('RUN PACIFIC',)
('SCHOOL JACKET',)
('SEVEN SWARM',)
('SIEGE MADRE',)
('STEERS ARMAGEDDON',)
('STRAIGHT HOURS',)
('SUMMER SCARFACE',)
('SUPERFLY TRIP',)
('TITANIC BOONDOCK',)
('TITANS JERK',)
('VANISHING ROCKY',)
('WATERSHIP FRONTIER',)


In [14]:
ia.sender(answer="sql_ex05", task="group_having", question="ex05", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex05', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 6**: Quais filmes estão alugados por Florence Woods?

Retorne:
- O primeiro nome
- O sobrenome
- O id do cliente
- O título do filme

Ordene pelo:
- Título do filme, decrescente

In [17]:
sql_ex06 = """
SELECT
	customer.first_name, customer.last_name, 
    customer.customer_id, film.title
FROM
	rental INNER JOIN customer USING (customer_id)
    INNER JOIN inventory USING (inventory_id)
    INNER JOIN film USING (film_id)
WHERE
	customer.first_name = UPPER('Florence')
    AND customer.last_name = UPPER('Woods')
    AND rental.return_date IS NULL
ORDER BY
	film.title
DESC;
"""

db(sql_ex06)

Executando query:
('FLORENCE', 'WOODS', 107, 'CLUB GRAFFITI')
('FLORENCE', 'WOODS', 107, 'BLADE POLISH')


In [18]:
ia.sender(answer="sql_ex06", task="group_having", question="ex06", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex06', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 7**: Para quais línguas não tem nenhum filme na locadora? Ordene de forma crescente.

**Dica**: use `LEFT OUTER JOIN`

In [19]:
sql_ex07 = """
SELECT
	language.name
FROM
	language LEFT OUTER JOIN film USING (language_id)
WHERE
	film.title IS NULL
ORDER BY
	language.name
ASC;
"""

db(sql_ex07)

Executando query:
('French',)
('German',)
('Italian',)
('Japanese',)
('Mandarin',)


In [20]:
ia.sender(answer="sql_ex07", task="group_having", question="ex07", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex07', style=ButtonStyle()), Output()), _dom_classes=('widget…

## `DISTINCT`

As vezes desejamos consultar quais os valores distintos de uma coluna. Para isso usamos o qualificador `DISTINCT`. 

Por exemplo: Quais os anos de lançamento dos filmes da base? 

In [21]:
# Vai aparecer muitas cópias de "(2006,)"
db("SELECT release_year FROM film LIMIT 20")

Executando query:
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)
(2006,)


Ops, parece que não tem muita variedade nesta base! Usando `DISTINCT` podemos limpar esse resultado:

In [22]:
db("SELECT DISTINCT release_year FROM film")

Executando query:
(2006,)


### Praticando

**Exercício 8**: Quais clientes estão alugando um DVD agora? Ordene pelo nome e sobrenome. Retorne o id, nome e sobrenome do cliente.

In [23]:
sql_ex08 = """
SELECT DISTINCT
	customer_id, customer.first_name, customer.last_name
FROM
	rental INNER JOIN customer USING (customer_id)
WHERE
	rental.return_date IS NULL
ORDER BY
	customer.first_name, customer.last_name;
"""

db(sql_ex08)

Executando query:
(525, 'ADRIAN', 'CLARY')
(352, 'ALBERT', 'CROUSE')
(568, 'ALBERTO', 'HENNING')
(152, 'ALICIA', 'MILLS')
(548, 'ALLAN', 'CORNISH')
(412, 'ALLEN', 'BUTTERFIELD')
(228, 'ALLISON', 'STANLEY')
(181, 'ANA', 'BRADLEY')
(582, 'ANDY', 'VANHORN')
(29, 'ANGELA', 'HERNANDEZ')
(33, 'ANNA', 'HILL')
(175, 'ANNETTE', 'OLSON')
(142, 'APRIL', 'BURNS')
(438, 'BARRY', 'LOVELACE')
(287, 'BECKY', 'MILES')
(440, 'BERNARD', 'COLBY')
(199, 'BETH', 'FRANKLIN')
(14, 'BETTY', 'WHITE')
(73, 'BEVERLY', 'BROOKS')
(457, 'BILL', 'GAVIN')
(366, 'BRANDON', 'HUEY')
(493, 'BRENT', 'HARKINS')
(111, 'CARMEN', 'OWENS')
(42, 'CAROLYN', 'PEREZ')
(269, 'CASSANDRA', 'WALTERS')
(163, 'CATHY', 'SPENCER')
(512, 'CECIL', 'VINES')
(495, 'CHARLIE', 'BESS')
(394, 'CHRIS', 'BROTHERS')
(534, 'CHRISTIAN', 'JUNG')
(43, 'CHRISTINE', 'ROBERTS')
(234, 'CLAUDIA', 'FULLER')
(537, 'CLINTON', 'BUFORD')
(227, 'COLLEEN', 'BURTON')
(527, 'CORY', 'MEEHAN')
(245, 'COURTNEY', 'DAY')
(388, 'CRAIG', 'MORRELL')
(410, 'CURTIS', 'IRBY')
(2

In [24]:
ia.sender(answer="sql_ex08", task="group_having", question="ex08", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex08', style=ButtonStyle()), Output()), _dom_classes=('widget…

## Agrupamento

Uma das características mais valiosas de banco de dados é o *agrupamento*. Podemos agrupar os resultados de uma query indicando uma coluna cujos valores serão usados para agrupar os dados.

Por exemplo, considere a seguinte tabela, que chamaremos de `vendas`:

| id | id_item | item | preco |
|--|--|--|--|
| 1 | 1 | A | 5 |
| 2 | 2 | B | 6 |
| 3 | 1 | A | 3 |
| 4 | 3 | C | 7 |
| 5 | 3 | C | 5 |
| 6 | 1 | A | 2 |

Se agruparmos pela coluna `id_item` teremos 3 conjuntos de resultados:

id_item = 1:

| id | id_item | item | preco |
|--|--|--|--|
| 1 | 1 | A | 5 |
| 3 | 1 | A | 3 |
| 6 | 1 | A | 2 |

id_item = 2:

| id | id_item | item | preco |
|--|--|--|--|
| 2 | 2 | B | 6 |

id_item = 3:

| id | id_item | item | preco |
|--|--|--|--|
| 4 | 3 | C | 7 |
| 5 | 3 | C | 5 |

É como se tivessemos uma lista de tabelas! Isso não é permitido em SQL. Temos que **resumir** a informação de cada uma das tabelas a uma linha só, o que significa que, para cada coluna, devemos escolher uma dessas opções:
- Resumir a informação da coluna usando uma **função de grupo**. Podemos somar, tirar a média, contar itens, concatená-los em uma única string, entre outras;
- Para colunas que se relacionam 1 para 1 com a coluna de agrupamento (como a coluna de agrupamento em si, ou a coluna `item` neste exemplo), manter este valor. Isso acontece frequentemente quando fazemos `JOIN`.
- Não incluir a coluna, caso contrário.

Neste exemplo, podemos tomar a seguinte decisão para cada coluna:
- `id`: descartar
- `id_item`: manter valor
- `item`: manter valor
- `preco`: vamos calcular a soma dos valores, e renomear esta informação para `total`

Com isso, obtemos a seguinte tabela:

| id_item | item | total |
|--|--|--|
| 1 | A | 10 |
| 2 | B | 6 |
| 3 | C | 12 |

Por fim, se não queremos id_item, ficamos com a seguinte tabela:

| item | total |
|--|--|
| A | 10 |
| B | 6 |
| C | 12 |

Para obter essa tabela podemos usar o seguinte comando SQL:

```SQL
SELECT 
    item, SUM(preco) as total 
FROM 
    vendas
GROUP BY
    id_item
```

Consulte o capítulo 9 do seu livro texto para conhecer mais sobre agrupamentos.

### Praticando

**Exercício 9**: Quais os 10 atores que mais apareceram em filmes?

Retorne o id, nome, sobrenome e a quantidade de filmes que o ator atua (nomeie esta coluna como `film_count`).

Ordene de forma descrescente pela quantidade, crescente pelo primeiro nome e crescente pelo segundo nome.

In [26]:
sql_ex09 = """
SELECT
	actor.actor_id, actor.first_name,
    actor.last_name, COUNT(film_actor.actor_id) as film_count
FROM
	film INNER JOIN film_actor USING (film_id)
    INNER JOIN actor USING (actor_id)
GROUP BY
	film_actor.actor_id
ORDER BY
	film_count DESC,
    first_name ASC,
    last_name ASC
LIMIT 10;
"""

db(sql_ex09)

Executando query:
(107, 'GINA', 'DEGENERES', 42)
(102, 'WALTER', 'TORN', 41)
(198, 'MARY', 'KEITEL', 40)
(181, 'MATTHEW', 'CARREY', 39)
(23, 'SANDRA', 'KILMER', 37)
(81, 'SCARLETT', 'DAMON', 36)
(144, 'ANGELA', 'WITHERSPOON', 35)
(106, 'GROUCHO', 'DUNST', 35)
(60, 'HENRY', 'BERRY', 35)
(13, 'UMA', 'WOOD', 35)


In [27]:
ia.sender(answer="sql_ex09", task="group_having", question="ex09", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex09', style=ButtonStyle()), Output()), _dom_classes=('widget…

## Pipeline do comando `SELECT`

Uma versão mais completa do `SELECT` (mas não inteiramente completa - consulte o manual do MySQL) é vista abaixo:

```
SELECT [DISTINCT] <select_header> 
FROM <source_tables>
WHERE <filter_expression>
GROUP BY <grouping_expressions>
HAVING <filter_expression>
ORDER BY <ordering_expressions>
LIMIT <count> 
OFFSET <count>
```

Você já deve ter percebido que o comando `SELECT` tem uma sequência própria de avaliação. Por exemplo, para saber quais filmes custam mais que 3 dinheiros, podemos escrever:

In [28]:
db("""
SELECT
    COUNT(f.rental_rate)
FROM
    film f
WHERE
    f.rental_rate > 3
""")

Executando query:
(336,)


Observe que o 'apelido' f para a tabela 'film' é definido na cláusula `FROM`, mas usado em `SELECT` e também em `WHERE`.

A ordem de execução do comando `SELECT` é aproximadamente como segue:

1. `FROM <source_tables>`: indica as tabelas que serão usadas nesta query e, conceitualmente, combina estas tabelas através de *produto cartesiano* em uma grande tabela. (Note o termo "*conceitualmente*" que usei: em termos de implementação da query este produto cartesiano raramente é construído.)

2. `WHERE <filter_expression>`: filtra linhas.

3. `GROUP BY <grouping_expressions>`: agrupa conjuntos de linhas.

4. `SELECT <select_heading>`: escolha de colunas e de agregados.

5. `HAVING <filter_expression>`: outra filtragem, esta aplicada apenas **depois** da agregação. Pode usar resultados do processo de agregação. Obriga o uso de `GROUP BY`.

6. `DISTINCT`: Elimina linhas duplicadas.

7. `ORDER BY`: ordena as linhas do resultado.

8. `OFFSET <count>`: Pula linhas do resultado. Requer LIMIT.

9. `LIMIT <count>`: Mantém apenas um número máximo de linhas.

Esta sequencia também serve como dica de como projetar uma query! 
- Comece identificando as tabelas que você deseja usar
- Monte o filtro de linhas, incluindo critérios de `JOIN`
- Agrupe
- Selecione colunas e aplique funções de agregação, conforme necessário
- Filtre com `HAVING`, agora que temos agregação
- O resto é mais fácil, aplique conforme requerido

## `WHERE` versus `HAVING`

Conforme visto acima, temos a cláusula `HAVING` para fazer filtragens *APÓS* agregação.

**Para que serve isso?** Por exemplo, suponha que queremos saber quais categorias de filme possuem a letra `a` em seu nome **E** menos que sessenta filmes cadastrados na base.

A seguinte query irá falhar.

In [29]:
db("""
SELECT 
    ca.category_id,
    ca.name,
    COUNT(f.film_id) AS film_count
FROM
    category ca
    INNER JOIN film_category fc USING(category_id)
    INNER JOIN film f USING(film_id)
WHERE
    lower(ca.name) LIKE '%a%' AND
COUNT(f.film_id) < 60 -- FALHA AQUI!!!!!!!!!!!!!!!!!!!!
GROUP BY
    ca.category_id
ORDER BY
    film_count DESC
""")

Executando query:


DatabaseError: 1111 (HY000): Invalid use of group function

A query falha porque a função de agregação `COUNT` necessita que as linhas já tenham sido selecionadas / filtradas. Então, ao tentar utilizar no `WHERE` uma função que depende das linhas filtradas pelo `WHERE`, criamos uma situação de conflito!

Para solucionar, iremos utilizar `HAVING`:

In [30]:
db("""
SELECT 
    ca.category_id,
    ca.name,
    COUNT(f.film_id) AS film_count
FROM
    category ca
    INNER JOIN film_category fc USING(category_id)
    INNER JOIN film f USING(film_id)
WHERE
    lower(ca.name) LIKE '%a%'
GROUP BY
    ca.category_id
HAVING
    film_count < 60
ORDER BY
    film_count DESC
""")

Executando query:
(4, 'Classics', 57)
(16, 'Travel', 57)


## Praticando

**Exercício 10**: Liste a duração média dos filmes na categoria 'Drama'. Renomeie o atributo retornado para `duracao_media_drama`.

In [31]:
sql_ex10 = """
SELECT
	AVG(film.length) as duracao_media_drama
FROM
	film INNER JOIN film_category USING (film_id)
    INNER JOIN category USING (category_id)
WHERE
	category.name = 'Drama';
"""

db(sql_ex10)

Executando query:
(Decimal('120.8387'),)


In [32]:
ia.sender(answer="sql_ex10", task="group_having", question="ex10", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex10', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 11**: Liste o nome da categoria e a duração média dos filmes por categoria. Renomeie o atributo de média para `avg_len`. Ordene de forma decrescente por `avg_len`.

In [33]:
sql_ex11 = """
SELECT
	category.name, AVG(film.length) as avg_len
FROM
	film INNER JOIN film_category USING (film_id)
    INNER JOIN category USING (category_id)
GROUP BY
	category.name
ORDER BY
	avg_len
DESC;
"""

db(sql_ex11)

Executando query:
('Sports', Decimal('128.2027'))
('Games', Decimal('127.8361'))
('Foreign', Decimal('121.6986'))
('Drama', Decimal('120.8387'))
('Comedy', Decimal('115.8276'))
('Family', Decimal('114.7826'))
('Music', Decimal('113.6471'))
('Travel', Decimal('113.3158'))
('Horror', Decimal('112.4821'))
('Classics', Decimal('111.6667'))
('Action', Decimal('111.6094'))
('New', Decimal('111.1270'))
('Animation', Decimal('111.0152'))
('Children', Decimal('109.8000'))
('Documentary', Decimal('108.7500'))
('Sci-Fi', Decimal('108.1967'))


In [34]:
ia.sender(answer="sql_ex11", task="group_having", question="ex11", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex11', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 12**: Liste o nome da categoria e a duração média dos filmes por categoria, apenas para categorias cuja duração média de filme excede 120 minutos. Renomeie o atributo de média para `avg_len`. Ordene de forma decrescente por `avg_len`.

In [35]:
sql_ex12 = """
SELECT
	category.name, AVG(film.length) as avg_len
FROM
	film INNER JOIN film_category USING (film_id)
    INNER JOIN category USING (category_id)
GROUP BY
	category.name
HAVING
	avg_len > 120
ORDER BY
	avg_len
DESC;
"""

db(sql_ex12)

Executando query:
('Sports', Decimal('128.2027'))
('Games', Decimal('127.8361'))
('Foreign', Decimal('121.6986'))
('Drama', Decimal('120.8387'))


In [36]:
ia.sender(answer="sql_ex12", task="group_having", question="ex12", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex12', style=ButtonStyle()), Output()), _dom_classes=('widget…

**Exercício 13**: Quais atores participaram de 35 a 40 filmes (intervalo fechado)?

Retorne:

- Nome
- Sobrenome
- Quantidade de filmes

Ordene por:
- Quantidade de filmes (Decrescente)
- Se houver empate na quantidade de filmes, ordene de forma crescente pelo nome e sobrenome.

In [39]:
sql_ex13 = """
SELECT
	actor.first_name, actor.last_name, COUNT(film_actor.film_id) as film_count
FROM
	film INNER JOIN film_actor USING (film_id)
    INNER JOIN actor USING (actor_id)
GROUP BY
	actor.actor_id
HAVING
	film_count >= 35
    AND film_count <= 40
ORDER BY
	film_count DESC,
    actor.first_name ASC,
    actor.last_name ASC;
"""

db(sql_ex13)

Executando query:
('MARY', 'KEITEL', 40)
('MATTHEW', 'CARREY', 39)
('SANDRA', 'KILMER', 37)
('SCARLETT', 'DAMON', 36)
('ANGELA', 'WITHERSPOON', 35)
('GROUCHO', 'DUNST', 35)
('HENRY', 'BERRY', 35)
('UMA', 'WOOD', 35)
('VAL', 'BOLGER', 35)
('VIVIEN', 'BASINGER', 35)


In [40]:
ia.sender(answer="sql_ex13", task="group_having", question="ex13", answer_type="pyvar")

interactive(children=(Button(description='Enviar ex13', style=ButtonStyle()), Output()), _dom_classes=('widget…

# Conclusão

Esta aula de hoje foi bastante densa! Dicas de estudo:

- Pratique no seu livro-texto, capítulo 9. Lembre-se que a base 'música' pode ser usada para praticar os comandos SQL vistos no livro.
- Tente criar queries que sirvam de exemplo para os conceitos do livro! A tarefa de criar exemplos é muito instrutiva!

**Leitura prévia**:
Para a próxima aula vamos continuar praticando, com os assuntos dos capítulos 10 e 11, prepare-se para a aula, ok?

Até a próxima!

In [41]:
connection.close()

## Conferir Notas

Confira se as notas na atividade são as esperadas!

Primeiro na atividade atual!

In [45]:
ia.grades(by="task", task="group_having")

|    | Tarefa       |   Nota |
|---:|:-------------|-------:|
|  0 | group_having |     10 |

In [43]:
ia.grades(task="group_having")

|    | Atividade    | Exercício   |   Peso |   Nota |
|---:|:-------------|:------------|-------:|-------:|
|  0 | group_having | ex01        |      1 |     10 |
|  1 | group_having | ex02        |      4 |     10 |
|  2 | group_having | ex03        |      4 |     10 |
|  3 | group_having | ex04        |      4 |     10 |
|  4 | group_having | ex05        |      4 |     10 |
|  5 | group_having | ex06        |      8 |     10 |
|  6 | group_having | ex07        |      6 |     10 |
|  7 | group_having | ex08        |      6 |     10 |
|  8 | group_having | ex09        |     12 |     10 |
|  9 | group_having | ex10        |     10 |     10 |
| 10 | group_having | ex11        |     10 |     10 |
| 11 | group_having | ex12        |      6 |     10 |
| 12 | group_having | ex13        |     12 |     10 |

In [44]:
ia.grades(by="task")

|    | Tarefa       |   Nota |
|---:|:-------------|-------:|
|  0 | agg_join     |     10 |
|  1 | ddl          |     10 |
|  2 | dml          |     10 |
|  3 | group_having |     10 |
|  4 | newborn      |     10 |
|  5 | select01     |     10 |