## **PREENCHA A CÉLULA ABAIXO COM O(S) INTEGRANTE(S)**

### Colocar o nome completo e RA

# Movielens

Este [dataset](https://grouplens.org/datasets/movielens/100k/) descreve as avaliações de filmes feitas por usuários no site [MovieLens](https://movielens.org/), um serviço de recomendação de filmes. As avaliações (ratings) variam de 1 a 5, cada usuário avaliou pelo menos 20 filmes e existem simples informações demográficas sobre os usuários. Existem no banco de dados, aproximadamente, 100,000 avaliações de 1000 usuários feitas a 1700 filmes.

## Descrição das tabelas

* **Occupations**: Armazena a lista de ocupações dos usuários;
* **Users**: Armazena informações sobre os usuários, por exemplo, idade e cep;
* **Ratings**: Armazena as notas que os usuários atribuíram aos filmes e em qual momento esta nota foi atribuída;
* **Movies**: Armazena informações dos filmes;
* **Genres_movies**: Armazena o relacionamento dos gêneros e dos filmes;
* **Genres**: Armazena a lista de gêneros.

## Diagrama de Tabelas - Modelo lógico

![image.png](attachment:57cbca96-278a-44f1-9cf5-4fa75901448a.png)<img src="../../resources/images/movielens_diagram.png" width="1000px">


In [None]:
SHOW DATABASES;

In [2]:
USE movielens;

In [7]:
SHOW TABLES;

Tables_in_movielens
genres
genres_movies
movies
occupations
ratings
users


In [None]:
SHOW TABLE STATUS;

# Questões Exemplo

## [Questão Exemplo] Liste todos os usuários
<!--
SELECT * FROM users LIMIT 10;
SELECT * FROM users; -->

In [3]:
SELECT * FROM users LIMIT 10;

id,age,gender,occupation_id,zip_code
1,24,M,20,85711
2,53,F,14,94043
3,23,M,21,32067
4,24,M,20,43537
5,33,F,14,15213
6,42,M,7,98101
7,57,M,1,91344
8,36,M,1,5201
9,29,M,19,1002
10,53,M,10,90703


## [Questão Exemplo] Liste o sexo e a idade dos usuários
<!--
 SELECT gender, age FROM users LIMIT 10;-->

In [4]:
SELECT gender, age FROM users LIMIT 10;

gender,age
M,24
F,53
M,23
M,24
F,33
M,42
M,57
M,36
M,29
M,53


## [Questão Exemplo] Liste todos os sexos dos usuários sem repetição
<!-- SELECT DISTINCT gender FROM users; -->

In [5]:
SELECT DISTINCT gender FROM users;

gender
M
F


## [Questão Exemplo] Liste o id e a idade dos usuários que possuem mais de 25 anos
<!-- SELECT id, age FROM users WHERE age > 25;-->

In [6]:
SELECT id, age FROM users WHERE age > 25 LIMIT 10;

id,age
2,53
5,33
6,42
7,57
8,36
9,29
10,53
11,39
12,28
13,47


## [Questão Exemplo] Liste o id e a idade dos usuários que possuem entre 25 anos e 35 anos
<!-- SELECT id, age FROM users WHERE age > 25 AND age < 35 LIMIT 10;-->

In [7]:
SELECT id, age FROM users WHERE age > 25 AND age < 35 LIMIT 10;

id,age
5,33
9,29
12,28
17,30
21,26
23,30
28,32
32,28
38,28
41,33


## [Questão Exemplo] Liste o id e o gênero dos usuários que fizeram pelo menos uma avaliação de filme

In [8]:
--Consulta aninhada
SELECT id, gender FROM
 users
 WHERE id IN
(SELECT user_id FROM ratings) LIMIT 10;

id,gender
1,M
2,F
3,M
4,M
5,F
6,M
7,M
8,M
9,M
10,M


In [9]:
--Junção
SELECT u.id, u.gender FROM
 users u JOIN ratings r on u.id = r.user_id
 LIMIT 10;

id,gender
196,M
186,F
22,M
244,M
166,M
298,M
115,M
253,F
305,M
6,M


## [Questão Exemplo] Quantos usuários são do sexo masculino e quantos usuários são do sexo feminino?

In [10]:
SELECT gender, COUNT(*)
FROM users
GROUP BY gender;

gender,COUNT(*)
F,274
M,671


## [Questão Exemplo] Quantos usuários tem o mesmo sexo e a mesma idade?

In [11]:
SELECT age, gender, COUNT(*)
FROM users
GROUP BY age, gender;

age,gender,COUNT(*)
7,M,1
10,M,1
11,M,1
13,F,2
13,M,3
14,F,3
15,F,3
15,M,3
16,F,2
16,M,3


# Questões a serem respondidas

## [Questão 1] Liste todos os filmes
<!--
SELECT * FROM movies LIMIT 10; 
-->

In [2]:
SELECT * FROM movies LIMIT 10;

id,title,release_date
1,Toy Story (1995),1995-01-01
2,GoldenEye (1995),1995-01-01
3,Four Rooms (1995),1995-01-01
4,Get Shorty (1995),1995-01-01
5,Copycat (1995),1995-01-01
6,Shanghai Triad (Yao a yao yao dao waipo qiao) (1995),1995-01-01
7,Twelve Monkeys (1995),1995-01-01
8,Babe (1995),1995-01-01
9,Dead Man Walking (1995),1995-01-01
10,Richard III (1995),1996-01-22


## [Questão 2] Liste todos os títulos e data de lançamento dos filmes
<!--
SELECT title, release_date FROM movies LIMIT 10; 
-->

In [4]:
SELECT title, release_date FROM movies LIMIT 20;

title,release_date
Toy Story (1995),1995-01-01
GoldenEye (1995),1995-01-01
Four Rooms (1995),1995-01-01
Get Shorty (1995),1995-01-01
Copycat (1995),1995-01-01
Shanghai Triad (Yao a yao yao dao waipo qiao) (1995),1995-01-01
Twelve Monkeys (1995),1995-01-01
Babe (1995),1995-01-01
Dead Man Walking (1995),1995-01-01
Richard III (1995),1996-01-22


## [Questão 3] Liste todas as datas que tiveram lançamento de filmes sem repetição
<!--
SELECT DISTINCT release_date FROM movies LIMIT 10; 
-->

In [5]:
SELECT DISTINCT release_date FROM movies WHERE release_date IS NOT NULL ORDER BY release_date LIMIT 10; 

release_date
1922-01-01
1926-01-01
1930-01-01
1931-01-01
1932-01-01
1933-01-01
1934-01-01
1935-01-01
1936-01-01
1937-01-01


## [Questão 4] Liste o título de todos os filmes com data de lançamento maior que 07/07/1995. 

Dica: Não é mandatório, mas veja a documentação sobre `date`: https://mariadb.com/kb/en/date/
<!--
SELECT title, release_date FROM movies WHERE release_date > str_to_date("07/07/1995", "%d/%m/%Y") LIMIT 20;
-->

In [8]:
SELECT title FROM movies WHERE release_date > '1995-07-07' LIMIT 30;

title
Richard III (1995)
"Usual Suspects, The (1995)"
Mighty Aphrodite (1995)
Mr. Holland's Opus (1995)
From Dusk Till Dawn (1996)
Muppet Treasure Island (1996)
Braveheart (1995)
Taxi Driver (1976)
Rumble in the Bronx (1995)
"Birdcage, The (1996)"


## [Questão 5] Liste todos os usuários e o nome de suas profissões 
<!--
SELECT u.id as user_id, o.name as occupation FROM users u JOIN occupations o ON u.occupation_id = o.id  LIMIT 10; 
-->

In [44]:
SELECT u.id, o.name 
FROM users u JOIN occupations o
ON u.occupation_id = o.id
LIMIT 10;

id,name
1,Technician
2,Other
3,Writer
4,Technician
5,Other
6,Executive
7,Administrator
8,Administrator
9,Student
10,Lawyer

user_id,occupation
1,Technician
2,Other
3,Writer
4,Technician
5,Other
6,Executive
7,Administrator
8,Administrator
9,Student
10,Lawyer


## [Questão 6] Liste o título dos filmes que contenham a palavra "Treasure" em seu título
<!--
SELECT title FROM movies WHERE title LIKE '%Treasure%'; 
-->

In [3]:
SELECT title FROM movies WHERE title LIKE "%Treasure%" LIMIT 15;

title
Muppet Treasure Island (1996)
"Treasure of the Sierra Madre, The (1948)"


## [Questão 7] Liste todos as ocupações com "o" na penultima posição do nome

In [14]:
SELECT * FROM occupations WHERE name LIKE "%o_" LIMIT 10;

id,name
1,Administrator
3,Doctor
4,Educator


## [Questão 8] Insira dois usuários com ids 2000 e 3000 com a profissão "Programmer" (id 15). Escolha outros valores para os demais campos.

<!--
SELECT * FROM users WHERE id >= 2000;

INSERT INTO users VALUES(2000, 35, "M", 15, "123456");

INSERT INTO users VALUES(3000, 30, "F", 15, "123456");

SELECT * FROM users WHERE id >= 2000;
-->

In [24]:
INSERT INTO users VALUES(2000, 23, "M", 15, "123456");

SELECT * FROM users WHERE id = 2000;

INSERT INTO users VALUES(3000, 32, "F", 15, "135790");

SELECT * FROM users WHERE id = 3000;

id,age,gender,occupation_id,zip_code
2000,23,M,15,123456

id,age,gender,occupation_id,zip_code
3000,32,F,15,135790


## [Questão 9] Altere a profissão do usuário de id 3000 para "Scientist" (id 18)
<!--
SELECT * FROM users WHERE id = 3000;

UPDATE users
       SET occupation_id = 18
       WHERE id = 3000;

SELECT * FROM users WHERE id = 3000;
-->

In [39]:
SELECT u.id as user_id, o.name as profession 
FROM users u 
JOIN occupations o
ON o.id = u.occupation_id
WHERE u.id = 3000;

UPDATE users
       SET occupation_id = 18
       WHERE id = 3000;
       
SELECT u.id as user_id, o.name as profession 
FROM users u 
JOIN occupations o
ON o.id = u.occupation_id
WHERE u.id = 3000;

user_id,profession
3000,Scientist

user_id,profession
3000,Scientist


## [Questão 10] Delete o usuário de id 3000
<!--
SELECT * FROM users WHERE id = 3000;

DELETE FROM users WHERE id = 3000;

SELECT * FROM users WHERE id >= 2000;
-->

In [11]:
DELETE FROM users WHERE id = 3000;

In [12]:
SELECT * FROM users WHERE id = 3000;

## [Questão 11] Liste todos os usuários que não fizeram nenhuma avaliação de filme
<!--
--SOLUÇÃO 01
SELECT id FROM users WHERE id NOT IN (SELECT user_id FROM ratings);

--SOLUÇÃO 02
SELECT u.id FROM users u LEFT JOIN ratings r ON u.id = r.user_id WHERE r.user_id IS NULL;
-->

In [43]:
SELECT u.id
FROM users u LEFT JOIN ratings r
ON u.id = r.user_id
WHERE r.user_id IS NULL;

id
2000
3000
10000
10001

id
2000
3000
10000
10001


## [Questão 12] Liste o título dos filmes e seus gêneros
<!--
SELECT m.title, g.name FROM movies m JOIN genres_movies gm ON m.id = gm.movie_id 
                                     JOIN genres g         ON g.id = gm.genre_id 
                                     LIMIT 10;
-->

In [17]:
SELECT title, name FROM movies INNER JOIN genres_movies ON genres_movies.movie_id = movies.id
INNER JOIN genres ON genres_movies.genre_id = genres.id LIMIT 10; 

title,name
Toy Story (1995),Animation
Toy Story (1995),Children's
Toy Story (1995),Comedy
GoldenEye (1995),Action
GoldenEye (1995),Adventure
GoldenEye (1995),Thriller
Four Rooms (1995),Thriller
Get Shorty (1995),Action
Get Shorty (1995),Comedy
Get Shorty (1995),Drama


## [Questão 13] Quantos usuários possuem a profissão "Student"?
<!--
SELECT oc.name, COUNT(*) FROM users u JOIN occupations oc ON u.occupation_id = oc.id WHERE oc.name = 'Student' GROUP BY oc.name;
-->

In [42]:
SELECT o.name, COUNT(*) 
FROM users u JOIN occupations o
ON u.occupation_id = o.id
WHERE o.name LIKE "Student"
GROUP BY o.name;

name,COUNT(*)
Student,196

name,COUNT(*)
Student,196


## [Questão 14] Qual são os ids dos 10 filmes mais populares?
<!--
SELECT movie_id, count(rating) as avaliacoes FROM ratings GROUP BY movie_id ORDER BY avaliacoes DESC LIMIT 10;
-->

In [5]:
SELECT movies.id FROM movies INNER JOIN ratings ON ratings.movie_id = movies.id ORDER BY rating DESC LIMIT 10;

id
465
1014
222
387
95
234
603
327
201
1137


## [Questão 15] Crie uma View com a média de avaliações de cada filme. A partir da view, quais os nomes dos filmes com maior média de avaliação? 

<!--
CREATE OR REPLACE VIEW ratings_avg AS SELECT movie_id, AVG(rating) as media FROM ratings GROUP BY movie_id;

SELECT * FROM ratings_avg ORDER BY media DESC LIMIT 20;

SELECT m.title, m.id FROM ratings_avg ra JOIN movies m ON ra.movie_id = m.id WHERE ra.media IN (SELECT MAX(media) FROM ratings_avg);
-->

In [80]:
CREATE OR REPLACE VIEW Media_Avaliacao AS
SELECT movie_id, AVG(rating) as media
FROM ratings
GROUP BY movie_id; 

SELECT movie_id, media
FROM Media_Avaliacao
ORDER BY media DESC
LIMIT 15;

SELECT m.id, m.title
FROM movies m JOIN Media_Avaliacao ma
ON m.id = ma.movie_id
WHERE ma.media = (SELECT MAX(media) FROM Media_Avaliacao)
ORDER BY m.title;

movie_id,media
1189,5.0
1653,5.0
1467,5.0
1500,5.0
1293,5.0
814,5.0
1599,5.0
1536,5.0
1201,5.0
1122,5.0

id,title
1536,Aiqing wansui (1994)
1653,Entertaining Angels: The Dorothy Day Story (1996)
814,"Great Day in Harlem, A (1994)"
1201,Marlene Dietrich: Shadow and Light (1996)
1189,Prefontaine (1997)
1467,"Saint of Fort Washington, The (1993)"
1500,Santa with Muscles (1996)
1599,Someone Else's America (1995)
1293,Star Kid (1997)
1122,They Made Me a Criminal (1939)


# Questões Extras

O conjunto de questões abaixo não será contabilizado na sua nota. No entanto, recomenda-se fortemente que as questões sejam respondidas.

## [Questão Extra] Quantos estudantes menores de 18 anos avaliaram filmes de terror ou crime
<!--
--SOLUÇÃO 1
SELECT COUNT(DISTINCT u.id) as Quantidade FROM occupations oc JOIN users u ON u.occupation_id = oc.id 
                                                                  JOIN ratings r ON r.user_id = u.id
                                                                  WHERE oc.name = "Student" AND u.age < 18 
                                                                        AND r.movie_id IN
                                                                          (SELECT DISTINCT m.id FROM movies m JOIN genres_movies gm ON m.id = gm.movie_id
                                                                                                     JOIN genres g ON g.id = gm.genre_id  
                                                                                       WHERE g.name = "Horror" OR g.name = "Crime");


--SOLUÇÃO 2
SELECT COUNT(DISTINCT u.id) as Quantidade FROM occupations oc JOIN users u ON u.occupation_id = oc.id 
                                                              JOIN ratings r ON r.user_id = u.id
                                                              JOIN movies m ON r.movie_id = m.id
                                                              JOIN genres_movies gm ON m.id = gm.movie_id
                                                              JOIN genres g ON g.id = gm.genre_id
                                                              WHERE oc.name = "Student" AND u.age < 18 AND g.name IN ("Horror","Crime");
                                                                        
-->

In [6]:
SELECT * FROM genres;

id,name
1,Action
2,Adventure
3,Animation
4,Children's
5,Comedy
6,Crime
7,Documentary
8,Drama
9,Fantasy
10,Film-Noir


In [9]:
SELECT count(*) FROM users INNER JOIN ratings ON users.id = ratings.user_id
INNER JOIN movies ON movies.id = ratings.user_id
INNER JOIN genres_movies ON genres_movies.movie_id = movies.id
INNER JOIN genres ON genres_movies.genre_id = genres.id
WHERE users.age < 18 AND genres.name IN ('Crime', 'Horror');

count(*)
135


## [Questão Extra] Quais os nomes dos top 10 filmes com melhor média de avaliação considerando filmes que possuem mais de 10 avaliações?

Você pode utilizar Views caso acredite ser pertinente.
<!--
--SOLUÇÃO 01 - JOIN VIEWS
CREATE OR REPLACE VIEW top_movies AS SELECT movie_id, count(rating) as avaliacoes FROM ratings GROUP BY movie_id;

SELECT  m.id as id, m.title as title, ra.media as media, tm.avaliacoes as avaliacoes
FROM ratings_avg ra JOIN top_movies tm ON ra.movie_id = tm.movie_id
JOIN movies m ON tm.movie_id = m.id
WHERE tm.avaliacoes >10
ORDER BY media DESC
LIMIT 10;

-- SOLUÇÃO 02 - HAVING
SELECT r.movie_id, m.title, AVG(r.rating) as rating_avg, COUNT(r.rating) as rating_count
FROM ratings r JOIN movies m ON r.movie_id = m.id
GROUP BY r.movie_id, m.title
HAVING rating_count > 10
ORDER BY rating_avg DESC
LIMIT 10;
-->

## [Questão Extra] Quais estudantes avaliaram filmes que possuem a palavra "Man" em seu título?
<!--
SELECT DISTINCT u.id as user_id, oc.name as occupation FROM occupations oc JOIN users u ON u.occupation_id = oc.id 
                                                                  JOIN ratings r ON r.user_id = u.id
                                                                  JOIN movies m ON m.id = r.movie_id
                                                                  WHERE oc.name = "Student" AND m.title LIKE "%Man%"
                                                                  LIMIT 10;
-->

In [10]:
SELECT * FROM occupations;

id,name
1,Administrator
2,Artist
3,Doctor
4,Educator
5,Engineer
6,Entertainment
7,Executive
8,Healthcare
9,Homemaker
10,Lawyer


In [14]:
SELECT users.id FROM occupations INNER JOIN users ON users.occupation_id = occupations.id
INNER JOIN ratings ON ratings.user_id = users.id
INNER JOIN movies ON movies.id = ratings.movie_id
WHERE occupations.id = 19 AND movies.title LIKE '%Man%' LIMIT 20;

id
276
110
99
37
117
303
73
110
286
94


## [Questão Extra] Com base na questão 15, retorne em apenas uma consulta, todos os nomes de filmes com a maior ou menor média de avaliação.

<!--
SELECT m.*, ra.media FROM movies m JOIN ratings_avg ra ON m.id = ra.movie_id
WHERE ra.media IN
(SELECT MAX(media) FROM ratings_avg
UNION
SELECT MIN(media) FROM ratings_avg);
-->

# Desafio

## [Desafio - Parte 1] Como ficaria o modelo lógico do banco de dados para que fosse possível implementar a seguinte funcionalidade: "usuários podem ser amigos de outros usuários"?

## [Desafio Parte 2] Crie comandos SQL para popular o seu banco de dados inserindo amizades entre usuários.

## [Desafio Parte 3] Quais são os filmes avaliados pelos amigos dos amigos do usuário de id 1? 

Se for necessário, crie comandos SQL para popular o seu banco de dados para adicionar amigos ao usuário de id 1 e outros usuários