# Movielens

Este [dataset](https://grouplens.org/datasets/movielens/100k/) descreve as avaliações de filmes feitas por usuários no site [MovieLens](https://movielens.org/), um serviço de recomendação de filmes. As avaliações (ratings) variam de 1 a 5, cada usuário avaliou pelo menos 20 filmes e existem simples informações demográficas sobre os usuários. Existem no banco de dados, aproximadamente, 100,000 avaliações de 1000 usuários feitas a 1700 filmes.

## Descrição das tabelas

* **Occupations**: Armazena a lista de ocupações dos usuários;;
* **Users**: Armazena informações sobre os usuários, por exemplo, idade e cep;
* **Ratings**: Armazena as notas que os usuários atribuíram aos filmes e em qual momento esta nota foi atribuída;
* **Movies**: Armazena informações dos filmes;
* **Genres_movies**: Armazena o relacionamento dos gêneros e dos filmes;
* **Genres**: Armazena a lista de gêneros.

## Modelo lógico

<img src="../resources/images/movielens_diagram.png" width="1000px">


In [2]:
USE movielens;

## [Questão Exemplo] Liste todos os usuários
<!--
SELECT * FROM users LIMIT 10;
SELECT * FROM users; -->

In [5]:
SELECT * FROM users LIMIT 10;

id,age,gender,occupation_id,zip_code
1,24,M,20,85711
2,53,F,14,94043
3,23,M,21,32067
4,24,M,20,43537
5,33,F,14,15213
6,42,M,7,98101
7,57,M,1,91344
8,36,M,1,5201
9,29,M,19,1002
10,53,M,10,90703


## [Questão Exemplo] Liste o id e idade dos usuários
<!-- SELECT id, age FROM users;
 SELECT id, age FROM users LIMIT 10;-->

In [6]:
SELECT id, age FROM users LIMIT 10;

id,age
1,24
2,53
3,23
4,24
5,33
6,42
7,57
8,36
9,29
10,53


## [Questão Exemplo] Liste todos os ids das ocupações dos usuários sem repetição
<!-- SELECT DISTINCT occupation_id FROM users; -->

In [8]:
SELECT DISTINCT occupation_id FROM users;

occupation_id
20
14
21
7
1
19
10
4
18
6


## [Questão Exemplo] Liste o id e a idade dos usuários que possuem mais de 25 anos
<!-- SELECT id, age FROM users WHERE age > 25;-->

In [10]:
SELECT id, age FROM users WHERE age > 25 LIMIT 10;

id,age
2,53
5,33
6,42
7,57
8,36
9,29
10,53
11,39
12,28
13,47


## [Questão Exemplo] Liste o id e a idade dos usuários que possuem entre 25 anos e 35 anos
<!-- SELECT id, age FROM users WHERE age > 25 AND age < 35 LIMIT 10;-->

In [13]:
SELECT id, age FROM users WHERE age > 25 AND age < 35 LIMIT 10;

id,age
5,33
9,29
12,28
17,30
21,26
23,30
28,32
32,28
38,28
41,33


## [Questão Exemplo] Liste o id e o gênero dos usuários que fizeram pelo menos uma avaliação de filme

In [9]:
--Consulta aninhada
SELECT id, gender FROM
 users
 WHERE id in
(SELECT user_id FROM ratings) LIMIT 10;

id,gender
1,M
2,F
3,M
4,M
5,F
6,M
7,M
8,M
9,M
10,M


In [8]:
--Junção
SELECT u.id, u.gender FROM
 users u JOIN ratings r on u.id = r.user_id
 LIMIT 10;

id,gender
196,M
186,F
22,M
244,M
166,M
298,M
115,M
253,F
305,M
6,M


## [Questão Exemplo] Quantos usuários são do sexo masculino e quantos usuários são do sexo feminino?

In [10]:
SELECT gender, COUNT(*)
FROM users
GROUP BY gender;

gender,COUNT(*)
F,273
M,670


## [Questão Exemplo] Quantos usuários existem agrupados por idade e separados por gênero?

In [11]:
SELECT age, gender, COUNT(*)
FROM users
GROUP BY age, gender;

age,gender,COUNT(*)
7,M,1
10,M,1
11,M,1
13,F,2
13,M,3
14,F,3
15,F,3
15,M,3
16,F,2
16,M,3
