# Análise + SQL

Neste mini-projeto utilizarei a linguagem sql para responder algumas perguntas utilizando query sql e um pouco de pandas para manipulação de dados.

Utilizaremos SQL para quatro perguntas:
* Quais são os gêneros musicais presentes no database?
* Quantos são os artistas presentes no DB e quais?
* Quantos são os álbuns?
* Quais os 5 artistas com mais álbuns?

In [1]:
#imports de bibliotecas
import pandas as pd
import sqlite3

In [2]:
# Atribuindo uma variável com o nome do database
db= 'chinook.db'

In [3]:
# Criando consulta Para retornar os gêneros do database:
conn = sqlite3.connect(db)

cursor = conn.cursor()

query = '''SELECT name AS Generos FROM genres'''

cursor.execute(query)

generos = pd.read_sql(query, conn)

generos

Unnamed: 0,Generos
0,Rock
1,Jazz
2,Metal
3,Alternative & Punk
4,Rock And Roll
5,Blues
6,Latin
7,Reggae
8,Pop
9,Soundtrack


In [4]:
# Criando consulta para Retornar o nome dos artistas sem duplicatas
conn = sqlite3.connect(db)

cursor = conn.cursor()

query = '''SELECT DISTINCT Name as Artistas FROM artists'''

cursor.execute(query)

artistas = pd.read_sql(query, conn)

artistas

Unnamed: 0,Artistas
0,AC/DC
1,Accept
2,Aerosmith
3,Alanis Morissette
4,Alice In Chains
...,...
270,"Mela Tenenbaum, Pro Musica Prague & Richard Kapp"
271,Emerson String Quartet
272,"C. Monteverdi, Nigel Rogers - Chiaroscuro; Lon..."
273,Nash Ensemble


In [5]:
# Criando consulta para retornar a contagem de número de álbuns
conn = sqlite3.connect(db)

cursor = conn.cursor()

query = '''SELECT COUNT(title) AS n_albuns FROM albums'''

cursor.execute(query)

albuns = pd.read_sql(query, conn)

albuns

Unnamed: 0,n_albuns
0,347


In [6]:
# Criando consulta para retornar o id das 5 bandas com mais álbuns
conn = sqlite3.connect(db)

cursor = conn.cursor()

query = '''SELECT DISTINCT Artistid AS ArtistasID, COUNT(Title) AS albuns FROM albums
            GROUP BY ArtistasID
            ORDER BY albuns DESC
            LIMIT 5'''

cursor.execute(query)

n_musicas = pd.read_sql(query, conn)

n_musicas

Unnamed: 0,ArtistasID,albuns
0,90,21
1,22,14
2,58,11
3,50,10
4,150,10


In [7]:
# Criando Consulta para retornar os artistas dos id da consulta anterior
conn= sqlite3.connect(db)

cursor = conn.cursor()

query = '''SELECT artistid AS ArtistasID, Name AS artistas FROM artists
           WHERE Artistid  IN (90, 22, 58, 50, 150)'''

cursor.execute(query)

artistas1 = pd.read_sql(query, conn)

artistas1

Unnamed: 0,ArtistasID,artistas
0,22,Led Zeppelin
1,50,Metallica
2,58,Deep Purple
3,90,Iron Maiden
4,150,U2


In [8]:
# Usando pandas para dar juntar as duas tabelas
albuns_artistas = pd.merge(artistas1, n_musicas, on='ArtistasID' ,how='left')

In [9]:
albuns_artistas

Unnamed: 0,ArtistasID,artistas,albuns
0,22,Led Zeppelin,14
1,50,Metallica,10
2,58,Deep Purple,11
3,90,Iron Maiden,21
4,150,U2,10


## Resultados:

### Quais são os gêneros músicais presentes na base de dados?

In [10]:
generos

Unnamed: 0,Generos
0,Rock
1,Jazz
2,Metal
3,Alternative & Punk
4,Rock And Roll
5,Blues
6,Latin
7,Reggae
8,Pop
9,Soundtrack


### Quantos são os artistas presentes na plataforma?

R: 275 artistas

In [11]:
artistas 

Unnamed: 0,Artistas
0,AC/DC
1,Accept
2,Aerosmith
3,Alanis Morissette
4,Alice In Chains
...,...
270,"Mela Tenenbaum, Pro Musica Prague & Richard Kapp"
271,Emerson String Quartet
272,"C. Monteverdi, Nigel Rogers - Chiaroscuro; Lon..."
273,Nash Ensemble


### Quantos são os albuns presentes no DB?

R: 347 albuns

In [12]:
albuns

Unnamed: 0,n_albuns
0,347


### Quais são os 5 artistas com mais albuns?

In [13]:
albuns_artistas

Unnamed: 0,ArtistasID,artistas,albuns
0,22,Led Zeppelin,14
1,50,Metallica,10
2,58,Deep Purple,11
3,90,Iron Maiden,21
4,150,U2,10
