<a href="https://colab.research.google.com/github/kubohenrique/SQL_ML/blob/main/SQL_ADVENTURE_PROJECT_Sponge_Bob_Database_%7C_Henrique_Kubo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Sobre:

Este notebook foi criado por Henrique Kubo, um estudante de ciência de dados.

O objetivo é demonstrar como criar e consultar bancos de dados, utilizando um pequeno conjunto de dados temáticos do Bob Esponja.

* Os dados NÃO são garantidos como precisos e estão sendo usados apenas para fins demonstrativos.

# Criando o Banco de Dados

## 3 Tabelas.

**Characters:** Armazena o ID, Nome e espécie de cada personagem principal.

**Episodes:** Armazena o ID, Título e data de exibição de cada episódio.

**CharacterEpsisode:** Armazena o relacionamento entre essas 2 tabelas. É uma relação many-to many (muitos para muitos) entre cada personagem e os episódios em que eles aparecem. É many-to-many porque um personagem pode aparecer em vários episódios e um episódio pode ter vários personagens.

In [5]:
import sqlite3

conn = sqlite3.connect('spongebob.db')
c = conn.cursor()

# Criando as tabelas

# Tabela dos personagens

c.execute('''
CREATE TABLE IF NOT EXISTS Characters(
  id INTEGER PRIMARY KEY,
  name TEXT NOT NULL,
  species TEXT NOT NULL)
''')

# Tabela Episódio

c.execute('''
CREATE TABLE IF NOT EXISTS Episodes(
  id INTEGER PRIMARY KEY,
  title TEXT NOT NULL,
  air_date DATE)
''')

# Tabela Personagem Episódio

c.execute('''
CREATE TABLE IF NOT EXISTS CharacterEpisode(
  character_id  INTEGER,
  episode_id INTEGER,
  FOREIGN KEY(character_id) REFERENCES Characters(id),
  FOREIGN KEY(episode_id) REFERENCES Episodes(id),
  PRIMARY KEY(character_id, episode_id) )
''')

# Inserindo Dados

# Personagens
characters = [
    ('Spongebob Squarepants', 'Sponge'),
    ('Patrick Star', 'Starfish'),
    ('Squidward Tentacles', 'Octopus'),
    ('Mr. Krabs', 'Crab'),
    ('Plankton', 'Plankton'),
    ('Gary', 'Snail'),
    ('Sandy Cheeks', 'Squirrel'),
    ('Mrs. Puff', 'Pufferfish'),
    ('Pearl Krabs', 'Whale'),
    ('Larry the Lobster', 'Lobster'),
    ('The Flying Dutchman', 'Ghost'),
    ('Mermaid Man', 'Merman'),
    ('Barnacle Boy', 'Merman')
]

c.executemany('INSERT INTO Characters (name, species) VALUES (?, ?)', characters)

# Episodios
episodes = [
    ('Help Wanted', '1999-05-01'),
    ('Bubblestand', '1999-07-17'),
    ('Tea at the Treedome', '1999-05-01'),
    ('Ripped Pants', '1999-07-17'),
    ('Jellyfishing', '1999-07-31'),
    ('Plankton!', '1999-07-31'),
    ('Naughty Nautical Neighbors', '1999-08-07'),
    ('Boating School', '1999-08-07'),
    ('Pizza Delivery', '1999-08-14'),
    ('Home Sweet Pineapple', '1999-08-14'),
    ('Mermaid Man and Barnacle Boy', '1999-08-21'),
    ('Pickles', '1999-08-21'),
    ('Hall Monitor', '1999-08-28')
]

c.executemany('INSERT INTO Episodes (title, air_date) VALUES (?, ?)', episodes)

# Episodios vinculados ao personagem
character_episode_links = [
    (1, 1), (1, 2), (1, 3), (1, 4), (1, 5),
    (2, 1), (2, 2), (2, 3), (2, 5), (2, 6), (2, 7),
    (3, 1), (3, 2), (3, 5), (3, 7), (3, 8),
    (4, 1), (4, 6), (4, 11), (4, 12),
    (5, 6),
    (6, 2), (6, 5),
    (7, 3), (7, 4), (7, 10),
    (8, 8), (8, 13),
    (9, 6), (9, 12),
    (10, 4),
    (11, 5), (11, 10),
    (12, 11),
    (13, 11)
]

c.executemany('INSERT INTO CharacterEpisode (character_id, episode_id) VALUES (?, ?)', character_episode_links)

# Commit and close
conn.commit()


# SELECT

A instrução SELECT é fundamental no SQL e é usada para consultar dados de um banco de dados.

## Tabela dos personagens

In [6]:
import pandas as pd

query = '''
SELECT * FROM Characters;
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,id,name,species
0,1,Spongebob Squarepants,Sponge
1,2,Patrick Star,Starfish
2,3,Squidward Tentacles,Octopus
3,4,Mr. Krabs,Crab
4,5,Plankton,Plankton
5,6,Gary,Snail
6,7,Sandy Cheeks,Squirrel
7,8,Mrs. Puff,Pufferfish
8,9,Pearl Krabs,Whale
9,10,Larry the Lobster,Lobster


## Tabela de Episodios

In [7]:
query = '''
SELECT * FROM Episodes;
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,id,title,air_date
0,1,Help Wanted,1999-05-01
1,2,Bubblestand,1999-07-17
2,3,Tea at the Treedome,1999-05-01
3,4,Ripped Pants,1999-07-17
4,5,Jellyfishing,1999-07-31
5,6,Plankton!,1999-07-31
6,7,Naughty Nautical Neighbors,1999-08-07
7,8,Boating School,1999-08-07
8,9,Pizza Delivery,1999-08-14
9,10,Home Sweet Pineapple,1999-08-14


## Tabela de Episodios vinculados ao personagem

In [10]:
query = '''
SELECT * FROM CharacterEpisode limit 10;
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,character_id,episode_id
0,1,1
1,1,2
2,1,3
3,1,4
4,1,5
5,2,1
6,2,2
7,2,3
8,2,5
9,2,6


# ORDER BY


Com a cláusula ORDER BY, podemos ordenar os resultados por uma ou mais colunas. Aqui, estamos ordenando os personagens com base em seus nomes em ordem ascendente (a ordem padrão).

In [11]:
query = '''
SELECT * FROM Characters
ORDER BY name;
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,id,name,species
0,13,Barnacle Boy,Merman
1,6,Gary,Snail
2,10,Larry the Lobster,Lobster
3,12,Mermaid Man,Merman
4,4,Mr. Krabs,Crab
5,8,Mrs. Puff,Pufferfish
6,2,Patrick Star,Starfish
7,9,Pearl Krabs,Whale
8,5,Plankton,Plankton
9,7,Sandy Cheeks,Squirrel


# WHERE

A cláusula WHERE filtra registros com base em uma ou mais condições. Neste bloco, estamos selecionando personagens cuja espécie é 'Esponja'.







In [13]:
query = '''
SELECT name FROM Characters
WHERE species = 'Sponge';
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,name
0,Spongebob Squarepants


# CASE

A instrução CASE permite lógica condicional diretamente no SQL. Este bloco classifica os personagens como 'Personagem Principal' ou 'Personagem Secundário' com base em sua espécie.

In [14]:
query = '''
SELECT name,
CASE
  WHEN species = 'Sponge' THEN 'Main Character'
  WHEN species = 'Starfish' THEN 'Main Character'
  ELSE 'Secundary Character'
END as Character_type
FROM Characters;
'''

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,name,Character_type
0,Spongebob Squarepants,Main Character
1,Patrick Star,Main Character
2,Squidward Tentacles,Secundary Character
3,Mr. Krabs,Secundary Character
4,Plankton,Secundary Character
5,Gary,Secundary Character
6,Sandy Cheeks,Secundary Character
7,Mrs. Puff,Secundary Character
8,Pearl Krabs,Secundary Character
9,Larry the Lobster,Secundary Character


# Agregações / GROUP BY

Funções de agregação no SQL nos permitem realizar operações como contar, somar, calcular a média, etc. O agrupamento nos permite agrupar linhas semelhantes.

Aqui, estamos contando o número de episódios em que cada personagem apareceu.

In [15]:
query = """
SELECT character_id, COUNT(episode_id) as Episode_Count
FROM CharacterEpisode
GROUP BY character_id;
"""

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,character_id,Episode_Count
0,1,5
1,2,6
2,3,5
3,4,4
4,5,1
5,6,2
6,7,3
7,8,2
8,9,2
9,10,1


# Subqueries

As subconsultas permitem executar uma consulta dentro de outra consulta para refinar resultados ou realizar operações complexas.

Aqui criamos uma subconsulta que busca os nomes dos personagens que apareceram no episódio intitulado "Help Wanted".

In [17]:
query = """
SELECT name
FROM Characters
WHERE id IN (
    SELECT character_id
    FROM CharacterEpisode
    WHERE episode_id = (SELECT id FROM Episodes WHERE title = "Help Wanted"))
"""

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,name
0,Spongebob Squarepants
1,Patrick Star
2,Squidward Tentacles
3,Mr. Krabs


# (INNER JOIN):
Essa junção retorna linhas quando há uma correspondência em ambas as tabelas. Se nenhuma correspondência for encontrada, essas linhas são excluídas dos resultados.

Aqui nós combinamos todas as 3 tabelas para ver quais personagens apareceram em quais episódios.

In [20]:
query = """
SELECT Characters.name, Episodes.title
FROM Characters
INNER JOIN CharacterEpisode ON Characters.id = CharacterEpisode.character_id
INNER JOIN Episodes ON Episodes.id = CharacterEpisode.episode_id;
"""

df = pd.read_sql_query(query, conn)
df

Unnamed: 0,name,title
0,Spongebob Squarepants,Help Wanted
1,Spongebob Squarepants,Bubblestand
2,Spongebob Squarepants,Tea at the Treedome
3,Spongebob Squarepants,Ripped Pants
4,Spongebob Squarepants,Jellyfishing
5,Patrick Star,Help Wanted
6,Patrick Star,Bubblestand
7,Patrick Star,Tea at the Treedome
8,Patrick Star,Jellyfishing
9,Patrick Star,Plankton!
