<a href="https://colab.research.google.com/github/GuAparecido/Projeto_Final_Python/blob/main/ProjetoFinalPython.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Projeto Final **Python**

In [None]:
import requests
import time
import hashlib
from google.colab import userdata
import pandas as pd
import sqlite3
import datetime as dt
import sklearn

In [None]:
# Request Url: http://gateway.marvel.com/v1/public/comics
# Request Method: GET
urlComics = "http://gateway.marvel.com/v1/public/comics"
urlCharacter = "http://gateway.marvel.com/v1/public/characters"
urlEvents = "http://gateway.marvel.com/v1/public/events"

# Declarando as variáveis necessárias
api_key = userdata.get('api_key')
ts = str(int(time.time()))
secret_key = userdata.get('secret_key')
string_to_hash =  ts + secret_key + api_key
hash_value = hashlib.md5(string_to_hash.encode('utf-8')).hexdigest()

#Definindo parâmetros de utilização da API.
params = {
    "apikey": api_key,
    "ts": ts,
    "hash": hash_value
}

# Buscando requisições dos quadrinhos
responseComics = requests.get(urlComics, params=params)

# Buscando requisições dos personagens
responseCharacters = requests.get(urlCharacter, params=params)

# # Buscando requisições dos eventos
responseEvents = requests.get(urlEvents, params=params)

# Validando o retorno das APIs
# Quadrinhos
if responseComics.status_code == 200:
    dadosComics = responseComics.json()
    print("Tudo certo com a requisição de comics")
else:
    print(f"Erro na requisição: {responseComics.status_code}")

# Personagens
if responseCharacters.status_code == 200:
    dadosCharacters = responseCharacters.json()
    print("Tudo certo com a requisição de characters")
else:
    print(f"Erro na requisição: {responseCharacters.status_code}")

# Eventos
if responseEvents.status_code == 200:
    dadosEvents = responseEvents.json()
    print("Tudo certo com a requisição de events")
else:
    print(f"Erro na requisição: {responseEvents.status_code}")

In [None]:
# Verificando o retorno
dadosComics

In [None]:
# Verificando o retorno
dadosCharacters

In [None]:
# Verificando o retorno
dadosEvents

In [None]:
# Validando status
statusComics = dadosComics.get('status')
print(statusComics)

statusCharacters = dadosCharacters.get('status')
print(statusCharacters)

statusEvents = dadosEvents.get('status')
print(statusEvents)

In [None]:
# Encurtando o caminho aos objetos desejados
resultsComics = dadosComics.get('data', {}).get('results', [])
resultsComics

In [None]:
# Buscando informações necessárias
infoComics = [{
              'Código': x['id'],
              'Nome': x['title'],
              'Descrição': x['description'],
              'Páginas': x['pageCount'],
              'Criadores': ', '.join([str(y["name"] + " (" + y ["role"] + ")") for y in x["creators"]["items"]])
              } for x in resultsComics]

infoComics

In [None]:
# Encurtando o caminho aos objetos
resultsCharacters = dadosCharacters.get('data', {}).get('results', [])
resultsCharacters

In [None]:
infoCharacter = [{
                  'Código': x['id'],
                  'Nome': x['name'],
                  'Descrição': x['description'],
                  'Quadrinhos': ', '.join([y["name"] for y in x["comics"]["items"]])
                  } for x in resultsCharacters]

infoCharacter

In [None]:
# Encurtando o caminho aos objetos
resultsEvents = dadosEvents.get('data', {}).get('results', [])
resultsEvents

In [None]:
infoEvents = [{'Código': x['id'],
               'Nome': x['title'],
               'Descrição': x['description'],
               'Data Início': x['start'],
               'Data Fim': x['end'],
               'Criador': ', '.join([str(y["name"] + " (" + y ["role"] + ")") for y in x["creators"]["items"]])
               } for x in resultsEvents]

infoEvents

In [None]:
from pandas import DataFrame
dtCom = DataFrame(infoComics)
dtCha = DataFrame(infoCharacter)
dtEven = DataFrame(infoEvents)

In [None]:
dtCom.head(1)

In [None]:
dtCha.head(1)

In [None]:
dtEven.head(1)

In [None]:
#Criando o banco
conn = sqlite3.connect('bancoMarvel')

In [None]:
#Definindo o cursor
cursor = conn.cursor()

In [None]:
#Criando tabela Comics
cursor.execute('CREATE TABLE IF NOT EXISTS Comics(id INTEGER, name TEXT, description TEXT, pages INTEGER, creators TEXT)')

cursor.execute('CREATE TABLE IF NOT EXISTS Character(id INTEGER, name TEXT, description TEXT, comics TEXT)')

cursor.execute('CREATE TABLE IF NOT EXISTS Events(id INTEGER, name TEXT, description TEXT, dtini DATE, dtfim DATE, creators TEXT)')

In [None]:
#cursor.execute('DROP TABLE Comics')
#cursor.execute('DROP TABLE Character')
#cursor.execute('DROP TABLE Events')

In [None]:
# Definindo funções
def inserirDados(dados, table):

  # Validando tabela Comics e inserindo
  if table.upper() == 'COMICS' and dados == infoComics:
    for x in range(0, len(dados)):
      cursor.execute(f"""
            INSERT INTO {table} (id, name, description, pages, creators)
            VALUES (?, ?, ?, ?, ?)
        """, (dados[x]['Código'], dados[x]['Nome'], dados[x]['Descrição'], dados[x]['Páginas'], dados[x]['Criadores']))
      conn.commit()
    print(f'Dados inseridos com sucesso na tabela {table}!')

  # Validando tabela Character e inserindo
  elif (table.upper() == 'CHARACTER' and dados == infoCharacter):
    for x in range(0, len(dados)):
      cursor.execute(f"""
            INSERT INTO {table} (id, name, description, comics)
            VALUES (?, ?, ?, ?)
        """, (dados[x]['Código'], dados[x]['Nome'], dados[x]['Descrição'], dados[x]['Quadrinhos']))
      conn.commit()
    print(f'Dados inseridos com sucesso na tabela {table}!')

  # Validando tabela Events e inserindo
  elif (table.upper() == 'EVENTS' and dados == infoEvents):
    for x in range(0, len(dados)):
      cursor.execute(f"""
            INSERT INTO {table} (id, name, description, dtini, dtfim, creators)
            VALUES (?, ?, ?, ?, ?, ?)
        """, (dados[x]['Código'], dados[x]['Nome'], dados[x]['Descrição'], dados[x]['Data Início'], dados[x]['Data Fim'], dados[x]['Criador']))
      conn.commit()
    print(f'Dados inseridos com sucesso na tabela {table}!')

  else:
    print('Tabela inválida.')

def visualizarTabela(table):
  return pd.read_sql(f"SELECT * FROM {table}", conn)

In [None]:
inserirDados(infoComics, 'Comics')

In [None]:
inserirDados(infoCharacter, 'Character')

In [None]:
inserirDados(infoEvents, 'Events')

In [None]:
visualizarTabela('Comics')

In [None]:
visualizarTabela('Character')

In [None]:
visualizarTabela('Events')

##Insights

###Comics

In [None]:
# Quadrinho com a maior quantidade de páginas
pd.read_sql(f"SELECT id, name, description, MAX(pages) FROM Comics", conn)

In [None]:
# Quadrinho com a menor quantidade de páginas
pd.read_sql(f"SELECT id, name, description, MIN(pages) FROM Comics WHERE pages != 0", conn)

In [None]:
# Quadrinho que são pôsters
pd.read_sql(f"SELECT COUNT(pages) FROM Comics WHERE pages = 0", conn)

In [None]:
# Quantidade de quadrinhos
pd.read_sql(f"SELECT COUNT(pages) FROM Comics WHERE pages != 0", conn)

####Trazendo todos os criadores separados por linha na tabela Comics

In [None]:
# Removendo a descrição, não será necessária nessa análise
criadoresComics = pd.read_sql(f'SELECT id, name, pages, creators FROM comics', conn)

In [None]:
# Exportar para CSV
criadoresComics.to_csv('CriadoresComicsCSV' + '.csv', encoding='utf-8', index=False, header=True,)

In [None]:
# Alterando o CriadoresCSV.csv para retornar todos os criadores em linha.
creatorsComics = pd.read_csv("CriadoresComicsCSV.csv")

creatorsComics['creators'] = creatorsComics['creators'].str.split(', ')
df_creators = creatorsComics.explode('creators').reset_index(drop=True)
df_creators.head(10)

In [None]:
# Criando a tabela ComicsCreators que irá receber os dados filtrados
df_creators.to_sql('ComicsCreators', conn)

In [None]:
# SELECT para validar os dados
pd.read_sql('SELECT * FROM ComicsCreators', conn)

In [None]:
# Buscando quantos os autores e de quantos quadrinhos são responsáveis.
countCreatorsComics = pd.read_sql('SELECT creators, COUNT(1) FROM ComicsCreators GROUP BY creators', conn)

countCreatorsComics

In [None]:
# Exportando Events para Excel
countCreatorsComics.to_csv('quantQuadCriados.CSV' + '.csv', encoding='utf-8', index=False, header=True, sep = ';')

--------------------------------------------

###Events

In [None]:
# Criando uma partição da tabela events com dados necessários para a manipulação.
criadoresEvents = pd.read_sql(f'SELECT id, name, description, dtini, dtfim, creators FROM events', conn)

In [None]:
# Exportando para CSV
criadoresEvents.to_csv('CriadoresEventsCSV' + '.csv', encoding='utf-8', index=False, header=True,)

In [None]:
# Manipulando em CSV para tornar a lista de criadores em linhas
creatorsEvents = pd.read_csv("CriadoresEventsCSV.csv")

creatorsEvents['creators'] = creatorsEvents['creators'].str.split(', ')
df_creatorsEvents = creatorsEvents.explode('creators').reset_index(drop=True)
df_creatorsEvents.head(10)

In [None]:
# Criando a tabela EventsCreators que irá retornar todos os criadores dos eventos em linha
df_creatorsEvents.to_sql('EventsCreators', conn)

In [None]:
# SELECT de validação dos dados
pd.read_sql('SELECT * FROM EventsCreators', conn)

In [None]:
# Visualizando a quantidade de eventos criados por cada criador.
countCreatorsEvents = pd.read_sql('SELECT creators, COUNT(1) FROM EventsCreators GROUP BY creators', conn)

countCreatorsEvents

In [None]:
# Exportando Events para Excel
countCreatorsEvents.to_csv('quantEventCriados.CSV' + '.csv', encoding='utf-8', index=False, header=True, sep = ';')

--------------------------------------------------------

###Character

In [None]:
# Realizando um SELECT nos dados necessários
quadrinhosCharacter = pd.read_sql(f'SELECT id, name, description, comics FROM character', conn)

In [None]:
#Exportando para CSV
quadrinhosCharacter.to_csv('ComicsCharacterCSV' + '.csv', encoding='utf-8', index=False, header=True,)

In [None]:
# Trazendo os personagens e os quadrinhos em que participa
comicsCharacter = pd.read_csv("ComicsCharacterCSV.csv")

comicsCharacter['comics'] = comicsCharacter['comics'].str.split(', ')
df_comicsCharacter = comicsCharacter.explode('comics').reset_index(drop=True)
df_comicsCharacter.head(10)

In [None]:
# Criando a tabela com os personagens e um quadrinho por linha
df_comicsCharacter.to_sql('CharacterComics', conn)

In [None]:
# SELECT para validar os dados
pd.read_sql('SELECT * FROM CharacterComics', conn)

In [None]:
# Visualizando a quantidade de quadrinhos cada personagem faz parte.
countComicsCharacter = pd.read_sql('SELECT name, COUNT(1) FROM CharacterComics GROUP BY name', conn)

countComicsCharacter

In [None]:
# Exportando Events para Excel
countComicsCharacter.to_csv('quantQuadPerson.CSV' + '.csv', encoding='utf-8', index=False, header=True, sep = ';')

--------------------------------------------------------