In [None]:
# ::::::::::::::::::::::::::::::::
# :: FASE 01 - COLETA DE DADOS ::
# ::::::::::::::::::::::::::::::::

# IMPORTAR A LIBS QUE SERÃO UTILIZADAS
import requests
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# SOLICITAÇÃO PARA ACESSO AOS DADOS
resposta = requests.get("https://api.cartola.globo.com/atletas/mercado")

# VERIFICAÇÃO DE ERRO NA ENTREGA DOS DADOS
if resposta.status_code == 200:

# TRANSFORMAR OS DADOS EM ARQUIVO JSON
    dado = resposta.json()

# TRIAGEM DE DADOS
    for atleta in dado["atletas"]:

      posicao = atleta["posicao_id"]
      nome = atleta["apelido"]
      time = atleta["clube_id"]
      jogos = atleta["jogos_num"]
      preco = atleta["preco_num"]
      media = atleta["media_num"]
      minimo = atleta["minimo_para_valorizar"]
      
# TRANSFORMAR OS DADOS SELECIONADOS EM DICIONÁRIO
      jogadores = {'posicao':[posicao],'nome':[nome],'time':[time],'jogos':[jogos],'preco':[preco],'media':[media],'minimo':[minimo]}
     
# TRANSFORMAR DICIONÁRIO EM DATAFRAME
      df = pd.DataFrame(jogadores)

# VERIFICAÇÃO E ELIMINAÇÃO DE DUPLICATAS
      df.drop_duplicates()

# SALVAR OS DADOS COLETADOS EM CSV      
      df.to_csv('DADOS_COLETADOS.csv',header=None,index=None,mode='a')

# ::::::::::::::::::::::::::::::::
# :: FASE 02 - LIMPEZA DE DADOS ::
# ::::::::::::::::::::::::::::::::
      
# IMPORTAR O ARQUIVO CSV RECEM GERADO
df = pd.read_csv('DADOS_COLETADOS.csv')

# NOMEAR AS COLUNAS PARAR CADA ATRIBUTO
df.columns = ['POSIÇÃO', 'NOME', 'TIME', 'JOGOS', 'PREÇO', 'MÉDIA', 'MÍNIMO']

# ORDENAÇÃO DOS DADOS PELA POSIÇÃO DOS ATLETAS
df = df.sort_values('POSIÇÃO')

# RENOMEAR POSIÇÃO PARA SUAS NOMECLATURAS
df['POSIÇÃO'] = df['POSIÇÃO'].replace([1,2,3,4,5,6], ["GOL","LAT","ZAG", "MEI", "ATA", "TEC"])

# ALTERAR CLUBE_ID PARA ABREVIAÇÕES DOS NOMES DOS TIMES    
df['TIME'] = df['TIME'].replace([1371,262,263,264,266,275,276,277,280,282,285,286,290,293,294,314,327,354,356,373],  
                                      ["CUI","FLA","BOT","COR","FLU","PAL","SAO","SAN","BGT","CAM",
                                       "INT","JUV","GOI","CAP","CFC","AVA","AME","CEA","FOR","ACG"])

# SALVAR OS DADOS LIMPOS EM CSV   
df.to_csv('DADOS_LIMPOS.csv',mode='a') 


In [None]:
# ::::::::::::::::::::::::::::::::::
# :: FASE 03 - MINERAÇÃO DE DADOS ::
# ::::::::::::::::::::::::::::::::::

# ALGORITOMO PARA GARANTIR (MAIOR PROBABILIDADE DE VALORIZAÇÃO BASEANDO EM TITULARIDADE, PERFORMANCE E ESTABILIDADE
df = df[(df['JOGOS'] > 7) & (df['MÉDIA'] > 3.5) & (df['MÍNIMO'] < df['MÉDIA']) & (df['MÉDIA'] - df['MÍNIMO'] > 1.0)]

# SALVAR OS DADOS FILTRADOS EM CSV   
df.to_csv('DADOS_FILTRADOS.csv',mode='a') 

# ABSTRAÇÃO DE ATLETAS REMANESCENTES POR POSIÇÃO
goleiros = df[df['POSIÇÃO'] == "GOL"]
laterais = df[df['POSIÇÃO'] == "LAT"]
zagueiros = df[df['POSIÇÃO'] == "ZAG"]
meias = df[df['POSIÇÃO'] == "MEI"]
atacantes = df[df['POSIÇÃO'] == "ATA"]
tecnicos = df[df['POSIÇÃO'] == "TEC"]

# :::::::::::::::::::::::::::::::::::::
# :: FASE 04 - VIZUALIZAÇÃO DE DADOS ::
# :::::::::::::::::::::::::::::::::::::

#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE GOLEIROS
nome = goleiros['NOME']
time = goleiros['TIME']
minimo = goleiros['MÍNIMO']
media = goleiros['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="", ylabel='Pontuação', title='GOLEIROS')

plt.savefig('01_ANALISE_GOLEIROS.png', bbox_inches='tight')
plt.show()


In [None]:
#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE LATERAIS
nome = laterais['NOME']
time = laterais['TIME']
minimo = laterais['MÍNIMO']
media = laterais['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="", ylabel='Pontuação', title='LATERAIS')

plt.savefig('02_ANALISE_LATERAIS.png', bbox_inches='tight')
plt.show()

In [None]:
#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE ZAGUEIROS
nome = zagueiros['NOME']
time = zagueiros['TIME']
minimo = zagueiros['MÍNIMO']
media = zagueiros['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="",ylabel='Pontuação', title='ZAGUEIROS')

plt.savefig('03_ANALISE_ZAGUEIROS.png', bbox_inches='tight')
plt.show()

In [None]:
#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE MEIAS
nome = meias['NOME']
time = meias['TIME']
minimo = meias['MÍNIMO']
media = meias['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="",ylabel='Pontuação', title='MEIAS')

plt.savefig('04_ANALISE_MEIAS.png', bbox_inches='tight')
plt.show()

In [None]:
#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE ATACANTES
nome = atacantes['NOME']
time = atacantes['TIME']
minimo = atacantes['MÍNIMO']
media = atacantes['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="",ylabel='Pontuação', title='ATACANTES')

plt.savefig('05_ANALISE_ATACANTES.png', bbox_inches='tight')
plt.show()

In [None]:
#CONSTRUÇÃO GRAFICA PARA ANALISE DE PERFORMANCE ENTRE TÉCNICOS
nome = tecnicos['NOME']
time = tecnicos['TIME']
minimo = tecnicos['MÍNIMO']
media = tecnicos['MÉDIA']

df = pd.DataFrame(np.c_[media,minimo], index=nome+" "+"("+ time +")",columns=['Média','Mínima'])
df.plot.bar(grid=True,xlabel="",ylabel='Pontuação', title='TÉCNICOS')

plt.savefig('06_ANALISE_TECNICOS.png', bbox_inches='tight')
plt.show()
