In [None]:
import pandas as pd
import requests
import time
import os
from datetime import datetime, timedelta
import logging
from dotenv import load_dotenv
#from openpyxl.workbook import Workbook

load_dotenv()
chave_api = os.getenv("Authorization")


def coletar_dados(pagina, data_inicial, data_final, situacao):
    url = "Api de teste
    headers = {
        "chave-api": chave_api
    }
    params = {
        "pagina": pagina,
        "data_inicial": data_inicial.strftime('%d-%m-%Y'),
        "data_final": data_final.strftime('%d-%m-%Y'),
        "situacao": situacao
    }
    resposta = requests.get(url, headers=headers, params=params)
    return resposta

limite_diferentes_consultas = 10
tempo_limite_minutos = 16

requisicoes_diferentes_consultas = 0
tempo_inicio = time.time()

hoje = datetime.now().date()

# Definindo intervalos de datas (120 dias no total, 60 dias para trás e 60 dias para frente)
data_intervalo = 60
datas_config = [
    {"nome": "nova", "data_inicial": hoje - timedelta(days=data_intervalo), "data_final": hoje + timedelta(days=data_intervalo)},
    {"nome": "em_andamento", "data_inicial": hoje - timedelta(days=data_intervalo), "data_final": hoje + timedelta(days=data_intervalo)},
    {"nome": "finalizada", "data_inicial": hoje - timedelta(days=data_intervalo), "data_final": hoje + timedelta(days=data_intervalo)},
    {"nome": "aguardando", "data_inicial": hoje - timedelta(days=data_intervalo), "data_final": hoje + timedelta(days=data_intervalo)},
    {"nome": "realizada", "data_inicial": hoje - timedelta(days=data_intervalo), "data_final": hoje + timedelta(days=data_intervalo)}
]


diretorio_base = r"\\192.168.0.190\ti\DESENVOLVIMENTO\Projetos\extracao_dados_python\get_api_tarefas_situacao"
diretorio_hoje = os.path.join(diretorio_base, hoje.strftime('%d-%m-%Y'))

# Cria o diretório se não existir
if not os.path.exists(diretorio_hoje):
    os.makedirs(diretorio_hoje)

# Configuração do logging
log_file_path = os.path.join(diretorio_hoje, "log.txt")
logging.basicConfig(filename=log_file_path, level=logging.INFO, format='%(asctime)s %(levelname)s: %(message)s')


for config in datas_config:
    situacao = config["nome"]
    data_inicial = config["data_inicial"]
    data_final = config["data_final"]
    pagina = 1
    nova_tabela = pd.DataFrame()

    while True:
        #CONTROLE DE REQUISICOES =======================================================================
        tempo_decorrido = time.time() - tempo_inicio

        if requisicoes_diferentes_consultas >= limite_diferentes_consultas:
            if tempo_decorrido < (tempo_limite_minutos * 60):
                tempo_espera = (tempo_limite_minutos * 60) - tempo_decorrido
                logging.info(
                    f"Limite de requisições para consultas diferentes atingido. Esperando {tempo_espera:.1f} segundos.")
                time.sleep(tempo_espera)
            requisicoes_diferentes_consultas = 0
            tempo_inicio = time.time()

        #FAZ O REQUEST E REALIZA A VERIFICACAO DO STATUS_CODE ===========================================
        try:
            resposta = coletar_dados(pagina, data_inicial, data_final, situacao)
            logging.info(f"Requisição feita: Página {pagina}, Situação {situacao}, URL {resposta.url}")
        except requests.RequestException as e:
            logging.error(f"Erro ao fazer a requisição: {e}")
            break
        if resposta.status_code == 200:
            logging.info(f"Requisição bem-sucedida: {resposta.url}")
        elif resposta.status_code == 429:
            logging.error(f"Erro 429: Limite de requisições excedido. Esperando 1 hora.")
            time.sleep(61 * 61)  # Espera 1 hora se ocorrer um erro 429
            continue  # Tenta novamente após esperar
        else:
            logging.error(f"Erro ao acessar a API: {resposta.status_code} - {resposta.text}")
            break

        #CONVERTE PARA JSON ==============================================================================
        try:
            informacoes = resposta.json()
        except ValueError as e:
            logging.error(f"Erro ao decodificar JSON: {e}")
            break

        #VERIFICA SE RETORNA VAZIO =======================================================================
        if not informacoes:
            logging.info(f"Nenhum dado recebido na página {pagina} para a situação '{situacao}'.")
            break


        tabela = pd.DataFrame(informacoes)
        nova_tabela = pd.concat([nova_tabela, tabela], ignore_index=True)
        pagina += 1
        requisicoes_diferentes_consultas += 1

        # Salvamento dos dados coletados em Excel com data e hora
        timestamp = datetime.now().strftime('%d-%m-%Y_%H-%M-%S')
        excel_file = os.path.join(diretorio_hoje, f"dados_coletados_{situacao}_{timestamp}.xlsx")
        nova_tabela.to_excel(excel_file, index=False)

        logging.info(f"Dados da situação '{situacao}' salvos em: {excel_file}")

print("Processo concluído.")


## Utilizando to_sql, 
### OBS: a funcao if_exists="replace" sempre recria a tabela e subistitui, isso ocorre no exemplo colocado abaixo

In [2]:
import pandas as pd
from sqlalchemy import create_engine

tabela = pd.read_csv("usuarios.csv")

engine = create_engine("mysql+pymysql://root:root@127.0.0.1/mysql_python")

tabela.to_sql("usuarios", con=engine, if_exists="replace", index=False)

200

In [3]:
import pandas as pd
from sqlalchemy import create_engine

tabela = pd.read_csv("usuariosv2.csv")

engine = create_engine("mysql+pymysql://root:root@127.0.0.1/mysql_python")

tabela.to_sql("usuarios", con=engine, if_exists="replace", index=False)

150