
# üìä Projeto de Automa√ß√£o e An√°lise de Dados de Contratos e Conv√™nios

**Autor:** Artenio Reis  
**Disciplina:** An√°lise e Automa√ß√£o de Dados  
**Objetivo:** Demonstrar um processo completo de:
- Leitura de dados de contratos e conv√™nios
- Tratamento e padroniza√ß√£o das informa√ß√µes
- Cria√ß√£o de banco de dados (SQL Server)
- An√°lise com m√©tricas e gr√°ficos relevantes
- Exporta√ß√£o de relat√≥rio
- Envio autom√°tico por e-mail diariamente

---


##  Importa√ß√£o de Bibliotecas

In [64]:

import os, re, unicodedata
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from urllib.parse import quote_plus




## Coleta de Dados via API

In [65]:
import requests
import pandas as pd

# URLs das APIs
URL_API_contratos = "https://api-dados-abertos.cearatransparente.ce.gov.br/transparencia/contratos/contratos?page=50&data_assinatura_inicio=01%2F01%2F2024&data_assinatura_fim=31%2F05%2F2024"
URL_API_convenios = "https://api-dados-abertos.cearatransparente.ce.gov.br/transparencia/contratos/convenios?page=5&data_assinatura_inicio=01%2F01%2F2024&data_assinatura_fim=31%2F12%2F2024"

# Requisi√ß√£o para Contratos
print("üì• Buscando dados de CONTRATOS...")
response_contratos = requests.get(URL_API_contratos)
if response_contratos.status_code == 200:
    dados_contratos = response_contratos.json()
    contratos_df = pd.DataFrame(dados_contratos.get('data', []))
    contratos_df.to_csv("contratos_df.csv", index=False, encoding='utf-8')
    print("‚úÖ Dados de CONTRATOS obtidos com sucesso!")
    print(f"üìÇ Arquivo 'contratos_df.csv' salvo com {len(contratos_df)} registros!")
else:
    print(f"‚ùå Erro ao acessar API de Contratos: {response_contratos.status_code}")

# Requisi√ß√£o para Conv√™nios
print("\nüì• Buscando dados de CONV√äNIOS...")
response_convenios = requests.get(URL_API_convenios)
if response_convenios.status_code == 200:
    dados_convenios = response_convenios.json()
    convenios_df = pd.DataFrame(dados_convenios.get('data', []))
    convenios_df.to_csv("convenios_df.csv", index=False, encoding='utf-8')
    print("‚úÖ Dados de CONV√äNIOS obtidos com sucesso!")
    print(f"üìÇ Arquivo 'convenios_df.csv' salvo com {len(convenios_df)} registros!")
else:
    print(f"‚ùå Erro ao acessar API de Conv√™nios: {response_convenios.status_code}")

print("\nüéâ Exporta√ß√£o conclu√≠da! Dois arquivos foram gerados:")
print("   - contratos_tratados.csv")
print("   - convenios_df.csv")

üì• Buscando dados de CONTRATOS...
‚úÖ Dados de CONTRATOS obtidos com sucesso!
üìÇ Arquivo 'contratos_df.csv' salvo com 100 registros!

üì• Buscando dados de CONV√äNIOS...
‚úÖ Dados de CONV√äNIOS obtidos com sucesso!
üìÇ Arquivo 'convenios_df.csv' salvo com 25 registros!

üéâ Exporta√ß√£o conclu√≠da! Dois arquivos foram gerados:
   - contratos_tratados.csv
   - convenios_df.csv


##  Leitura e Uni√£o das Bases de Dados

In [66]:

# Caminhos dos arquivos CSV exportados
path_contratos = "contratos_df.csv"
path_convenios = "convenios_df.csv"

# Leitura
df_contratos = pd.read_csv(path_contratos, dtype=str, low_memory=False)
df_convenios = pd.read_csv(path_convenios, dtype=str, low_memory=False)

print("Contratos:", df_contratos.shape)
print("Conv√™nios:", df_convenios.shape)

# Uni√£o em um √∫nico DataFrame
df_all = pd.concat([df_contratos, df_convenios], ignore_index=True, sort=False)
df_all.head()


Contratos: (100, 65)
Conv√™nios: (25, 65)


Unnamed: 0,id,cod_concedente,cod_financiador,cod_gestora,cod_orgao,cod_secretaria,descricao_modalidade,descricao_objeto,descricao_tipo,descricao_url,...,data_inicio,data_rescisao,confidential,gestor_contrato,data_finalizacao_prestacao_contas,sequential,emergency,law,has_non_profit_transfer,nome_fiscal
0,546307,270001,891633,270401,27200004,27000000,INEXIGIBILIDADE,Constitui objeto do presente Contrato a presta...,CONTRATO,20240321.1310038.Integra.CONTRATO.pdf,...,2024-03-20T00:00:00.000-03:00,,False,CAMILA VIEIRA DA SILVA,,5257,False,,,
1,546632,228549,904377,220001,22000000,22000000,DISPENSA,AQUISI√á√ÉO DE G√äNEROS ALIMENT√çCIOS (DISPENSA ) ...,CONTRATO,20240321.1309998.Integra.CONTRATO.pdf,...,2024-04-02T00:00:00.000-03:00,,False,ROSANGELA PAIXAO VIEIRA DA SILVA,,5531,False,,,
2,547282,240301,914435,240401,24200004,24000000,PREG√ÉO ELETR√îNICO,Constitui objeto deste contrato o Servi√ßo de S...,CONTRATO,20240404.1311137.Integra.CONTRATO.pdf,...,2024-03-20T00:00:00.000-03:00,,False,LUCIANO PAMPLONA DE GOES CAVALCANTI,0001-01-01,6154,False,,,
3,546438,240001,875801,240401,24200004,24000000,PREG√ÉO ELETR√îNICO,SOLICITA√á√ÉO PARA CONTRATUALIZAR O SALDO DISPON...,CONTRATO,20240321.1310031.Integra.CONTRATO.pdf,...,2024-03-27T00:00:00.000-03:00,,False,CAMILLA DA SILVA MACIEL,0001-01-01,5354,False,,,
4,546049,211101,922462,211101,56200006,56000000,PREG√ÉO ELETR√îNICO,COLHER DESCART√ÅVEL PARA ADAGRI,DESPESA.SEM.INSTRUMENTO.CONTRATUAL,Sem √çntegra,...,2024-03-20T00:00:00.000-03:00,,False,,,5007,False,,,


##  Tratamento e Padroniza√ß√£o dos Dados

In [67]:

# Fun√ß√£o para normalizar nomes de colunas (min√∫sculas, sem acento, sem espa√ßos)
def normalize_col(col):
    s = str(col)
    s = unicodedata.normalize('NFKD', s).encode('ASCII', 'ignore').decode('ASCII')
    s = s.lower().strip()
    s = re.sub(r'\s+', '_', s)
    s = re.sub(r'[^0-9a-z_]', '', s)
    return s

df_all.columns = [normalize_col(c) for c in df_all.columns]

# Mapeamento de colunas mais relevantes
mapping = {
    "orgao": ["orgao", "orgao_nome", "orgao_contratante"],
    "descricao_objeto": ["descricao_objeto", "objeto"],
    "descricao_modalidade": ["descricao_modalidade", "modalidade"],
    "data_assinatura": ["data_assinatura", "dt_assinatura"],
    "data_termino": ["data_termino", "dt_termino"],
    "valor_contrato": ["valor_contrato", "valor_total"],
    "valor_pago": ["valor_pago", "valor_liquidado"],
    "numero_contrato": ["numero_contrato", "num_contrato"]
}

# Aplica mapeamento
df_std = df_all.copy()
for std_col, candidates in mapping.items():
    df_std[std_col] = np.nan
    for c in candidates:
        if c in df_std.columns:
            df_std[std_col] = df_std[c]
            break

df_std.head()


Unnamed: 0,id,cod_concedente,cod_financiador,cod_gestora,cod_orgao,cod_secretaria,descricao_modalidade,descricao_objeto,descricao_tipo,descricao_url,...,gestor_contrato,data_finalizacao_prestacao_contas,sequential,emergency,law,has_non_profit_transfer,nome_fiscal,orgao,valor_pago,numero_contrato
0,546307,270001,891633,270401,27200004,27000000,,,CONTRATO,20240321.1310038.Integra.CONTRATO.pdf,...,CAMILA VIEIRA DA SILVA,,5257,False,,,,,,
1,546632,228549,904377,220001,22000000,22000000,,,CONTRATO,20240321.1309998.Integra.CONTRATO.pdf,...,ROSANGELA PAIXAO VIEIRA DA SILVA,,5531,False,,,,,,
2,547282,240301,914435,240401,24200004,24000000,,,CONTRATO,20240404.1311137.Integra.CONTRATO.pdf,...,LUCIANO PAMPLONA DE GOES CAVALCANTI,0001-01-01,6154,False,,,,,,
3,546438,240001,875801,240401,24200004,24000000,,,CONTRATO,20240321.1310031.Integra.CONTRATO.pdf,...,CAMILLA DA SILVA MACIEL,0001-01-01,5354,False,,,,,,
4,546049,211101,922462,211101,56200006,56000000,,,DESPESA.SEM.INSTRUMENTO.CONTRATUAL,Sem √çntegra,...,,,5007,False,,,,,,


## Convers√£o de Valores e Datas

In [69]:

# Convers√£o de moeda para float
def parse_currency(v):
    if pd.isna(v):
        return np.nan
    v = str(v).replace("R$", "").replace(".", "").replace(",", ".")
    v = re.sub(r'[^0-9.-]', '', v)
    try:
        return float(v)
    except:
        return np.nan

df_std["valor_contrato"] = df_std["valor_contrato"].apply(parse_currency)
df_std["valor_pago"] = df_std["valor_pago"].apply(parse_currency)

# Convers√£o de datas
df_std["data_assinatura"] = pd.to_datetime(df_std["data_assinatura"], errors="coerce", dayfirst=True)
df_std["data_termino"] = pd.to_datetime(df_std["data_termino"], errors="coerce", dayfirst=True)

# Colunas derivadas
df_std["duracao_dias"] = (df_std["data_termino"] - df_std["data_assinatura"]).dt.days
df_std["percentual_pago"] = np.where(df_std["valor_contrato"] > 0,
                                     (df_std["valor_pago"] / df_std["valor_contrato"]) * 100,
                                     np.nan)

df_std.head()


Unnamed: 0,id,cod_concedente,cod_financiador,cod_gestora,cod_orgao,cod_secretaria,descricao_modalidade,descricao_objeto,descricao_tipo,descricao_url,...,sequential,emergency,law,has_non_profit_transfer,nome_fiscal,orgao,valor_pago,numero_contrato,duracao_dias,percentual_pago
0,546307,270001,891633,270401,27200004,27000000,,,CONTRATO,20240321.1310038.Integra.CONTRATO.pdf,...,5257,False,,,,,,,,
1,546632,228549,904377,220001,22000000,22000000,,,CONTRATO,20240321.1309998.Integra.CONTRATO.pdf,...,5531,False,,,,,,,,
2,547282,240301,914435,240401,24200004,24000000,,,CONTRATO,20240404.1311137.Integra.CONTRATO.pdf,...,6154,False,,,,,,,,
3,546438,240001,875801,240401,24200004,24000000,,,CONTRATO,20240321.1310031.Integra.CONTRATO.pdf,...,5354,False,,,,,,,,
4,546049,211101,922462,211101,56200006,56000000,,,DESPESA.SEM.INSTRUMENTO.CONTRATUAL,Sem √çntegra,...,5007,False,,,,,,,,


## An√°lise Explorat√≥ria e Visualiza√ß√µes

In [70]:

# Top √≥rg√£os por valor contratado
orgao_col = "orgao"
valor_col = "valor_contrato"

# Se as colunas padronizadas estiverem vazias, retorne ao primeiro candidato dispon√≠vel do mapeamento
if df_std[orgao_col].isna().all():
	for c in mapping[orgao_col]:
		if c in df_std.columns and not df_std[c].isna().all():
			orgao_col = c
			break

if df_std[valor_col].isna().all():
	for c in mapping[valor_col]:
		if c in df_std.columns and not df_std[c].isna().all():
			valor_col = c
			break

# Remover linhas com valores ausentes em qualquer coluna
df_plot = df_std[[orgao_col, valor_col]].dropna()

if not df_plot.empty:
	top_orgao = df_plot.groupby(orgao_col)[valor_col].apply(pd.to_numeric, errors='coerce').sum(level=orgao_col).sort_values(ascending=False).head(10)
	plt.figure(figsize=(10,6))
	top_orgao.plot(kind="barh")
	plt.title("Top 10 √ìrg√£os por Valor Contratado")
	plt.xlabel("Valor Total (R$)")
	plt.show()
else:
	print("Nenhum dado dispon√≠vel para plotar o gr√°fico de √≥rg√£os por valor contratado.")


Nenhum dado dispon√≠vel para plotar o gr√°fico de √≥rg√£os por valor contratado.


In [72]:

# Distribui√ß√£o de modalidades
modalidade_counts = df_std["descricao_modalidade"].value_counts().head(10)

if not modalidade_counts.empty:
	plt.figure(figsize=(10,6))
	modalidade_counts.plot(kind="bar")
	plt.title("Top 10 Modalidades")
	plt.ylabel("Quantidade")
	plt.show()
else:
	print("Nenhum dado dispon√≠vel para plotar o gr√°fico de modalidades.")


Nenhum dado dispon√≠vel para plotar o gr√°fico de modalidades.


## Exporta√ß√£o do Relat√≥rio

In [None]:

output_csv = "relatorio_diario_contratos.csv"
df_std.to_csv(output_csv, index=False)
print("üìÇ Arquivo salvo:", output_csv)


## Grava√ß√£o no Banco de Dados (SQL Server)

In [None]:

odbc_conn_str = (
    'DRIVER={ODBC Driver 18 for SQL Server};'
    'SERVER=localhost;'
    'DATABASE=DMD;'
    'UID=sa;'
    'PWD=arte171721;'
    'Encrypt=yes;'
    'TrustServerCertificate=yes;'
)

if has_sqlalchemy:
    try:
        from sqlalchemy import create_engine
        engine_url = f"mssql+pyodbc:///?odbc_connect={quote_plus(odbc_conn_str)}"
        engine = create_engine(engine_url)
        df_std.to_sql("contratos_convenios", engine, if_exists="replace", index=False)
        print("‚úÖ Dados gravados no SQL Server (tabela: contratos_convenios).")
    except Exception as e:
        print("‚ùå Erro ao gravar no SQL Server:", e)
else:
    print("‚ö†Ô∏è SQLAlchemy n√£o dispon√≠vel neste ambiente.")


## Envio Autom√°tico do Relat√≥rio por E-mail (CSV + Gr√°ficos)

In [None]:

import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
from email.mime.base import MIMEBase
from email import encoders

EMAIL_REMETENTE = "artenio.reis@gmail.com"
SENHA_REMETENTE = "notj kuab ldzn gtzi"  # senha de app
EMAIL_DESTINATARIO = "artenioreis@live.com"

mensagem = MIMEMultipart()
mensagem['From'] = EMAIL_REMETENTE
mensagem['To'] = EMAIL_DESTINATARIO
mensagem['Subject'] = "üìä Relat√≥rio Di√°rio de Contratos e Conv√™nios"

corpo = """
<p>Ol√°,</p>
<p>Segue em anexo o relat√≥rio di√°rio de contratos e conv√™nios extra√≠dos da plataforma Cear√° Transparente.</p>
<p>Atenciosamente,<br>Artenio Reis</p>
"""
mensagem.attach(MIMEText(corpo, 'html'))

# Arquivos para enviar (CSV + gr√°ficos)
arquivos = ["relatorio_diario_contratos.csv", "graf_top_orgao.png", "graf_modalidade.png"]

for arquivo in arquivos:
    if os.path.exists(arquivo):
        with open(arquivo, "rb") as anexo:
            parte = MIMEBase('application', 'octet-stream')
            parte.set_payload(anexo.read())
            encoders.encode_base64(parte)
            parte.add_header('Content-Disposition', f'attachment; filename={os.path.basename(arquivo)}')
            mensagem.attach(parte)

try:
    with smtplib.SMTP('smtp.gmail.com', 587) as servidor:
        servidor.starttls()
        servidor.login(EMAIL_REMETENTE, SENHA_REMETENTE)
        servidor.send_message(mensagem)
        print("‚úÖ E-mail enviado com sucesso!")
except Exception as e:
    print("‚ùå Erro ao enviar e-mail:", e)



## ‚úÖ Conclus√£o

Neste projeto foram aplicados os seguintes passos:
- Uni√£o e padroniza√ß√£o das bases de contratos e conv√™nios
- Limpeza de dados (valores, datas e duplicatas)
- Cria√ß√£o de colunas derivadas para an√°lise (ex.: dura√ß√£o, percentual pago)
- An√°lises gr√°ficas (top √≥rg√£os, modalidades)
- Exporta√ß√£o de relat√≥rio consolidado em CSV
- Grava√ß√£o dos dados no SQL Server
- Envio autom√°tico de relat√≥rio por e-mail (com CSV + gr√°ficos anexados)

Este fluxo pode ser **agendado diariamente** (via Task Scheduler no Windows ou cron no Linux), garantindo transpar√™ncia e acompanhamento cont√≠nuo.
