In [4]:
import re
import unicodedata
import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy.types import VARCHAR, INTEGER, DECIMAL, Date, Text

# ========================
# Config do banco
# ========================
USER = "cortex360"
PASSWORD = "Cortex360Vini"
HOST = "localhost"
PORT = 3306
DB = "cortex360"

engine = create_engine(f"mysql+pymysql://{USER}:{PASSWORD}@{HOST}:{PORT}/{DB}")

# ========================
# Arquivo Excel
# ========================
excel_file = f"/www/wwwroot/alunosdamedicina.com/PESSOAL_CONTRATADO_BASE (2).xlsx"  # ajuste se necessário

# ========================
# Tabela e colunas esperadas
# ========================
expected_cols = [
    "id", "orgao_demandante", "secretaria", "municipio", "bairro", "mesorregiao",
    "diretoria", "setor", "responsavel", "tipo", "processo_sei", "local_obra",
    "objeto_contratacao", "empresa_contratada", "numero_contrato",
    "assinatura_contrato", "ordem_inicio_data", "prazo_dias", "termino_previsto_data",
    "valor_contrato_a", "aditivo_numero", "novo_prazo_aditivo_dias", "valor_aditivo_b",
    "prazo_com_aditivo_dias", "valor_total_c", "reajuste_numero", "percentual_reajuste",
    "valor_reajuste_d", "valor_total_e", "descricao_servicos_periodo",
    "percentual_executado_periodo", "medicao_anterior_acumulada_f", "data_medicao_atual",
    "valor_liquidado_g", "liquidado_acumulado", "andamento_fisico_percentual",
    "liquidado_acumulado_percentual", "saldo_contratual_sem_reajuste_i",
    "saldo_contratual_com_reajuste", "saldo_empenho", "numero_oficio_solicitacao_recursos",
    "fonte_recursos", "status_contrato", "inicio_suspensao", "termino_suspensao",
    "previsao_termino_atualizada", "vigencia_contratual", "conclusao_obra_real",
    "objetivo", "observacoes"
]

date_cols = [
    "assinatura_contrato", "ordem_inicio_data", "termino_previsto_data",
    "data_medicao_atual", "inicio_suspensao", "termino_suspensao",
    "previsao_termino_atualizada", "vigencia_contratual", "conclusao_obra_real"
]

money_cols = [
    "valor_contrato_a", "valor_aditivo_b", "valor_total_c", "valor_reajuste_d",
    "valor_total_e", "medicao_anterior_acumulada_f", "valor_liquidado_g",
    "liquidado_acumulado", "saldo_contratual_sem_reajuste_i",
    "saldo_contratual_com_reajuste", "saldo_empenho"
]

percent_cols = [
    "percentual_reajuste", "percentual_executado_periodo",
    "andamento_fisico_percentual", "liquidado_acumulado_percentual"
]

int_cols = ["prazo_dias", "novo_prazo_aditivo_dias", "prazo_com_aditivo_dias"]

# ========================
# Utilidades
# ========================
def strip_accents(s: str) -> str:
    return "".join(c for c in unicodedata.normalize("NFKD", s) if not unicodedata.combining(c))

def normalize_header(s: str) -> str:
    s = str(s).strip()
    s = strip_accents(s)
    s = s.lower()
    s = s.replace("nº", "numero")
    s = re.sub(r"[^a-z0-9]+", "_", s)
    s = re.sub(r"_+", "_", s).strip("_")
    return s

def parse_money(x):
    if pd.isna(x): return None
    s = str(x).strip()
    s = s.replace("R$", "").replace(" ", "")
    # primeiro remove separador de milhar e troca decimal para ponto
    s = s.replace(".", "").replace(",", ".")
    try:
        return float(s)
    except:
        return None

def parse_percent(x):
    if pd.isna(x): return None
    s = str(x).strip().replace("%", "").replace(" ", "")
    s = s.replace(",", ".")
    try:
        return float(s)
    except:
        return None

def parse_int(x):
    if pd.isna(x): return None
    s = str(x).strip()
    s = re.sub(r"[^0-9\-]", "", s)
    try:
        return int(s)
    except:
        return None

def parse_date(x):
    if pd.isna(x): return None
    # aceita dd/mm/aaaa, dd-mm-aaaa, aaaa-mm-dd etc.
    try:
        return pd.to_datetime(x, dayfirst=True, errors="coerce").date()
    except:
        return None

# Mapeamentos específicos (ajuste se necessário) — da coluna normalizada do Excel -> coluna da tabela
custom_map = {
    # blocos de identificação
    "id": "id",
    "orgao_demandante": "orgao_demandante",
    "secretaria": "secretaria",
    "municipio": "municipio",
    "bairro": "bairro",
    "mesorregiao": "mesorregiao",
    "diretoria": "diretoria",
    "setor": "setor",
    "responsavel": "responsavel",
    "tipo": "tipo",
    "processo_sei": "processo_sei",
    "processo_sei_": "processo_sei",  # se vier com extra
    "local_da_obra": "local_obra",
    "local_obra": "local_obra",
    "objeto_de_contratacao": "objeto_contratacao",
    "objeto_contratacao": "objeto_contratacao",
    "empresa_contratada": "empresa_contratada",
    "empresa_contratada_": "empresa_contratada",
    "numero_do_contrato": "numero_contrato",
    "no_do_contrato": "numero_contrato",
    "n_do_contrato": "numero_contrato",
    "numero_contrato": "numero_contrato",

    # datas / prazos
    "assinatura_do_contrato_data": "assinatura_contrato",
    "assinatura_contrato_data": "assinatura_contrato",
    "assinatura_contrato": "assinatura_contrato",
    "contrato_ordem_de_inicio_data": "ordem_inicio_data",
    "ordem_de_inicio_data": "ordem_inicio_data",
    "ordem_inicio_data": "ordem_inicio_data",
    "contrato_prazo_dias": "prazo_dias",
    "prazo_dias": "prazo_dias",
    "contrato_termino_previsto_data": "termino_previsto_data",
    "termino_previsto_data": "termino_previsto_data",

    # valores
    "contrato_valor_rs_a": "valor_contrato_a",
    "valor_a": "valor_contrato_a",
    "valor_contrato_a": "valor_contrato_a",
    "aditivo_n": "aditivo_numero",
    "aditivo_numero": "aditivo_numero",
    "novo_prazo_apos_aditivo_dias": "novo_prazo_aditivo_dias",
    "novo_prazo_aditivo_dias": "novo_prazo_aditivo_dias",
    "aditivos_valor_rs_b": "valor_aditivo_b",
    "valor_b": "valor_aditivo_b",
    "valor_total_rs_c_a_b": "valor_total_c",
    "valor_total_c": "valor_total_c",
    "contrato_apos_aditivo_prazo_do_contrato_c_aditivos_dias": "prazo_com_aditivo_dias",
    "prazo_contrato_com_aditivos_dias": "prazo_com_aditivo_dias",
    "contrato_apos_aditivo_valor_total_rs_c_a_b": "valor_total_c",

    "reajuste_n": "reajuste_numero",
    "reajuste_numero": "reajuste_numero",
    "valor_dos_reajustes": "percentual_reajuste",
    "valor_dos_reajustes_": "percentual_reajuste",
    "percentual_reajuste": "percentual_reajuste",
    "valor_total_dos_reajustes_rs_d": "valor_reajuste_d",
    "valor_reajuste_d": "valor_reajuste_d",
    "valor_total_do_contrato_rs_e_c_d": "valor_total_e",
    "valor_total_e": "valor_total_e",

    "descricao_dos_servicos_executados_no_periodo": "descricao_servicos_periodo",
    "servicos_executados_no_periodo": "percentual_executado_periodo",
    "medicao_anterior_acumuladar_f": "medicao_anterior_acumulada_f",
    "medicao_anterior_acumulada_f": "medicao_anterior_acumulada_f",
    "data_da_medicao_atual": "data_medicao_atual",
    "valor_liquidado_na_medicao_rs_g": "valor_liquidado_g",
    "valor_liquidado_g": "valor_liquidado_g",
    "liquidado_acumulado_rs": "liquidado_acumulado",
    "liquidado_acumulado": "liquidado_acumulado",
    "andamento_fisico_executado": "andamento_fisico_percentual",
    "liquidado_acumulado_": "liquidado_acumulado_percentual",

    "saldo_contratual_sem_reajustes_rs_i_c_f_g": "saldo_contratual_sem_reajuste_i",
    "saldo_contratual_sem_reajuste_i": "saldo_contratual_sem_reajuste_i",
    "saldo_contratual_com_reajuste_rs": "saldo_contratual_com_reajuste",
    "saldo_contratual_com_reajuste": "saldo_contratual_com_reajuste",
    "saldo_de_empenho_rs": "saldo_empenho",
    "saldo_empenho": "saldo_empenho",

    "numero_do_oficio_de_solicitacao_de_recursos": "numero_oficio_solicitacao_recursos",
    "fonte_de_recursos": "fonte_recursos",
    "fonte_recursos": "fonte_recursos",
    "status_do_contrato": "status_contrato",
    "status_contrato": "status_contrato",

    "inicio_da_suspensao": "inicio_suspensao",
    "inicio_suspensao": "inicio_suspensao",
    "termino_da_suspensao": "termino_suspensao",
    "termino_suspensao": "termino_suspensao",
    "previsao_de_termino_atualizada_data": "previsao_termino_atualizada",
    "previsao_termino_atualizada_data": "previsao_termino_atualizada",
    "previsao_termino_atualizada": "previsao_termino_atualizada",
    "vigencia_contratual_data": "vigencia_contratual",
    "vigencia_contratual": "vigencia_contratual",
    "conclusao_da_obra_real_data": "conclusao_obra_real",
    "conclusao_obra_real_data": "conclusao_obra_real",
    "conclusao_obra_real": "conclusao_obra_real",

    "objetivo": "objetivo",
    "observacoes": "observacoes",
    "observacao": "observacoes",
}

# ========================
# Ler Excel (tudo como texto)
# ========================
df = pd.read_excel(excel_file, dtype=str)

orig_cols = list(df.columns)

# Normaliza os cabeçalhos
norm_cols = [normalize_header(c) for c in df.columns]
df.columns = norm_cols

# Aplica o custom_map quando conhecido
mapped_cols = {}
for c in df.columns:
    if c in custom_map:
        mapped_cols[c] = custom_map[c]
    else:
        # tentativa automática: se já estiver igual ao esperado, mantém
        if c in expected_cols:
            mapped_cols[c] = c

df = df.rename(columns=mapped_cols)

# Mostra ajuda se algo não mapeou
not_mapped = [c for c in df.columns if c not in expected_cols]
if not_mapped:
    print("⚠️ Colunas ainda não mapeadas (serão ignoradas no insert):")
    print(not_mapped)

# Garante que TODAS as colunas esperadas existam (mesmo que vazias)
for col in expected_cols:
    if col not in df.columns:
        df[col] = None

# Mantém apenas as colunas da tabela e na ordem certa
df = df[expected_cols]

# ========================
# Conversões de tipos
# ========================
# Datas
for c in date_cols:
    df[c] = pd.to_datetime(df[c], dayfirst=True, errors="coerce").dt.date

# Dinheiro
for c in money_cols:
    df[c] = df[c].apply(parse_money)

# Percentuais
for c in percent_cols:
    df[c] = df[c].apply(parse_percent)

# Inteiros
for c in int_cols:
    df[c] = df[c].apply(parse_int)

# Limita tamanhos de textos longos (evita "Data too long")
df["descricao_servicos_periodo"] = df["descricao_servicos_periodo"].astype(str).str.slice(0, 500)
for c in ["id","orgao_demandante","secretaria","municipio","bairro","mesorregiao","diretoria",
          "setor","responsavel","tipo","processo_sei","local_obra","objeto_contratacao",
          "empresa_contratada","numero_contrato","aditivo_numero","reajuste_numero",
          "numero_oficio_solicitacao_recursos","fonte_recursos","status_contrato","objetivo"]:
    df[c] = df[c].astype(str).str.slice(0, 255)

# ========================
# Inserir no MySQL
# ========================
dtype_map = {
    "id": VARCHAR(50),
    "orgao_demandante": VARCHAR(255),
    "secretaria": VARCHAR(255),
    "municipio": VARCHAR(255),
    "bairro": VARCHAR(255),
    "mesorregiao": VARCHAR(255),
    "diretoria": VARCHAR(255),
    "setor": VARCHAR(255),
    "responsavel": VARCHAR(255),
    "tipo": VARCHAR(255),
    "processo_sei": VARCHAR(255),
    "local_obra": VARCHAR(255),
    "objeto_contratacao": VARCHAR(255),
    "empresa_contratada": VARCHAR(255),
    "numero_contrato": VARCHAR(50),
    "assinatura_contrato": Date(),
    "ordem_inicio_data": Date(),
    "prazo_dias": INTEGER(),
    "termino_previsto_data": Date(),
    "valor_contrato_a": DECIMAL(15, 2),
    "aditivo_numero": VARCHAR(50),
    "novo_prazo_aditivo_dias": INTEGER(),
    "valor_aditivo_b": DECIMAL(15, 2),
    "prazo_com_aditivo_dias": INTEGER(),
    "valor_total_c": DECIMAL(15, 2),
    "reajuste_numero": VARCHAR(50),
    "percentual_reajuste": DECIMAL(6, 2),
    "valor_reajuste_d": DECIMAL(15, 2),
    "valor_total_e": DECIMAL(15, 2),
    "descricao_servicos_periodo": VARCHAR(500),
    "percentual_executado_periodo": DECIMAL(6, 2),
    "medicao_anterior_acumulada_f": DECIMAL(15, 2),
    "data_medicao_atual": Date(),
    "valor_liquidado_g": DECIMAL(15, 2),
    "liquidado_acumulado": DECIMAL(15, 2),
    "andamento_fisico_percentual": DECIMAL(6, 2),
    "liquidado_acumulado_percentual": DECIMAL(6, 2),
    "saldo_contratual_sem_reajuste_i": DECIMAL(15, 2),
    "saldo_contratual_com_reajuste": DECIMAL(15, 2),
    "saldo_empenho": DECIMAL(15, 2),
    "numero_oficio_solicitacao_recursos": VARCHAR(255),
    "fonte_recursos": VARCHAR(255),
    "status_contrato": VARCHAR(255),
    "inicio_suspensao": Date(),
    "termino_suspensao": Date(),
    "previsao_termino_atualizada": Date(),
    "vigencia_contratual": Date(),
    "conclusao_obra_real": Date(),
    "objetivo": VARCHAR(255),
    "observacoes": Text(),
}

df.to_sql(
    name="cohidro_obras_import",
    con=engine,
    if_exists="append",
    index=False,
    dtype=dtype_map,
    method="multi",
    chunksize=500,
)

print("✅ Dados inseridos com sucesso na tabela cohidro_obras_import.")
print("Colunas originais do Excel (para conferência):")
print(orig_cols)
print("\nColunas normalizadas -> destino (quando mapeadas):")
print({c: custom_map.get(c, c if c in expected_cols else None) for c in norm_cols})

⚠️ Colunas ainda não mapeadas (serão ignoradas no insert):
['nome', 'local_de_trabalho', 'funcao', 'status', 'data_de_inicio', 'celular', 'cpf_mf', 'email']
✅ Dados inseridos com sucesso na tabela cohidro_obras_import.
Colunas originais do Excel (para conferência):
['ID', 'NOME', 'LOCAL DE TRABALHO', 'FUNÇÃO', 'STATUS', 'DATA DE INÍCIO', 'CELULAR', 'CPF/MF', 'EMAIL']

Colunas normalizadas -> destino (quando mapeadas):
{'id': 'id', 'nome': None, 'local_de_trabalho': None, 'funcao': None, 'status': None, 'data_de_inicio': None, 'celular': None, 'cpf_mf': None, 'email': None}


In [5]:
!pwd

/www/wwwroot/alunosdamedicina.com


In [8]:
%pip install openpyxl

[33mDEPRECATION: Loading egg at /www/server/panel/pyenv/lib/python3.12/site-packages/PyMySQL-0.9.3-py3.12.egg is deprecated. pip 24.3 will enforce this behaviour change. A possible replacement is to use pip for package installation.. Discussion can be found at https://github.com/pypa/pip/issues/12330[0m[33m
[0mCollecting openpyxl
  Downloading openpyxl-3.1.5-py2.py3-none-any.whl.metadata (2.5 kB)
Collecting et-xmlfile (from openpyxl)
  Downloading et_xmlfile-2.0.0-py3-none-any.whl.metadata (2.7 kB)
Downloading openpyxl-3.1.5-py2.py3-none-any.whl (250 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m250.9/250.9 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0mm
[?25hDownloading et_xmlfile-2.0.0-py3-none-any.whl (18 kB)
Installing collected packages: et-xmlfile, openpyxl
Successfully installed et-xmlfile-2.0.0 openpyxl-3.1.5
[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[

In [5]:
import pandas as pd
import plotly.express as px
# Importe JupyterDash em vez de apenas dash
from jupyter_dash import JupyterDash
from dash import dcc
from dash import html

# Carregar dados de exemplo (pode ser seu próprio CSV)
df = pd.DataFrame({
    "Frutas": ["Maçãs", "Laranjas", "Uvas", "Bananas"],
    "Quantidade": [4, 1, 2, 2],
    "Cidade": ["SP", "RJ", "SP", "RJ"]
})

# Criar um gráfico com Plotly Express
fig = px.bar(df, x="Frutas", y="Quantidade", color="Cidade", barmode="group")

# Iniciar o aplicativo Dash usando JupyterDash
# O método run_server() agora precisa do parâmetro mode='inline'
app = JupyterDash(__name__)

# Definir o layout do dashboard
app.layout = html.Div(children=[
    html.H1(children='Meu Primeiro Dashboard com Dash'),

    html.Div(children='''
        Um gráfico de barras simples para começar.
    '''),

    dcc.Graph(
        id='grafico-exemplo',
        figure=fig
    )
])

# Rodar o servidor no modo "inline" para exibir o dashboard diretamente no notebook
if __name__ == '__main__':
    app.run_server(mode="inline")


ModuleNotFoundError: No module named 'jupyter_dash'

In [6]:
import re

import unicodedata

import pandas as pd

from sqlalchemy import create_engine, text

from sqlalchemy.types import VARCHAR, INTEGER, DECIMAL, Date, Text



# ========================

# Config do banco

# ========================

USER = "cortex360"

PASSWORD = "Cortex360Vini"

HOST = "localhost"

PORT = 3306

DB = "cortex360"

TABLE = "cohidro_obras_import"



engine = create_engine(f"mysql+pymysql://{USER}:{PASSWORD}@{HOST}:{PORT}/{DB}")



# ========================

# Arquivo Excel

# ========================

excel_file = "/www/wwwroot/alunosdamedicina.com/PLANILHA DE DADOS COHIDRO - agosto.xlsx"



# ========================

# Listas de tipos por coluna (iguais ao CREATE TABLE)

# ========================

expected_cols = [

    "id", "orgao_demandante", "secretaria", "municipio", "bairro", "mesorregiao",

    "diretoria", "setor", "responsavel", "tipo", "processo_sei", "local_obra",

    "objeto_contratacao", "empresa_contratada", "numero_contrato",

    "assinatura_contrato", "ordem_inicio_data", "prazo_dias", "termino_previsto_data",

    "valor_contrato_a", "aditivo_numero", "novo_prazo_aditivo_dias", "valor_aditivo_b",

    "prazo_com_aditivo_dias", "valor_total_c", "reajuste_numero", "percentual_reajuste",

    "valor_reajuste_d", "valor_total_e", "descricao_servicos_periodo",

    "percentual_executado_periodo", "medicao_anterior_acumulada_f", "data_medicao_atual",

    "valor_liquidado_g", "liquidado_acumulado", "andamento_fisico_percentual",

    "liquidado_acumulado_percentual", "saldo_contratual_sem_reajuste_i",

    "saldo_contratual_com_reajuste", "saldo_empenho", "numero_oficio_solicitacao_recursos",

    "fonte_recursos", "status_contrato", "inicio_suspensao", "termino_suspensao",

    "previsao_termino_atualizada", "vigencia_contratual", "conclusao_obra_real",

    "objetivo", "observacoes"

]



date_cols = [

    "assinatura_contrato", "ordem_inicio_data", "termino_previsto_data",

    "data_medicao_atual", "inicio_suspensao", "termino_suspensao",

    "previsao_termino_atualizada", "vigencia_contratual", "conclusao_obra_real"

]



money_cols = [

    "valor_contrato_a", "valor_aditivo_b", "valor_total_c", "valor_reajuste_d",

    "valor_total_e", "medicao_anterior_acumulada_f", "valor_liquidado_g",

    "liquidado_acumulado", "saldo_contratual_sem_reajuste_i",

    "saldo_contratual_com_reajuste", "saldo_empenho"

]



percent_cols = [

    "percentual_reajuste", "percentual_executado_periodo",

    "andamento_fisico_percentual", "liquidado_acumulado_percentual"

]



int_cols = ["prazo_dias", "novo_prazo_aditivo_dias", "prazo_com_aditivo_dias"]



dtype_map = {

    "id": VARCHAR(50),

    "orgao_demandante": VARCHAR(255),

    "secretaria": VARCHAR(255),

    "municipio": VARCHAR(255),

    "bairro": VARCHAR(255),

    "mesorregiao": VARCHAR(255),

    "diretoria": VARCHAR(255),

    "setor": VARCHAR(255),

    "responsavel": VARCHAR(255),

    "tipo": VARCHAR(255),

    "processo_sei": VARCHAR(255),

    "local_obra": VARCHAR(255),

    "objeto_contratacao": VARCHAR(255),

    "empresa_contratada": VARCHAR(255),

    "numero_contrato": VARCHAR(50),

    "assinatura_contrato": Date(),

    "ordem_inicio_data": Date(),

    "prazo_dias": INTEGER(),

    "termino_previsto_data": Date(),

    "valor_contrato_a": DECIMAL(15, 2),

    "aditivo_numero": VARCHAR(50),

    "novo_prazo_aditivo_dias": INTEGER(),

    "valor_aditivo_b": DECIMAL(15, 2),

    "prazo_com_aditivo_dias": INTEGER(),

    "valor_total_c": DECIMAL(15, 2),

    "reajuste_numero": VARCHAR(50),

    "percentual_reajuste": DECIMAL(6, 2),

    "valor_reajuste_d": DECIMAL(15, 2),

    "valor_total_e": DECIMAL(15, 2),

    "descricao_servicos_periodo": VARCHAR(500),

    "percentual_executado_periodo": DECIMAL(6, 2),

    "medicao_anterior_acumulada_f": DECIMAL(15, 2),

    "data_medicao_atual": Date(),

    "valor_liquidado_g": DECIMAL(15, 2),

    "liquidado_acumulado": DECIMAL(15, 2),

    "andamento_fisico_percentual": DECIMAL(6, 2),

    "liquidado_acumulado_percentual": DECIMAL(6, 2),

    "saldo_contratual_sem_reajuste_i": DECIMAL(15, 2),

    "saldo_contratual_com_reajuste": DECIMAL(15, 2),

    "saldo_empenho": DECIMAL(15, 2),

    "numero_oficio_solicitacao_recursos": VARCHAR(255),

    "fonte_recursos": VARCHAR(255),

    "status_contrato": VARCHAR(255),

    "inicio_suspensao": Date(),

    "termino_suspensao": Date(),

    "previsao_termino_atualizada": Date(),

    "vigencia_contratual": Date(),

    "conclusao_obra_real": Date(),

    "objetivo": VARCHAR(255),

    "observacoes": Text(),

}



# ========================

# Helpers de normalização/conversão

# ========================

def strip_accents(s: str) -> str:

    return "".join(c for c in unicodedata.normalize("NFKD", s) if not unicodedata.combining(c))



def normalize_header(s: str) -> str:

    s = str(s).strip()

    s = strip_accents(s)

    s = s.lower()

    s = s.replace("nº", "numero")

    s = re.sub(r"[^a-z0-9]+", "_", s)

    s = re.sub(r"_+", "_", s).strip("_")

    return s



def parse_money(x):

    if pd.isna(x): return None

    s = str(x).strip().replace("R$", "").replace(" ", "")

    s = s.replace(".", "").replace(",", ".")

    try: return float(s)

    except: return None



def parse_percent(x):

    if pd.isna(x): return None

    s = str(x).strip().replace("%", "").replace(" ", "").replace(",", ".")

    try: return float(s)

    except: return None



def parse_int(x):

    if pd.isna(x): return None

    s = re.sub(r"[^0-9\-]", "", str(x).strip())

    try: return int(s)

    except: return None



# ========================

# 1) Ler Excel como texto e normalizar cabeçalhos

# ========================

df = pd.read_excel(excel_file, dtype=str)

orig_cols = list(df.columns)

df.columns = [normalize_header(c) for c in df.columns]



# ========================

# 2) Mapeamento “inteligente” (ajuste aqui se necessário)

# ========================

custom_map = {

    # Identificação

    "id": "id",

    "orgao_demandante": "orgao_demandante",

    "secretaria": "secretaria",

    "municipio": "municipio",

    "bairro": "bairro",

    "mesorregiao": "mesorregiao",

    "diretoria": "diretoria",

    "setor": "setor",

    "responsavel": "responsavel",

    "tipo": "tipo",

    "processo_sei": "processo_sei",

    "local_da_obra": "local_obra",

    "local_obra": "local_obra",

    "objeto_de_contratacao": "objeto_contratacao",

    "objeto_contratacao": "objeto_contratacao",

    "empresa_contratada": "empresa_contratada",

    "numero_do_contrato": "numero_contrato",

    "n_do_contrato": "numero_contrato",

    "no_do_contrato": "numero_contrato",

    "numero_contrato": "numero_contrato",



    # Datas / prazos

    "assinatura_do_contrato_data": "assinatura_contrato",

    "assinatura_contrato_data": "assinatura_contrato",

    "assinatura_contrato": "assinatura_contrato",

    "contrato_ordem_de_inicio_data": "ordem_inicio_data",

    "ordem_de_inicio_data": "ordem_inicio_data",

    "ordem_inicio_data": "ordem_inicio_data",

    "contrato_prazo_dias": "prazo_dias",

    "prazo_dias": "prazo_dias",

    "contrato_termino_previsto_data": "termino_previsto_data",

    "termino_previsto_data": "termino_previsto_data",



    # Valores

    "contrato_valor_rs_a": "valor_contrato_a",

    "valor_contrato_a": "valor_contrato_a",

    "aditivo_n": "aditivo_numero",

    "aditivo_numero": "aditivo_numero",

    "novo_prazo_apos_aditivo_dias": "novo_prazo_aditivo_dias",

    "novo_prazo_aditivo_dias": "novo_prazo_aditivo_dias",

    "aditivos_valor_rs_b": "valor_aditivo_b",

    "valor_aditivo_b": "valor_aditivo_b",

    "valor_total_rs_c_a_b": "valor_total_c",

    "valor_total_c": "valor_total_c",

    "contrato_apos_aditivo_prazo_do_contrato_c_aditivos_dias": "prazo_com_aditivo_dias",

    "prazo_contrato_com_aditivos_dias": "prazo_com_aditivo_dias",

    "reajuste_n": "reajuste_numero",

    "reajuste_numero": "reajuste_numero",

    "valor_dos_reajustes": "percentual_reajuste",

    "percentual_reajuste": "percentual_reajuste",

    "valor_total_dos_reajustes_rs_d": "valor_reajuste_d",

    "valor_reajuste_d": "valor_reajuste_d",

    "valor_total_do_contrato_rs_e_c_d": "valor_total_e",

    "valor_total_e": "valor_total_e",



    # Medições / % / saldos

    "descricao_dos_servicos_executados_no_periodo": "descricao_servicos_periodo",

    "servicos_executados_no_periodo": "percentual_executado_periodo",

    "medicao_anterior_acumulada_f": "medicao_anterior_acumulada_f",

    "data_da_medicao_atual": "data_medicao_atual",

    "valor_liquidado_na_medicao_rs_g": "valor_liquidado_g",

    "valor_liquidado_g": "valor_liquidado_g",

    "liquidado_acumulado_rs": "liquidado_acumulado",

    "liquidado_acumulado": "liquidado_acumulado",

    "andamento_fisico_executado": "andamento_fisico_percentual",

    "liquidado_acumulado_": "liquidado_acumulado_percentual",



    "saldo_contratual_sem_reajustes_rs_i_c_f_g": "saldo_contratual_sem_reajuste_i",

    "saldo_contratual_sem_reajuste_i": "saldo_contratual_sem_reajuste_i",

    "saldo_contratual_com_reajuste_rs": "saldo_contratual_com_reajuste",

    "saldo_contratual_com_reajuste": "saldo_contratual_com_reajuste",

    "saldo_de_empenho_rs": "saldo_empenho",

    "saldo_empenho": "saldo_empenho",



    # Outros

    "numero_do_oficio_de_solicitacao_de_recursos": "numero_oficio_solicitacao_recursos",

    "fonte_de_recursos": "fonte_recursos",

    "fonte_recursos": "fonte_recursos",

    "status_do_contrato": "status_contrato",

    "status_contrato": "status_contrato",

    "inicio_da_suspensao": "inicio_suspensao",

    "inicio_suspensao": "inicio_suspensao",

    "termino_da_suspensao": "termino_suspensao",

    "termino_suspensao": "termino_suspensao",

    "previsao_de_termino_atualizada_data": "previsao_termino_atualizada",

    "previsao_termino_atualizada_data": "previsao_termino_atualizada",

    "previsao_termino_atualizada": "previsao_termino_atualizada",

    "vigencia_contratual_data": "vigencia_contratual",

    "vigencia_contratual": "vigencia_contratual",

    "conclusao_da_obra_real_data": "conclusao_obra_real",

    "conclusao_obra_real_data": "conclusao_obra_real",

    "conclusao_obra_real": "conclusao_obra_real",

    "objetivo": "objetivo",

    "observacoes": "observacoes",

    "observacao": "observacoes",

}



df = df.rename(columns={c: custom_map.get(c, c) for c in df.columns})



# Cria colunas ausentes como None e limita textos longos

for c in expected_cols:

    if c not in df.columns:

        df[c] = None



df["descricao_servicos_periodo"] = df["descricao_servicos_periodo"].astype(str).str.slice(0, 500)

for c in ["id","orgao_demandante","secretaria","municipio","bairro","mesorregiao","diretoria",

          "setor","responsavel","tipo","processo_sei","local_obra","objeto_contratacao",

          "empresa_contratada","numero_contrato","aditivo_numero","reajuste_numero",

          "numero_oficio_solicitacao_recursos","fonte_recursos","status_contrato","objetivo"]:

    df[c] = df[c].astype(str).str.slice(0, 255)



# Conversões de tipos

for c in date_cols:

    df[c] = pd.to_datetime(df[c], dayfirst=True, errors="coerce").dt.date



for c in money_cols:

    df[c] = df[c].apply(lambda x: None if pd.isna(x) else parse_money(x))



for c in percent_cols:

    df[c] = df[c].apply(lambda x: None if pd.isna(x) else parse_percent(x))



for c in int_cols:

    df[c] = df[c].apply(lambda x: None if pd.isna(x) else parse_int(x))



# ========================

# 3) BUSCAR ORDEM OFICIAL DAS COLUNAS NO MYSQL

# ========================

with engine.connect() as conn:

    cols_in_db = conn.execute(

        text("""

            SELECT COLUMN_NAME

            FROM information_schema.columns

            WHERE table_schema = :db

              AND table_name   = :tb

            ORDER BY ORDINAL_POSITION

        """),

        {"db": DB, "tb": TABLE}

    ).fetchall()



# Remove a auto_increment

ordered_cols = [r[0] for r in cols_in_db if r[0].lower() != "id_auto"]



# Garante que só vamos inserir colunas existentes na tabela, e na ORDEM do MySQL

missing_for_db = [c for c in ordered_cols if c not in df.columns]

if missing_for_db:

    # Cria colunas faltantes como None

    for c in missing_for_db:

        df[c] = None



df = df[ordered_cols]  # <- ORDEM IDÊNTICA À TABELA



# ========================

# 4) Inserir no MySQL

# ========================

# Filtra dtype_map apenas para colunas que estamos inserindo

dtype_for_insert = {k: v for k, v in dtype_map.items() if k in ordered_cols}



df.to_sql(

    name=TABLE,

    con=engine,

    if_exists="append",

    index=False,

    dtype=dtype_for_insert,

    method="multi",

    chunksize=500,

)



print("✅ Inserção concluída com colunas na MESMA ORDEM do MySQL.")

print("➡️ Colunas destino (ordem MySQL):", ordered_cols)

print("ℹ️ Colunas originais do Excel:", orig_cols)



SyntaxError: invalid non-printable character U+00A0 (500504358.py, line 55)

In [1]:
%pip install dash

[33mDEPRECATION: Loading egg at /www/server/panel/pyenv/lib/python3.12/site-packages/PyMySQL-0.9.3-py3.12.egg is deprecated. pip 24.3 will enforce this behaviour change. A possible replacement is to use pip for package installation.. Discussion can be found at https://github.com/pypa/pip/issues/12330[0m[33m
[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49m/www/server/panel/pyenv/bin/python3.12 -m pip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


Colunas do Excel (normalizadas): ['id', 'nome', 'local_de_trabalho', 'funcao', 'status', 'data_de_inicio', 'celular', 'cpf_mf', 'email']
Mapeadas para a tabela: 1 / 50 -> ['id']


SystemExit: ❌ Poucas colunas mapeadas. Verifique se o ARQUIVO é o de OBRAS e se os cabeçalhos batem. Abortado para evitar NULLs.


To exit: use 'exit', 'quit', or Ctrl-D.



In [20]:
import pandas as pd

In [21]:
df_relatorio_obras = pd.read_excel(f"/www/wwwroot/alunosdamedicina.com/Massive_import.xlsx")

In [22]:
df_relatorio_obras

Unnamed: 0,ID,ÓRGÃO DEMANDANTE,SECRETARIA,MUNICÍPIO,BAIRRO,MESOREGIÃO,DIRETORIA,SETOR,RESPONSÁVEL,TIPO,...,NUMERO DO OFICIO DE SOLICITAÇÃO DE RECURSOS,FONTE DE RECURSOS,STATUS DO CONTRATO,Início da suspensâo,Término da suspensâo,PREVISÃO DE TÉRMINO ATUALIZADA (Data),VIGENCIA CONTRATUAL (Data),CONCLUSÃO DA OBRA REAL (data),OBJETIVO,OBSERVAÇÕES
0,1,CECIERJ,Fundação Centro de Ciências e Educação Superio...,Paracambi,Bairro da Fábrica,Metropolitana do Rio de Janeiro,DOB,4º COOBRA,DIEGO SCOVINO,Obra,...,,100000000 - ORDINÁRIOS PROVENIENTES DE IMPOSTOS,EM ANDAMENTO,44918.0,45797.0,45869.0,45983.0,,,Obra encontra-se em Em andamento. Reiniciada e...
1,2,DPGERJ,Defensoria Pública Geral do Estado do Rio de J...,Rio de Janeiro,Santa Cruz,Metropolitana do Rio de Janeiro,DOB,4º COOBRA,DIEGO SCOVINO,Obra,...,,,EM SUSPENSÃO CONTRATUAL,,,45520.0,,,,Obra encontra-se em Suspensão Contratual pelo ...
2,3,DPGERJ,Defensoria Pública Geral do Estado do Rio de J...,Campos dos Goytacazes,Centro,Norte Fluminense,DOB,3º COOBRA,GUILHERME,Obra,...,,,CONCLUIDO,,,45482.0,,,,Obra Concluída.\nObra encontra-se em termo de ...
3,4,SEEDUC,Secretaria de Estado de Educação,Rio de Janeiro,Tijuca,Metropolitana do Rio de Janeiro,DOB,,MARCUS,Obra,...,,,CONCLUIDA E INAUGURADA,,,44469.0,,,,Obra Concluída - inaugurada.
4,5,SECC,Secretaria de Estado de Cultura e Economia Cri...,Rio de Janeiro,Flamengo,Metropolitana do Rio de Janeiro,DOB,,MARCUS,Obra,...,,,CONCLUIDA E INAUGURADA,,,44520.0,,,,Obra Concluída - inaugurada.
5,6,SEEDUC,Secretaria de Estado de Educação,Rio de Janeiro,Cidade de Deus,Metropolitana do Rio de Janeiro,DOB,4º COOBRA,DIEGO SCOVINO,Obra,...,,,EM SUSPENSÃO CONTRATUAL,,,45535.0,,,,Obra encontra-se em Suspensão Contratual pelo ...
6,7,SEPOL,Secretaria de Estado de Polícia Civil,Barra Mansa,Centro,Sul Fluminense,DOB,3º COOBRA,CARLOS EDUARDO,Obra,...,,,CONCLUIDO,,,45190.0,,,,Obra concluída.\nOfício de Solicitação de recu...
7,8,SEDSODH,Secretaria de Estado de Desenvolvimento Social...,Rio de Janeiro,Madureira,Metropolitana do Rio de Janeiro,DOB,4º COOBRA,DIEGO SCOVINO,Obra,...,,,CONCLUIDO,,,45513.0,,,,Obra concluída.\nOfício de Solicitação de recu...
8,9,SEPOL,Secretaria de Estado de Polícia Civil,Araruama,Centro,Baixadas Litorâneas,DOB,3º COOBRA,GUILHERME,Obra,...,,,CONCLUIDO,,,45190.0,,,,Obra concluída.\nOfício de Solicitação de recu...
9,10,SEPOL,Secretaria de Estado de Polícia Civil,Rio de Janeiro,Centro,Metropolitana do Rio de Janeiro,DOB,4º COOBRA,DIEGO SCOVINO,Obra,...,,759 - Recursos Vinculados a Fundos,EM ANDAMENTO,,45363.0,45241.0,,,,Obra rescindida 12/03/2024 D.O.\nObra foi cont...


In [24]:
import re, math, unicodedata
import pandas as pd
from sqlalchemy import create_engine, text
from sqlalchemy.types import VARCHAR, INTEGER, DECIMAL, Date, Text

# ... (sua conexão, leitura do Excel, mapping e expected_cols iguais) ...

# ---------- Parsers robustos ----------
DEC_PREC, DEC_SCALE = 15, 2
DEC_MAX = 10**(DEC_PREC-DEC_SCALE) - 10**(-DEC_SCALE)   # 9_999_999_999_999.99

def parse_money_strict(x):
    """Extrai o 1º número da string (ex.: '1.234.567,89 - texto') e converte para float.
       Se exceder DECIMAL(15,2), retorna None."""
    if x is None or (isinstance(x, float) and math.isnan(x)):
        return None
    s = str(x)
    # pega padrão '1.234.567,89' ou '1234567,89' ou '1234567.89'
    m = re.search(r'[-+]?(?:\d{1,3}(?:\.\d{3})+|\d+)(?:[.,]\d+)?', s)
    if not m:
        return None
    num = m.group(0)
    # normaliza para ponto decimal
    num = num.replace('.', '').replace(',', '.')
    try:
        v = float(num)
        # corta valores fora do DECIMAL(15,2)
        if abs(v) > DEC_MAX:
            return None
        # força 2 casas (opcional)
        return round(v, 2)
    except:
        return None

def parse_percent_strict(x):
    if x is None or (isinstance(x, float) and math.isnan(x)):
        return None
    s = str(x)
    m = re.search(r'[-+]?\d+(?:[.,]\d+)?', s)
    if not m:
        return None
    num = m.group(0).replace(',', '.')
    try:
        return float(num)
    except:
        return None

def parse_int_strict(x):
    if x is None or (isinstance(x, float) and math.isnan(x)):
        return None
    m = re.search(r'-?\d+', str(x))
    if not m:
        return None
    try:
        return int(m.group(0))
    except:
        return None

def parse_date_strict(x):
    """Tenta: formatos DD/MM/AAAA, DD-MM-AAAA, AAAA-MM-DD, e serial Excel."""
    if x is None or (isinstance(x, float) and math.isnan(x)):
        return None
    # serial Excel (número 'pequeno' e só dígitos)
    if re.fullmatch(r'\d+', str(x)):
        try:
            n = int(x)
            # limite razoável p/ datas modernas
            if 0 < n < 60000:
                return pd.to_datetime(n, unit='d', origin='1899-12-30').date()
        except:
            pass
    for fmt in ("%d/%m/%Y", "%d-%m-%Y", "%Y-%m-%d"):
        try:
            return pd.to_datetime(str(x), format=fmt).date()
        except:
            continue
    # fallback com dayfirst, mas silencioso
    try:
        return pd.to_datetime(str(x), dayfirst=True, errors="coerce").date()
    except:
        return None

# ---------- Conversões ----------
# Datas
for c in [
    "assinatura_contrato","ordem_inicio_data","termino_previsto_data",
    "data_medicao_atual","inicio_suspensao","termino_suspensao",
    "previsao_termino_atualizada","vigencia_contratual","conclusao_obra_real"
]:
    df[c] = df[c].apply(parse_date_strict)

# Dinheiro
for c in [
    "valor_contrato_a","valor_aditivo_b","valor_total_c","valor_reajuste_d",
    "valor_total_e","medicao_anterior_acumulada_f","valor_liquidado_g",
    "liquidado_acumulado","saldo_contratual_sem_reajuste_i",
    "saldo_contratual_com_reajuste","saldo_empenho"
]:
    df[c] = df[c].apply(parse_money_strict)

# Percentuais
for c in [
    "percentual_reajuste","percentual_executado_periodo",
    "andamento_fisico_percentual","liquidado_acumulado_percentual"
]:
    df[c] = df[c].apply(parse_percent_strict)

# Inteiros
for c in ["prazo_dias","novo_prazo_aditivo_dias","prazo_com_aditivo_dias"]:
    df[c] = df[c].apply(parse_int_strict)

# ---------- Sanidade: reportar possíveis problemas antes do insert ----------
bad_big = []
for c in ["liquidado_acumulado","valor_contrato_a","valor_total_e"]:
    bad = df[c].dropna().abs() > DEC_MAX
    if bad.any():
        bad_big.append((c, int(bad.sum())))
if bad_big:
    print("⚠️ Valores acima do limite DECIMAL(15,2) foram anulados:", bad_big)

# ---------- Ordem oficial e insert com dtype ----------
with engine.connect() as conn:
    rows = conn.execute(text("""
        SELECT COLUMN_NAME
        FROM information_schema.columns
        WHERE table_schema=:db AND table_name=:tb
        ORDER BY ORDINAL_POSITION
    """), {"db": DB, "tb": "cohidro_obras_import"}).fetchall()
ordered_cols = [r[0] for r in rows if r[0].lower() != "id_auto"]
df = df[ordered_cols]

dtype_map = {
    "id": VARCHAR(50),
    "orgao_demandante": VARCHAR(255),
    "secretaria": VARCHAR(255),
    "municipio": VARCHAR(255),
    "bairro": VARCHAR(255),
    "mesorregiao": VARCHAR(255),
    "diretoria": VARCHAR(255),
    "setor": VARCHAR(255),
    "responsavel": VARCHAR(255),
    "tipo": VARCHAR(255),
    "processo_sei": VARCHAR(255),
    "local_obra": VARCHAR(255),
    "objeto_contratacao": VARCHAR(255),
    "empresa_contratada": VARCHAR(255),
    "numero_contrato": VARCHAR(50),
    "assinatura_contrato": Date(),
    "ordem_inicio_data": Date(),
    "prazo_dias": INTEGER(),
    "termino_previsto_data": Date(),
    "valor_contrato_a": DECIMAL(15,2),
    "aditivo_numero": VARCHAR(50),
    "novo_prazo_aditivo_dias": INTEGER(),
    "valor_aditivo_b": DECIMAL(15,2),
    "prazo_com_aditivo_dias": INTEGER(),
    "valor_total_c": DECIMAL(15,2),
    "reajuste_numero": VARCHAR(50),
    "percentual_reajuste": DECIMAL(6,2),
    "valor_reajuste_d": DECIMAL(15,2),
    "valor_total_e": DECIMAL(15,2),
    "descricao_servicos_periodo": VARCHAR(500),
    "percentual_executado_periodo": DECIMAL(6,2),
    "medicao_anterior_acumulada_f": DECIMAL(15,2),
    "data_medicao_atual": Date(),
    "valor_liquidado_g": DECIMAL(15,2),
    "liquidado_acumulado": DECIMAL(15,2),
    "andamento_fisico_percentual": DECIMAL(6,2),
    "liquidado_acumulado_percentual": DECIMAL(6,2),
    "saldo_contratual_sem_reajuste_i": DECIMAL(15,2),
    "saldo_contratual_com_reajuste": DECIMAL(15,2),
    "saldo_empenho": DECIMAL(15,2),
    "numero_oficio_solicitacao_recursos": VARCHAR(255),
    "fonte_recursos": VARCHAR(255),
    "status_contrato": VARCHAR(255),
    "inicio_suspensao": Date(),
    "termino_suspensao": Date(),
    "previsao_termino_atualizada": Date(),
    "vigencia_contratual": Date(),
    "conclusao_obra_real": Date(),
    "objetivo": VARCHAR(255),
    "observacoes": Text(),
}

df.to_sql("cohidro_obras_import", engine, if_exists="append", index=False,
          dtype=dtype_map, method="multi", chunksize=500)

print("✅ Import concluído em cohidro_obras_import")

✅ Import concluído em cohidro_obras_import
