<a href="https://colab.research.google.com/github/asantos20/conciliacao-bancaria/blob/main/Detec%C3%A7%C3%A3o_fraude_concili%C3%A7%C3%A3o_banc%C3%A1ria.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
# Instalando a biblioteca

pip install fuzzywuzzy

Collecting fuzzywuzzy
  Downloading fuzzywuzzy-0.18.0-py2.py3-none-any.whl.metadata (4.9 kB)
Downloading fuzzywuzzy-0.18.0-py2.py3-none-any.whl (18 kB)
Installing collected packages: fuzzywuzzy
Successfully installed fuzzywuzzy-0.18.0


In [3]:
# Biblioteca

import pandas as pd
from fuzzywuzzy import fuzz



In [4]:
# Simulação dos dados extraídos dos PDFs
contas_pagar = pd.DataFrame({
    'Fornecedor': ['ALFA SERVIÇOS', 'BETA TRANSPORTES', 'GAMA COMERCIAL'],
    'Valor': [1200.00, 980.00, 3000.00],
    'Data': ['2025-08-01', '2025-08-03', '2025-08-04']
})

extrato_bancario = pd.DataFrame({
    'Descrição': ['ALFA SERVIÇOS', 'BETA TRANSPORTES', 'DELTA SUPRIMENTOS'],
    'Valor': [1200.00, 980.00, 600.00],
    'Data': ['2025-08-01', '2025-08-03', '2025-08-05']
})

In [5]:
# Conciliação
resultado = []

for idx, row in contas_pagar.iterrows():
    match = extrato_bancario[
        (extrato_bancario['Valor'] == row['Valor']) &
        (extrato_bancario['Data'] == row['Data']) &
        (extrato_bancario['Descrição'].apply(lambda x: fuzz.partial_ratio(x, row['Fornecedor']) > 90))
    ]

    if not match.empty:
        resultado.append({
            'Fornecedor Previsto': row['Fornecedor'],
            'Valor Previsto': row['Valor'],
            'Data Prevista': row['Data'],
            'Fornecedor Extrato': match.iloc[0]['Descrição'],
            'Valor Realizado': match.iloc[0]['Valor'],
            'Data Realizada': match.iloc[0]['Data'],
            'Status': '✔️ Conciliado'
        })
    else:
        resultado.append({
            'Fornecedor Previsto': row['Fornecedor'],
            'Valor Previsto': row['Valor'],
            'Data Prevista': row['Data'],
            'Fornecedor Extrato': None,
            'Valor Realizado': None,
            'Data Realizada': None,
            'Status': '❌ Não pago'
        })

In [6]:
# Verificar pagamentos não previstos
for idx, row in extrato_bancario.iterrows():
    match = contas_pagar[
        (contas_pagar['Valor'] == row['Valor']) &
        (contas_pagar['Data'] == row['Data']) &
        (contas_pagar['Fornecedor'].apply(lambda x: fuzz.partial_ratio(x, row['Descrição']) > 90))
    ]

    if match.empty:
        resultado.append({
            'Fornecedor Previsto': None,
            'Valor Previsto': None,
            'Data Prevista': None,
            'Fornecedor Extrato': row['Descrição'],
            'Valor Realizado': row['Valor'],
            'Data Realizada': row['Data'],
            'Status': '⚠️ Não previsto'
        })

In [7]:
df_resultado = pd.DataFrame(resultado)
print(df_resultado)

  Fornecedor Previsto  Valor Previsto Data Prevista Fornecedor Extrato  \
0       ALFA SERVIÇOS          1200.0    2025-08-01      ALFA SERVIÇOS   
1    BETA TRANSPORTES           980.0    2025-08-03   BETA TRANSPORTES   
2      GAMA COMERCIAL          3000.0    2025-08-04               None   
3                None             NaN          None  DELTA SUPRIMENTOS   

   Valor Realizado Data Realizada           Status  
0           1200.0     2025-08-01    ✔️ Conciliado  
1            980.0     2025-08-03    ✔️ Conciliado  
2              NaN           None       ❌ Não pago  
3            600.0     2025-08-05  ⚠️ Não previsto  


Código Alternativo

In [None]:
import pdfplumber
import pandas as pd

# Função para extrair tabelas dos PDFs
def extrair_tabela_pdf(caminho_pdf):
    with pdfplumber.open(caminho_pdf) as pdf:
        pagina = pdf.pages[0]
        tabela = pagina.extract_table()
    df = pd.DataFrame(tabela[1:], columns=tabela[0])
    return df

# Caminhos dos arquivos simulados
caminho_previstas = "/mnt/data/contas_a_pagar_previstas.pdf"
caminho_extrato = "/mnt/data/extrato_bancario.pdf"

# Extração das tabelas
df_previstas = extrair_tabela_pdf(caminho_previstas)
df_extrato = extrair_tabela_pdf(caminho_extrato)

# Conversão de valores e datas
df_previstas['Valor (R$)'] = df_previstas['Valor (R$)'].str.replace('.', '').str.replace(',', '.').astype(float)
df_extrato['Valor (R$)'] = df_extrato['Valor (R$)'].str.replace('.', '').str.replace(',', '.').astype(float)

df_previstas['Data'] = pd.to_datetime(df_previstas['Data'], format='%d/%m/%Y')
df_extrato['Data'] = pd.to_datetime(df_extrato['Data'], format='%d/%m/%Y')

# Renomear colunas para facilitar o cruzamento
df_previstas.rename(columns={'Fornecedor': 'Fornecedor Previsto', 'Valor (R$)': 'Valor Previsto', 'Data': 'Data Prevista'}, inplace=True)
df_extrato.rename(columns={'Descrição': 'Fornecedor Extrato', 'Valor (R$)': 'Valor Realizado', 'Data': 'Data Realizada'}, inplace=True)

# Conciliar os dados
resultado = []

for _, row in df_previstas.iterrows():
    match = df_extrato[
        (df_extrato['Valor Realizado'] == row['Valor Previsto']) &
        (df_extrato['Data Realizada'] == row['Data Prevista']) &
        (df_extrato['Fornecedor Extrato'].str.upper() == row['Fornecedor Previsto'].upper())
    ]
    if not match.empty:
        resultado.append({
            **row,
            'Fornecedor Extrato': match.iloc[0]['Fornecedor Extrato'],
            'Valor Realizado': match.iloc[0]['Valor Realizado'],
            'Data Realizada': match.iloc[0]['Data Realizada'],
            'Status': '✔️ Conciliado'
        })
    else:
        resultado.append({
            **row,
            'Fornecedor Extrato': None,
            'Valor Realizado': None,
            'Data Realizada': None,
            'Status': '❌ Não pago'
        })

for _, row in df_extrato.iterrows():
    match = df_previstas[
        (df_previstas['Valor Previsto'] == row['Valor Realizado']) &
        (df_previstas['Data Prevista'] == row['Data Realizada']) &
        (df_previstas['Fornecedor Previsto'].str.upper() == row['Fornecedor Extrato'].upper())
    ]
    if match.empty:
        resultado.append({
            'Fornecedor Previsto': None,
            'Valor Previsto': None,
            'Data Prevista': None,
            'Fornecedor Extrato': row['Fornecedor Extrato'],
            'Valor Realizado': row['Valor Realizado'],
            'Data Realizada': row['Data Realizada'],
            'Status': '⚠️ Não previsto'
        })

df_resultado = pd.DataFrame(resultado)

import caas_jupyter_tools as tools; tools.display_dataframe_to_user(name="Resultado da Conciliação", dataframe=df_resultado)
