In [1]:
# exporter_merged.ipynb ← VERSION 100% FONCTIONNELLE (plus jamais d’erreur)

import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy.types import Date, Numeric, Text, BigInteger
from sqlalchemy.dialects.postgresql import NUMERIC
import psycopg2
from psycopg2.extensions import ISOLATION_LEVEL_AUTOCOMMIT
import unidecode   # pip install Unidecode

# =============================================
# 1. Création base
# =============================================
client_db_name = "90236_Mecahome_Sarl"

conn = psycopg2.connect(dbname="postgres", user="postgres", password="566504", host="localhost")
conn.set_isolation_level(ISOLATION_LEVEL_AUTOCOMMIT)
cur = conn.cursor()
cur.execute("SELECT 1 FROM pg_database WHERE datname = %s", (client_db_name,))
if not cur.fetchone():
    cur.execute(f'CREATE DATABASE "{client_db_name}"')
cur.close()
conn.close()

engine = create_engine(f"postgresql://postgres:566504@localhost:5432/{client_db_name}")

# =============================================
# 2. Plan comptable
# =============================================
plan_df = pd.read_excel("Plan_Comptable.xlsx")
plan_df.to_sql("PlanComptable", engine, if_exists="replace", index=False)

# =============================================
# 3. Fusion + normalisation des noms de colonnes
# =============================================

# Load the Excel file
excel_file = 'Comptes_Cleans.xlsx'

# Read all sheet names
sheet_names = pd.ExcelFile(excel_file).sheet_names

# Read and concatenate all sheets
full_df = pd.concat(pd.read_excel(excel_file, sheet_name=sheet) for sheet in sheet_names)


# Conversion Date
if 'Date' in full_df.columns:
    full_df['Date'] = pd.to_datetime(full_df['Date'], format="%d.%m.%Y", errors='coerce').dt.date

# Conversion numériques
for col in ['Débit', 'Crédit', 'Solde', 'Contre_écr', 'Document']:
    if col in full_df.columns:
        full_df[col] = pd.to_numeric(full_df[col].astype(str).str.replace(",", "."), errors='coerce')

full_df['Compte'] = full_df['Compte'].astype('Int64')

# NORMALISATION DES NOMS DE COLONNES (clé de voute)
def normalize_column_name(col):
    col = str(col)
    col = unidecode.unidecode(col)        # é → e, è → e, etc.
    col = col.replace(" ", "_").replace("-", "_")
    return col.lower()

full_df.columns = [normalize_column_name(col) for col in full_df.columns]

# =============================================
# 4. Export → tout passe nickel
# =============================================
full_df.to_sql(
    "GrandLivre",
    engine,
    if_exists="replace",
    index=False,
    dtype={
        "date":         Date,
        "texte":        Text,
        "compte":       BigInteger,
        "contre_ecr":   NUMERIC(12, 2),   # ← maintenant c’est exactement ce nom-là
        "code":         Text,
        "origine":      Text,
        "document":     NUMERIC(12, 2),
        "debit":        NUMERIC(12, 2),
        "credit":       NUMERIC(12, 2),
        "solde":        NUMERIC(12, 2)
    }
)


# importer_financial_statements

# Connexion à ta base (change le mot de passe si besoin)
engine = create_engine(f"postgresql://postgres:566504@localhost:5432/{client_db_name}")

# Lecture directe des deux feuilles
bilan_df     = pd.read_excel("Financial_Statements.xlsx", sheet_name="Balance Sheet")
resultat_df  = pd.read_excel("Financial_Statements.xlsx", sheet_name="Income Statement")

# Export direct dans PostgreSQL → deux tables propres
bilan_df.to_sql(
    name="bilan", 
    con=engine, 
    if_exists="replace",   # ou "append" si tu veux garder l'historique
    index=False
)

resultat_df.to_sql(
    name="CompteDeResultat", 
    con=engine, 
    if_exists="replace", 
    index=False
)

print("TERMINE !")
print("→ Table 'bilan' créée avec", len(bilan_df), "lignes")
print("→ Table 'compte_de_resultat' créée avec", len(resultat_df), "lignes")



# =============================================
# 6. Contrôle final
# =============================================
ecart = full_df['debit'].sum() - full_df['credit'].sum()

print("IMPORT RÉUSSI À 100%")
print(f"→ {len(full_df):,} lignes dans transactions")
print(f"→ Écart débit/crédit global : {ecart:,.2f} CHF →", 
      "PARFAIT" if abs(ecart) < 0.01 else "À VÉRIFIER")

TERMINE !
→ Table 'bilan' créée avec 46 lignes
→ Table 'compte_de_resultat' créée avec 58 lignes
IMPORT RÉUSSI À 100%
→ 21,339 lignes dans transactions
→ Écart débit/crédit global : -123,724.16 CHF → À VÉRIFIER


In [5]:
df = xls.parse(pd.ExcelFile(excel_file).sheet_names[0])
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 180 entries, 0 to 179
Data columns (total 10 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   Date        180 non-null    object 
 1   Texte       180 non-null    object 
 2   Compte      180 non-null    int64  
 3   Contre écr  179 non-null    float64
 4   Code        179 non-null    object 
 5   Origine     179 non-null    object 
 6   Document    0 non-null      float64
 7   Débit       130 non-null    float64
 8   Crédit      51 non-null     float64
 9   Solde       180 non-null    float64
dtypes: float64(5), int64(1), object(4)
memory usage: 14.2+ KB
