In [2]:
import pandas as pd

# Nuevo enlace del archivo de Google Drive (modificado para descarga directa)
url = "https://docs.google.com/spreadsheets/d/1chmzMUVVT6IYTsGmXDoN88W8_4JpzEbo/export?format=xlsx"

# Leer las hojas específicas del archivo
try:
    df_usuarios = pd.read_excel(url, sheet_name="USUARIOS")
    df_anticipos = pd.read_excel(url, sheet_name="ANTICIPOS")
    df_relacion_pagos = pd.read_excel(url, sheet_name="SALDOS")

    # Mostrar las primeras filas para confirmar
    print("USUARIOS:")
    print(df_usuarios.head())

    print("\nANTICIPOS:")
    print(df_anticipos.head())

    print("\nSALDOS:")
    print(df_relacion_pagos.head())
except Exception as e:
    print(f"Error al leer el archivo: {e}")



USUARIOS:
     Acreedor            Nombre del Proveedor
0  2000007804      SANCHEZ TORRES JUAN CARLOS
1  2000007805   HERRERA MARTINEZ DIANA MALENY
2  2000007947  GONZALEZ CARABALLO LUIS OVIDIO
3  2000008013        ROMAN BEDOYA RUBEN DARIO
4  2000008022         CARVAJAL GRANADA FELIPE

ANTICIPOS:
   Soc.    Acreedor            Nombre del Proveedor     Nº doc.  MANIFIESTO   
0  CO03  2000007804      SANCHEZ TORRES JUAN CARLOS  1700021000   242479060  \
1  CO03  2000007805   HERRERA MARTINEZ DIANA MALENY  1700008000   242480239   
2  CO03  2000007947  GONZALEZ CARABALLO LUIS OVIDIO  1700007500   242479154   
3  CO03  2000008013        ROMAN BEDOYA RUBEN DARIO  1700019000   242480216   
4  CO03  2000008022         CARVAJAL GRANADA FELIPE  1700017000   242480291   

   Err  BP VP Clase Signif.clave contab. Fecha_Manifiesto  Fe.contab.  CPag   
0  NaN NaN  K    KA     Anular anticipos       02.01.2024  02.01.2024   NaN  \
1  NaN NaN  K    KA     Anular anticipos       02.01.2024  02.01.2024

LIMPIEZA DE LOS DATOS

In [3]:
# Leer la hoja "ANTICIPOS" desde el archivo
df_anticipos = pd.read_excel(url, sheet_name="ANTICIPOS")

# Seleccionar solo las columnas necesarias
df_anticipos = df_anticipos[['Acreedor', 'Nombre del Proveedor', 'MANIFIESTO', 'Fecha_Manifiesto', 'ANTICIPO']]

# Convertir la columna "Fecha_Manifiesto" a formato datetime
df_anticipos['Fecha_Manifiesto'] = pd.to_datetime(df_anticipos['Fecha_Manifiesto'], format='%d.%m.%Y')

# Limpiar la columna "ANTICIPO" eliminando el signo "-" y convirtiendo a tipo numérico
df_anticipos['ANTICIPO'] = df_anticipos['ANTICIPO'].astype(str).str.replace('-', '').astype(float)

# Mostrar los primeros registros después de la limpieza
print("Datos limpios de la tabla ANTICIPOS:")
print(df_anticipos.head())



Datos limpios de la tabla ANTICIPOS:
     Acreedor            Nombre del Proveedor  MANIFIESTO Fecha_Manifiesto   
0  2000007804      SANCHEZ TORRES JUAN CARLOS   242479060       2024-01-02  \
1  2000007805   HERRERA MARTINEZ DIANA MALENY   242480239       2024-01-02   
2  2000007947  GONZALEZ CARABALLO LUIS OVIDIO   242479154       2024-01-02   
3  2000008013        ROMAN BEDOYA RUBEN DARIO   242480216       2024-01-02   
4  2000008022         CARVAJAL GRANADA FELIPE   242480291       2024-01-02   

   ANTICIPO  
0  111000.0  
1  141420.0  
2  111000.0  
3  132000.0  
4  261360.0  


In [4]:
# Filtrar y sobrescribir las columnas necesarias (elimina cualquier columna extra)
df_relacion_pagos = df_relacion_pagos[["pago", "Acreedor", "Nombre 1", "MANIFIESTO", "VALOR_SALDO"]]

# Convertir la columna "pago" a formato datetime (día, mes, año)
df_relacion_pagos["pago"] = pd.to_datetime(df_relacion_pagos["pago"], dayfirst=True)

# Limpiar la columna "VALOR_SALDO"
df_relacion_pagos["VALOR_SALDO"] = (
    df_relacion_pagos["VALOR_SALDO"]
    .astype(str)
    .str.replace("-", "", regex=False)
    .str.replace(",", "", regex=False)
    .astype(float)
)

# Mostrar las primeras filas del dataframe limpio
print(df_relacion_pagos.head())




        pago    Acreedor                           Nombre 1 MANIFIESTO   
0 2022-05-13  2000007728  NAVARRO VERGARA KATERINE MILAGROS  241961048  \
1 2022-05-13  2000007728  NAVARRO VERGARA KATERINE MILAGROS  241962459   
2 2022-05-13  2000007728  NAVARRO VERGARA KATERINE MILAGROS  241962649   
3 2022-05-13  2000007728  NAVARRO VERGARA KATERINE MILAGROS  241963704   
4 2022-05-13  2000007728  NAVARRO VERGARA KATERINE MILAGROS  241964813   

   VALOR_SALDO  
0     188839.0  
1      39384.0  
2      52459.0  
3     135379.0  
4      19692.0  


In [5]:
from sqlalchemy import create_engine

# Datos de conexión a PostgreSQL
usuario = 'postgres'
contraseña = 'Luna2030.'  # Cambia por tu contraseña
host = 'localhost'
puerto = '5433'  # Asegúrate de que coincide con tu configuración
db = 'Proyecto_Pagos'

# Crear el motor de conexión
engine = create_engine(f'postgresql+psycopg2://{usuario}:{contraseña}@{host}:{puerto}/{db}')

# Probar la conexión
try:
    with engine.connect() as connection:
        print("Conexión exitosa a PostgreSQL.")
except Exception as e:
    print(f"Error al conectar a la base de datos: {e}")


Conexión exitosa a PostgreSQL.


In [6]:
# Subir la tabla de usuarios
df_usuarios.to_sql('usuarios', engine, if_exists='replace', index=False)
print("Datos importados exitosamente a la tabla 'usuarios'.")

# Subir la tabla de anticipos
df_anticipos.to_sql('anticipos', engine, if_exists='replace', index=False)
print("Datos importados exitosamente a la tabla 'anticipos'.")

# Subir la tabla de relación de pagos
df_relacion_pagos.to_sql('saldos', engine, if_exists='replace', index=False)
print("Tabla 'saldos' exportada a PostgreSQL sin columnas extra.")


Datos importados exitosamente a la tabla 'usuarios'.
Datos importados exitosamente a la tabla 'anticipos'.
Tabla 'saldos' exportada a PostgreSQL sin columnas extra.
