In [1]:
import sys
sys.path.append('../_amigocloud')

from sqlalchemy import create_engine, text
from amigocloud import AmigoCloud
from docx import Document
from docx2pdf import convert
import os
import json

# CONEXIÓN A GOOGLE DRIVE
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
import os

gauth = GoogleAuth()

# Si existe el archivo, intenta cargarlo
if os.path.exists("mycreds.txt"):
    gauth.LoadCredentialsFile("mycreds.txt")

# Si no hay credenciales o son inválidas, forzar nueva autenticación
if gauth.credentials is None or gauth.access_token_expired:
    try:
        gauth.LocalWebserverAuth()
    except:
        print("Error de autenticación. Eliminá 'mycreds.txt' y volvé a intentarlo.")
else:
    gauth.Authorize()

gauth.SaveCredentialsFile("mycreds.txt")
drive = GoogleDrive(gauth)

In [2]:
sys.path.append('..')

from config import RUTA_UNIDAD_ONE_DRIVE
from config import RUTA_LOCAL_ONE_DRIVE
from config import POSTGRES_UTEA
RUTA_COMPLETA = os.path.join(RUTA_UNIDAD_ONE_DRIVE, RUTA_LOCAL_ONE_DRIVE)

In [3]:
def get_ruta_informes():
    try:
        with open('../../ruta_informes.txt', 'r') as file:
            ruta_inf = file.readline().strip()
            return ruta_inf
    except FileNotFoundError:
        print("El archivo 'ruta_local.txt' no se encuentra en la ruta especificada.")
    return None

In [4]:
ruta_informes = get_ruta_informes()
directorio_origen = ruta_informes + r'\_informes'
directorio_destino = ruta_informes + r'\_pdf'

In [5]:
# Recorre y convierte a pdf archivos .docx que no empiezan con "_"
def convertir_docx_to_pdf():
    for archivo in os.listdir(directorio_origen):
        if archivo.lower().endswith(".docx") and not archivo.startswith("_"):
            ruta_docx = os.path.join(directorio_origen, archivo)
            ruta_pdf = os.path.join(directorio_destino, archivo.replace(".docx", ".pdf"))
            
            try:
                convert(ruta_docx, ruta_pdf)
                print(ruta_docx)
                if os.path.exists(ruta_pdf):
                    print(f"✅ Convertido: {archivo}")
                    os.remove(ruta_docx)
                    print(f"🗑️ Eliminado original: {archivo}")
                else:
                    print(f"❌ Error: PDF no generado para {archivo}")
            except Exception as e:
                print(f"⚠️ Error al convertir {archivo}: {e}")

def obtener_engine():
    return create_engine(
        f"postgresql+psycopg2://{POSTGRES_UTEA['USER']}:{POSTGRES_UTEA['PASSWORD']}@{POSTGRES_UTEA['HOST']}:{POSTGRES_UTEA['PORT']}/{POSTGRES_UTEA['DATABASE']}"
    )

def cargar_link_to_db(url, cite):
    engine = obtener_engine()
    try:
        with engine.begin() as conn:
            query = text("""
                UPDATE drones_pulverizacion.resumen_pulv SET link = :url WHERE cite = :cite
            """)
            conn.execute(query, {"url": url, "cite": cite})
            print(f"✔️ Se registro link para CITE: {cite}" )
    except Exception as e:
        print(f"❌ Error al actualizar CITE: {cite}, {e}")

In [6]:
convertir_docx_to_pdf()

  0%|          | 0/1 [00:00<?, ?it/s]

C:\Users\Usuario\Desktop\PROYECTOS\_informes\2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.docx
✅ Convertido: 2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.docx
🗑️ Eliminado original: 2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.docx


  0%|          | 0/1 [00:00<?, ?it/s]

C:\Users\Usuario\Desktop\PROYECTOS\_informes\765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.docx
✅ Convertido: 765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.docx
🗑️ Eliminado original: 765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.docx


  0%|          | 0/1 [00:00<?, ?it/s]

C:\Users\Usuario\Desktop\PROYECTOS\_informes\765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.docx
✅ Convertido: 765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.docx
🗑️ Eliminado original: 765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.docx


In [7]:
def cargar_pdf_to_drive(id_drive, title_file, path_file):
    try:
        # 1. Buscar si ya existe un archivo con el mismo nombre en la misma carpeta
        query = f"'{id_drive}' in parents and title = '{title_file}' and trashed = false"
        file_list = drive.ListFile({'q': query}).GetList()

        if file_list:
            # Si ya existe, usamos el primero encontrado
            file = file_list[0]
            print(f"[INFO] El archivo '{title_file}' ya existe. Se reemplazará.")
        else:
            # Si no existe, creamos uno nuevo
            file = drive.CreateFile({
                "mimeType": "application/pdf",
                "parents": [{"kind": "drive#fileLink", "id": id_drive}]
            })
            file['title'] = title_file
            print(f"[INFO] El archivo '{title_file}' no existe. Se creará uno nuevo.")

        # 2. Reemplazar el contenido
        file.SetContentFile(path_file)
        file.Upload()

        # 3. Dar permisos públicos si es nuevo
        if not file_list:
            file.InsertPermission({
                'type': 'anyone',
                'value': 'anyone',
                'role': 'reader'
            })

        print(f"[OK] Archivo '{title_file}' subido exitosamente.")
        return file['alternateLink']

    except Exception as e:
        print(f"[ERROR] No se pudo subir el archivo '{title_file}': {e}")
        return False

In [8]:
contenido = os.listdir(directorio_destino)
contenido

['2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.pdf',
 '765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.pdf',
 '765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.pdf']

In [9]:
for file in contenido:
    partes = file.split('_')
    
    cite = partes[-1].split('.')[0]
    sigla = partes[1]
    title_file = file
    id_drive = '18rEKX1tmqx4_Du3ydULVYXIrjfH5sGzk'
    path_file = os.path.join(directorio_destino, file)
    print(cite)
    url_drive = cargar_pdf_to_drive(id_drive, title_file, path_file)
    if url_drive == False:
        continue
    cargar_link_to_db(url_drive, cite)
    if os.path.exists(path_file):
        os.remove(path_file)
        print("✅ Archivo eliminado.")
    else:
        print("⚠️ El archivo no existe.")

PA-2025-64
[INFO] El archivo '2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.pdf' no existe. Se creará uno nuevo.
[OK] Archivo '2816_SADA_15-08-2025_DONOSO BLANCO ALBERTO_PA-2025-64.pdf' subido exitosamente.
✔️ Se registro link para CITE: PA-2025-64
✅ Archivo eliminado.
PA-2025-63
[INFO] El archivo '765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.pdf' no existe. Se creará uno nuevo.
[OK] Archivo '765_SADA_12-08-2025_AGROP. CATALA S.R.L._PA-2025-63.pdf' subido exitosamente.
✔️ Se registro link para CITE: PA-2025-63
✅ Archivo eliminado.
PA-2025-62
[INFO] El archivo '765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.pdf' no existe. Se creará uno nuevo.
[OK] Archivo '765_SADA_26-07-2025_AGROP. CATALA S.R.L._PA-2025-62.pdf' subido exitosamente.
✔️ Se registro link para CITE: PA-2025-62
✅ Archivo eliminado.
