In [9]:
# ============================================================
# üöÄ Migraci√≥n SQLite ‚Üí DuckDB robusta (corregido fotos_descargadas)
# ============================================================

!pip install duckdb tqdm

import duckdb
import sqlite3
import os
from tqdm import tqdm
from google.colab import drive

# 1Ô∏è‚É£ Montar Drive
drive.mount('/content/drive')

# 2Ô∏è‚É£ Rutas SQLite
rutas_sqlite = [
    "/content/drive/MyDrive/Backup BD/correos(2).db",
    "/content/drive/MyDrive/Backup BD/correos(3).db",
    "/content/drive/MyDrive/Backup BD/imagenes_telegram.db"
]

# 3Ô∏è‚É£ Ruta DuckDB final
ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"

# 4Ô∏è‚É£ Conectar DuckDB
conn_duck = duckdb.connect(ruta_duckdb)

# 5Ô∏è‚É£ Crear tablas
conn_duck.execute("""
CREATE TABLE IF NOT EXISTS correos (
    id BIGINT PRIMARY KEY,
    correo TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS telefonos (
    id BIGINT PRIMARY KEY,
    telefono TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS fotos_descargadas (
    chat_id BIGINT,
    message_id BIGINT,
    file_path TEXT,
    PRIMARY KEY(chat_id, message_id)
)
""")

# 6Ô∏è‚É£ Contador de IDs
next_id = {
    "correos": 1,
    "telefonos": 1
}

# 7Ô∏è‚É£ Funci√≥n de migraci√≥n
def migrar_sqlite_a_duck(sqlite_path, tabla, columnas, unique_col=None):
    global next_id
    if not os.path.exists(sqlite_path):
        print(f"‚ö†Ô∏è Archivo no encontrado: {sqlite_path}")
        return

    conn_sql = sqlite3.connect(sqlite_path)
    cursor_sql = conn_sql.cursor()

    cursor_sql.execute("SELECT name FROM sqlite_master WHERE type='table';")
    tablas = [t[0] for t in cursor_sql.fetchall()]
    if tabla not in tablas:
        conn_sql.close()
        return

    # Extraer filas
    cursor_sql.execute(f"SELECT {', '.join(columnas)} FROM {tabla}")
    filas = cursor_sql.fetchall()

    if filas:
        for fila in filas:
            # ‚úÖ Solo generamos ID para correos y telefonos
            if tabla in ["correos", "telefonos"]:
                id_val = next_id[tabla]
                next_id[tabla] += 1
                cols = ["id"] + columnas
                placeholders = ','.join(['?']*(len(fila)+1))
                values = [id_val]+list(fila)
            else:
                cols = columnas
                placeholders = ','.join(['?']*len(fila))
                values = list(fila)

            # SQL con ON CONFLICT si hay columna √∫nica
            if unique_col:
                sql = f"""
                INSERT INTO {tabla} ({', '.join(cols)})
                VALUES ({placeholders})
                ON CONFLICT({unique_col}) DO NOTHING
                """
            else:
                sql = f"""
                INSERT OR IGNORE INTO {tabla} ({', '.join(cols)}) VALUES ({placeholders})
                """

            conn_duck.execute(sql, values)

        print(f"‚úÖ Migradas {len(filas)} filas de {tabla} desde {os.path.basename(sqlite_path)}")

    conn_sql.close()

# 8Ô∏è‚É£ Migrar todas las bases
for ruta in rutas_sqlite:
    print(f"\nüîπ Procesando {os.path.basename(ruta)}")
    migrar_sqlite_a_duck(ruta, "correos", ["correo", "enviado"], unique_col="correo")
    migrar_sqlite_a_duck(ruta, "telefonos", ["telefono", "enviado"], unique_col="telefono")
    migrar_sqlite_a_duck(ruta, "fotos_descargadas", ["chat_id", "message_id", "file_path"])

# 9Ô∏è‚É£ Cerrar DuckDB
conn_duck.close()

print("\nüéØ Migraci√≥n completada correctamente!")
print(f"üìå Base unificada en: {ruta_duckdb}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).

üîπ Procesando correos(2).db
‚úÖ Migradas 8666 filas de correos desde correos(2).db
‚úÖ Migradas 7 filas de telefonos desde correos(2).db

üîπ Procesando correos(3).db
‚úÖ Migradas 8432 filas de correos desde correos(3).db

üîπ Procesando imagenes_telegram.db
‚úÖ Migradas 39868 filas de fotos_descargadas desde imagenes_telegram.db

üéØ Migraci√≥n completada correctamente!
üìå Base unificada en: /content/drive/MyDrive/Backup BD/proyectocv.duckdb


In [12]:
import duckdb
from google.colab import drive

drive.mount('/content/drive')

ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"
conn = duckdb.connect(ruta_duckdb)

# Listar todas las tablas de la base
tablas = conn.execute("SHOW TABLES").fetchall()
print("üìö Tablas existentes en la DuckDB:")
for t in tablas:
    print(" -", t[0])

conn.close()


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
üìö Tablas existentes en la DuckDB:


In [13]:
import os

ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"
print("Archivo existe:", os.path.exists(ruta_duckdb))
print("Tama√±o del archivo (bytes):", os.path.getsize(ruta_duckdb))


Archivo existe: True
Tama√±o del archivo (bytes): 12288


In [14]:
# ============================================================
# üöÄ Migraci√≥n SQLite ‚Üí DuckDB robusta (corregido fotos_descargadas)
# ============================================================

!pip install duckdb tqdm

import duckdb
import sqlite3
import os
from tqdm import tqdm
from google.colab import drive

# 1Ô∏è‚É£ Montar Drive
drive.mount('/content/drive')

# 2Ô∏è‚É£ Rutas SQLite
rutas_sqlite = [
    "/content/drive/MyDrive/Backup BD/correos(2).db",
    "/content/drive/MyDrive/Backup BD/correos(3).db",
    "/content/drive/MyDrive/Backup BD/imagenes_telegram.db"
]

# 3Ô∏è‚É£ Ruta DuckDB final
ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"

# 4Ô∏è‚É£ Conectar DuckDB
conn_duck = duckdb.connect(ruta_duckdb)

# 5Ô∏è‚É£ Crear tablas
conn_duck.execute("""
CREATE TABLE IF NOT EXISTS correos (
    id BIGINT PRIMARY KEY,
    correo TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS telefonos (
    id BIGINT PRIMARY KEY,
    telefono TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS fotos_descargadas (
    chat_id BIGINT,
    message_id BIGINT,
    file_path TEXT,
    PRIMARY KEY(chat_id, message_id)
)
""")

# 6Ô∏è‚É£ Contador de IDs
next_id = {
    "correos": 1,
    "telefonos": 1
}

# 7Ô∏è‚É£ Funci√≥n de migraci√≥n
def migrar_sqlite_a_duck(sqlite_path, tabla, columnas, unique_col=None):
    global next_id
    if not os.path.exists(sqlite_path):
        print(f"‚ö†Ô∏è Archivo no encontrado: {sqlite_path}")
        return

    conn_sql = sqlite3.connect(sqlite_path)
    cursor_sql = conn_sql.cursor()

    # Revisar si existe la tabla
    cursor_sql.execute("SELECT name FROM sqlite_master WHERE type='table';")
    tablas = [t[0] for t in cursor_sql.fetchall()]
    if tabla not in tablas:
        conn_sql.close()
        return

    # Extraer filas
    cursor_sql.execute(f"SELECT {', '.join(columnas)} FROM {tabla}")
    filas = cursor_sql.fetchall()

    if filas:
        for fila in filas:
            # Generar ID para correos y telefonos
            if tabla in ["correos", "telefonos"]:
                id_val = next_id[tabla]
                next_id[tabla] += 1
                cols = ["id"] + columnas
                values = [id_val] + list(fila)
            else:
                cols = columnas
                values = list(fila)

            # Insertar con manejo de duplicados
            if tabla in ["correos", "telefonos"]:
                # DuckDB soporta INSERT ... ON CONFLICT en columnas UNIQUE
                sql = f"""
                INSERT INTO {tabla} ({', '.join(cols)})
                SELECT {', '.join(['?']*len(values))}
                WHERE NOT EXISTS (SELECT 1 FROM {tabla} WHERE {unique_col}=?)
                """
                conn_duck.execute(sql, values + [values[1]])  # valor √∫nico al final
            else:
                # fotos_descargadas: clave primaria compuesta
                sql = f"""
                INSERT INTO {tabla} ({', '.join(cols)})
                SELECT {', '.join(['?']*len(values))}
                WHERE NOT EXISTS (SELECT 1 FROM {tabla} WHERE chat_id=? AND message_id=?)
                """
                conn_duck.execute(sql, values + [values[0], values[1]])

        print(f"‚úÖ Migradas {len(filas)} filas de {tabla} desde {os.path.basename(sqlite_path)}")

    conn_sql.close()

# 8Ô∏è‚É£ Migrar todas las bases
for ruta in rutas_sqlite:
    print(f"\nüîπ Procesando {os.path.basename(ruta)}")
    migrar_sqlite_a_duck(ruta, "correos", ["correo", "enviado"], unique_col="correo")
    migrar_sqlite_a_duck(ruta, "telefonos", ["telefono", "enviado"], unique_col="telefono")
    migrar_sqlite_a_duck(ruta, "fotos_descargadas", ["chat_id", "message_id", "file_path"])

# 9Ô∏è‚É£ Guardar cambios y cerrar DuckDB
conn_duck.execute("COMMIT")
conn_duck.close()

print("\nüéØ Migraci√≥n completada correctamente!")
print(f"üìå Base unificada en: {ruta_duckdb}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).

üîπ Procesando correos(2).db
‚úÖ Migradas 8666 filas de correos desde correos(2).db
‚úÖ Migradas 7 filas de telefonos desde correos(2).db

üîπ Procesando correos(3).db
‚úÖ Migradas 8432 filas de correos desde correos(3).db

üîπ Procesando imagenes_telegram.db
‚úÖ Migradas 39868 filas de fotos_descargadas desde imagenes_telegram.db


TransactionException: TransactionContext Error: cannot commit - no transaction is active

In [15]:
# ============================================================
# üöÄ Migraci√≥n SQLite ‚Üí DuckDB simple y funcional
# ============================================================

!pip install duckdb tqdm

import duckdb
import sqlite3
import os
from tqdm import tqdm
from google.colab import drive

# 1Ô∏è‚É£ Montar Drive
drive.mount('/content/drive')

# 2Ô∏è‚É£ Rutas SQLite
rutas_sqlite = [
    "/content/drive/MyDrive/Backup BD/correos(2).db",
    "/content/drive/MyDrive/Backup BD/correos(3).db",
    "/content/drive/MyDrive/Backup BD/imagenes_telegram.db"
]

# 3Ô∏è‚É£ Ruta DuckDB final
ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"

# 4Ô∏è‚É£ Conectar DuckDB
conn_duck = duckdb.connect(ruta_duckdb)

# 5Ô∏è‚É£ Crear tablas b√°sicas
conn_duck.execute("""
CREATE TABLE IF NOT EXISTS correos (
    correo TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS telefonos (
    telefono TEXT UNIQUE,
    enviado TEXT DEFAULT 'no'
)
""")

conn_duck.execute("""
CREATE TABLE IF NOT EXISTS fotos_descargadas (
    chat_id BIGINT,
    message_id BIGINT,
    file_path TEXT,
    PRIMARY KEY(chat_id, message_id)
)
""")

# 6Ô∏è‚É£ Funci√≥n de migraci√≥n simplificada
def migrar_sqlite_a_duck_simple(sqlite_path, tabla, columnas, unique_col=None):
    if not os.path.exists(sqlite_path):
        print(f"‚ö†Ô∏è Archivo no encontrado: {sqlite_path}")
        return

    conn_sql = sqlite3.connect(sqlite_path)
    cursor_sql = conn_sql.cursor()

    # Verificar que la tabla exista
    cursor_sql.execute("SELECT name FROM sqlite_master WHERE type='table';")
    tablas = [t[0] for t in cursor_sql.fetchall()]
    if tabla not in tablas:
        conn_sql.close()
        return

    # Extraer filas
    cursor_sql.execute(f"SELECT {', '.join(columnas)} FROM {tabla}")
    filas = cursor_sql.fetchall()

    if filas:
        for fila in filas:
            # Insertar solo si no existe
            if tabla in ["correos", "telefonos"] and unique_col:
                sql = f"""
                INSERT INTO {tabla} ({', '.join(columnas)})
                SELECT {', '.join(['?']*len(fila))}
                WHERE NOT EXISTS (
                    SELECT 1 FROM {tabla} WHERE {unique_col}=?
                )
                """
                conn_duck.execute(sql, list(fila) + [fila[0]])
            elif tabla == "fotos_descargadas":
                sql = f"""
                INSERT INTO {tabla} ({', '.join(columnas)})
                SELECT {', '.join(['?']*len(fila))}
                WHERE NOT EXISTS (
                    SELECT 1 FROM {tabla} WHERE chat_id=? AND message_id=?
                )
                """
                conn_duck.execute(sql, list(fila) + [fila[0], fila[1]])

        print(f"‚úÖ Migradas {len(filas)} filas de {tabla} desde {os.path.basename(sqlite_path)}")

    conn_sql.close()

# 7Ô∏è‚É£ Migrar todas las bases
for ruta in rutas_sqlite:
    print(f"\nüîπ Procesando {os.path.basename(ruta)}")
    migrar_sqlite_a_duck_simple(ruta, "correos", ["correo", "enviado"], unique_col="correo")
    migrar_sqlite_a_duck_simple(ruta, "telefonos", ["telefono", "enviado"], unique_col="telefono")
    migrar_sqlite_a_duck_simple(ruta, "fotos_descargadas", ["chat_id", "message_id", "file_path"])

# 8Ô∏è‚É£ Cerrar DuckDB
conn_duck.close()

print("\nüéØ Migraci√≥n completada correctamente!")
print(f"üìå Base unificada en: {ruta_duckdb}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).

üîπ Procesando correos(2).db
‚úÖ Migradas 8666 filas de correos desde correos(2).db
‚úÖ Migradas 7 filas de telefonos desde correos(2).db

üîπ Procesando correos(3).db
‚úÖ Migradas 8432 filas de correos desde correos(3).db

üîπ Procesando imagenes_telegram.db
‚úÖ Migradas 39868 filas de fotos_descargadas desde imagenes_telegram.db

üéØ Migraci√≥n completada correctamente!
üìå Base unificada en: /content/drive/MyDrive/Backup BD/proyectocv.duckdb


In [16]:
# ============================================================
# üìä Auditor√≠a completa DuckDB - proyectocv.duckdb
# ============================================================

import duckdb
from google.colab import drive
drive.mount('/content/drive')

# Ruta de la base unificada
ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"

# Conectar DuckDB
conn = duckdb.connect(ruta_duckdb)

# 1Ô∏è‚É£ Listar tablas existentes
tablas = conn.execute("SHOW TABLES").fetchall()
print("üìö Tablas en la base DuckDB:")
for t in tablas:
    print(" -", t[0])

# 2Ô∏è‚É£ Auditor√≠a de correos
total_correos = conn.execute('SELECT COUNT(*) FROM correos').fetchone()[0]
enviados_correos = conn.execute("SELECT COUNT(*) FROM correos WHERE enviado='s√≠'").fetchone()[0]
pendientes_correos = total_correos - enviados_correos

print("\nüìä ESTADO GENERAL DE CORREOS")
print(f"Total correos      : {total_correos}")
print(f"Correos enviados   : {enviados_correos}")
print(f"Correos pendientes : {pendientes_correos}")
print(f"Progreso           : {enviados_correos/total_correos*100:.2f}%")

# √öltimos 10 correos
print("\nüì§ √öltimos 10 correos:")
ultimos_correos = conn.execute("SELECT correo, enviado FROM correos ORDER BY correo DESC LIMIT 10").fetchall()
for c in ultimos_correos:
    print(" -", c)

# 3Ô∏è‚É£ Auditor√≠a de tel√©fonos
total_tel = conn.execute("SELECT COUNT(*) FROM telefonos").fetchone()[0]
enviados_tel = conn.execute("SELECT COUNT(*) FROM telefonos WHERE enviado='s√≠'").fetchone()[0]
pendientes_tel = total_tel - enviados_tel

print("\nüìä ESTADO GENERAL DE TEL√âFONOS")
print(f"Total tel√©fonos    : {total_tel}")
print(f"Tel√©fonos enviados : {enviados_tel}")
print(f"Tel√©fonos pendientes: {pendientes_tel}")
print(f"Progreso           : {enviados_tel/total_tel*100:.2f}%")

# √öltimos 10 tel√©fonos
print("\nüì§ √öltimos 10 tel√©fonos:")
ultimos_tel = conn.execute("SELECT telefono, enviado FROM telefonos ORDER BY telefono DESC LIMIT 10").fetchall()
for t in ultimos_tel:
    print(" -", t)

# 4Ô∏è‚É£ Auditor√≠a fotos descargadas
total_fotos = conn.execute("SELECT COUNT(*) FROM fotos_descargadas").fetchone()[0]
print("\nüìä ESTADO GENERAL DE FOTOS DESCARGADAS")
print(f"Total fotos guardadas: {total_fotos}")

# √öltimas 10 fotos
print("\nüì§ √öltimas 10 fotos descargadas:")
ultimas_fotos = conn.execute("SELECT chat_id, message_id, file_path FROM fotos_descargadas ORDER BY message_id DESC LIMIT 10").fetchall()
for f in ultimas_fotos:
    print(" -", f)

# Cerrar conexi√≥n
conn.close()
print("\n‚úÖ Auditor√≠a finalizada correctamente")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
üìö Tablas en la base DuckDB:
 - correos
 - fotos_descargadas
 - telefonos

üìä ESTADO GENERAL DE CORREOS
Total correos      : 8666
Correos enviados   : 3318
Correos pendientes : 5348
Progreso           : 38.29%

üì§ √öltimos 10 correos:
 - ('zyanez@cactu.org.ec', 'no')
 - ('zunigae@condelpi.com', 'no')
 - ('zroberthwilliam@itsup.edu.ec', 's√≠')
 - ('zmorales@eysglobal.com', 's√≠')
 - ('zgaona@semvra.com', 'no')
 - ('zetalent@acir.ec', 'no')
 - ('zentrysas@outlook.com', 'no')
 - ('zeclutamientogye@seguridadasc-ec.com', 'no')
 - ('zambranojohiz@gmail.com', 'no')
 - ('zambranodm@plusservices.ec', 's√≠')

üìä ESTADO GENERAL DE TEL√âFONOS
Total tel√©fonos    : 7
Tel√©fonos enviados : 0
Tel√©fonos pendientes: 7
Progreso           : 0.00%

üì§ √öltimos 10 tel√©fonos:
 - ('+593998396803', 'no')
 - ('+593987864452', 'no')
 - ('+593986362459', 'no')
 - ('+5939857

In [17]:
# ============================================================
# üìä Auditor√≠a completa DuckDB con estructura de tablas
# ============================================================

import duckdb
from google.colab import drive

# 1Ô∏è‚É£ Montar Drive
drive.mount('/content/drive')

# 2Ô∏è‚É£ Conectar DuckDB
ruta_duckdb = "/content/drive/MyDrive/Backup BD/proyectocv.duckdb"
conn = duckdb.connect(ruta_duckdb)

# 3Ô∏è‚É£ Listar tablas
tablas = conn.execute("SHOW TABLES").fetchall()
tablas = [t[0] for t in tablas]
print("üìö Tablas en la base DuckDB:")
for t in tablas:
    print(" -", t)

# 4Ô∏è‚É£ Revisar estructura y contenido de cada tabla
for tabla in tablas:
    print(f"\nüìù Estructura de la tabla '{tabla}':")
    columnas = conn.execute(f"PRAGMA table_info('{tabla}')").fetchall()
    for col in columnas:
        cid, name, tipo, notnull, dflt_value, pk = col
        print(f"   - {name} | {tipo} | NOT NULL: {bool(notnull)} | PK: {bool(pk)} | DEFAULT: {dflt_value}")

    # 5Ô∏è‚É£ Totales de filas
    total_filas = conn.execute(f"SELECT COUNT(*) FROM {tabla}").fetchone()[0]
    print(f"   üîπ Total de filas: {total_filas}")

    # 6Ô∏è‚É£ Mostrar √∫ltimos 5 registros como ejemplo
    ultimos = conn.execute(f"SELECT * FROM {tabla} ORDER BY ROWID DESC LIMIT 5").fetchall()
    print("   üîπ √öltimos registros:")
    for r in ultimos:
        print("     ", r)

# 7Ô∏è‚É£ Cerrar conexi√≥n
conn.close()
print("\n‚úÖ Auditor√≠a completa de estructura y contenido finalizada")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
üìö Tablas en la base DuckDB:
 - correos
 - fotos_descargadas
 - telefonos

üìù Estructura de la tabla 'correos':
   - id | BIGINT | NOT NULL: True | PK: True | DEFAULT: None
   - correo | VARCHAR | NOT NULL: False | PK: False | DEFAULT: None
   - enviado | VARCHAR | NOT NULL: False | PK: False | DEFAULT: 'no'
   üîπ Total de filas: 8666
   üîπ √öltimos registros:
      (8666, 'seleccionecuador@heineken.com', 'no')
      (8665, 'convenio@incisdental.com', 'no')
      (8664, 'thumano@kaosport.com', 'no')
      (8663, 'humanareclutamientogestion@gmail.com', 'no')
      (8662, 'didatos127@gmail.com', 'no')

üìù Estructura de la tabla 'fotos_descargadas':
   - chat_id | BIGINT | NOT NULL: True | PK: True | DEFAULT: None
   - message_id | BIGINT | NOT NULL: True | PK: True | DEFAULT: None
   - file_path | VARCHAR | NOT NULL: False | PK: False | DEFAULT: None
