In [1]:
import os
import pandas as pd
import time

# Configuración de rutas
ruta_txt = r'G:\.shortcut-targets-by-id\1qiRlhHfAPP798Yj4Of2KBcgPILHzPquI\maquina virtual\ventas_16-07-2025'  # Carpeta con los txt
ruta_salida = r'C:\Users\juan_garnicac\Documents\escuchaSocial\resultado.xlsx'  # Archivo Excel de salida

# Verificar si la carpeta existe
if not os.path.exists(ruta_txt):
    print(f"ERROR: La carpeta no existe: {ruta_txt}")
    exit()

# Obtener lista de archivos txt
archivos_txt = [f for f in os.listdir(ruta_txt) if f.endswith('.txt')]
total_archivos = len(archivos_txt)

print(f"Encontrados {total_archivos} archivos txt en la carpeta")
print("Iniciando procesamiento...")
print("-" * 50)

# Lista para almacenar los datos
datos = []
inicio_total = time.time()

# Procesar cada archivo txt en la carpeta
for i, nombre_archivo in enumerate(archivos_txt, 1):
    inicio_archivo = time.time()
    
    ruta_completa = os.path.join(ruta_txt, nombre_archivo)
    
    print(f"Procesando archivo {i}/{total_archivos}: {nombre_archivo}")
    
    try:
        with open(ruta_completa, 'r', encoding='utf-8') as archivo:
            contenido = archivo.read().strip()
    except:
        try:
            with open(ruta_completa, 'r', encoding='latin-1') as archivo:
                contenido = archivo.read().strip()
        except:
            contenido = "ERROR: No se pudo leer el archivo"
            print(f"  ⚠️  Error leyendo archivo: {nombre_archivo}")
    
    datos.append({
        'nombre_archivo': nombre_archivo,
        'contenido': contenido
    })
    
    tiempo_archivo = time.time() - inicio_archivo
    print(f"  ✅ Completado en {tiempo_archivo:.2f} segundos")
    
    # Mostrar progreso cada 10 archivos
    if i % 10 == 0:
        print(f"Progreso: {i}/{total_archivos} archivos procesados")

print("-" * 50)
print("Creando archivo Excel...")

# Crear DataFrame y guardar Excel
inicio_excel = time.time()
df = pd.DataFrame(datos)
df.to_excel(ruta_salida, index=False, engine='openpyxl')
tiempo_excel = time.time() - inicio_excel

tiempo_total = time.time() - inicio_total

print(f"✅ Proceso completado en {tiempo_total:.2f} segundos")
print(f"📊 Se procesaron {len(datos)} archivos")
print(f"💾 Tiempo de creación Excel: {tiempo_excel:.2f} segundos")
print(f"📁 Archivo Excel guardado en: {ruta_salida}")

# Mostrar estadísticas de rendimiento
if total_archivos > 0:
    tiempo_promedio = tiempo_total / total_archivos
    print(f"⏱️  Tiempo promedio por archivo: {tiempo_promedio:.2f} segundos")

Encontrados 954 archivos txt en la carpeta
Iniciando procesamiento...
--------------------------------------------------
Procesando archivo 1/954: +573046349148 by BRYAN_ORTIZ@CUN.EDU.CO @ 10_56_21 AM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 2/954: +573157023760 by BRYAN_ORTIZ@CUN.EDU.CO @ 2_39_45 PM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 3/954: +573224415390 by BRYAN_ORTIZ@CUN.EDU.CO @ 3_54_44 PM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 4/954: +573147730324 by BRYAN_ORTIZ@CUN.EDU.CO @ 8_52_59 AM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 5/954: +573143780609 by BRYAN_ORTIZ@CUN.EDU.CO @ 8_57_08 AM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 6/954: +573505828177 by BRYAN_ORTIZ@CUN.EDU.CO @ 1_50_03 PM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 7/954: +573228339368 by BRYAN_ORTIZ@CUN.EDU.CO @ 11_44_38 AM.txt
  ✅ Completado en 0.01 segundos
Procesando archivo 8/954: +573225362474 by BRYAN_ORTIZ@CUN.EDU.CO @ 8_22