In [10]:
import csv
import os
import re  # Importar expresiones regulares para manejar separadores inconsistentes

def transformar_correcta(valor):
    """Transforma la letra de la respuesta correcta en un valor numérico."""
    mapeo = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
    return mapeo.get(valor.lower(), 0)  # Devuelve 0 si no encuentra la clave

def procesar_archivo_txt(archivo_txt):
    """Procesa un archivo .txt y devuelve una lista de datos procesados."""
    datos_procesados = []
    nombre_normativa = os.path.splitext(os.path.basename(archivo_txt))[0]  # Obtener el nombre del archivo sin la extensión

    with open(archivo_txt, 'r', encoding='utf-8') as file:
        lineas = file.readlines()

    for i, linea in enumerate(lineas, start=1):
        try:
            # Dividir por comas que pueden o no tener espacio después, considerando comillas
            partes = re.split(r'"\s*,\s*"', linea.strip())
            
            if len(partes) == 7:  # Verificar que la línea tiene exactamente 7 campos
                pregunta, respuesta_a, respuesta_b, respuesta_c, respuesta_d, correcta, justificacion = partes

                # Limpiar las comillas iniciales y finales
                pregunta = pregunta.strip('"')
                respuesta_a = respuesta_a.strip('"')
                respuesta_b = respuesta_b.strip('"')
                respuesta_c = respuesta_c.strip('"')
                respuesta_d = respuesta_d.strip('"')
                justificacion = justificacion.strip('"')

                # Transformar la respuesta correcta a número
                correcta_numerica = transformar_correcta(correcta)

                # Añadir el campo 'normativa' con el nombre del archivo
                datos_procesados.append([
                    pregunta, respuesta_a, respuesta_b, respuesta_c, respuesta_d,
                    correcta_numerica, justificacion, nombre_normativa
                ])
            else:
                print(f"Formato incorrecto en la línea {i} del archivo {archivo_txt}: {linea.strip()} (Campos detectados: {len(partes)})")
        except Exception as e:
            print(f"Error al procesar la línea {i} del archivo {archivo_txt}: {linea.strip()}\nDetalles del error: {e}")

    return datos_procesados

def guardar_datos_en_csv(datos_totales, archivo_csv):
    """Guarda todos los datos procesados en un archivo .csv sin encabezado."""
    with open(archivo_csv, 'w', newline='', encoding='utf-8') as file:
        escritor_csv = csv.writer(file)
        escritor_csv.writerows(datos_totales)  # Escribir todas las líneas de datos sin encabezado

def main():
    # Obtener la ruta del directorio actual
    directorio_actual = os.getcwd()
    print(f"Directorio actual: {directorio_actual}")
    
    # Listar todos los archivos .txt en el directorio actual
    archivos_txt = [archivo for archivo in os.listdir(directorio_actual) if archivo.endswith('.txt')]
    
    # Procesar todos los archivos .txt y combinar los datos
    datos_totales = []
    for archivo_txt in archivos_txt:
        print(f"Procesando archivo: {archivo_txt}")
        ruta_archivo = os.path.join(directorio_actual, archivo_txt)
        datos_procesados = procesar_archivo_txt(ruta_archivo)
        datos_totales.extend(datos_procesados)
    
    # Guardar todos los datos procesados en un único archivo .csv
    archivo_csv = os.path.join(directorio_actual, 'preguntas_test.csv')
    guardar_datos_en_csv(datos_totales, archivo_csv)
    
    print(f"Se han procesado {len(archivos_txt)} archivos .txt y los datos se han guardado en {archivo_csv}.")


In [11]:
main()

Directorio actual: C:\Users\Kuma\Documents\Django_projects\Opositorium\preguntas_txt
Procesando archivo: Constitución Española.txt
Procesando archivo: Estatuto de Autonomia de les Illes Balears.txt
Procesando archivo: Ley de Bases de Régimen Local.txt
Procesando archivo: Ley municipal y de régimen local de las Illes Balears.txt
Procesando archivo: Ley Reguladora de las Haciendas Locales.txt
Procesando archivo: Unión Europea.txt
Se han procesado 6 archivos .txt y los datos se han guardado en C:\Users\Kuma\Documents\Django_projects\Opositorium\preguntas_txt\preguntas_procesadas.csv.
