In [None]:
import re
import os
import csv


def sanitizar_texto(texto):
    """
    Limpia una celda de texto eliminando formato Markdown,
    saltos de línea y espacios extra.
    """
    # Elimina ** para negrita y * o _ para cursiva
    texto = re.sub(r"(\*\*|__|\*|_)", "", texto)
    # Reemplaza <br> y saltos de línea por un espacio
    texto = texto.replace("<br>", " ").replace("\n", " ")
    # Elimina múltiples espacios
    texto = re.sub(r"\s+", " ", texto)
    return texto.strip()


def analizar_linea_tabla_md(linea_md):
    """
    Analiza una línea de una tabla en formato Markdown y la divide en celdas.
    """
    if not linea_md.startswith("|"):
        linea_md = "|" + linea_md
    if not linea_md.endswith("|"):
        linea_md += "|"
    celdas = [celda.strip() for celda in linea_md.split("|")[1:-1]]
    return celdas


def extraer_y_transformar_tablas(contenido_md):
    """
    Encuentra todas las tablas de casos de uso y las transforma en una lista de filas
    para un CSV consolidado.

    Args:
        contenido_md (str): El contenido del archivo Markdown.

    Returns:
        list: Una lista de listas, lista para ser escrita en un archivo CSV.
    """
    lineas = contenido_md.split("\n")
    datos_consolidados = [["id_caso_de_uso", "atributo", "valor"]]
    en_tabla = False
    filas_tabla_actual = []

    for linea in lineas:
        # Detecta el inicio de una tabla por la línea de separación (e.g., |:---|:---|)
        if re.match(r"^\s*\|?\s*:?-+:?\s*\|", linea):
            if not en_tabla:
                en_tabla = True
                # La línea anterior era el encabezado, pero para este formato
                # no lo necesitamos ya que la tabla es clave-valor.
                # Limpiamos las filas de la tabla anterior.
                filas_tabla_actual = []
                # La línea anterior al separador es el encabezado de la tabla.
                # La línea anterior a esa puede ser el contenido de la primera fila.
                # Asumimos que la tabla empieza 2 líneas antes de la de separación.
                # Esta lógica se simplifica al procesar al final de la tabla.

                # La línea anterior es el encabezado, la guardamos
                linea_encabezado = lineas[lineas.index(linea) - 1]
                filas_tabla_actual.append(analizar_linea_tabla_md(linea_encabezado))
                continue

        if en_tabla:
            # Si la línea ya no parece parte de la tabla, la procesamos y cerramos
            if not linea.strip().startswith("|"):
                en_tabla = False

                # --- Procesar la tabla que acabamos de encontrar ---
                if filas_tabla_actual and len(filas_tabla_actual[0]) == 2:
                    # Asumimos que la primera fila siempre es el ID
                    id_key = sanitizar_texto(filas_tabla_actual[0][0])
                    if id_key == "ID del Caso de Uso":
                        id_caso_de_uso = sanitizar_texto(filas_tabla_actual[0][1])

                        # Recorremos todas las filas de esta tabla para añadirlas
                        for fila in filas_tabla_actual:
                            if len(fila) == 2:
                                atributo = sanitizar_texto(fila[0])
                                valor = sanitizar_texto(fila[1])
                                datos_consolidados.append(
                                    [id_caso_de_uso, atributo, valor]
                                )

                filas_tabla_actual = []  # Limpiar para la siguiente tabla
                continue

            # Si seguimos en la tabla, añadimos la fila
            fila = analizar_linea_tabla_md(linea)
            if len(fila) > 0:  # Ignorar líneas vacías
                filas_tabla_actual.append(fila)

    # Procesar la última tabla si el archivo termina mientras se está leyendo
    if en_tabla and filas_tabla_actual:
        if len(filas_tabla_actual[0]) == 2:
            id_key = sanitizar_texto(filas_tabla_actual[0][0])
            if id_key == "ID del Caso de Uso":
                id_caso_de_uso = sanitizar_texto(filas_tabla_actual[0][1])
                for fila in filas_tabla_actual:
                    if len(fila) == 2:
                        atributo = sanitizar_texto(fila[0])
                        valor = sanitizar_texto(fila[1])
                        datos_consolidados.append([id_caso_de_uso, atributo, valor])

    return datos_consolidados


def main():
    """
    Función principal para leer un archivo Markdown, consolidar sus tablas
    en un único archivo CSV.
    """
    archivo_md = "readme.md"
    archivo_csv_salida = "casos_de_uso_consolidados.csv"

    try:
        with open(archivo_md, "r", encoding="utf-8") as f:
            contenido = f.read()

        datos_para_csv = extraer_y_transformar_tablas(contenido)

        if len(datos_para_csv) <= 1:  # Solo contiene el encabezado
            print(
                f"No se encontraron tablas de casos de uso válidas en '{archivo_md}'."
            )
            return

        with open(archivo_csv_salida, "w", newline="", encoding="utf-8") as f:
            writer = csv.writer(f)
            writer.writerows(datos_para_csv)

        print(f"¡Éxito! Se procesaron las tablas y se guardaron en un único archivo:")
        print(f"-> {archivo_csv_salida}")

    except FileNotFoundError:
        print(f"Error: El archivo '{archivo_md}' no fue encontrado.")
    except Exception as e:
        print(f"Ocurrió un error inesperado: {e}")


if __name__ == "__main__":
    main()