# Calculador de coordenadas en el cuadro que las almacena en un archivo .txt 

In [1]:
import time
import os
import numpy as np

def generar_coordenadas_fasta_filtro(ruta_fasta, ruta_coordenadas):
    """
    Lee archivos .contigs.fasta desde la ruta especificada, omite la primera línea de cada archivo,
    calcula las coordenadas de los puntos basados en el Juego del Caos y guarda las coordenadas en
    archivos .txt en la carpeta de destino.

    Args:
        ruta_fasta (str): Directorio donde se encuentran los archivos .contigs.fasta.
        ruta_coordenadas (str): Directorio donde se guardarán las coordenadas generadas.
    """
    
    # Crear la carpeta destino si no existe
    if not os.path.exists(ruta_coordenadas):
        os.makedirs(ruta_coordenadas)

    # Función para leer archivo .contigs.fasta y extraer la secuencia de ADN
    def leer_fasta(filename):
        with open(filename, 'r') as f:
            lines = f.readlines()
        # Ignorar la primera línea (cabecera) y unir el resto en una única secuencia
        secuencia = ''.join([line.strip() for line in lines[1:]])
        return secuencia

    # Función para calcular los puntos del juego del caos
    def calcular_puntos(secuencia, size=1800):
        # Diccionario que asigna coordenadas a cada nucleótido
        vertices = {'A': (0, 0), 'C': (0, size - 1), 'G': (size - 1, 0), 'T': (size - 1, size - 1)}

        # Punto inicial en el centro de la imagen
        punto = np.array([size // 2, size // 2])

        # Lista para almacenar los puntos
        puntos = []

        # Para cada nucleótido en la secuencia, actualizamos el punto y lo agregamos a la lista
        for nuc in secuencia:
            if nuc in vertices:
                vertice = np.array(vertices[nuc])
                # Punto nuevo es el promedio entre el punto actual y el vértice correspondiente
                punto = (punto + vertice) / 2
                puntos.append((punto[0], punto[1]))

        return puntos

    # Función para guardar los puntos en un archivo .txt
    def guardar_puntos(puntos, filename):
        with open(filename, 'w') as f:
            for x, y in puntos:
                f.write(f"{x},{y}\n")

    # Procesar cada archivo .contigs.fasta en la carpeta
    for filename in os.listdir(ruta_fasta):
        if filename.endswith('.fasta'):  # Asegúrate de procesar solo archivos .contigs.fasta
            ruta_archivo = os.path.join(ruta_fasta, filename)
            print(f"Procesando {filename}...")
    
            # Generar el nombre del archivo de coordenadas de salida
            output_coords_filename = os.path.join(ruta_coordenadas, f"{os.path.splitext(filename)[0]}_coords.txt")
    
            # Verificar si el archivo de coordenadas ya existe
            if os.path.exists(output_coords_filename):
                print(f"El archivo {output_coords_filename} ya existe. Saltando cálculo.")
                continue
    
            # Leer secuencia del archivo .fasta
            secuencia = leer_fasta(ruta_archivo)
    
            # Calcular los puntos del juego del caos
            puntos = calcular_puntos(secuencia)
    
            # Guardar los puntos en un archivo .txt
            guardar_puntos(puntos, output_coords_filename)
            print(f"Coordenadas guardadas en {output_coords_filename}")


In [None]:
%%time
# Ejemplo
path_input_folder = "/files/Mariel/Tesis_Mariel/data/Examples"
path_output_folder = "/files/Mariel/Tesis_Mariel/data/Examples"
generar_coordenadas_fasta_filtro(path_input_folder, path_input_folder)