In [1]:
import random
import copy

def insertar_guiones(matriz):
    # Hacemos una copia de la matriz para no modificar la original
    matriz_con_guiones = copy.deepcopy(matriz)
    
    # Encuentra la longitud máxima de las filas
    max_longitud = max(len(fila) for fila in matriz_con_guiones)
    
    # Para cada fila en la matriz
    for fila in matriz_con_guiones:
        # Si la longitud de la fila es menor que la longitud máxima
        if len(fila) < max_longitud:
            # Inserta guiones en posiciones aleatorias para igualar las longitudes
            posiciones = random.sample(range(len(fila) + 1), max_longitud - len(fila))
            for pos in posiciones:
                fila.insert(pos, '-')
        
        # Inserta tres guiones adicionales en posiciones aleatorias
        posiciones_extra = random.sample(range(len(fila) + 1), 3)
        for pos in posiciones_extra:
            fila.insert(pos, '-')
    
    return matriz_con_guiones

def calcular_puntaje(matriz_sin_guiones):
    puntos = 0
    for j in range(len(matriz_sin_guiones[0])):
        caracteres_en_posicion = [fila[j] for fila in matriz_sin_guiones]
        caracteres_no_guion = [caracter for caracter in caracteres_en_posicion if caracter != '-']
        
        # Verificar si hay al menos dos caracteres no guion y si al menos dos son iguales,
        # o si hay tres caracteres no guion y al menos dos son iguales, o si los tres son iguales
        if len(caracteres_no_guion) == 2 and len(set(caracteres_no_guion)) == 1:
            puntos += 1
        elif len(caracteres_no_guion) == 3 and (len(set(caracteres_no_guion)) == 1 or len(set(caracteres_no_guion)) == 2):
            puntos += 1
    return puntos

# Definir una función para eliminar columnas de guiones
def eliminar_columnas_guiones(matriz):
    columnas_con_guiones = set()
    for j in range(len(matriz[0])):
        columna = [fila[j] for fila in matriz]
        if all(caracter == '-' for caracter in columna):
            columnas_con_guiones.add(j)
    matriz_filtrada = [[caracter for i, caracter in enumerate(fila) if i not in columnas_con_guiones] for fila in matriz]
    return matriz_filtrada

# Definir una función para insertar tres guiones en posiciones aleatorias en cada fila
def mutacion_hijos(matriz):
    matriz_con_guiones = []
    for fila in matriz:
        fila_con_guiones = list(fila)
        for _ in range(3):  # Insertar tres guiones en posiciones aleatorias
            indice = random.randint(0, len(fila_con_guiones))
            fila_con_guiones.insert(indice, '-')
        matriz_con_guiones.append(fila_con_guiones)
    return matriz_con_guiones


num_matrices = 12
matrices_con_puntajes = []

X = list("ATCGATCG")
Y = list("GCTAGCTATA")
Z = list("TACGTACGC")

# Calcular la longitud de las tres variables
longitud_X = len(X)
longitud_Y = len(Y)
longitud_Z = len(Z)

# Encontrar la longitud mínima
longitud_minima = min(longitud_X, longitud_Y, longitud_Z)

# Encontrar la longitud máxima
longitud_maxima = max(longitud_X, longitud_Y, longitud_Z)

print("Longitud mínima:", longitud_minima)
print("Longitud máxima:", longitud_maxima)

for i in range(num_matrices):
    # Generamos una matriz nueva en cada iteración, basada en las listas originales
    matriz = [copy.deepcopy(X), copy.deepcopy(Y), copy.deepcopy(Z)]
    matriz_con_guiones = insertar_guiones(matriz)
    
    # Inicializar la lista de columnas sin guiones para esta matriz
    columnas_sin_guiones = []
    
    # Verificar si alguna columna no consiste solo de guiones
    for columna in zip(*matriz_con_guiones):
        if any(caracter != '-' for caracter in columna):
            columnas_sin_guiones.append(columna)
    
    # Transponer la lista de columnas sin guiones para obtener la matriz resultante
    matriz_sin_guiones = list(zip(*columnas_sin_guiones))

    # Imprimir la matriz sin guiones
    print(f"Matriz {i+1} sin guiones:")
    for fila in matriz_sin_guiones:
        print(''.join(fila))
    print()

    # Calcular puntajes
    puntos = calcular_puntaje(matriz_sin_guiones)
    
    # Imprimir puntaje
    print(f"Puntos para la matriz {i+1}: {puntos}\n")

    # Almacenar la matriz y su puntaje en la lista
    matrices_con_puntajes.append((matriz_sin_guiones, puntos))

Longitud mínima: 8
Longitud máxima: 10
Matriz 1 sin guiones:
A-T-CGAT-C--G
-GCTAG-CTA-TA
TAC-GTA-CGC--

Puntos para la matriz 1: 3

Matriz 2 sin guiones:
A-TCG--AT-CG
G-CTAGCTATA-
TACGTA-C-G-C

Puntos para la matriz 2: 1

Matriz 3 sin guiones:
--ATC-GATC-G-
GCT--AG-CTATA
TAC--G--TACGC

Puntos para la matriz 3: 3

Matriz 4 sin guiones:
-ATC-GAT-C-G-
GC--TAG-CTATA
TA-C-GTAC-G-C

Puntos para la matriz 4: 4

Matriz 5 sin guiones:
A-TCGAT-C-G-
GCT-AGCTAT-A
TA--C-GTACGC

Puntos para la matriz 5: 4

Matriz 6 sin guiones:
ATCGA-TC-G-
GCT-AGCTATA
TACGT-A-CGC

Puntos para la matriz 6: 4

Matriz 7 sin guiones:
ATC---G-AT-CG
-G-CTAGCTA-TA
TA-CGTA--CGC-

Puntos para la matriz 7: 3

Matriz 8 sin guiones:
AT-CGA---T-CG
-GC-TAGCTA-TA
TA-CG--T-ACGC

Puntos para la matriz 8: 4

Matriz 9 sin guiones:
-AT-C--GATCG
GCTAG-CTA-TA
-TACGTA--CGC

Puntos para la matriz 9: 3

Matriz 10 sin guiones:
--AT--CGA-TCG
G-C-TAGCT-ATA
TACGT---AC-GC

Puntos para la matriz 10: 3

Matriz 11 sin guiones:
AT--CGAT-CG-
-GCTAGCT

In [2]:
# Definir límite de ciclos y puntaje deseado
H = 7  # Puntaje mínimo buscado
G = 3  # Número de repeticiones máximas del ciclo

# Variable para verificar si se encontró una matriz con puntaje mayor a H
encontrado = False

for _ in range(G):
    # Ordenar las matrices por puntaje en orden descendente
    matrices_con_puntajes.sort(key=lambda x: x[1], reverse=True)

    # Mantener solo las seis mejores matrices
    matrices_con_puntajes = matrices_con_puntajes[:6]

    # Imprimir las seis matrices con los puntajes más altos
    print("Las seis matrices con los puntajes más altos:")
    for i, (matriz, puntaje) in enumerate(matrices_con_puntajes):
        print(f"Matriz {i+1} con puntaje {puntaje}:")
        for fila in matriz:
            print(''.join(fila))
        print()

    # Obtener las matrices en el top 6
    mejores_matrices = [matriz for matriz, _ in matrices_con_puntajes]

    # Mientras hayan matrices disponibles en el top 6
    while mejores_matrices:
        # Seleccionar dos matrices aleatorias
        matriz1, matriz2 = random.sample(mejores_matrices, 2)
        
        # Generar dos números aleatorios menores que la longitud mínima
        numero1 = random.randint(1, longitud_minima - 1)
        numero2 = random.randint(1, longitud_minima - 1)

        # Ordenar los números de menor a mayor
        numero_menor = min(numero1, numero2)
        numero_mayor = max(numero1, numero2)

        print("Número menor:", numero_menor)
        print("Número mayor:", numero_mayor)

        # Lista para almacenar las filas con la extracción
        extracciones = []

        # Iterar sobre cada fila de la primer matriz
        for fila in matriz1:
            # Contador para los caracteres no guion
            contador_no_guion = 0
            # Iterar sobre cada carácter de la fila
            for i, caracter in enumerate(fila):
                # Verificar si el carácter no es un guion
               if caracter != '-':
                contador_no_guion += 1
                # Verificar si el contador alcanza el valor de "numero_menor"
                if contador_no_guion >= numero_menor:
                    # Agregar la extracción de caracteres hasta este punto
                    extracciones.append(fila[:i+1])
                    break

        # Imprimir las extracciones
        for i, extraccion in enumerate(extracciones):
            print(f"Extracción {i+1}.1: {''.join(extraccion)}")

        # Lista para almacenar las extracciones de caracteres
        extracciones_segunda_matriz = []

        # Iterar sobre cada fila de la segunda mejor matriz
        for fila in matriz2:
            # Contador para los caracteres no guion
            contador_no_guion = 0
            # Bandera para indicar si se está extrayendo caracteres
            extrayendo = False
            # Lista para almacenar los caracteres a extraer
            caracteres_a_extraer = []
            # Iterar sobre cada carácter de la fila
            for i, caracter in enumerate(fila):
                # Verificar si el carácter no es un guion
                if caracter != '-':
                    contador_no_guion += 1
                # Verificar si el contador es igual al número menor
                if contador_no_guion == numero_menor:
                    # Comenzar la extracción de caracteres en el siguiente carácter
                    extrayendo = True
                # Verificar si se está extrayendo caracteres y el contador es menor o igual que el número mayor
                if extrayendo and contador_no_guion <= numero_mayor:
                    # Agregar el carácter a extraer
                    caracteres_a_extraer.append(caracter)
                # Verificar si el contador es igual al número mayor para la última extracción
                if contador_no_guion == numero_mayor:
                    # Romper el bucle para evitar extracciones adicionales
                    break
            # Agregar la lista de caracteres extraídos a la lista de extracciones
            extracciones_segunda_matriz.append(caracteres_a_extraer)

        # Eliminar el primer carácter de cada secuencia en extracciones_segunda_matriz
        extracciones_segunda_matriz = [extraccion[1:] for extraccion in extracciones_segunda_matriz]

        # Imprimir las extracciones de la segunda matriz
        for i, extraccion in enumerate(extracciones_segunda_matriz):
            print(f"Extracción {i+1}.2: {''.join(extraccion)}")

        # Lista para almacenar las extracciones de caracteres
        extracciones_finales = []

        # Iterar sobre cada fila de la primer matriz
        for fila in matriz1:
            # Contador para los caracteres no guion
            contador_no_guion = 0
            # Bandera para indicar si se está extrayendo caracteres
            extrayendo = False
            # Lista para almacenar los caracteres a extraer
            caracteres_a_extraer = []
            # Iterar sobre cada carácter de la fila
            for i, caracter in enumerate(fila):
                # Verificar si el carácter no es un guion
                if caracter != '-':
                    contador_no_guion += 1
                # Verificar si el contador es igual al número menor
                if contador_no_guion == numero_mayor:
                    # Comenzar la extracción de caracteres
                    extrayendo = True
                if extrayendo:
                    # Agregar el carácter a extraer
                    caracteres_a_extraer.append(caracter)
            # Agregar la lista de caracteres extraídos a la lista de extracciones
            extracciones_finales.append(caracteres_a_extraer)

        # Eliminar el primer carácter de cada secuencia en extracciones_segunda_matriz
        extracciones_finales = [extraccion[1:] for extraccion in extracciones_finales]

        # Imprimir las extracciones de la segunda mejor matriz
        for i, extraccion in enumerate(extracciones_finales):
            print(f"Extracción {i+1}.3: {''.join(extraccion)}")

        # Combinar las filas de cada conjunto de extracciones en una sola fila
        primera_fila_combinada = ''.join(extracciones[0]) + \
                                ''.join(extracciones_segunda_matriz[0]) + \
                                ''.join(extracciones_finales[0])

        segunda_fila_combinada = ''.join(extracciones[1]) + \
                                ''.join(extracciones_segunda_matriz[1]) + \
                                ''.join(extracciones_finales[1])

        tercera_fila_combinada = ''.join(extracciones[2]) + \
                                ''.join(extracciones_segunda_matriz[2]) + \
                                ''.join(extracciones_finales[2])

        # Imprimir las filas combinadas
        print("Primera fila combinada:", primera_fila_combinada)
        print("Segunda fila combinada:", segunda_fila_combinada)
        print("Tercera fila combinada:", tercera_fila_combinada)


        # Calcular las longitudes de las filas combinadas
        longitud_primera_fila_combinada = len(primera_fila_combinada)
        longitud_segunda_fila_combinada = len(segunda_fila_combinada)
        longitud_tercera_fila_combinada = len(tercera_fila_combinada)

        # Determinar la longitud máxima entre las filas combinadas
        longitud_maxima_filas_combinadas = max(longitud_primera_fila_combinada, longitud_segunda_fila_combinada, longitud_tercera_fila_combinada)

        # Ajustar las filas más cortas insertando guiones al final para igualarlas a la longitud máxima
        primera_fila_combinada += '-' * (longitud_maxima_filas_combinadas - longitud_primera_fila_combinada)
        segunda_fila_combinada += '-' * (longitud_maxima_filas_combinadas - longitud_segunda_fila_combinada)
        tercera_fila_combinada += '-' * (longitud_maxima_filas_combinadas - longitud_tercera_fila_combinada)

        # Imprimir las filas combinadas ajustadas
        print("Primera fila combinada ajustada:", primera_fila_combinada)
        print("Segunda fila combinada ajustada:", segunda_fila_combinada)
        print("Tercera fila combinada ajustada:", tercera_fila_combinada)

        # Combinar las tres filas combinadas en una sola matriz
        hijo = [primera_fila_combinada, segunda_fila_combinada, tercera_fila_combinada]

        # Imprimir la matriz combinada
        print("Hijo:")
        for fila in hijo:
            print(fila)

        # Insertar guiones aleatorios en el hijo
        hijo_con_guiones = mutacion_hijos(hijo)

        # Aplicar la función para eliminar columnas de guiones
        hijo_filtrado = eliminar_columnas_guiones(hijo_con_guiones)

        # Calcular el puntaje de la matriz combinada
        puntaje_hijo = calcular_puntaje(hijo_filtrado)

        # Agregar la matriz combinada y su puntaje a la lista de las seis mejores matrices
        matrices_con_puntajes.append((hijo_filtrado, puntaje_hijo))

        # Eliminar las matrices seleccionadas de la lista de mejores_matrices
        mejores_matrices.remove(matriz1)
        mejores_matrices.remove(matriz2)

        # Verificar si se alcanzó el puntaje mínimo requerido
        if puntaje_hijo >= H:
            print("Se encontró una matriz con puntaje mayor a", H)
            break
    # Si se encontró una matriz con puntaje mayor o igual a H, salir del ciclo externo
    if puntaje_hijo >= H:
        encontrado=True
        break

# Verificar si se encontró una matriz con puntaje mayor o igual a H
if encontrado:
    print("Se encontró una matriz con puntaje mayor a", H)
else:
    print("Se alcanzó el número máximo de repeticiones sin encontrar una matriz con puntaje mayor a", H)
    print("Se mostrará la matriz con mejor puntaje obtenida")

Las seis matrices con los puntajes más altos:
Matriz 1 con puntaje 5:
AT--CGAT-CG-
-GCTAGCT-ATA
TA--CG-TACGC

Matriz 2 con puntaje 4:
-ATC-GAT-C-G-
GC--TAG-CTATA
TA-C-GTAC-G-C

Matriz 3 con puntaje 4:
A-TCGAT-C-G-
GCT-AGCTAT-A
TA--C-GTACGC

Matriz 4 con puntaje 4:
ATCGA-TC-G-
GCT-AGCTATA
TACGT-A-CGC

Matriz 5 con puntaje 4:
AT-CGA---T-CG
-GC-TAGCTA-TA
TA-CG--T-ACGC

Matriz 6 con puntaje 3:
A-T-CGAT-C--G
-GCTAG-CTA-TA
TAC-GTA-CGC--

Número menor: 3
Número mayor: 5
Extracción 1.1: A-TC
Extracción 2.1: GCT
Extracción 3.1: TA--C
Extracción 1.2: GA
Extracción 2.2: AG
Extracción 3.2: G-T
Extracción 1.3: T-C-G-
Extracción 2.3: CTAT-A
Extracción 3.3: ACGC
Primera fila combinada: A-TCGAT-C-G-
Segunda fila combinada: GCTAGCTAT-A
Tercera fila combinada: TA--CG-TACGC
Primera fila combinada ajustada: A-TCGAT-C-G-
Segunda fila combinada ajustada: GCTAGCTAT-A-
Tercera fila combinada ajustada: TA--CG-TACGC
Hijo:
A-TCGAT-C-G-
GCTAGCTAT-A-
TA--CG-TACGC
Número menor: 4
Número mayor: 7
Extracción 1.1: A-T

In [3]:
# Ordenar las matrices por puntaje en orden descendente
matrices_con_puntajes.sort(key=lambda x: x[1], reverse=True)

# Mantener solo la mejor matriz
mejor_matriz, mejor_puntaje = matrices_con_puntajes[0]

# Imprimir la mejor matriz con su puntaje
print(f"La mejor matriz consiguió un puntaje de {mejor_puntaje}:")
for fila in mejor_matriz:
    print(''.join(fila))


La mejor matriz con puntaje 5:
AT--CGAT-CG-
-GCTAGCT-ATA
TA--CG-TACGC
