In [5]:
import numpy as np
import pandas as pd
import itertools

In [6]:
def funcion_seleccion(combinaciones_con_prob):
    """ algoritmo de selección """
    combinaciones_con_prob = np.array(combinaciones_con_prob)
    indice = np.argmax(np.array(combinaciones_con_prob[:, 1], dtype=float) + np.array(combinaciones_con_prob[:, 3], dtype=float))
    return combinaciones_con_prob[indice]


def calcular_frecuencias(alelos, individuos, posiciones, combinaciones):
    """Calcular frecuencias de cada combinación"""
    res = {}
    for x in range(individuos):
        for i in range(len(combinaciones)):
            val = ''.join(alelos[x, np.arange(posiciones), combinaciones[i]])
            if val not in res:
                res[val] = 0
            res[val] += 1
    return res

def calcular_hoplotipo(individuos, posiciones, alelos, combinaciones, res, cantidad_total):
    """ Calcular haplotipo más frecuente para cada individuo """
    for x in range(individuos):
        print(f"-- Individuo {x} ---" )
        combinaciones_con_prob = []
        for i in range(len(combinaciones)):
            aleloA_ind = combinaciones[i]
            aleloB_ind = np.abs(np.array(aleloA_ind) - 1)
            aleloA = ''.join(alelos[x, np.arange(posiciones), aleloA_ind])
            aleloB = ''.join(alelos[x, np.arange(posiciones), aleloB_ind])
            prob_A = res[aleloA]/cantidad_total
            prob_B = res[aleloB]/cantidad_total
            combinaciones_con_prob.append([aleloA, prob_A, aleloB, prob_B])
        
        print("Seleccionado:", funcion_seleccion(combinaciones_con_prob))



In [7]:
def main(individuos, posiciones):
    print(f"Cantidad de individuos: {individuos}, cantidad de posiciones: {posiciones}, cantidad de combinaciones posibles: {2 ** posiciones}")

    #leyendo datos
    alelo_uno = pd.read_csv('data_ch6/chr6_allele1_wmeta.csv', nrows=individuos)
    alelo_dos = pd.read_csv('data_ch6/chr6_allele2_wmeta.csv', nrows=individuos)
    #filtrando posiciones
    alelo_uno = alelo_uno[alelo_uno.columns[2:posiciones+2]].to_numpy()
    alelo_dos = alelo_dos[alelo_dos.columns[2:posiciones+2]].to_numpy()
    #uniendo alelos
    alelos = np.concatenate([alelo_uno.reshape(individuos, posiciones, 1), alelo_dos.reshape(individuos, posiciones, 1)], axis=2)

    #generando las combinaciones
    combinaciones = list(itertools.product([0, 1], repeat=posiciones))

    # Calcular frecuencias de cada combinación
    res = calcular_frecuencias(alelos, individuos, posiciones, combinaciones)
    cantidad_total = len(combinaciones) * individuos

    # Calcular haplotipo más frecuente para cada individuo
    calcular_hoplotipo(individuos, posiciones, alelos, combinaciones, res, cantidad_total)

In [8]:
main(10, 4)

Cantidad de individuos: 10, cantidad de posiciones: 4, cantidad de combinaciones posibles: 16
-- Individuo 0 ---
Seleccionado: ['TCAC' '0.11875' 'GCAC' '0.34375']
-- Individuo 1 ---
Seleccionado: ['TTGT' '0.01875' 'GCAC' '0.34375']
-- Individuo 2 ---
Seleccionado: ['GCAC' '0.34375' 'GCAC' '0.34375']
-- Individuo 3 ---
Seleccionado: ['TCAC' '0.11875' 'GCAC' '0.34375']
-- Individuo 4 ---
Seleccionado: ['TTGT' '0.01875' 'GCAC' '0.34375']
-- Individuo 5 ---
Seleccionado: ['GCAC' '0.34375' 'GTGT' '0.14375']
-- Individuo 6 ---
Seleccionado: ['GCAC' '0.34375' 'GTGT' '0.14375']
-- Individuo 7 ---
Seleccionado: ['TTGT' '0.01875' 'GCAC' '0.34375']
-- Individuo 8 ---
Seleccionado: ['GCAC' '0.34375' 'GCAC' '0.34375']
-- Individuo 9 ---
Seleccionado: ['GTGT' '0.14375' 'GTGT' '0.14375']
