# Populy
### Guía de uso en *jupyter notebook*

## Pasos previos: instalación

Populy es un paquete desarrollado en Python para la simulación de procesos evolutivos de tipo *forward evolution*.

La instalación es el primer paso antes de utilizar cualquier paquete o librería que no esté incluida en la instalación base de python. El siguiente código permite instalar el paquete utilizando la herramienta pip.

El símbolo de exclamación indica que no es un bloque de código normal, si no un comando de `shell`.

La instalación solo es necesaria una vez. Copia el código en una celda, pégalo y ejecútalo.

```
!pip install Populy
```


In [None]:
# ejecutar solo una única vez
!pip install Populy

Sin embargo, como no solo es necesario instalar este paquete se hará uso de un de el siguiente comando para instalar las dependencias del paquete:

In [None]:
!pip install -r requirements.txt

## Importar el paquete

La instalación hace disponible el paquete, la importación "carga" el paquete en la memoria para que sea accesible.
La forma de importar, aunque parece complicada viene a decir que "desde este archivo importa este código".

De momento importaremos tanto `Population` como `Plots`, el primero nos permite crear la población y el segundo representarla.

In [None]:
from populy.population import Population
from populy.plots import Plots

## Crear una población

La forma correcta de referirse a la creación de objetos es la instanciación. En el siguiente bloque se está instanciando una nueva población.

Tenemos una nueva poblacion vacía a la cual le hemos llamado 'poblacion'. Esta poblacion tiene una serie de características, llamadas <b>atributos</b>, que la definen. En este caso sus valores son unos predeterminados pero se pueden cambiar pasandole el nuevo valor del atributo dentro del paréntesis tal y como se ha hecho con el tamaño (size)

In [None]:
# se crea una nueva poblacion donde se especifican caracteristicas generales de esta
poblacion = Population(size=1000,
                       freq={'A':(0.4,0.6),'B':(0.6,0.4)},	
                       fit={'AABB':0.2},
                       mu=(0.01,0.01)
                       )

### Ejercicio 1: atributos

**Genes**
En nuestro ejempolo `poblacion`, ¿sabrías decir cuantos genes hay? ¿sabrías interpretar los valores del diccionario freq?

**Fitness**
¿Qué puede indicar el atributo `fit`?

**mu**
¿Qué puede significar el atributo `mu`?

Si se quiere saber más sobre los posibles parámetros que incluir se puede consultar la documentación mediante la función help

In [None]:
help(Population.__init__)

Este método nos da la información de la población que se le pase.

In [None]:
Population.info(poblacion)

## Generar individuos en la población

Una vez creada la población se puede operar sobre ella. Para hacerlo se requiere de una estructura llamada método. Un método es una función asociada a un objeto, por lo que se sigue la siguiente notación:

`objeto.metodo()`

Siendo poblacion el nombre de nuestro objeto en cuestión.
Como la población que hemos creado previamente estaba vacía, es necesario introducir unos individuos en ella mediante la siguiente linea de código:

In [None]:
poblacion.initIndividuals()

### Ejercicio 2: mostrar individuos 

Utilizando el método `printIndividuals` haz que se muestren por pantalla algunos individuos de la población.

In [None]:
# escribe aqui el codigo

## Evolución

El estado actual de la población es su estado inicial, es decir, se encuentra en la primera generación (generación 0).

Al igual que se ha hecho con los otros métodos `initIndividuals` y `printIndividuals` es necesario llamar ahora al método que permite hacer que la población evolucione, es decir, que vayan sucediendo nuevas generaciones.

In [None]:
poblacion.evolvePop(gens=100)

No es necesario conocer el proceso de evolución en detalle, sin embargo debe saberse que el método de reproducción se lleva a cabo teniendo en cuenta el sexo del individuo y haciendo un **muestreo aleatorio con reemplazamiento**. Es decir, se toman 2 individuos, se comprueba que son de sexos distintos, se genera un descendiente y devuelve a la población original (no se eliminan).

Si da curiosidad, el algoritmo que el método evolvePop sigue es el siguiente:

1. Se escogen 2 individuos de forma aleatoria de nuestra población
2. Se comprueban una serie de parámetros (si ambos son de sexos diferentes, por ejemplo)
3. Si se cumplen estos parámetros se genera un nuevo individuo (recordemos que individuo es una forma de referirse a un objeto de la clase individuo)
4. Dentro de cada individuo se genenera su genoma (sus cromosomas homólogos ya que se trabaja con un único cromosoma)
5. Se realizan algunas operaciones más, como la posibilidad de una mutación o la recombinación
6. Se aplica (o no) una función de selección que vendrá dada por su genoma, si sobrevive se añadirá a la siguiente generación (pasará el filtro)
8. Repetir el proceso hasta que tengamos una nueva población del mismo tamaño
9. Repetir el proceso hasta llegar al número de generaciones especificada

**Nota**: el concepto de evolución en la simulación no es exactamente igual al siginficado biológico, se dice que una población evoluciona cuando pasan las generaciones.

### Ejercicio 3: evolución
En el bloque anterior se ha evolucionado la población 100 generaciones. `poblacion` ha pasado de encontrarse en la generación 0 a la generación 100. Vuelve a utilizar `evolvePop`(ya sea volviendo a ejecutar o en un nuevo bloque de código) y comprueba en qué generación se encuentra la población mediante `Population.info(poblacion)`.

## Extraer información
Una vez completada la evolucion podemos acceder a los atributos y/o metodos de nuestra poblacion para ver si ha cambiado, o que informacion se ha ido recopilando durante la evolucion.

La forma más sencilla de obtener un resumen de los datos es utilizando el método `getDataFrame` que permite obtener una tabla (dataframe) donde se encuentra el resultado de la población.

In [None]:
# obtenemos la evolución de las frecuencias alélicas para el alelo mayor
poblacion.getDataFrame("alleles")

### Ejercicio 4: Cambio en las frecuencias
Observando la última fila de nuestra tabla de datos ¿dirías que las frecuencias alelicas han cambiado?

## Representar gráficamente la evolución

Para saber si la población ha evolucionado en el sentido biológico se puede comprobar el cambio en las frecuencias alélicas. Para nuestro ejemplo se ha especificado una población diploide con 2 locus (o genes) A y B, cada uno con un alelo mayor (A/B) y menor (a/b). 

La mejor forma de visualizar este cambio es utilizando la representación gráfica. Para ello se utilizará el módulo `plots` de la siguiente forma:

In [None]:
Plots.alleles(poblacion)

Si lo que se busca es obtener un resultado conjunto del cambio en los alelos, gametos, sexos y mutaciones se puede utilizar el siguiente método

In [None]:
# obtiene un resumen del cambio en la frecuencia alelica y gametica
poblacion.plotAll()

### Ejercicio 5: interpretación
¿ Cuál dirías que son las fuerzas evolutivas que actúan en esta población?

## Extra
### Concatenacion de varias poblaciones
Al metodo `initIndividuals` visto anteriormente podemos pasarle una población ya iniciada siempre y cuando tenga la misma estructura genética que la población que estamos construyendo (ej: no se puede pasar individuos con un solo locus 'A' cuando queremos que la poblacion tenga dos locus 'A','B')

En el siguiente código se crea una nueva población `newPop` a la cual se le pasará los individuos de la población anterior llamada `poblacion`.

In [None]:
# Creamos la nueva poblacion vacia
newPop = Population(size=200,fit={'aabb':0})

# Esta vez la llenamos de individuos ya existentes
newPop.initIndividuals(pop = poblacion)


### Ejercicio 6
Al igual que se ha hecho anteriormente, llama a los métodos correspondientes para evolucionar y representar la nueva población. 

**Nota1**: haz que la población evolucione durante 120 generaciones. **Nota2**: utiliza el método `.plotAll()` para representar todos los cambios en la población.


### Ejercicio 7: extra

¿Existe alguna analogía en las poblaciones reales que explique este fenómeno observado? 

## Simulación de múltiples poblaciones

Para trabajar con múltiples poblaciones idénticas se debe importar el módulo superpop:

In [None]:
from populy.superpop import Superpop

# permite eliminar el output por terminal
from IPython.display import clear_output

La forma de funcionar es similar a la vista anteriormente. En este caso para la creación de un conjunto de poblaciones se utilizará `Superpop`. A este objeto se le debe pasar el número de poblaciones y su tamaño.

In [None]:
# creamos el objeto
varias_poblaciones = Superpop(popsize=100,n=10)


En este caso el objeto `varias_poblaciones` contiene un total de 10 poblaciones, cada una con 100 individuos.

El siguiente paso es evolucionar

In [None]:
# evoluciona la poblacion
varias_poblaciones.evolvePops(gens=100)
# evita mostrar el output por terminal
clear_output()

Por último se representa el resultado

In [None]:
varias_poblaciones.plotPops()

### Ejercicio 8: interpretación de resultados

¿Qué fenómeno o mecansimo evolutivo dirías que está actuando en estas poblaciones?


### Ejercicio avanzado:

Averigua la frecuencia de fijación de A y B.

Quizá es demasiado complejo? Hacerlo pero más simple

In [None]:
# Lista de poblaciones
pops = varias_poblaciones.sPop
# para ver el tamaño de la lista, es decir, el numero de subpoblaciones...
size = len(pops)
print(size)

# para ver las frecuencias alelicas de la ultima generacion recorremos la lista
fA = [0,0]
fB = [0,0]
print(f'Frecuencias alelicas en la ultima generacion {pops[0].gen}')
for i,poblacion in enumerate(pops):
    frecuencias_alelicas = poblacion.alleleFreq()
    print('Poblacion 0: ',frecuencias_alelicas)
    # contamos cuantos alelos se han fijado
    if frecuencias_alelicas['A'] == 1:
        fA[0] +=1
    elif frecuencias_alelicas['A'] == 0:
        fA[1] +=1 
    if frecuencias_alelicas['B'] == 1:
        fB[0] +=1
    elif frecuencias_alelicas['B'] == 0:
        fB[1] += 1
# calculamos el porcentaje sobre el total
fA = [(x/size)*100 for x in fA]
fB = [(x/size)*100 for x in fB]

print(f'Frecuencia de fijación de A: {fA[0]}% \t de a {fA[1]}%',
      f'Frecuencia de fijación de B: {fB[0]}% \t de b {fB[1]}%',sep='\n')