# Práctica 3: Proteínas y aminoácidos
## Conceptos a trabajar
La diversidad funcional expresada por las proteínas, parten de la variedad molecular y la secuencia especifica que las componen. Los aminoácidos son subunidades de bajo peso molecular, los cuales, cumplen una función específica en la estructura de la proteína, por sus propiedades fisicoquímicas, como, polaridad, acidez o basicidad, aromaticidad, tamaño, capacidad de formar enlaces o su reactividad química**<sup> 8 </sup>** (Fig. 5). Por tal razón, pueden ser clasificados de diversas formas:

1.	Por la polaridad, la capacidad de interaccionar con moléculas de agua, dividiéndose en:

   * Apolares: hidrofóbicos.
   * Polares: hidrofílicos.
   * Ácidos: carga negativa a pH.
   * Básicos: carga positiva a pH fisiológico.

<img src="img/Figura6-es.jpg" alt="aminoácidos2" width="900"/>

*Figura 5. Estructura y clasificación de los aminoácidos por su polaridad. Figura adaptada de: [A Brief Guide to the Twenty Common Amino Acids (2014)](https://www.compoundchem.com/2014/09/16/aminoacids/)*

2. Por la conformación de su cadena latera, se pueden agrupar en:
   * Alifáticos
   * Aromáticos
   * Hidroxiáminoacidos
   * Tioaminoácidos
   * Iminoácidos
   * Dicarboxílicos
   * Amidas
   * Dibásicos

Conocer las propiedades fisicoquímicas de las proteínas, han facilitado la predicción de sus estructuras secundarias, es decir, entender el plegamiento de las proteínas para la formación tridimensional a partir de la cadena de aminoácidos que la forman, esto mediante los posibles enlaces que establecen entre las subunidades y entre proteínas.

## Planteamiento del problema
Para dar solución al objetivo general de la práctica, analizaremos 2 propiedades fisicoquímicas de la enzima del citocromo P450, empleando como guía la información de las figuras 6 y 7. De esta forma, obtendremos la información básica de la proteína, la cual, facilitaría una predicción de su plegamiento mediante el uso de las ciencias ómicas. Las propiedades que vamos a evaluar son:
* Polaridad
* Acidez o basicidad

Antes de comenzar, debemos crear un diccionario de las propiedades fisicoquímicas que queremos evaluar, con la clasificación de cada aminoácido. Donde, las `key` serían los aminoácidos y los `value` las propiedades.

In [None]:
#Diccionario de aminoácidos para su clasificación
propiedades= {"A": "Apolar", "V": "Apolar", "L": "Apolar", "G": "Apolar", "I": "Apolar", "F": "Apolar","W": "Apolar", "M": "Apolar", "P": "Apolar", "S": "Polar", "T": "Polar", "Y": "Polar", "N": "Polar", "Q": "Polar", "C": "Polar", "D": "Ácidos", "E": "Ácidos", "K": "Básicos", "R": "Básicos",  "H": "Básicos"}

print(f'Los aminoácidos son: \n{list(propiedades.keys())}')
print('-----------------')
print(f'Las propiedades son: \n{set(propiedades.values())}')
# se utiliza un conjunto a partir de la lista para que las propiedades no se repitan

A continuación, vamos a crear la función `total_elements` para obtener el número de nucleótidos polares, apolares, ácidos y básicos presentes en la proteína.
Se utilizará el módulo `collections.Counter` el cual organiza los elementos de una lista en un `Counter` que dice cuantas veces se repite cada elemento.
El objeto `Counter` se puede comvertir luego en un `diccionario` donde podemos ver la infromación.

`Counter` también tiene métodos útilies, por ejemplo: `.most_common(n)`, el cual retorna el n-elemento más común del `Counter`.

mayor información https://docs.python.org/3/library/collections.html

In [None]:
def total_elements(lista_proteina):
    # Se importa el módulo a utilziar
    from collections import Counter
    # Se crea una lista vaçia donde se va a guardar la propiedad de cada aminoácido
    list_propiedades_proteina = list()
    contador = list()

    # Se va a iterar por cada aminoácido de la proteína
    for element in lista_proteina:

        # Se busca la propiedad del aminoácido y se guarda en la lista (.append())
        list_propiedades_proteina.append(propiedades[element])
        # Se llama al método Counter para organizar los datos
        contador = Counter(list_propiedades_proteina)
    print(f'Resumen de propiedades de la proteína:')
    print(f'Total elementos: {len(lista_proteina)}')
    print(f'Frecuenca de las propiedades: {dict(contador)}')
    print(f'Propiedad más común: {contador.most_common(1)[0]}')

    return None


In [None]:
# Proteína encontrada en la actividad 2
print(proteina)
print('-----------')
total_elements(proteina)

Con esta información, ya conocemos la longitud de la secuencia de aminoácidos y las propiedades fisicoquímicas de su estructura, la cual cuenta con regiones tanto polares, como apolares, siendo esta última la más común, lo que nos permite tener una aproximación del carácter de los grupos funcionales con los que es tiende a hacer reacción.

## Actividad practica 3
Teniendo en cuenta lo revisado en este Notebook introductorio y con ayuda de la bibliografía, conteste:
1.	¿Se podrían clasificar los aminoácidos de una forma diferente?
2.	Realice una nueva clasificación de la proteína basándose en la conformación de la cadena latera
3.	Que diferencia presenta la secuencia de aminoácidos final en comparación con la secuencia de CYP2C19 (NM_000769.4) una secuencia de la misma familia de proteínas del citocromo P450 que presenta un polimorfismo (mutación) en la secuencia de aminoácidos.

## Conclusiones
En este tutorial, comprendido los usos de las herramientas básicas de Python empleadas en las practicas bioinformáticas, que van desde el manejo y recopilación de datos, hasta el uso de comandos y métodos para su manipulación y análisis. Esto se realizó mediante dos fases, una teórica y una práctica, donde realizamos la expresión del material genético de una proteína desde una secuencia de ADN, hasta obtener los correspondientes aminoácidos y sus propiedades.
En los próximos tutoriales, explicaremos más herramientas de Python utilizadas en la recopilación y organización de datos obtenidos de recursos electrónicos, implementando diferentes librerías y su desarrollo.
