### Ejercicio 2

Implementad un conjunto de funciones para obtener la **secuencia de ADN** del organismo *Homo sapiens* del cromosoma 1 (**chr1**) desde la posición 100000 hasta 101000 para la referencia **hg19**.  Para realizar el ejercicio utilizad la API de [UCSC](https://genome.ucsc.edu/goldenPath/help/api.html).

**Nota**: El genoma de referencia de una célula es un repositorio de secuencias de ADN ( ácido desoxirribonucleico) empaquetado en forma de cromosoma. El ADN es un ácido nucleico que contiene la información genética que dirige el desarrollo y el funcionamiento de todos los seres vivos. El ADN se puede entender como una secuencia de nucleótidos (A, C, T y G) de una determinada longitud.  Este material hereditario codifica los genes que, una vez descifrados, son indispensables para la síntesis de las proteínas. 

Un genoma de referencia es la representación de la secuencia de ADN del genoma de una especie.  En el caso del organismo *Homo sapiens*, existen diferentes versiones del genoma de referencia.  La última versión, hg38, se publicó en el 2014 y es la más detallada y precisa.

UCSC es un navegador de la Universidad de Santa Cruz de California que ofrece acceso a secuencias genómicas y su correspondiente anotación (genes, mRNAs, CpG,…) de una gran variedad de organismos, vertebrados e invertebrados. 

Referencia: [Genómica Computacional](http://discovery.uoc.edu/iii/encore/record/C__Rb1046448__Sgenomica%20Computacional__Orightresult__U__X7?lang=cat&suite=def). Enrique Blanco. Barcelona, Universitat Oberta de Catalunya, 2011.

**Importante**: No es necesario entender toda la información que podéis obtener a través de la API de UCSC. Fijaros bien con lo que os pide el enunciado ( prestad atención a la palabras clave en negrita), y revisad los ejemplos de acceso a los datos que hay en la web de [UCSC](https://genome.ucsc.edu/goldenPath/help/api.html).


In [None]:
# Respuesta
import requests
import json

In [None]:
def parse_response(response):
  data = None
  if response.status_code == 200:
    # Los datos están formateados en str
    data = json.loads(response.content)
  else:
    raise Exception(f"Error en la respuesta {response.status_code}, {response.reason}")
  return data

In [None]:
def get_sequence_UCSC(endpoint, genome_ref, chrom, start, end):
  base_url = endpoint + "genome=" + genome_ref + ";chrom=" + chrom + ";start=" +  start + ";end=" + end

  # Creamos la petición
  response = requests.get(base_url)

  # Realizamos el check de la petición
  data = parse_response(response)

  if data:
    dna = data.get('dna')
  return dna

In [None]:
endpoint = "https://api.genome.ucsc.edu/getData/sequence?"
gen_ref = "hg19"
chrom = 'chr1'
start = '100000'
end = '101000'

In [None]:
sequence_data = get_sequence_UCSC(endpoint, gen_ref, chrom, start, end)

In [None]:
print(sequence_data[0:11])

actaagcacac


In [None]:
len(sequence_data)

1000