In [14]:
import re

# Leyendo el archivo
data = "gene.fna"

# Abriendo archivo 
with open(data,"r") as datos:
    linea = datos.read()

total = ''.join(linea.split('\n')[1:])

### Pregunta b
Tomando secuencias de tres nucleóticos de ventana determine el número de CCG o
GCC que se encuentran en la secuencia.


In [13]:

# Esta línea busca todas las ocurrencias del patrón "GCC" en la cadena total. 
dataG= re.findall(r"(?=(GCC))",total)

# Esta línea busca todas las ocurrencias del patrón "CCG" en la cadena total. 
dataC = re.findall(r"(?=(CCG))",total)

# Esta línea busca todas las ocurrencias de los patrones "CCG" o "GCC" en la cadena total. 
data1 = re.findall(r"(?=(CCG|GCC))",total)

print("Cantidad de coincidencias para 'GCC':", len(dataG))
print("Cantidad de coincidencias para 'CCG':", len(dataC))
print("Cantidad total de coincidencias para 'CCG' o 'GCC':", len(data1))

Cantidad de coincidencias para 'GCC': 1394
Cantidad de coincidencias para 'CCG': 334
Cantidad total de coincidencias para 'CCG' o 'GCC': 1728


### Pregunta d
¿Es posible automatizar la descarga del archivo directamente desde Python?¿què librerìas y/o sentencias utilizarìa?. Escriba còdigo para dicha descarg


Sí, es posible automatizar la descarga de archivos directamente desde Python. Se utilizó la librería `requests` para realizar solicitudes HTTP y descargar archivos. La librería `requests` es muy popular y fácil de usar para este propósito.

### Librerías y Sentencias Utilizadas

1. **Librerías**:
   - `requests`: Para realizar solicitudes HTTP y descargar contenido.
   - `os`: Para manejar archivos en el sistema, como eliminar archivos después de combinarlos.

2. **Sentencias**:
   - `requests.get(url)`: Para realizar una solicitud GET a una URL.
   - `response.status_code`: Para verificar el código de estado de la respuesta y asegurar que la solicitud fue exitosa.
   - `response.text`: Para obtener el contenido de la respuesta en formato de texto.
   - `with open(nombreArchivo, 'w') as archivo`: Para abrir un archivo en modo escritura y guardar el contenido descargado.
   - `os.remove(fasta1)`: Para eliminar un archivo del sistema.

### Código para la Descarga Automatizada

A continuación, se presenta el código que automatiza la descarga de un archivo FASTA desde la base de datos NCBI utilizando la librería `requests`:

```python
import requests

def descargar_fasta(nuccoreId, start, end, strand, nombreArchivo):
    """
    Descarga una secuencia de la base de datos NCBI en formato FASTA.

    :param nuccoreId: ID de la secuencia en NCBI.
    :param start: Posición inicial de la secuencia.
    :param end: Posición final de la secuencia.
    :param strand: Cadena de ADN (1 para directa, 2 para complementaria).
    :param nombreArchivo: Nombre del archivo donde se guardará la secuencia.
    """
    try:
        # Construir la URL para obtener la secuencia en formato FASTA
        fastaUrl = f"https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&id={nuccoreId}&rettype=fasta&retmode=text&seq_start={start}&seq_stop={end}&strand={strand}"
        
        # Realizar la solicitud GET para descargar el archivo FASTA
        response = requests.get(fastaUrl)
        
        # Verificar si la solicitud fue exitosa (código de estado 200)
        if response.status_code == 200:
            # Guardar el contenido en un archivo FASTA
            with open(nombreArchivo, 'w') as archivo:
                archivo.write(response.text)
            print(f"¡Archivo '{nombreArchivo}' descargado exitosamente!")
        else:
            print(f"Error al descargar el archivo FASTA. Código de estado: {response.status_code}")
    except Exception as e:
        print(f"Error durante la descarga del archivo FASTA: {e}")

# Ejemplo de uso
nuccoreId = "NC_060929.1"
start = 150027795
end = 150086185
strand = 1  # 1 para directa, 2 para complementaria
nombreArchivo = "secuenciaDescargada.fasta"
descargar_fasta(nuccoreId, start, end, strand, nombreArchivo)
```

### Explicación del Código

1. **Definición de la Función `descargar_fasta`**:
   - La función `descargar_fasta` toma los parámetros necesarios para construir una URL que apunta a la API de NCBI y especifica el rango de bases y la cadena de ADN que se desea descargar.
   - Dentro de la función, se construye la URL utilizando los parámetros proporcionados.
   - Se realiza una solicitud GET a la URL utilizando `requests.get(fastaUrl)`.
   - Si la solicitud es exitosa (`response.status_code == 200`), se guarda el contenido en un archivo con el nombre especificado (`nombreArchivo`).
   - Se maneja cualquier excepción que pueda ocurrir durante el proceso de descarga.

2. **Uso de la Función**:
   - Se proporcionan valores de ejemplo para los parámetros necesarios (`nuccoreId`, `start`, `end`, `strand`, `nombreArchivo`).
   - Se llama a la función `descargar_fasta` con estos parámetros para descargar la secuencia y guardarla en un archivo llamado "secuenciaDescargada.fasta".

Este código puede ser modificado y adaptado para descargar diferentes secuencias cambiando los valores de los parámetros según sea necesario.

### Usando codigo para descargar el archivo pedido

In [4]:
import requests
import os

def descargar_fasta(nuccoreId, start, end, strand, nombreArchivo):
    """
    :param nuccoreId: ID de la secuencia en NCBI.
    :param start: Posición inicial de la secuencia.
    :param end: Posición final de la secuencia.
    :param strand: Cadena de ADN (1 para directa, 2 para complementaria).
    :param nombreArchivo: Nombre del archivo donde se guardará la secuencia.
    """
    try:
        # Construir la URL para obtener la secuencia en formato FASTA
        fastaUrl = f"https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&id={nuccoreId}&rettype=fasta&retmode=text&seq_start={start}&seq_stop={end}&strand={strand}"
        
        # Realizar la solicitud GET para descargar el archivo FASTA
        response = requests.get(fastaUrl)
        
        # Verificar si la solicitud fue exitosa (código de estado 200)
        if response.status_code == 200:
            # Guardar el contenido en un archivo FASTA
            with open(nombreArchivo, 'w') as archivo:
                archivo.write(response.text)
            print(f"¡Archivo '{nombreArchivo}' descargado exitosamente!")
        else:
            print(f"Error al descargar el archivo FASTA. Código de estado: {response.status_code}")
    except Exception as e:
        print(f"Error durante la descarga del archivo FASTA: {e}")

def combinar_archivos(fasta1, fasta2, archivoCombinado):
    """
    Combina dos archivos FASTA en uno solo y elimina los archivos originales.

    :param fasta1: Nombre del primer archivo FASTA.
    :param fasta2: Nombre del segundo archivo FASTA.
    :param archivoCombinado: Nombre del archivo combinado.
    """
    try:
        # Leer el contenido del primer archivo FASTA
        with open(fasta1, 'r') as archivo1:
            contenidoFasta1 = archivo1.read()

        # Leer el contenido del segundo archivo FASTA
        with open(fasta2, 'r') as archivo2:
            contenidoFasta2 = archivo2.read()

        # Escribir ambos contenidos en el archivo combinado
        with open(archivoCombinado, 'w') as archivo:
            archivo.write(contenidoFasta1)
            archivo.write('\n')  # Agregar una línea en blanco entre las secuencias
            archivo.write(contenidoFasta2)

        print(f"¡Archivos '{fasta1}' y '{fasta2}' combinados en '{archivoCombinado}'!")

        # Eliminar los archivos originales
        os.remove(fasta1)
        os.remove(fasta2)

        print(f"Archivos '{fasta1}' y '{fasta2}' eliminados.")
    except Exception as e:
        print(f"Error al combinar los archivos: {e}")

# Descargar la primera secuencia
nuccoreId1 = "NC_060929.1"
start1 = 150027795
end1 = 150086185
strand1 = 1  # 1 para directa, 2 para complementaria
nombreArchivo1 = "secuenciaDescargada1.fasta"
descargar_fasta(nuccoreId1, start1, end1, strand1, nombreArchivo1)

# Descargar la segunda secuencia
nuccoreId2 = "NC_000005.10"
start2 = 149492982
end2 = 149551439
strand2 = 1  # 1 para directa, 2 para complementaria
nombreArchivo2 = "secuenciaDescargada2.fasta"
descargar_fasta(nuccoreId2, start2, end2, strand2, nombreArchivo2)

# Archivos FASTA para combinar
archivoFasta1 = "secuenciaDescargada1.fasta"
archivoFasta2 = "secuenciaDescargada2.fasta"

# Nombre del archivo combinado
archivoCombinado = "secuenciasCombinadas.fasta"

# Llamar a la función para combinar los archivos y eliminar los antiguos
combinar_archivos(archivoFasta1, archivoFasta2, archivoCombinado)


¡Archivo 'secuenciaDescargada1.fasta' descargado exitosamente!
¡Archivo 'secuenciaDescargada2.fasta' descargado exitosamente!
¡Archivos 'secuenciaDescargada1.fasta' y 'secuenciaDescargada2.fasta' combinados en 'secuenciasCombinadas.fasta'!
Archivos 'secuenciaDescargada1.fasta' y 'secuenciaDescargada2.fasta' eliminados.
