# Input y output

Python,  como todo lenguaje de programación de alto nivel, ofrece diversas formas de entrada y salida de datos. Esto incluye manejo local de archivos o  lectura y escritura de archivos remotas. Para esta última opción hay varías formas de las cuales veremos algunas.  

## 1. Manejo de archivos

Hay diferentes tipos de archivos: *archivos de texto* y *archivos binarios*. Los primeros son aquéllos que pueden leerse con Notepad (en Windows) o editores como kate, gedit, vi, emacs, vscode, etc. (en Linux). Un programa Python (o en casi cualquier otro lenguaje de programación) se escribe en un archivo de texto.

Los archivos binarios son archivos donde se encuentra codificada en binario información de distinto tipo: imágenes, videos, sonido, programas ejecutables, pero también puede ser texto formateado (.doc por ejemplo).

Ambos tipos de archivos se pueden acceder y modificar de manera automática desde un programa Python (o cualquier otro lenguaje). Manipularemos solamente archivos de texto, por ser más sencillo comprender lo que se está haciendo, pero los archivos binarios se manipulan de manera muy similar.

Se puede crear un archivo de la siguiente manera:

In [None]:
archivo = open('mi_archivo.txt','w')    # la 'w' significa que el archivo se abre para escritura (writing)
                                        # si el archivo ya existía, se borran sus contenidos al momento de abrirse
print(type(archivo))
archivo.write('hola\n')                 # escribe una línea en el archivo
archivo.write('¿qué tal?\n')            # escribe una línea en el archivo
archivo.write('chau, nos vemos')        # escribe una línea en el archivo
archivo.close()                         # cierra el archivo

<class '_io.TextIOWrapper'>


para revisar lo que se escribió podríamos simplemente abrir el archivo

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.read()               # lee todo el archivo
print(type(contenido))
print(contenido)                         # muestra el contenido del archivo
archivo.close()                          # cierra el archivo

<class 'str'>
hola
¿qué tal?
chau, nos vemos


Procesar un archivo tiene 3 etapas:

1.   abrir el archivo
2.   procesamiento propiamente dicho
3.   cerrar el archivo

El primer paso es inevitable, no se puede procesar sin abrir. El tercero no, pero si no se lo hace se pueden obtener errores. Es importante recordar cerrar los archivos.

Un archivo también puede abrirse para agregar información:

In [None]:
archivo = open('mi_archivo.txt','a')     # la 'a' significa que el archivo se abre para agregar al final (append)
archivo.write('\nhola de nuevo\n\n\n')   # escribe una línea en el archivo
archivo.write('regresé\n')               # escribe una línea en el archivo
archivo.close()                          # cierra el archivo

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.read()               # lee todo el archivo
archivo.close()                          # cierra el archivo
print(contenido)                         # muestra el contenido del archivo


hola
¿qué tal?
chau, nos vemos
hola de nuevo


regresé



El método `read()` permite cargar todo el archivo de una vez. Eso frecuentemente facilita el procesamiento de su contenido, pero no siempre es lo que uno desea: la  intrucción `read()` carga todo el archivo en memoria y si el archivo es muy grande, por ejemplo de varios Gigabytes, seguramente esto puede ocasionar algún problema durante la ejecución de dicha instrucción.

Si queremos limitar la lectura del archivo podemos leer de una vez cierta cantidad de caracteres:

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.read(13)             # lee el archivo hasta el 13 avo caracter
print(contenido)
archivo.close()

hola
¿qué tal


La siguiente vez que se lee, se lee a partir del último caracter leído:

In [None]:
archivo = open('mi_archivo.txt','r')           # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.read(3)                    # lee el archivo hasta el 3 avo caracter
print('Hasta el 3er caracter:',contenido)      # muestra el contenido de lo leido
contenido = archivo.read(10)                    # lee el archivo hasta el 5 avo caracter
print('5 caracteres desde el 4to:',contenido)  # muestra el contenido de lo leido
archivo.close()                                # cierra el archivo

Hasta el 3er caracter: hol
5 caracteres desde el 4to: a
¿qué tal


In [None]:
archivo = open('./sample_data/anscombe.json','r')           # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.read(100)
cadena = contenido
while len(cadena) > 0:
    cadena = archivo.read(100)
    contenido += cadena
    print(cadena)

archivo.close()

.0, "Y":7.58},
  {"Series":"I", "X":9.0, "Y":8.81},
  {"Series":"I", "X":11.0, "Y":8.33},
  {"Series
":"I", "X":14.0, "Y":9.96},
  {"Series":"I", "X":6.0, "Y":7.24},
  {"Series":"I", "X":4.0, "Y":4.26}
,
  {"Series":"I", "X":12.0, "Y":10.84},
  {"Series":"I", "X":7.0, "Y":4.81},
  {"Series":"I", "X":5
.0, "Y":5.68},

  {"Series":"II", "X":10.0, "Y":9.14},
  {"Series":"II", "X":8.0, "Y":8.14},
  {"Ser
ies":"II", "X":13.0, "Y":8.74},
  {"Series":"II", "X":9.0, "Y":8.77},
  {"Series":"II", "X":11.0, "Y
":9.26},
  {"Series":"II", "X":14.0, "Y":8.10},
  {"Series":"II", "X":6.0, "Y":6.13},
  {"Series":"I
I", "X":4.0, "Y":3.10},
  {"Series":"II", "X":12.0, "Y":9.13},
  {"Series":"II", "X":7.0, "Y":7.26},

  {"Series":"II", "X":5.0, "Y":4.74},

  {"Series":"III", "X":10.0, "Y":7.46},
  {"Series":"III", "
X":8.0, "Y":6.77},
  {"Series":"III", "X":13.0, "Y":12.74},
  {"Series":"III", "X":9.0, "Y":7.11},
 
 {"Series":"III", "X":11.0, "Y":7.81},
  {"Series":"III", "X":14.0, "Y":8.84},
  {"Series":

Pero la forma más adecuada para leer archivos grandes de texto con líneas,  es línea por línea. Esto es posible hacerlo con la instrucción `readline()`:

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
contenido = archivo.readline()
print('primera línea:', contenido, end='')
contenido = archivo.readline()
print('segunda línea:', contenido, end='')
archivo.close()

primera línea: hola
segunda línea: ¿qué tal?


Podemos iterar línea por línea para leer archivos:

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
linea = archivo.readline()
while linea != '':
    print(linea, end='')
    linea = archivo.readline()
archivo.close()

hola
¿qué tal?
chau, nos vemos
hola de nuevo


regresé


Python ofrece una notación más compacta, y equivalente,  para procesar todas las líneas de un archivo y conciste en iterar sobre el archivo abierto.

In [None]:
archivo = open('mi_archivo.txt','r')     # la 'r' significa que el archivo se abre para lectura (reading)
for linea in archivo:                    # lee el archivo linea por linea
    print(linea, end='')
print('\ny eso es todo.')
archivo.close()

hola
¿qué tal?
chau, nos vemos
hola de nuevo


regresé

y eso es todo.


## 2. Programación defensiva: comprobando si un archivo existe:

Un error típico cuando se quiere abrir un archivo para lectura es que el archivo puede no existir. Peor aún, cuando uno quiere abrir para escritura, si el archivo ya existe se borra. En ambas situaciones puede resultar conveniente chequear si existe antes de abrirlo:

In [None]:
nombre_de_archivo = 'mi_archivo2.txt'
try:
    archivo = open(nombre_de_archivo, 'r')
    linea = archivo.readline()
    while linea != '':
        print(linea, end='')
        linea = archivo.readline()
    archivo.close()
except IOError:
    print(nombre_de_archivo + ' no existe.')
finally:
    print('Se puede seguir escribiendo código')
print(archivo.closed)

mi_archivo2.txt no existe.
Se puede seguir escribiendo código
True


In [None]:
nombre_de_archivo = 'mi_archivo2.txt'
try:
    archivo = open(nombre_de_archivo, 'r')
    archivo.close()
except IOError:
    res = False

Lo  que hemos definido arriba es un manejador de excepciones:  el `try` trata de hacer lo que está en su cuerpo, si lo del cuerpo del `try` falla, es decir se produce una excepción,  entonces se ejecuta el `except`,  que en este caso da un mensaje de error. Pase lo que pase se ejecuta el `finally` que  en el ejemplo imprime un mensaje.   

Más precisamente la sentencia `try` funciona de la siguiente manera.

1. Primero se ejecuta la cláusula `try` (la(s) sentencia(s) entre las palabras clave `try` y `except`).
2. Si no se produce ninguna excepción, se salta la cláusula `except` y se termina la ejecución de la sentencia `try`.
3. Si se produce una excepción durante la ejecución de la cláusula `try`, se salta el resto de la cláusula. Entonces, si el tipo de la excepción coincide con la excepción nombrada después de la palabra clave `except`, se ejecuta la cláusula `except`, y luego la ejecución continúa después del bloque try/except.
4. Si se produce una excepción que no coincide con la excepción nombrada en la cláusula `except`, se pasa a las sentencias `try` externas, en este caso las que tiene Python.
5. Si hay una cláusula `finally`, ésta se ejecutará como la última tarea. La cláusula `finally` se ejecuta tanto si la sentencia `try` produce una excepción como si no.

In [None]:
def existe_archivo(nombre: str) -> bool:
    res = True
    try:
        archivo = open(nombre_de_archivo, 'r')
        archivo.close()
    except IOError:
        res = False
    return res

nombre_de_archivo = 'sample_data/california_housing_test.csv'
if existe_archivo(nombre_de_archivo):
    archivo = open(nombre_de_archivo, 'r')
    linea = archivo.readline()
    print(linea)
    archivo.close()
else:
    print(nombre_de_archivo + ' no existe.')

nombre_de_archivo = 'notas.csv'
if existe_archivo(nombre_de_archivo):
    archivo = open(nombre_de_archivo, 'r')
    linea = archivo.readline()
    print(linea)
    archivo.close()
else:
    print(nombre_de_archivo + ' no existe.')



"longitude","latitude","housing_median_age","total_rooms","total_bedrooms","population","households","median_income","median_house_value"

notas.csv no existe.


Otra manera es usando el módulo `os.path`

In [None]:
import os.path

nombre_de_archivo = 'mi_archivo2.txt'
if os.path.isfile(nombre_de_archivo):
    print('Archivo de nombre', nombre_de_archivo, 'existe.')
else:
    print('Archivo de nombre', nombre_de_archivo, 'no existe.')

Archivo de nombre mi_archivo2.txt no existe.


In [None]:
dir(os)

## 2. Manejo de archivos. Usos y costumbres

La forma anterior de leer y escribir archivos es la más directa, pero hay una forma más conveniente, implementada a partir de Python 2.5, que es con el uso del `with`.

El uso del `with` asegura que el archivo sea cerrado al finalizar su utilización, incluso si se produce un error (una excepción).

Veamos un ejemplo de creación y escritura de un archivo:

In [None]:
with open("archivo.txt", "w") as f:
    f.write('Hola\n')
    f.write('Adios')
print(f.closed)  # True

True


Veamos un ejemplo de lectura:

In [None]:
with open("archivo.txt", "r") as f:
    content = f.read()
print(f.closed)  # True

True


In [None]:
with open('archivo.txt', 'r') as f:
    linea_1 = f.readline()
print(linea_1)

Hola



In [None]:
with open('archivo.txt', 'r') as f:
    linea = f.readline()
    while linea != '':
        print(linea, end='')
        linea = f.readline()


Hola
Adios

Como antes,  si el archivo es grande podemos leer línea por línea iterando sobre el objeto de I/O:

In [None]:
with open('archivo.txt', 'r') as f:
    for linea in f:
        print(linea)

Hola

Adios


¿Qué pasa si el archivo no existe?

In [None]:
with open('archivo_2.txt', 'r') as f:
    contenido = f.read()
print(contenido)

FileNotFoundError: [Errno 2] No such file or directory: 'archivo_2.txt'

Si queremos que aunque el archivo no existe el programa siga (algo que no es muy usual), podemos mezclar el `with` con las instrucciones que habíamos visto usando la biblioteca  `os`.

In [None]:
import os.path
contenido = ''
nombre_de_archivo = 'archivo_2.txt'
if os.path.isfile(nombre_de_archivo):
    with open(nombre_de_archivo, 'r') as f:
        contenido = f.read()

print(contenido)

O, más convenientemente,  usar excepciones:

In [None]:
nombre_de_archivo = 'archivo_2.txt'
try:
    with open(nombre_de_archivo, 'r') as f:
        contenido = f.read()
except IOError:
    print(nombre_de_archivo + ' no existe.')

print (f.closed)

archivo_2.txt no existe.
True


# 3. Lectura de carpetas o directorios

Podemos desear procesar una carpeta y saber los archivos que contiene. Lo podemos hacer de la siguiente manera:

In [None]:
import os

print('El directorio actual es:', os.getcwd())

nombres = os.scandir('.')   # '.' es la carpeta actual, donde "estamos parados"
print('Devuelve un objeto iterable:',nombres, '\n')
for nombre in nombres:
    print(nombre)


El directorio actual es: /content
Devuelve un objeto iterable: <posix.ScandirIterator object at 0x7b4edb81eb10> 

<DirEntry '.config'>
<DirEntry 'archivo.txt'>
<DirEntry 'mi_archivo.txt'>
<DirEntry 'sample_data'>


In [None]:
nombres = os.scandir('..')   # '..' es la carpeta precedente a la actual.
print('Devuelve un objeto iterable:',nombres, '\n')
for nombre in nombres:
    print(nombre)


Devuelve un objeto iterable: <posix.ScandirIterator object at 0x7b4edb81e9c0> 

<DirEntry 'run'>
<DirEntry 'libx32'>
<DirEntry 'proc'>
<DirEntry 'lib'>
<DirEntry 'dev'>
<DirEntry 'boot'>
<DirEntry 'opt'>
<DirEntry 'tmp'>
<DirEntry 'root'>
<DirEntry 'mnt'>
<DirEntry 'lib64'>
<DirEntry 'lib32'>
<DirEntry 'usr'>
<DirEntry 'sys'>
<DirEntry 'sbin'>
<DirEntry 'etc'>
<DirEntry 'home'>
<DirEntry 'var'>
<DirEntry 'media'>
<DirEntry 'bin'>
<DirEntry 'srv'>
<DirEntry 'content'>
<DirEntry 'kaggle'>
<DirEntry '.dockerenv'>
<DirEntry 'datalab'>
<DirEntry 'tools'>
<DirEntry 'NGC-DL-CONTAINER-LICENSE'>
<DirEntry 'cuda-keyring_1.0-1_all.deb'>


In [None]:
nombres = os.scandir('../content/sample_data')   #
print('Devuelve un objeto iterable:',nombres, '\n')
for nombre in nombres:
    print(nombre)

También podemos poner el nombre específico de una carpeta:

In [None]:
import os
nombre_de_carpeta = 'sample_data'
nombres = os.scandir(nombre_de_carpeta)
# print(nombres)
for nombre in nombres:
    print(nombre)

Si  la carpeta no existe obtendremos una excepción.

## 4. Creación de carpetas

Hay diferentes métodos disponibles en el módulo `os` para crear un directorio, pero nosotros solo explicaremos `os.mkdir()`

El método `os.mkdir()` en Python se utiliza para crear un directorio en la ruta indicada. Este método devuelve  una excepción `FileExistsError` si el directorio a crear ya existe.

Veamos un ejemplo:

In [None]:
import os

directorio = 'mi_carpeta/'     # Directorio a crear
parent_dir = ".."    # Directorio precedente al actual

path = os.path.join(parent_dir, directorio) # ruta completa. Más "robusto" que pegar cadenas.
print(path)

os.mkdir('mi_carpeta')

../mi_carpeta/


In [None]:
nombres = os.scandir('.')
# print(nombres)
for nombre in nombres:
    print(nombre)

<DirEntry '.config'>
<DirEntry 'archivo.txt'>
<DirEntry 'mi_carpeta'>
<DirEntry '.ipynb_checkpoints'>
<DirEntry 'mi_archivo.txt'>
<DirEntry 'sample_data'>


Si ejecutamos la celda anterior más de una vez obtenemos un error, pues el directorio `mi_carpeta` ya está creado.

Podemos remover un directorio vacío con la instrucción `os.rmdir`:

In [None]:
os.rmdir('mi_carpeta')

Podemos remover archivos con la instrucción `os.remove`:

In [None]:
os.remove('mi_archivo.txt')

Las instrucciones del módulo `os` nos permiten hacer un completo manejo del sistema de archivos. Hay otro módulos que  ayudan al manejo de archivos,  como ser `pathlib` y `shutil`,  que no explicaremos en esta clase.

## 5. Lectura de archivos en la red

Para leer un archivo en la red hay,  como suele ocurrir  en Python,  varias forma de hacerlo. Nosotros lo haremos, por lo menos en este lección,  con la biblioteca `requests`.

La biblioteca `requests` es el estándar de facto para hacer peticiones HTTP en Python. Abstrae las complejidades de hacer peticiones detrás de una agradable y sencilla API que nos permite centrarnos en interactuar con los servicios y consumir datos en nuestras aplicaciones.

A lo largo de esta sección veremos algunas de las características más útiles que `requests` tiene para ofrecer, así como la forma de personalizar y optimizar esas características para diferentes situaciones que podamos encontrar.


**Empezar con `requests`**

Comencemos por instalar la biblioteca `requests`. Para ello, se ejecuta el siguiente comando:

`pip install requests`


Una vez instalada `requests`, podemos utilizarla. En Google Colab la biblioteca `requests` ya está instalada.

La importación de `requests` se hace como la de cualquier biblioteca:

In [None]:
import requests

Ahora que ya tenemos todo preparado, es hora de comenzar a utilizar `requests`. Nuestro primer objetivo será aprender a hacer una petición GET.

**Protocolo HTTP**

El Protocolo de Transferencia de Hipertexto (HTTP) está diseñado para permitir la comunicación entre clientes y servidores.

HTTP funciona como un protocolo de petición-respuesta entre un cliente y un servidor. Estas acciones se hacen mediante métodos específicos del protocola HTTP.

*Ejemplo:* un cliente (navegador) envía una petición HTTP al servidor; entonces el servidor devuelve una respuesta al cliente. La respuesta contiene información de estado sobre la solicitud y también puede contener el contenido solicitado.

Los métodos HTTP, como GET y POST, determinan la acción que se intenta realizar al hacer una petición HTTP. GET indica que queremos "conseguir" y POST  es un método HTTP  que  indica que queremos "enviar".

Explicamos lo anterior, debido a que ahora debemos interactuar con servidores HTTP,  no con sistemas de archivos.

**El  método get() de `requests`**

Uno de los métodos HTTP más comunes es GET. El método GET indica que estás tratando de obtener o recuperar datos de un recurso específico. Para hacer una petición GET con  la biblioteca `requests`, hay que invocar  `requests.get()`.

Para probar esto, puedes hacer una petición GET a la API REST raíz de GitHub llamando a `get()` con la siguiente URL:

In [None]:
requests.get('https://api.github.com')

<Response [200]>


¡Excelente! Hemos hecho nuestro primer GET.

Veamos otro ejemplo:

In [None]:
requests.get('https://wikipedia.org')

<Response [200]>

La respuesta 200 en el método `requests.get()` de Python significa que la solicitud HTTP fue exitosa, lo que indica que la solicitud se procesó correctamente y el servidor devolvió una respuesta satisfactoria

¿Qué pasa si queremos explorar un sitio que no existe?

In [None]:
requests.get('https://wikipedia.arg')

Vemos que se produce una excepción y el programa termina. Evidentemente esto puede ocurrir muy frecuentemente, por ejemplo cuando el sitio está caido, y esta situación debería ser manejada con excepciones: debemos hacer los `requests.get()` dentro de un `try()`. Por ejemplo,  

In [None]:
archivo = 'https://wikipedia.org'
try :
    response = requests.get(archivo)
    status_code = response.status_code
except requests.exceptions.RequestException as e:
    print(e)
    status_code = 550
print(type(response))
print(status_code)

<class 'requests.models.Response'>
200


In [None]:
archivo = 'https://wikipedia.arg'
try :
    response = requests.get(archivo)
    status_code = response.status_code
except requests.exceptions.RequestException as e:
    print(e) # imprime en la terminal el error que se produjo
    status_code = 550

print(status_code)

HTTPSConnectionPool(host='wikipedia.arg', port=443): Max retries exceeded with url: / (Caused by NameResolutionError("<urllib3.connection.HTTPSConnection object at 0x7b4edb536260>: Failed to resolve 'wikipedia.arg' ([Errno -2] Name or service not known)"))
550


El valor de `response.status_code` puede ser un código de estado HTTP que indica el resultado de la solicitud. Algunos valores posibles y sus significados son:

- `200`: Indica que la solicitud ha tenido éxito.
- `404`: Significa que el recurso solicitado no se ha encontrado en el servidor.
- `500`: Indica un error interno en el servidor que impide transmitir el recurso solicitado.
- `503`: Muestra que el servidor no está disponible temporalmente debido a sobrecarga o mantenimiento.

En  el ejemplo, luego de intentar recuperar un documento en internet obtenemos la variable `status_code` que nos dice que ocurrió en el intento. Si el valor de `status_code` es `550`, código que definimos nosotros,  significa que el sitio no está disponible.

**Los objetos de la clase `Response`**

El output del método `get()` devuelve un objeto del tipo `Response`. Este es un objeto poderoso que permite inspeccionar los resultados de la solicitud.

Hagamos de nuevo esa misma petición, pero esta vez almacenando el valor de retorno en una variable para que podamos ver más de cerca sus atributos y comportamientos.

No usaremos excepciones para no escribir demasiado, pero siempre deberían usarse con el  método `get()`.

In [None]:
respuesta = requests.get('https://api.github.com')
print(respuesta)

<Response [200]>


En este ejemplo, hemos capturado el valor de retorno de `get()`, que es una instancia de `Response`, y lo almacenamos en una variable llamada `respuesta`. Ahora podemos usar `respuesta ` para ver información sobre los resultados de tu petición GET.

La primera información que se puede obtener de `Response` es el código de estado. Un código de estado nos informa del estado de la solicitud.

Como ya dijimos, un estado `200` significa que su solicitud fue exitosa, mientras que un estado `404 NOT FOUND` significa que el recurso que estaba buscando no fue encontrado. Hay muchos otros códigos de estado posibles que nos dan información específica sobre lo que sucedió con su solicitud.

Con el  atributo `status_code` podemos ver el código de estado que el servidor devolvió:

In [None]:
respuesta.status_code

200

`status_code` devolvió un `200`, lo que significa que la solicitud fue exitosa y el servidor respondió con los datos que solicitamos.

Además del código de estado 200 que indica una solicitud exitosa, el método `requests.get()` en Python puede devolver otros códigos de estado que indican diferentes tipos de respuestas del servidor:

- 301 (Moved Permanently): Indica que el recurso solicitado se ha movido permanentemente a una nueva ubicación. La nueva URL se especifica en el encabezado "Location" de la respuesta.

- 302 (Found): Indica que el recurso solicitado se ha movido temporalmente a una nueva ubicación. La nueva URL se especifica en el encabezado "Location" de la respuesta.

- 401 (Unauthorized): Indica que se requiere autenticación para acceder al recurso solicitado.

- 403 (Forbidden): Indica que el servidor ha entendido la solicitud pero se niega a autorizarla.

- 404 (Not Found): Indica que el servidor no pudo encontrar el recurso solicitado.

- 500 (Internal Server Error): Indica que ha ocurrido un error inesperado en el servidor que le impide procesar la solicitud.

- 502 (Bad Gateway): Indica que el servidor está actuando como una puerta de enlace o proxy y ha recibido una respuesta inválida del servidor upstream.

- 503 (Service Unavailable): Indica que el servidor no está listo para manejar la solicitud debido a un mantenimiento temporal u otros problemas.

Estos códigos de estado se agrupan en rangos que indican el tipo de respuesta:

- 1xx (Informational): Indica que la solicitud se recibió y se está procesando.
- 2xx (Successful): Indica que la solicitud se recibió, se entendió y se aceptó con éxito.
- 3xx (Redirection): Indica que se requiere acción adicional para completar la solicitud.
- 4xx (Client Error): Indica que hay un error en la solicitud del cliente.
- 5xx (Server Error): Indica que ha ocurrido un error en el servidor.

En resumen, además del código 200 que indica una solicitud exitosa, `requests.get()` puede devolver otros códigos de estado que proporcionan información sobre el resultado de la solicitud HTTP.

**El contenido**

La respuesta de una solicitud GET a menudo tiene alguna información valiosa, conocida como *carga útil* o *payload* (en inglés), en el cuerpo del mensaje. Utilizando los atributos y métodos de los objetos de la clase `Response`, podemos ver la carga útil en una variedad de formatos diferentes.

Para ver el contenido de la respuesta en bytes, se utiliza `.content`:

In [None]:
respuesta = requests.get('https://api.github.com')
print(respuesta.content)

b'{"current_user_url":"https://api.github.com/user","current_user_authorizations_html_url":"https://github.com/settings/connections/applications{/client_id}","authorizations_url":"https://api.github.com/authorizations","code_search_url":"https://api.github.com/search/code?q={query}{&page,per_page,sort,order}","commit_search_url":"https://api.github.com/search/commits?q={query}{&page,per_page,sort,order}","emails_url":"https://api.github.com/user/emails","emojis_url":"https://api.github.com/emojis","events_url":"https://api.github.com/events","feeds_url":"https://api.github.com/feeds","followers_url":"https://api.github.com/user/followers","following_url":"https://api.github.com/user/following{/target}","gists_url":"https://api.github.com/gists{/gist_id}","hub_url":"https://api.github.com/hub","issue_search_url":"https://api.github.com/search/issues?q={query}{&page,per_page,sort,order}","issues_url":"https://api.github.com/issues","keys_url":"https://api.github.com/user/keys","label_sea

In [None]:
respuesta = requests.get('https://es.wikipedia.org')
respuesta.content

b'<!DOCTYPE html>\n<html class="client-nojs vector-feature-language-in-header-enabled vector-feature-language-in-main-page-header-disabled vector-feature-sticky-header-disabled vector-feature-page-tools-pinned-disabled vector-feature-toc-pinned-clientpref-1 vector-feature-main-menu-pinned-disabled vector-feature-limited-width-clientpref-1 vector-feature-limited-width-content-disabled vector-feature-custom-font-size-clientpref-1 vector-feature-appearance-enabled vector-feature-appearance-pinned-clientpref-1 vector-feature-night-mode-disabled skin-theme-clientpref-day vector-toc-not-available" lang="es" dir="ltr">\n<head>\n<meta charset="UTF-8">\n<title>Wikipedia, la enciclopedia libre</title>\n<script>(function(){var className="client-js vector-feature-language-in-header-enabled vector-feature-language-in-main-page-header-disabled vector-feature-sticky-header-disabled vector-feature-page-tools-pinned-disabled vector-feature-toc-pinned-clientpref-1 vector-feature-main-menu-pinned-disable

Mientras que `.content` le da acceso a los bytes brutos de la carga útil de la respuesta, a menudo querremos convertirlos en una cadena utilizando una codificación de caracteres como UTF-8. `Response` lo hará por nosotros cuando accedamos a `.text`:

In [None]:
print(respuesta.text)

<!DOCTYPE html>
<html class="client-nojs vector-feature-language-in-header-enabled vector-feature-language-in-main-page-header-disabled vector-feature-sticky-header-disabled vector-feature-page-tools-pinned-disabled vector-feature-toc-pinned-clientpref-1 vector-feature-main-menu-pinned-disabled vector-feature-limited-width-clientpref-1 vector-feature-limited-width-content-disabled vector-feature-custom-font-size-clientpref-1 vector-feature-appearance-enabled vector-feature-appearance-pinned-clientpref-1 vector-feature-night-mode-disabled skin-theme-clientpref-day vector-toc-not-available" lang="es" dir="ltr">
<head>
<meta charset="UTF-8">
<title>Wikipedia, la enciclopedia libre</title>
<script>(function(){var className="client-js vector-feature-language-in-header-enabled vector-feature-language-in-main-page-header-disabled vector-feature-sticky-header-disabled vector-feature-page-tools-pinned-disabled vector-feature-toc-pinned-clientpref-1 vector-feature-main-menu-pinned-disabled vecto

Dado que la decodificación de bytes a una cadena requiere un esquema de codificación, las peticiones intentarán adivinar la codificación basándose en las cabeceras de la respuesta si no se especifica una.

In [None]:
print(respuesta.text)

**Headers (cabeceras)**
Las headers pueden proporcionar información útil, como el tipo de contenido de la carga útil de la respuesta y un límite de tiempo para almacenar en caché la respuesta. Para ver estas cabeceras, acceda a `.headers`:

In [None]:
respuesta.headers

{'date': 'Mon, 27 May 2024 00:12:12 GMT', 'server': 'mw-web.eqiad.main-5b6c8cbc9d-c5z8x', 'x-content-type-options': 'nosniff', 'content-language': 'es', 'origin-trial': 'AonOP4SwCrqpb0nhZbg554z9iJimP3DxUDB8V4yu9fyyepauGKD0NXqTknWi4gnuDfMG6hNb7TDUDTsl0mDw9gIAAABmeyJvcmlnaW4iOiJodHRwczovL3dpa2lwZWRpYS5vcmc6NDQzIiwiZmVhdHVyZSI6IlRvcExldmVsVHBjZCIsImV4cGlyeSI6MTczNTM0Mzk5OSwiaXNTdWJkb21haW4iOnRydWV9', 'accept-ch': '', 'vary': 'Accept-Encoding,Cookie,Authorization', 'last-modified': 'Mon, 27 May 2024 00:11:29 GMT', 'content-type': 'text/html; charset=UTF-8', 'content-encoding': 'gzip', 'age': '46921', 'x-cache': 'cp1102 miss, cp1102 hit/4958', 'x-cache-status': 'hit-front', 'server-timing': 'cache;desc="hit-front", host;desc="cp1102"', 'strict-transport-security': 'max-age=106384710; includeSubDomains; preload', 'report-to': '{ "group": "wm_nel", "max_age": 604800, "endpoints": [{ "url": "https://intake-logging.wikimedia.org/v1/events?stream=w3c.reportingapi.network_error&schema_uri=/w3c/re

In [None]:
print(type(respuesta.headers))
print(respuesta.headers['date'])
print(respuesta.headers['DATE'])

<class 'requests.structures.CaseInsensitiveDict'>
Mon, 27 May 2024 00:12:12 GMT
Mon, 27 May 2024 00:12:12 GMT


`.headers` devuelve un objeto similar a un diccionario, que permite acceder a los valores de las cabeceras por su clave. Por ejemplo, para ver el tipo de contenido de la carga útil de la respuesta, puede acceder a Content-Type:

In [None]:
respuesta.headers['Content-Type']

'text/html; charset=UTF-8'

Sin embargo, hay algo especial en este objeto de cabecera tipo diccionario. La especificación HTTP define que las cabeceras no distinguen entre mayúsculas y minúsculas, lo que significa que podemos acceder a estas cabeceras sin preocuparnos por sus mayúsculas:

In [None]:
respuesta.headers['content-type']

'text/html; charset=UTF-8'

Tanto si utilizamos la clave `'content-type'` como `'Content-Type'`, obtendremos el mismo valor.

## 6. Ejemplo: contando las vocales de un sitio

Haremos un script que solicita el nombre de un sitio y  si el sitio existe cuenta cuantas ocurrencias tiene cada vocal no acentuada. Además el script devuelve un código. Si el sitio existe y está accesible el código devuelto es `200`. Si el sitio no existe o está caido u otro problema, devuelve el código del problema.

Escribimos el escript completo y luego ingresemos tres sitios para ver como funciona: primero `https://wikipedia.org`,  que es un nombre válido, luego `wikipedia.org`, que no es válido y finalmente `https://wikipedia.arg`,  que tampoco es válido.

In [None]:
import requests

def solicitar_nombre_del_sitio():
    """
    Solicita el nombre de un sitio web
    """
    nombre_sitio = input("Ingrese un sitio web: ").strip()
    return nombre_sitio


def contar_vocales(sitio):
    """
    pre: sitio es un nómbre de un sitio web (debe incluir http o https en su nombre)
    post: devuelve la ocurrencia de cada vocal no acentuada
    """
    contador = {'a' : 0, 'e' : 0, 'i' : 0, 'o' : 0, 'u' : 0}
    try :
        response = requests.get(sitio)
        status_code = response.status_code
    except requests.exceptions.RequestException as e:
        print(e) # imprime en la terminal el error que se produjo
        status_code = 550
    if status_code == 200:
        texto_sitio = response.text.lower()
        for letra in texto_sitio:
            if letra in contador.keys():
                contador[letra] += 1
    return contador, status_code


def main():
    sitio = solicitar_nombre_del_sitio()
    # probar con https://wikipedia.org, wikipedia.org y https://wikipedia.arg
    vocales, status_code = contar_vocales(sitio)
    print(vocales)
    print(status_code)

if __name__ == "__main__":
    main()

Ingrese un sitio web: wikipedia.org
Invalid URL 'wikipedia.org': No scheme supplied. Perhaps you meant https://wikipedia.org?
{'a': 0, 'e': 0, 'i': 0, 'o': 0, 'u': 0}
550


El código que devuelve en la segunda coordenada la  función `contar_vocales()` nos permite saber que ocurrió cuando se quizo acceder al sitio y nos permite saber que el resultado es válido si y solo si  ese código  es `200`.