# Interacción con archivos CSV, XML y JSON

Es común que cuando interactuamos y obtenemos datos de páginas o sitios de Internet estos datos se encuentren en formatos estructurados. Veremos a continuación, brevemente, como podemos obtener datos de archivos CSV, XML y JSON.

## 1. Archivos CSV

La forma estructurada más sencilla de información es un archivo CSV,  que es similar a una hoja de una planilla de cálculo.

Un archivo CSV (Comma Separated Values) es un tipo de archivo de texto que se utiliza comúnmente para almacenar datos tabulares. Los datos en un archivo CSV se organizan en filas y columnas, donde cada fila corresponde a un registro y cada columna corresponde a un campo en ese registro. Los campos en un archivo CSV se separan por un carácter delimitador, como una coma, un punto y coma o una tabulación.

Cada registro en un archivo CSV se almacena en una nueva línea, y los valores de los campos pueden estar rodeados de comillas dobles si contienen el carácter delimitador. Por ejemplo, el siguiente es un ejemplo de un archivo CSV que contiene información sobre personas:

    nombre,edad,ciudad
    Juan,30,"Quito, Centro"
    María,25,Medellín
    Pedro,40,Lima

En este ejemplo, la primera línea del archivo CSV contiene los nombres de los campos (`nombre`, `edad` y `ciudad`), mientras que las siguientes líneas contienen los datos de los registros.

Los archivos CSV son una forma común de intercambiar datos entre diferentes programas o sistemas, ya que son un formato simple y legible por humanos. También se pueden abrir y editar fácilmente en programas de hojas de cálculo, como Microsoft Excel o Google Sheets.

Por otro lado,  tiene la limitación de que la información se puede estructurar unicamente en filas y columnas.


Construyamos un ejemplo sencillo:

In [1]:
with open('archivo.csv', 'w') as csvfile:
    csvfile.write('nombre, edad,ciudad\n')
    csvfile.write('"Perez,Juan", 30, Quito\n')
    csvfile.write('María, 25, Medellín\n')
    csvfile.write('Pedro, 40, Lima\n')

Para leer un archivo CSV en Python, puede utilizar el módulo `csv`. Este módulo proporciona una forma fácil de leer y escribir archivos CSV. A continuación, se muestra un ejemplo de cómo leer un archivo CSV y obtener los valores de los campos:

Usaremos un archivo CSV  que recién hemos creado. 

Para leer este archivo, se puede usar el siguiente código en Python:

In [2]:
import csv

# abre el archivo CSV en modo lectura
with open('archivo.csv', newline='') as csvfile:
    reader = csv.reader(csvfile, delimiter=',', quotechar='"') # crea un objeto reader de CSV
    valores = []
    # iteramos sobre las filas del archivo CSV:
    for fila in reader:
        valores.append(fila)


En este código, usamos  `with open()` para abrir el archivo CSV en modo lectura. A continuación, creamos un objeto lector de CSV usando la función `csv.reader()`. Este objeto lector toma el archivo CSV y los parámetros `delimiter` y `quotechar`, que indican el carácter delimitador y el carácter de comillas, respectivamente. En este ejemplo, estamos usando comas como delimitadores y comillas dobles como caracteres de comillas.

Luego, iteramos sobre las filas del archivo CSV utilizando un ciclo `for`. Guardamos las filas del archivo CSV  en la lista `valores` .

Imprimamos su contenido:

In [None]:

for i in range(min(10, len(valores))):
    fila = valores[i]
    print(fila[0], fila[1], fila[2])

En resumen, para leer un archivo CSV en Python, puede usar el módulo `csv` y la función `csv.reader()`. Para obtener los valores de los campos, simplemente iteramos sobre el objeto `reader`.

También podríamos haber hecho `valores = list(reader)` e iteramos sobre la lista.

Finalmente,  como la primera fila son los id de los campos, no son valores que nos interesan. Una forma eficiente de leer solo los valores es la siguiente:

In [6]:
with open('archivo.csv', newline='') as csvfile:
    reader = csv.reader(csvfile, delimiter=',', quotechar='"') # crea un objeto reader de CSV
    next(reader) # salta la primera fila
    valores = []
    for fila in reader:
        valores.append(fila)

E imprimimos su contenido:

In [None]:
print(valores)

## 2. Lectura y escritura de archivos JSON

JSON, cuyo nombre corresponde a las siglas *JavaScript Object Notation* o *Notación de Objetos de JavaScript*, es un formato ligero de intercambio de datos, que resulta sencillo de leer y escribir para los programadores y simple de interpretar y generar para las máquinas.

JSON es un formato de texto completamente independiente de lenguaje y puede ser interpretado y creado por los siguientes lenguajes:

- C
- C++
- C#
- Java
- JavaScript
- Perl
- Python
- etc.

Muchos lenguajes de programación proporcionan métodos para analizar una cadena de texto con este formato en un objeto nativo y viceversa.

Pese a su nombre, no es necesariamente parte de JavaScript, de hecho, es un estándar basado en texto plano para el intercambio de datos, por lo que se usa en muchos sistemas que requieren mostrar o enviar información para ser interpretada por otros sistemas.

Una de las características de JSON, al ser un formato que es independiente de cualquier lenguaje de programación, es que los servicios que comparten información por este método no necesitan hablar el mismo idioma, es decir, el emisor puede ser Java y el receptor Python, pues cada uno tiene su propia librería para codificar y decodificar cadenas en este formato.



La estructura de los documentos JSON se basa en dos estructuras de datos fundamentales:

**Objetos.** Son conjuntos no ordenados de pares clave-valor, donde las claves son cadenas de texto y los valores pueden ser de cualquier tipo de dato válido en JSON.

Ejemplo de un objeto JSON:

```
{
    "nombre": "Pepito Conejo",
    "edad": 25,
    "carnet_de_conducir": true
}
```

**Matrices.** Son listas ordenadas de valores que pueden ser de cualquier tipo de dato.

Ejemplo de una matriz JSON:

```
[1, "pepe", 3.14, "Pepito Conejo"]
```

Dentro de una matriz puede haber datos, objetos JSON o matrices. 

Como habrán notado, lo notable de JSON  es que los archivos de texto en formato JSON son muy parecidos a los diccionarios y listas de Python,  con una sintaxis idéntica.

Ahora veremos como convertir objetos de Ptyhon que son combinación de diccionarios y listas a un cadena que puede ser guardada como archivo JSON. 

Primero creemos el objeto: será una lista de diccionarios,  cada diccionario tendrá un `id` como clave cuyo valor será un número entero, los haremos consecutivos, y tres claves más `min`, `max`, `prom`, donde `min` es un número aleatorio del  $0$ al $1000$, `max` es un número aleatorio del $1001$ al $2000$ y `prom` es el promedio de `min` y `max`.



In [None]:
from random import randint
lista = []
for i in range(10):
    mini_, maxi_ = randint(0, 1000), randint(1001, 2000)
    lista.append({'id': i, 'min': mini_, 'max': maxi_, 'prom': (mini_ + maxi_) / 2})

print(lista)


Ahora transformemos el objeto lista a una cadena JSON. Para ellos utilizamos `json.dumps()` que transforma un diccionario o lista en una cadena con  estructura JSON. 

In [None]:
import  json

json_ = json.dumps(lista) # transforma a JSON (es una str)

with open('archivo.json', 'w') as f:
    f.write(json_) # guarda el JSON en el archivo

print(json_)

La  variable  `json_` es de tipo `str` y cuando la imprimimos queda muy parecida a `print(lista)`, pero que quede claro  que `lista`, una lista, es un objeto muy diferente a  `json_`, una cadena.

Ahora recuperemos el archivo que contiene JSON con las estructuras correspondientes (listas, diccionarios). Para hacer esto  utilizaremos `json.loads()` que transforma una cadena JSON en listas y diccionarios. 

In [None]:
with open('archivo.json', 'r') as f:
    data = f.read() # data es una str

archivo = json.loads(data) # el archivo es (en este caso) una lista de diccionarios
print('Tipo del archivo:', type(archivo))
print('Tipo del primer elemento del archivo:',type(archivo[0]))

print('\nImprimimos todo el archivo:')
print(archivo)

print('\nImprimimos alguna información del archivo:')
for item in archivo:
    print(item['prom'])

Veamos otro ejemplo de  `json.dumps()`:

In [4]:
import json
u = {'a': {2 : 0 }, 'b': {1 : 5 }} # u es un diccionario
cadena = str(u)
print('cadena:', type(cadena),cadena)
# dic = json.loads(cadena) # no  funciona
print ('Un diccionario:\t\t\t',type(u), u)
x = json.dumps(u) # transforma a JSON (es una str)
print('Un JSON:\t\t\t', type(x), x)
y = json.loads(x)
print('De nuevo un diccionario:\t',type(y), y)

cadena: <class 'str'> {'a': {2: 0}, 'b': {1: 5}}
Un diccionario:			 <class 'dict'> {'a': {2: 0}, 'b': {1: 5}}
Un JSON:			 <class 'str'> {"a": {"2": 0}, "b": {"1": 5}}
De nuevo un diccionario:	 <class 'dict'> {'a': {'2': 0}, 'b': {'1': 5}}


Observar que el diccionario original cambia las claves numérica de *TODOS* los diccionarios a tipo `str`, incluso los diccionarios que son valores de otro diccionario.

Los valores numéricos se mantienen numéricos. Si un valor es un lista,  se mantiene lista.

**Ejemplo.** Crearemos una lista de diccionarios y queremos escribir uno por línea en un archivo, para que luego sea leido usando `json.loads()`.

En  la celda de código siguiente implementamos un ejemplo: creamos una lista con 100 diccionarios tipo


`{'x' : entero al azar, 'y' : entero al azar, nº de orden en la lista : [entero al azar, entero al azar] }` 

y los guardaremos en el archivo `prueba.txt`, uno en cada linea utilizando `json.dumps()`.

In [None]:
import json
import random



lista_dic = []
for i in range(100):
  x, y, w0, w1 = random.randint(1, 1000), random.randint(1, 1000), random.randint(1, 1000), random.randint(1, 1000)
  lista_dic.append({ 'x' : x, 'y' : y, i : [w0 , w1]})

# Guardamos en el archivo prueba.txt, línea por línea el diccionario.

with open('prueba.txt', 'w') as f:
    for i in range(len(lista_dic)):
        f.write(json.dumps(lista_dic[i])+'\n') # \n pasa de renglón

# Revisar el archivo prueba.txt

Para leer debemos hacerlo también linea por linea, pues el archivo no tiene la estructura lógica de un diccionario o lista (debería abrir con `{` o `[` y cerrar con `}` o  `]`,  respectivamente). Haremos una lista de diccionarios a partir de `prueba.txt`.

In [None]:
lista_dic2 = []
with open('prueba.txt', 'r') as f:
    for linea in f:
        lista_dic2.append(json.loads(linea))

print(lista_dic2)

print(type(lista_dic2[3]), lista_dic2[3]) # comprobamos que cada coordenada
# es un diccionario

# Importante:  las claves numéricas pasaron a str. Los valores matienen su tipo (int, list, etc)
print(lista_dic[3][3])
print(lista_dic2[3]['3']) # No estaría bien  print(lista_dic2[3][3])

*Ejemplos de cosas que  **NO** funcionan.*


In [None]:
import json
# Si hacemos json.dumps()  de una string, Python lo hace, pero no es el resultado que esperamos.
x = json.dumps("{'a': {2 : 0 }, 'b': {1 : 5 }}")
print(type(x), x)
y = json.loads(x)
print(type(y), y) # json.loads() en este caso devuelve una string!
# y es una string que "parece" un diccionario. Pero no lo es.
# z = json.loads(y) #  esto directamente da error


**Recomendación:** Usar `json.loads()` y `json.dumps()` de forma prolija y de acuerdo a los lineamientos escritos más arriba. Quizás haciendo aguna  "magia" con los `replace()` se pueda arreglar la celda de código anterior, pero es mejor no hacerlo.

## 3. Lectura de archivos JSON en internet


Para leer un archivo JSON desde internet utilizando el módulo `requests` en Python, se puede hacer lo siguiente:

    import requests

Hcemos una solicitud HTTP GET al servidor que contiene el archivo JSON utilizando la función `get()` de `requests`. La respuesta de la solicitud será un objeto `Response` que contiene la información de la respuesta del servidor.

    response = requests.get(url)

Donde `url` es la dirección URL del archivo JSON que deseamos leer.

Verificamos que la solicitud se haya realizado correctamente en base al código de estado de la respuesta. Si el código de estado es `200`, significa que la solicitud se realizó correctamente.

Si la solicitud se realizó correctamente, puedes acceder al contenido del archivo JSON utilizando el método `json()` del objeto `Response`. Este método decodifica el contenido JSON y devuelve un objeto Python que representa los datos del archivo JSON.

    if response.status_code == 200:
        # El archivo JSON fue encontrado y cargado correctamente
        data = response.json()
    else:
        print('Hubo un problema al cargar el archivo JSON')

El objeto data ahora contiene los datos del archivo JSON, los cuales podemos utilizar en tu programa como cualquier otro objeto Python.

**Ejemplo.** Leeremos un archivo de internet con los siguientes datos:  

    {"catalog":
        {"book":
        [
            {"@id": "bk101",
                "author": ["Gambardella, Matthew"],
                "title": "XML Developer's Guide",
                "genre": "Computer",
                "price": "44.95",
                "publish_date": "2000-10-01",
                "description": "An in-depth look at creating applications with XML."},
            {"@id": "bk102",
                "author": ["Ralls, Kim", "Gambardella, Matthew"],
                "title": "Midnight Rain",
                "genre": "Fantasy",
                "price": "5.95",
                "publish_date": "2000-12-16",
                "description": "A former architect battles ..."},
            ...
            ...
        ]
        }
    }

El archivo completo se encuentra en

    https://raw.githubusercontent.com/tirabo/Algoritmos-y-Programacion/main/2023/archivos/books.json

Leamos el archivo:

In [5]:
import requests

url = 'https://raw.githubusercontent.com/tirabo/Algoritmos-y-Programacion/main/2023/archivos/books.json'
response = requests.get(url)

if response.status_code == 200:
    # El archivo JSON fue encontrado y cargado correctamente
    data = response.json()
else:
    print('Hubo un problema al cargar el archivo JSON')
print(response.status_code)

200


Imprimamos su contenido:

In [6]:
print(type(data))
print(data)

<class 'dict'>
{'catalog': {'book': [{'@id': 'bk101', 'author': ['Gambardella, Matthew'], 'title': "XML Developer's Guide", 'genre': 'Computer', 'price': '44.95', 'publish_date': '2000-10-01', 'description': 'An in-depth look at creating applications with XML.'}, {'@id': 'bk102', 'author': ['Ralls, Kim', 'Gambardella, Matthew'], 'title': 'Midnight Rain', 'genre': 'Fantasy', 'price': '5.95', 'publish_date': '2000-12-16', 'description': 'A former architect battles corporate zombies, an evil sorceress, and her own childhood to become queen of the world.'}, {'@id': 'bk103', 'author': ['Corets, Eva'], 'title': 'Maeve Ascendant', 'genre': 'Fantasy', 'price': '5.95', 'publish_date': '2000-11-17', 'description': 'After the collapse of a nanotechnology society in England, the young survivors lay the foundation for a new society.'}, {'@id': 'bk104', 'author': ['Corets, Eva'], 'title': "Oberon's Legacy", 'genre': 'Fantasy', 'price': '5.95', 'publish_date': '2001-03-10', 'description': 'In post-ap

Luego si deseamos obtener metadatos del primer libro podemos hacer:

In [7]:
data['catalog']['book'][0]

{'@id': 'bk101',
 'author': ['Gambardella, Matthew'],
 'title': "XML Developer's Guide",
 'genre': 'Computer',
 'price': '44.95',
 'publish_date': '2000-10-01',
 'description': 'An in-depth look at creating applications with XML.'}

Si deseamos imprimir los títulos de todos los libros podemos hacer:

In [None]:
for libro in data['catalog']['book']:
    print(libro['title'])

## 4. Lectura y escritura de archivos XML

Un archivo XML (Extensible Markup Language) es un tipo de archivo de texto que se utiliza para almacenar y transportar datos de manera estructurada. Un archivo XML está compuesto por una serie de etiquetas que definen elementos y atributos que describen la estructura y los datos contenidos en el archivo.

Cada elemento en un archivo XML está compuesto por una etiqueta de apertura y una etiqueta de cierre, y puede contener elementos anidados y atributos. Por ejemplo, el siguiente es un ejemplo simple de un archivo XML que contiene información sobre una persona:

    <persona>
    <nombre>Juan</nombre>
    <edad>30</edad>
    <ciudad>Córdoba</ciudad>
    </persona>

En este ejemplo, el elemento `persona` es el elemento raíz del archivo XML, y contiene tres elementos anidados: `nombre`, `edad` y `ciudad`. Cada uno de estos elementos tiene un valor asociado, que se encuentra entre las etiquetas de apertura y cierre.

Los archivos XML se utilizan comúnmente para intercambiar datos entre diferentes sistemas o aplicaciones, ya que proporcionan una forma estructurada y legible por máquinas para representar la información. También se pueden utilizar para definir y describir documentos y aplicaciones complejas, como documentos de ayuda en línea, aplicaciones web y formatos de archivo personalizados.

Esta estructura se puede implmentar en JSON también:


    {'persona':  [{'nombre': 'Juan'}, {'edad': '30'}, {'ciudad': 'Córdoba'}]

Obviamente hay otras formas de hacerlo.


### 4.1. Elementos y atributos
En XML, los *elementos* son las partes principales de un documento XML y representan los distintos elementos de información que se están describiendo en el documento. Los elementos tienen un nombre que los identifica y pueden contener *otros elementos*, *atributos* o *texto*.

Por ejemplo, en el siguiente fragmento de código XML, `<trkpt>` y `<ele>` son elementos:

    <trkpt lat="-30.9424310" lon="-64.2770290">
        <ele>740.7</ele>
    </trkpt>

Los *atributos*, por otro lado, proporcionan información adicional sobre los elementos y se utilizan para describir características específicas del elemento. Los atributos se incluyen dentro de la etiqueta del elemento y tienen un nombre y un valor.

En el ejemplo anterior, `lat` y `lon` son atributos del elemento `<trkpt>`. El valor de los atributos se especifica entre comillas dobles después del nombre del atributo, separado por un signo igual.

Los elementos y atributos en XML se utilizan para estructurar y describir los datos de forma clara y organizada. Los elementos proporcionan la estructura general del documento XML y los atributos permiten proporcionar información adicional sobre los elementos.

### 4.2. xml.dom

La biblioteca `xml.dom` de Python es una biblioteca estándar que proporciona una forma de analizar y manipular documentos XML mediante el modelo de objetos del documento (DOM, por sus siglas en inglés). El modelo DOM representa el documento XML como un árbol de nodos, donde cada nodo representa un elemento, atributo, texto u otro tipo de contenido en el documento.

Para obtener elementos y atributos de un documento XML utilizando la biblioteca xml.dom, puedes seguir estos pasos:

Importar la biblioteca y abrir el archivo XML:

    import xml.dom.minidom
    # Abrir archivo XML
    doc = xml.dom.minidom.parse("archivo.xml")


Si los datos vienen dados por una cadena, en vez de un archivo,  cambia un poco el código:

    import xml.dom.minidom
    # Abrir cadena XML
    doc = xml.dom.minidom.parseString(xml_string)

Obtener los elementos del documento mediante el método `getElementsByTagName`:

    # Obtener elementos
    elementos = doc.getElementsByTagName("nombre_del_elemento")
Obtener los atributos de un elemento mediante el método `getAttribute`:

    # Obtener atributo
    valor_atributo = elementos[0].getAttribute("nombre_del_atributo")
Obtener el contenido de un elemento mediante el método `firstChild.nodeValue`:

    # Obtener contenido
    contenido = elementos[0].firstChild.nodeValue
En el ejemplo anterior, se utiliza `xml.dom.minidom` para parsear el archivo XML y convertirlo en un objeto `Document`. Luego, se utiliza el método `getElementsByTagName` para obtener todos los elementos del documento con un nombre de etiqueta específico. Una vez que se tienen los elementos, se pueden obtener sus atributos utilizando el método `getAttribute` y su contenido utilizando la propiedad `firstChild.nodeValue`.

Es importante tener en cuenta que el método `getElementsByTagName` devuelve una lista de elementos, incluso si solo hay un elemento con el nombre de etiqueta especificado en el documento. Por lo tanto, en el ejemplo anterior se utiliza `elementos[0]` para acceder al primer elemento de la lista. Si se espera que solo haya un elemento con el nombre de etiqueta especificado en el documento, se puede utilizar `getElementsByTagName(nombre_del_elemento)[0]` para obtener directamente ese elemento.

### 4.3. Ejemplo
Veamos ahora un archivo XML de internet,  con una estructura no demasiado complicada pero con más registros. El archivo que vamos a leer es `books.xml` y su estrucura es:

    <?xml version="1.0"?>
    <catalog>
    <book id="bk101">
        <author>Gambardella, Matthew</author>
        <title>XML Developer's Guide</title>
        <genre>Computer</genre>
        <price>44.95</price>
        <publish_date>2000-10-01</publish_date>
        <description>An in-depth look at creating applications
        with XML.</description>
    </book>
    <book id="bk102">
        <author>Ralls, Kim</author>
        <author>Gambardella, Matthew</author>
        <title>Midnight Rain</title>
        <genre>Fantasy</genre>
        <price>5.95</price>
        <publish_date>2000-12-16</publish_date>
        <description>A former architect battles corporate zombies,
        an evil sorceress, and her own childhood to become queen
        of the world.</description>
    </book>
        ...
        ...
    </catalog>

Es decir, es un catálogo de libros y  cada libro contiene información sobre el título,  su autor o autores,  etc. Observar que este archivo no puede ser representado en formato CSV, pues el elemento `author`se puede repetir un número indeterminado de veces.

La ubicación del archivo es

    https://raw.githubusercontent.com/tirabo/Algoritmos-y-Programacion/main/2023/archivos/books.xml

In [8]:
import requests

respuesta = requests.get('https://raw.githubusercontent.com/tirabo/Algoritmos-y-Programacion/main/2023/archivos/books.xml')
xml_string = respuesta.content
respuesta.status_code

200

`200` nos indica que el archivo ha sido leido sin inconvenientes.

Ahora procederemos a "parsear"  el archivo (que es un XML), usando las instrucciones que vimos más arriba:

In [10]:
import xml.dom.minidom
# Abrir cadena XML
dom = xml.dom.minidom.parseString(xml_string) # cuando viene dado por una cadena
print('tipo  de dom:', type(dom))
# Obtener elementos
elementos = dom.getElementsByTagName("book")
print('El  primer elemento book:',elementos[0])
print('El  segundo elemento book:',elementos[1])
# Obtener atributo
valor_atributo = elementos[0].getAttribute("id")
print('Atributo \'id\' del primer elemento \'book\':', valor_atributo)
valor_atributo_1 = elementos[1].getAttribute("id")
print('Atributo \'id\' del segundo elemento \'book\':', valor_atributo_1)

# Obtener contenido
contenido = elementos[0].firstChild.nodeValue
print(type(contenido),':', contenido) # no hay contenido de texto
autor = elementos[0].getElementsByTagName("author")
contenido = autor[0].firstChild.nodeValue
print('El primer autor del primer libro es:', type(contenido),':', contenido)


tipo  de dom: <class 'xml.dom.minidom.Document'>
El  primer elemento book: <DOM Element: book at 0x222f0b5b6d0>
El  segundo elemento book: <DOM Element: book at 0x222f0ed68c0>
Atributo 'id' del primer elemento 'book': bk101
Atributo 'id' del segundo elemento 'book': bk102
<class 'str'> : 
      
El primer autor del primer libro es: <class 'str'> : Gambardella, Matthew


Observar que el segundo libro tiene dos autores, por lo tanto para recuperar todos los autores por cada `id` podemos hacer:

In [None]:
libros = []
for elemento in elementos:
    id_libro = elemento.getAttribute("id")
    autores_obj = elemento.getElementsByTagName("author")
    autores = []
    for autor in autores_obj:
        autores.append(autor.firstChild.nodeValue)
    libros.append((id_libro,  autores))

for libro in libros:
    print(libro)


## 5. Uso de APIs

Una API (Interfaz de Programación de Aplicaciones) es un conjunto de reglas y protocolos que permite que diferentes aplicaciones de software se comuniquen e intercambien datos entre sí. Es como un puente que conecta aplicaciones y les permite compartir información y funcionalidades.


Por ejemplo, (ver [2]), si se tiene una app para móviles acerca de recetas y se hace una búsqueda de una determinada receta, se puede utilizar una API para que esta aplicación se comunique con el sitio web de recetas y pida las recetas que cumplen con los criterios de búsqueda. La API entonces se encarga de recibir la solicitud, buscar las recetas apropiadas y regresar los resultados a la aplicación. Una API es una forma de conectar diferentes aplicaciones y hacer que trabajen juntas de manera más eficiente y efectiva.

Las APIS *no* son lenguaje dependientes,  es decir cualquier lenguaje moderno de programación (Python, Java, C++, etc) puede invocar y utilizar una API bien definida.

Algunas características clave de las APIs:

- Permiten que aplicaciones se comuniquen de manera segura y controlada, sin exponer todos los detalles internos de cada sistema. [1][2][4]
- Proporcionan una forma estandarizada y documentada para que los desarrolladores puedan acceder a los datos y funcionalidades de otras aplicaciones. [1][2][4]
- Facilitan el desarrollo de aplicaciones al permitir reutilizar funciones y datos existentes, en lugar de tener que crearlos desde cero. [1][4]
- Pueden ser públicas (abiertas al público), privadas (solo para uso interno) o asociadas a socios comerciales. [1][4]
- Utilizan protocolos como HTTP, REST y SOAP para definir cómo se realizan las solicitudes y respuestas entre aplicaciones. [3][4]

En resumen, las APIs son la forma en que las aplicaciones se comunican y comparten información de manera segura y estandarizada, lo que permite a los desarrolladores crear nuevas funcionalidades y experiencias de usuario más rápidamente. [1][4]

Referencias:

- [1] https://www.ibm.com/topics/api
- [2] https://es.wikipedia.org/wiki/API
- [3] https://www.techtarget.com/searchapparchitecture/definition/application-program-interface-API
- [4] https://www.mulesoft.com/resources/api/what-is-an-api
- [5] https://www.computer.org/publications/tech-news/trends/what-are-apis/

### Ejemplo: la API del NOAA

La Oficina Nacional de Administración Oceánica y Atmosférica (National Oceanic and Atmospheric Administration, NOAA) es una agencia científica del Departamento de Comercio de los Estados Unidos cuyas actividades se centran en monitorear las condiciones de los océanos y la atmósfera.

El NOAA ofrece distintos *datasets* (conjuntos de datos estructurados) sin limitaciones. Los datos puedes ser bajados directamente del sitio web https://www.noaa.gov/ o, alternativamente, accedidos por API.

En esta sección accederemos a los datasets utilizando la API. Para utilizar la API se debe solicitar  un *token* al NOAA (ver *Referencias*, más abajo). El token es una cadena de caracteres que funciona como id y password al mismo tiempo.

Ahora utilizaremos un token obtenido para esta clase,  pero pueden obtener rápidamente una en forma individual.

Si al comienzo ponemos

    import requests
    token = 'nuestro token'
    my_headers = {'token' : token}
    response = requests.get('https://www.ncdc.noaa.gov/cdo-web/api/v2/datasets', headers=my_headers)
    respuesta = response.json()
    resultados = respuesta['results'] # Datasets disponible
    for w in resultados:
      pass
      print(w['uid'],':',w['name'])

obtendremos el `id` de cada uno de los datasets ofrecidos por el NOAA via API y una breve descripción de los mismos.

Implementamos el código de más arriba agregando el token y  excepciones para que el código sea más robusto.



In [1]:
import requests
token = 'LsJXpYprYMzOKjMtqAlDmMUzwGelIQDf'
my_headers = {'token' : token}
try :
    response = requests.get('https://www.ncdc.noaa.gov/cdo-web/api/v2/datasets', headers=my_headers)
    status_code = response.status_code
except requests.exceptions.RequestException as e:
    print(e) # imprime en la terminal el error que se produjo
    status_code = 550

respuesta = response.json()
resultados = respuesta['results'] # Datasets disponible
for w in resultados:
    pass
    print(w['uid'],':',w['name'])

a


La API permite una variedad de consultas, por ejemplo:




In [2]:
# Ejemplo: datasets  disponible en la ciudad US390029
import requests
token = 'LsJXpYprYMzOKjMtqAlDmMUzwGelIQDf'
my_headers = {'token' : token}
try :
    response = requests.get('https://www.ncdc.noaa.gov/cdo-web/api/v2/datasets?locationid=CITY:US390029', headers=my_headers)
    status_code = response.status_code
except requests.exceptions.RequestException as e:
    print(e) # imprime en la terminal el error que se produjo
    status_code = 550
respuesta = response.json()
print(respuesta)

nos devuelve todos los datasets disponibles para determinada localidad,  en este caso `US390029` que es la ciudad de Zanesville, OH US.

También podemos obtener, por ejemplo, datos climatológicos de una determinada localidad durante un período determinado de tiempo: la consulta



In [None]:
# Datos climatológicos diarios (temperatura máxima, temperatura mínima y precipitaciones) en un período de tiempo en
# la estación meteorológica  AR000087344 (Aeropuerto de Córdoba)
fecha_ini, fecha_fin = '2024-04-24', '2024-04-30'
try :
    response = requests.get('https://www.ncdc.noaa.gov/cdo-web/api/v2/data?datasetid=GHCND&stationid=GHCND:AR000087344&limit=1000&units=metric&startdate='+fecha_ini+'&enddate='+fecha_fin+'', headers=my_headers)
    status_code = response.status_code
except requests.exceptions.RequestException as e:
    print(e) # imprime en la terminal el error que se produjo
    status_code = 550
respuesta = response.json()
print(type(respuesta))
for  item in respuesta:
    print(item)

nos devuelve un sumario de temperaturas y precipitaciones diarias en el mes de mayo de la estación meteorológica del Aeropuerto de Córdoba,  que está codificada `AR000087344`.  


Observar que la respuesta recibida puede ser convertida a JSON, pues así lo permite la API. En  este caso particular, la respuesta JSON es un diccionario con dos claves: `metadata` y `results`. El campo `metadata` nos da información sobre tipo de datos, formato, etc. Mientras que `results` es el contenido que nos interesa.

In [None]:
print(respuesta['metadata'])
print(respuesta['results'])

`respuesta['results']`es una lista con datos meteorológicos de la localidad en el período especificado:

In [None]:
for  data in respuesta['results']:
    print(data)

Observar que cada elemento de  `resultados` es un diccionario y en ese diccionario  estan las claves`date`, `datatype` y `value`.
- `date` indica el día.
- Si el `datatype` es `TMAX`,  entonces `value` indica la temperatura máxima del día.
- Si el `datatype` es `TMIN`,  entonces `value` indica la temperatura mínima del día.
- Si el `datatype` es `TAVG`,  entonces `value` indica la temperatura promedio del día.
- Si el `datatype` es `PRCP`,  entonces `value` indica la precipitación (en mm) de ese día.

Es importante notar que no todos los datos se encuentran para todos los días.




En las referencias a continuación se encuentra como obtener el token, la descripción de la API, la lista de estaciones meteorológicas y mucha más información.



*Referencias*
- https://www.ncdc.noaa.gov/ National Centers for Environmental Information (37 petabytes)
- https://www.ncei.noaa.gov/support/access-data-service-api-user-documentation
- Para bajar estaciones meteorolgógicas:  https://www1.ncdc.noaa.gov/pub/data/ghcn/daily/ghcnd-stations.txt
- https://www.ncdc.noaa.gov/ghcn-daily-description
- Para bajar manual de ghcn-daily: https://www1.ncdc.noaa.gov/pub/data/ghcn/daily/readme.txt
- Para pedir token: https://www.ncdc.noaa.gov/cdo-web/token
- Climate Data Online - Web Services Documentation: https://www.ncdc.noaa.gov/cdo-web/webservices/v2#gettingStarted
- Manual genérico para uso de APIs en Python: https://www.nylas.com/blog/use-python-requests-module-rest-apis/

### Otros ejemplos de APIs

Algunas APIs interesantes para practicar son:


- **PokéAPI**: Proporciona datos sobre Pokémon como movimientos, habilidades, tipos, etc. Permite crear fácilmente un Pokédex. [2][3]
- **API de la NASA**: Permite acceder a datos de la NASA como imágenes de satélites, clima en Marte, etc. Requiere registro para obtener acceso a algunos datos. [1][2]
- **API de Marvel**: Ofrece contenido de Marvel como personajes, cómics, películas y videojuegos. Requiere registro en developer.marvel.com. [3]
- **COVID Tracking API**: Proporciona datos de COVID-19 a nivel mundial como contagios, pruebas, hospitalizaciones y muertes. [3]
- **OpenWeather APIs**: Permite obtener información meteorológica actual, histórica y pronósticos. También ofrece mapas. [3]

Todas estas APIs son de datos públicos,  algunas requieren registro. Tambén algunas pueden tener un límite diario de consultas.



Las siguientes APIs  son de suma utilidad para algunos desarrolladores, pero o bien son pagas o bien requieren un un complicado proceso de registro. O  ambas cosas!


## APIs de servicios populares

- **API de Google Maps**: Agrega funcionalidades de mapas a aplicaciones web como mostrar ubicaciones, calcular rutas, obtener direcciones. [4]
- **API de Facebook**: Integra funcionalidades sociales como compartir contenido, autenticación de usuarios, conexión a la red de Facebook. [4]
- **API de Twitter**: Permite enviar y recibir tweets, buscar tweets, compartir contenido a través de Twitter. [4]



Referencias:

- [1] https://platzi.com/blog/12-api-gratis-para-desarrolladores-frontend/
- [2] https://www.youtube.com/watch?v=xOsqjAyIWwI
- [3] https://ed.team/blog/las-mejores-apis-publicas-para-practicar
- [4] https://www.nucba.com.ar/blog/posts/mejores-apis-para-practicar
- [5] https://www.youtube.com/watch?v=ZgV3ohcNXYQ