## Desafio 7 - Desafio APIs

La API que se va a utilizar en el notebook es una API del Gobierno de EEUU, mas precisamente del Departamento de Salud y Servicios Humanos, dentro de ella, de la Oficina de Prevención de Enfermedades y Promoción de la Salud. El sitio principal del organismo es: 
https://health.gov/

La url de donde se obtiene información de la API es:
https://health.gov/our-work/national-health-initiatives/health-literacy/consumer-health-content/free-web-content/apis-developers/how-use-api

Lo interesante de la API es que tiene un listado de tópicos y a su vez dentro de cada tópico hay una API con data del mismo, hasta se puede seleccionar el idioma esto es pasandolo como parámetro en la url. Es decir puedo hacer una consulta al API general o aun API específico y hasta se puede parametrizar un poco a la consulta.

### Consulta a la API principal

In [1]:
import pandas as pd
import requests as rq
import json

In [2]:
url = 'https://health.gov/myhealthfinder/api/v3/itemlist.json?Type=topic'

data = rq.get(url)

data

<Response [200]>

Se observa que el status code es 200 por lo tanto esta todo ok.

In [3]:
data_json = json.loads(data.text)

data_json

{'Result': {'Error': 'False',
  'Total': 100,
  'Query': {'ApiVersion': '3',
   'ApiType': 'itemlist',
   'TopicId': None,
   'ToolId': None,
   'CategoryId': None,
   'PopulationId': None,
   'Keyword': None,
   'Who': None,
   'Age': None,
   'Sex': None,
   'Pregnant': None,
   'TobaccoUse': None,
   'SexuallyActive': None,
   'Category': None,
   'Lang': 'en',
   'Type': 'topic',
   'ReturnType': 'json',
   'Callback': None,
   'HealthfinderPage': None,
   'APiType': 'itemlist'},
  'Language': 'English',
  'Items': {'Item': [{'Type': 'Topic',
     'Id': '25',
     'Title': 'Keep Your Heart Healthy',
     'ParentId': -1,
     'TranslationId': '25'},
    {'Type': 'Topic',
     'Id': '327',
     'Title': 'Get Enough Folic Acid',
     'ParentId': -1,
     'TranslationId': '327'},
    {'Type': 'Topic',
     'Id': '329',
     'Title': 'Lower Your Risk of Falling',
     'ParentId': -1,
     'TranslationId': '329'},
    {'Type': 'Topic',
     'Id': '350',
     'Title': 'Get Tested for Chla

La url consultada vendría a ser la API principal de donde se obtiene el listado de temas o tópicos. Se puede observar como el JSON devuelto consta básicamente de dos partes una que vendría a ser una especie de encabezado y la otra parte es el listado de tópicos en si. A continuación se van a realizar algunas averiguaciones sobre este JSON. 

In [4]:
# Mas allá de status code obtenido el propio JSON tiene una clave que devuelve si hay error en el mismo. 
data_json['Result']['Error']

'False'

In [5]:
# Obtengo el idioma en el que es devuelto la data. Luego se hara consulta para el idioma español.
data_json['Result']['Language']

'English'

In [6]:
# Obtengo la cantidad de tópicos. Luego se va a verificar esta info cuando el listado de tópicos sea convertido
# en dataframe.
data_json['Result']['Total']

100

In [7]:
data_json['Result']['Items']

{'Item': [{'Type': 'Topic',
   'Id': '25',
   'Title': 'Keep Your Heart Healthy',
   'ParentId': -1,
   'TranslationId': '25'},
  {'Type': 'Topic',
   'Id': '327',
   'Title': 'Get Enough Folic Acid',
   'ParentId': -1,
   'TranslationId': '327'},
  {'Type': 'Topic',
   'Id': '329',
   'Title': 'Lower Your Risk of Falling',
   'ParentId': -1,
   'TranslationId': '329'},
  {'Type': 'Topic',
   'Id': '350',
   'Title': 'Get Tested for Chlamydia and Gonorrhea',
   'ParentId': -1,
   'TranslationId': '350'},
  {'Type': 'Topic',
   'Id': '510',
   'Title': 'Make the Most of Your Baby’s Visit to the Doctor (Ages 0 to 11 Months) ',
   'ParentId': -1,
   'TranslationId': '510'},
  {'Type': 'Topic',
   'Id': '512',
   'Title': 'Make the Most of Your Child’s Visit to the Doctor (Ages 1 to 4)',
   'ParentId': -1,
   'TranslationId': '512'},
  {'Type': 'Topic',
   'Id': '514',
   'Title': 'Get Tested for Breast Cancer',
   'ParentId': -1,
   'TranslationId': '514'},
  {'Type': 'Topic',
   'Id': '5

In [8]:
# El listado de temas que es una lista de diccionarios es convertido en un dataframe.
items = data_json['Result']['Items']

item = items['Item']

df = pd.DataFrame(item)

df.head()

Unnamed: 0,Type,Id,Title,ParentId,TranslationId
0,Topic,25,Keep Your Heart Healthy,-1,25
1,Topic,327,Get Enough Folic Acid,-1,327
2,Topic,329,Lower Your Risk of Falling,-1,329
3,Topic,350,Get Tested for Chlamydia and Gonorrhea,-1,350
4,Topic,510,Make the Most of Your Baby’s Visit to the Doct...,-1,510


In [9]:
df.shape

(100, 5)

In [10]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 5 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Type           100 non-null    object
 1   Id             100 non-null    object
 2   Title          100 non-null    object
 3   ParentId       100 non-null    int64 
 4   TranslationId  100 non-null    object
dtypes: int64(1), object(4)
memory usage: 4.0+ KB


### Consulta del listado de tópicos pero en Español

In [11]:
url = 'https://health.gov/myhealthfinder/api/v3/itemlist.json?Type=topic&Lang=es&Lang=es'

data = rq.get(url)

data_json = json.loads(data.text)

data_json

{'Result': {'Error': 'False',
  'Total': 100,
  'Query': {'ApiVersion': '3',
   'ApiType': 'itemlist',
   'TopicId': None,
   'ToolId': None,
   'CategoryId': None,
   'PopulationId': None,
   'Keyword': None,
   'Who': None,
   'Age': None,
   'Sex': None,
   'Pregnant': None,
   'TobaccoUse': None,
   'SexuallyActive': None,
   'Category': None,
   'Lang': 'es',
   'Type': 'topic',
   'ReturnType': 'json',
   'Callback': None,
   'HealthfinderPage': None,
   'APiType': 'itemlist'},
  'Language': 'Spanish',
  'Items': {'Item': [{'Type': 'Topic',
     'Id': '25',
     'Title': 'Mantén sano a tu corazón ',
     'ParentId': -1,
     'TranslationId': '25'},
    {'Type': 'Topic',
     'Id': '327',
     'Title': 'Toma suficiente ácido fólico ',
     'ParentId': -1,
     'TranslationId': '327'},
    {'Type': 'Topic',
     'Id': '329',
     'Title': 'Reduce el riesgo de sufrir caídas',
     'ParentId': -1,
     'TranslationId': '329'},
    {'Type': 'Topic',
     'Id': '350',
     'Title': 'Ha

Aquí se observa que devuelve el mismo listado de tópicos pero en español.

### Consulta a un tópico en particular

A continuación se van a visualizar algunas de las keys mas importantes del JSON devuelto.

In [12]:
url = 'https://health.gov/myhealthfinder/api/v3/topicsearch.json?TopicId=527'

data = rq.get(url)

data_json = json.loads(data.text)

data_json

{'Result': {'Error': 'False',
  'Total': 1,
  'Query': {'ApiVersion': '3',
   'ApiType': 'topicsearch',
   'TopicId': '527',
   'ToolId': None,
   'CategoryId': None,
   'PopulationId': None,
   'Keyword': None,
   'Who': None,
   'Age': None,
   'Sex': None,
   'Pregnant': None,
   'TobaccoUse': None,
   'SexuallyActive': None,
   'Category': None,
   'Lang': 'en',
   'Type': None,
   'ReturnType': 'json',
   'Callback': None,
   'HealthfinderPage': None,
   'APiType': 'topicsearch'},
  'Language': 'English',
  'Resources': {'Resource': [{'Type': 'Topic',
     'Id': '527',
     'Title': 'Make the Most of Your Child’s Visit to the Doctor (Ages 5 to 10)',
     'TranslationId': '527',
     'TranslationTitle': '',
     'Categories': 'Checkups for Children and Teens',
     'Populations': '',
     'MyHFTitle': '',
     'MyHFDescription': '',
     'MyHFCategory': '',
     'MyHFCategoryHeading': '',
     'LastUpdate': '1658435717',
     'ImageUrl': 'https://health.gov/sites/default/files/2020

In [13]:
# Verifico que el JSON no tiene errores.
data_json['Result']['Error']

'False'

In [14]:
# Verifico el idioma del JSON.
data_json['Result']['Language']

'English'

In [15]:
# Muestro el título de tópico.
data_json['Result']['Resources']['Resource'][0]['Title']

'Make the Most of Your Child’s Visit to the Doctor (Ages 5 to 10)'

In [16]:
# Muestro la categoría del tema.
data_json['Result']['Resources']['Resource'][0]['Categories']

'Checkups for Children and Teens'

In [17]:
# Muestro la fecha del creación del tópico.
data_json['Result']['Resources']['Resource'][0]['LastUpdate']

'1658435717'

In [18]:
# Como la fecha está en timestamp la paso a calendario gregoriano.
ft = data_json['Result']['Resources']['Resource'][0]['LastUpdate']
fecha = pd.to_datetime(ft, unit="s")
fecha

Timestamp('2022-07-21 20:35:17')

In [19]:
# Obtengo la url de la imágen del tema.
url_img = data_json['Result']['Resources']['Resource'][0]['ImageUrl']

In [20]:
# Como lo que se obtiene de la imagen del tópico es la url, no la imagen en sí, si se desea verla a la misma se
# debe importar la librería PIL. La imagen a ser visualizada se abre aparte del notebook en otra ventana(cuando 
# se trabaja en un notebook local con Anaconda, en google Colab no funciona).
import urllib.request
from PIL import Image
  
urllib.request.urlretrieve(url_img,"imagen_tema.png")
  
img = Image.open("imagen_tema.png")

img.show()

In [21]:
# Obtengo el listado de los temas relacionados y los paso a un dataframe.
item = data_json['Result']['Resources']['Resource'][0]['RelatedItems']['RelatedItem']

df = pd.DataFrame(item)

df

Unnamed: 0,Type,Id,Title,Url
0,Topic,30608,Healthy Snacks: Quick Tips for Parents,https://health.gov/myhealthfinder/healthy-livi...
1,Topic,30566,Help Your Child Stay at a Healthy Weight,https://health.gov/myhealthfinder/health-condi...
2,Topic,30542,Talk to Your Kids About Sex and Healthy Relati...,https://health.gov/myhealthfinder/healthy-livi...
3,Topic,541,Get Your Child’s Vision Checked,https://health.gov/myhealthfinder/doctor-visit...
4,Topic,30535,"Talk to Your Kids About Tobacco, Alcohol, and ...",https://health.gov/myhealthfinder/healthy-livi...
5,Topic,530,Take Care of Your Child's Teeth,https://health.gov/myhealthfinder/doctor-visit...


In [22]:
df.shape

(6, 4)

In [23]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Type    6 non-null      object
 1   Id      6 non-null      object
 2   Title   6 non-null      object
 3   Url     6 non-null      object
dtypes: object(4)
memory usage: 320.0+ bytes


### Resumen

De la API seleccionada para trabajar quizas no se pudo hacer calculos estadisticos o graficar alguna data importante pero si se pudo llevar a cabo algunas cosas interesantes como formatear fecha, convertir un listado de diccionarios en una dataframe, abrir una imagen y acceder a información que puede llegar a ser de utilidad como el título, la fecha de creación o el listado de temas relacionados.