## Descripción del Notebook:

Este Notebook aborda el uso de la librería **WBGAPI** para la extracción de información del Banco Mundial.

## Descripción de la librería: WBGAPI

WBGAPI es una librería de Python cuyo autor es [Tim Herzog](https://pypi.org/user/tgherzog/), Científico de Datos Senior del Banco Mundial. De acuerdo a la descripción del proyecto,"WBGAPI provee acceso *pythonico* moderno a la API de datos del Banco Mundial" (WBGAPI Project Description, 2021). Se trata de una librería que permite acceder a la información contenida en las bases de datos del Banco Mundial, facilitando la obtención de datos a través del uso de métodos y funciones específicas.

## Instalación de WBGAPI:

WBGAPI es una librería disponible en *Python Package Index*; puede instalarse con el uso de `pip`:

In [1]:
pip install wbgapi



## Aspectos básicos de WBGAPI:

El alias recomendado por el autor para importar WBGAPI es *wb*:

In [2]:
import wbgapi as wb

Con el uso de la función nativa `dir(...)` se puede conocer la lista de métodos y atributos asociados a un objeto; como se observa, `wb` cuenta con un conjunto de métodos y atributos muy concisos:

In [3]:
dir(wb)

['APIError',
 'APIResponseError',
 'Coder',
 'Featureset',
 'Metadata',
 'MetadataCollection',
 'Series',
 'URLError',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 '__version__',
 '_concept_mrv_cache',
 '_queryAPI',
 '_refetch_url',
 '_responseHeader',
 '_responseObjects',
 'abbreviate',
 'api_maxlen',
 'data',
 'db',
 'economy',
 'economy_coder',
 'economy_metadata',
 'endpoint',
 'fetch',
 'get',
 'htmlTable',
 'income',
 'lang',
 'lending',
 'metadata',
 'pd',
 'per_page',
 'proxies',
 'queryParam',
 're',
 'reduce',
 'refetch',
 'region',
 'requests',
 'search',
 'search2',
 'series',
 'series_metadata',
 'source',
 'tabulate',
 'time',
 'topic',
 'urllib',
 'utils']

Cada uno de los principales sub-paquetes de `wb`, de acuerdo a la documentación oficial, contiene al menos cuatro métodos principales que permiten consultar y acceder a sus elementos. Estos cuatro métodos son: `.list()`, `.get()`, `.info()` y `.series()`. Los métodos `.list()`, `.info()` y `.series()` realizan tareas muy similares, pues devuelven información específica, sin embargo, se diferencian por la manera en que la información es presentada. Por ejemplo, si hacemos uso del sup-paquete `source` (que hace referencia a la base de datos empleada), al utilizar el método `.list()` se obtiene lo siguiente:

In [4]:
wb.source.list()

<generator object list at 0x7f6b4a0e64d0>

Como se evidencia, no se genera un resultado visible, sino que se crea un "generador"; sin embargo, si se usa `.info()` o `.series()`, se obtiene un objeto con información directamente observable. Para el caso de `.info()` se obtiene una tabla:

In [5]:
wb.source.info()

id,name,code,concepts,lastupdated
1.0,Doing Business,DBS,3.0,2021-08-18
2.0,World Development Indicators,WDI,3.0,2021-07-30
3.0,Worldwide Governance Indicators,WGI,3.0,2020-09-28
5.0,Subnational Malnutrition Database,SNM,3.0,2016-03-21
6.0,International Debt Statistics,IDS,4.0,2021-01-21
11.0,Africa Development Indicators,ADI,3.0,2013-02-22
12.0,Education Statistics,EDS,3.0,2020-12-20
13.0,Enterprise Surveys,ESY,3.0,2021-04-02
14.0,Gender Statistics,GDS,3.0,2021-07-20
15.0,Global Economic Monitor,GEM,3.0,2020-07-27


Así, se puede notar que el sub-paquete `.source` hace referencia a la base de datos empleada (el Banco Mundial tiene múltiples bases de datos, no solamente una). En este caso, hay 65 bases de datos disponibles, de la cual *World Development Indicators* es posiblemente la más reconocida (y es la que *WBGAPI* utiliza por defecto). Aunque el resultado obtenido con la aplicación del método `.info()` es una tabla, es importante aclarar que dicha tabla no es un `DataFrame` de *pandas*:

In [6]:
type(wb.source.info())

wbgapi.Featureset

El objeto generado por el método `.info()` es un `.Featureset` de *WBGAPI*. Dado que *pandas* es una de las librerías más ampliamente usadas para trabajar con datos, es muy probable que se quiera obtener una representación de *pandas* (`Series` o `DataFrame`). Esto, precisamente, es lo que permite la aplicación del método `.Series()`:

In [7]:
source_series = wb.source.Series()
print(type(source_series))
source_series

<class 'pandas.core.series.Series'>


1                               Doing Business
2                 World Development Indicators
3              Worldwide Governance Indicators
5            Subnational Malnutrition Database
6                International Debt Statistics
                        ...                   
81         International Debt Statistics: DSSI
82                   Global Public Procurement
83    Statistical Performance Indicators (SPI)
84                            Education Policy
85                               PEFA_2021_SNG
Name: SourceName, Length: 65, dtype: object

Aunque el método `.Series()` permite obtener una representación de la información sobre la base de datos como una `Series` de *pandas*, es importante notar que no toda la información generada con el método `.info()` se presenta cuando se usa el método `.Series()`. 

Es posible obtener una representación de la información generada por el método `.info()` como `DataFrame` de *pandas*; sin embargo, hay que ser cuidadosos ya que no se debe usar directamente el `Featureset` sino uno de sus atributos:

In [8]:
import pandas as pd

# Incorrecto:
pd.DataFrame(wb.source.info())

ValueError: ignored

In [9]:
# Correcto (usar los atributo "table" para la información
# y "columns" para las columnas):

pd.DataFrame(wb.source.info().table(),  columns = wb.source.info().columns)

Unnamed: 0,id,name,code,concepts,lastupdated
0,1,Doing Business,DBS,3,2021-08-18
1,2,World Development Indicators,WDI,3,2021-07-30
2,3,Worldwide Governance Indicators,WGI,3,2020-09-28
3,5,Subnational Malnutrition Database,SNM,3,2016-03-21
4,6,International Debt Statistics,IDS,4,2021-01-21
...,...,...,...,...,...
61,82,Global Public Procurement,GPP,3,2021-03-24
62,83,Statistical Performance Indicators (SPI),SPI,3,2021-04-01
63,84,Education Policy,EDP,3,2021-05-11
64,85,PEFA_2021_SNG,SNG,4,2021-08-17


## Referencias:

* WBGAPI Project Description, 2021. Disponible en: https://pypi.org/project/wbgapi/