### Código para correr leila localmente en jupyter
**ruta_leila** se refiere a la ruta en la que está alojado el código de leila que contiene las carpetas: ejemplos, leila y recursos

In [2]:
import sys
ruta_leila = '/home/michel/Documents/dnp/leila/leila_desarrollo_indice_reporte_herencia/leila'
sys.path.insert(0, ruta_leila)

# Módulo datos_gov - LEILA
Este libro de Jupyter contiene ejemplos con explicaciones de cómo utilizar el módulo que conecta a un usuario con el Portal de Datos Abiertos de Colombia

### Importar la clase DatosGov del módulo datos_gov
<!-- Importar la clase DatosGov del módulo datos_gov de LEILA. Con esta clase se podrá buscar información que esté publicada en el Portal de Datos Abiertos -->

In [3]:
from leila.datos_gov import DatosGov

Se importa la tabla de inventario de datos.gov.co. Esta tabla contiene todas las publicaciones del Portal (conjuntos de datos, enlaces externos, mapas, gráficos, etc.).

In [4]:
inventario = DatosGov().tabla_inventario()

Las columnas de la tabla de inventario son las siguientes:

"**numero_api**": número API del conjunto de datos. Este es un carácter único de cada conjunto de datos del Portal que se usa como insumo para abrirlo desde código.

"**nombre**": nombre de la publicación

"**descripcion**": descripción de la publicación

"**dueno**": dueño de la publicación. 

"**base_publica**": indica con un "si" si la información del conjunto de datos es público y con un "no" de lo contrario

"**tipo**": indica el tipo de la publicación, que puede ser uno de los siguientes: "conjunto de datos", "enlace externo", "mapa", "grafico", "vista filtrada", "archivo o documento", "historia", "visualizacion", "lente de datos", "formulario", "calendario".

"**categoria**": tema general del que trata la información publicada

"**terminos_clave**": términos clave relacionados con la publicación

"**url**": enlace web de la publicación en el Portal de Datos Abiertos

"**fecha_creacion**": fecha de creación de la publicación

"**fecha_actualizacion**": última fecha de actualización de la publicación

"**filas**": número de filas del conjunto de datos, si aplica

"**columnas**": número de columnas del conjunto de datos, si aplica

"**correo_contacto**": correo de contacto de la entidad dueña de los datos

"**licencia**": nombre de la licencia los datos

"**entidad**": nombre de la entidad dueña de los datos

"**entidad_url**": enlace web de la entidad dueña de los datos

"**entidad_sector**": sector de la entidad

"**entidad_departamento**": departamento de la entidad

"**entidad_orden**": especifica si publicación es de orden territorial, nacional, departamental o internacional

"**entidad_dependencia**": dependencia de la entidad dueña de los datos

"**entidad_municipio**": municipio donde opera la entidad

"**actualizacion_frecuencia**": frecuencia de actualización de los datos. Puede ser anual, semestral, mensual, trimestral, trianual, diaria, quinquenal, semanal, entre otros. También puede no aplicar

"**idioma**": idioma en el que se encuentra la información

"**cobertura**": alcance de la información. Puede ser nacional, departamental, municipal, centro poblado o internacional

### Filtrar la tabla de inventario

Es posible buscar información de interés dentro de la tabla de inventario. La búsqueda se hace a partir de términos o texto que puede ser buscado en las columnas de formato texto de la tabla de inventario, por un rango de fechas o por el número filas o columnas.

#### Ejemplo: búsqueda por términos clave

Para hacer la búsqueda por términos clave, se construye un diccionario de Python que contenga como llaves los nombres de las columnas de texto de la tabla de inventario sobre las cuales se desea hacer el filtro. Los valores de cada llave es una lista que contiene uno o más términos clave. Este diccionario se ingresa al método "tabla_inventario" de DatosGov dentro del parámetro "filtro".

Los términos que se ingresan al diccionario no tienen que tener tildes o mayúsculas que se encuentran en la columna original de la tabla de inventario. Por ejemplo, los resultados serán los mismos si se buscan las palabras "Economía", "economía", "economia" o "ECONOMÍA".

Abajo se encuentra un ejemplo donde se filtra la tabla de inventario por las columnas "nombre" y "tipo". Dentro de la columna "nombre" se busca si contiene los términos "economia" o "ambiente" y si la columna "tipo" contiene el término "conjunto de datos". Es decir, se están buscando conjuntos de datos de temas de economía o ambiente.

In [5]:
# Se crea el diccionario con el filtro deseado
filtro = {
    "nombre": ["economia", "ambiente"],
    "tipo": ["conjunto de datos"]
}

# Se abre la tabla de inventario con el filtro deseado
inventario = DatosGov().tabla_inventario(filtro=filtro)

In [6]:
# Se imprime la tabla de inventario con el filtro aplicado en la celda anterior
inventario

Unnamed: 0,numero_api,nombre,descripcion,dueno,base_publica,tipo,categoria,terminos_clave,url,fecha_creacion,...,entidad,entidad_url,entidad_sector,entidad_departamento,entidad_orden,entidad_dependencia,entidad_municipio,actualizacion_frecuencia,idioma,cobertura
5401,j7br-6yvm,Contactos Sec. Ambiente,Contactos en el departamento del Tolima para e...,Carlos Alberto Sanchez Alfonso,Si,conjunto de datos,Ambiente y Desarrollo Sostenible,"gobernacion,tolima,ambiente,contacto",https://www.datos.gov.co/d/j7br-6yvm,2016-12-12 16:42:03,...,Gobernacion del Tolima,,Ambiente y Desarrollo Sostenible,Tolima,Territorial,Secretaría del Ambiente y Gestión Riesgo del T...,Ibagué,Anual,Español,Departamental
5447,8w5c-54ny,Economía del municipio,La principal base de la economía del Municipio...,Alcaldía Guatavita,Si,conjunto de datos,Economía y Finanzas,,https://www.datos.gov.co/d/8w5c-54ny,2018-09-28 20:35:26,...,,,Agricultura y Desarrollo Rural,Cundinamarca,Territorial,Desarrollo económico,Guatavita,No aplica,Español,Municipal
8379,vwxz-yqyb:0,GESTIÓN DE AMBIENTE FÍSICO,,ESE HOSPITAL SAN FRANCISCO DE VILLA DE ELYVA,No,conjunto de datos,,,https://www.datos.gov.co/d/vwxz-yqyb/revisions/0,2022-09-29 18:17:56,...,,,,,,,,,,
11694,bgmv-gnda,AMBIENTE FÍSICO ANIMALES,Caracterización de viviendas estrategia APS (a...,Alcaldia de Pereira Secretaria TIC,Si,conjunto de datos,Salud y Protección Social,,https://www.datos.gov.co/d/bgmv-gnda,2019-12-03 13:28:54,...,Alcaldia de Pereira,https://www.datos.gov.co/d/bgmv-gnda,Salud y Protección Social,Risaralda,Territorial,Secretaria de Salud,Pereira,Anual,Español,Municipal
11893,8ffd-q6x9,AMBIENTE,La consolidación de temas ambientales en el mu...,ALCALDIADEPALESTINA,Si,conjunto de datos,Ambiente y Desarrollo Sostenible,ambiente,https://www.datos.gov.co/d/8ffd-q6x9,2018-07-12 16:56:38,...,,https://www.datos.gov.co/d/8ffd-q6x9,Ambiente y Desarrollo Sostenible,Caldas,Territorial,PLANEACION,Palestina,Anual,Español,Municipal
16614,rm5b-5f33,AMBIENTE FISICO,Caracterización de viviendas estrategia APS (a...,Alcaldia de Pereira Secretaria TIC,Si,conjunto de datos,Salud y Protección Social,,https://www.datos.gov.co/d/rm5b-5f33,2019-12-03 13:37:29,...,Alcaldia de Pereira,https://www.datos.gov.co/d/rm5b-5f33,Salud y Protección Social,Risaralda,Territorial,Secretaria de Salud,Pereira,Anual,Español,Municipal
21873,59f6-58a8,BD JOVENES DE AMBIENTE JURISDICCION DE CORP...,BD JOVENES DE AMBIENTE JURISDICCION DE CORP...,CORPORACION AUTONOMA REGIONAL DEL GUAVIO,Si,conjunto de datos,Participación ciudadana,,https://www.datos.gov.co/d/59f6-58a8,2021-12-10 16:17:48,...,Gloria Mora -coordinador del Area Educación am...,,Educación,Cundinamarca,Territorial,EDUCACION AMBIENTAL,Gachala,Semestral,Español,Municipal
23910,am4p-tz7w,Censo de Arbolado urbano en Ibagué-Sria Ambien...,Censo de Arbolado urbano en la ciudad de Ibagué,tic_ibague,Si,conjunto de datos,Ambiente y Desarrollo Sostenible,arboles,https://www.datos.gov.co/d/am4p-tz7w,2022-02-25 20:04:49,...,Secretaria de Ambiente y Gestión del Riesgo de...,https://www.datos.gov.co/d/am4p-tz7w,Ambiente y Desarrollo Sostenible,Tolima,Territorial,ALCALDIA DE IBAGUE -SECRETARIA DE AMBIENTE Y G...,Ibagué,Anual,Español,Municipal
27460,8ffd-q6x9:0,AMBIENTE,La consolidación de temas ambientales en el mu...,ALCALDIADEPALESTINA,No,conjunto de datos,Ambiente y Desarrollo Sostenible,ambiente,https://www.datos.gov.co/d/8ffd-q6x9/revisions/0,2021-03-04 14:43:12,...,,https://www.datos.gov.co/d/8ffd-q6x9,Ambiente y Desarrollo Sostenible,Caldas,Territorial,PLANEACION,Palestina,Anual,Español,Municipal
32259,9zck-qfvc,DELITOS CONTRA EL MEDIO AMBIENTE,Acciones que afectan los recursos naturales y ...,johalda,Si,conjunto de datos,Seguridad y Defensa,"ecosistemas,medio ambiente,recursos naturales",https://www.datos.gov.co/d/9zck-qfvc,2022-07-04 15:16:15,...,Ministerio de Defensa Nacional,https://www.mindefensa.gov.co/irj/portal/Minde...,Defensa,Bogotá D.C.,Nacional,Observatorio de Derechos Humanos y Defensa Nac...,Bogotá D.C.,Mensual,Español,Nacional


#### Ejemplo: búsqueda por rango de filas y columnas

Para hacer el filtro de la tabla de inventario por el tamaño de un conjunto de datos, se tiene que incluir el nombre de las columnas "filas" y "columnas" en el diccionario. Los valores de estas llaves son listas con dos elementos cada una: el primer elemento es el valor mínimo de filas o columnas y el segundo el valor máximo. 

A continuación se muestra un ejemplo de filtro, donde se seleccionan los conjuntos de datos con mínimo 50 filas y máximo 60 y con mínimo 8 columnas y máximo 10

In [7]:
# Se crea el diccionario con el filtro deseado
filtro = {
    "filas": [50, 60],
    "columnas": [8, 10]
}

# Se abre la tabla de inventario con el filtro deseado
inventario = DatosGov().tabla_inventario(filtro=filtro)

In [8]:
# Imprimir las columnas del código API, nombre, descripción, filas y columnas de la tabla de inventario filtrada
inventario[["numero_api", "nombre", "descripcion", "filas", "columnas"]]

Unnamed: 0,numero_api,nombre,descripcion,filas,columnas
36,pkzu-sphq,Publicaciones_E_Interacciones_Campaña_#UsoLosD...,,53.0,8.0
148,tvjz-wwbs,ENTIDADES FINANCIERAS EN EL DEPARTAMENTO DEL P...,Base de datos con las entidades financieras en...,60.0,10.0
359,8qip-sek5,Corregidores y Auxiliares Corregidores del Mun...,Corregidores y Auxiliares o Ayudantes de Corre...,54.0,9.0
530,jhsz-mybn,Zonas wifi de departamento de Casanare,Lista de zonas wifi en el departamento de Casa...,58.0,8.0
826,hysn-yquu,Publicidad registro de vallas Municipio de Pa...,Registro de vallas publicitarias del Municipio...,53.0,8.0
...,...,...,...,...,...
39744,mqu6-d62c,Producción Agrícola Cota Cundinamarca,Datos relacionados a la Producción Agrícola de...,52.0,10.0
39798,3yyx-wdfi,Empresas Constructoras Registradas en Palmira ...,Información de las empresas constructoras que ...,57.0,8.0
39835,symc-8gre,DOCENTES POR GENERO 2019-2,"Docentes de planta, contrato y catedráticos cl...",59.0,8.0
40082,3bvi-vpkx,Indicadores de Economía y Productividad de Sab...,Conozca indicadores de economía y productivida...,57.0,10.0


#### Ejemplo: búsqueda por fecha

La tabla de inventario también puede filtrase por fecha. Para hacerlo, se ingresa el diccionario de filtro con una de las columnas de fecha y se especifican las fechas de inicio y de fin deseadas. El siguiente ejemplo muestra cómo obtener la tabla de inventario para publicaciones creadas entre el 1 de enero de 2020 y el 1 de febrero de 2020.

In [9]:
# Se crea el diccionario con el filtro deseado
filtro = {
    "fecha_creacion": ["2020-01-01", "2020-02-01"],
}

# Se abre la tabla de inventario con el filtro deseado
inventario = DatosGov().tabla_inventario(filtro=filtro)

In [10]:
# Se muestra la tabla filtrada por fecha
inventario

Unnamed: 0,numero_api,nombre,descripcion,dueno,base_publica,tipo,categoria,terminos_clave,url,fecha_creacion,...,entidad,entidad_url,entidad_sector,entidad_departamento,entidad_orden,entidad_dependencia,entidad_municipio,actualizacion_frecuencia,idioma,cobertura
161,dva5-spdw,Casos importados de sarampión según entidad te...,Contiene la estadística de los Casos importado...,GOBERNACIÓN DEL CAQUETÁ,Si,conjunto de datos,Estadísticas Nacionales,,https://www.datos.gov.co/d/dva5-spdw,2020-01-15 14:51:43,...,Boletín Epidemiológico Semanal,,Estadísticas,Caquetá,Nacional,Dirección de las TIC,Florencia,Trienio,Español,Nacional
320,ng69-pr5i,Caudal Rio Chinchina 2016,Registro año 2016 de Caudales medios diarios d...,Aguas Manizales S.A. E.S.P,Si,conjunto de datos,Ambiente y Desarrollo Sostenible,"caudal,agua",https://www.datos.gov.co/d/ng69-pr5i,2020-01-03 14:37:23,...,Aguas de Manizales S.A. E.S.P,,Ambiente y Desarrollo Sostenible,Caldas,Territorial,Recurso Hidrico,Manizales,Anual,Español,Municipal
321,fitj-g26r,Centros de relevo - Llamadas,Centros de relevo - Llamadas,Ministerio TIC Oficina TI Gestión de Informacion,Si,conjunto de datos,"Ciencia, Tecnología e Innovación",,https://www.datos.gov.co/d/fitj-g26r,2020-01-27 19:38:45,...,Ministerio de Tecnologías de la Información y ...,https://colombiatic.mintic.gov.co,"Ciencia, Tecnología e innovación",Bogotá D.C.,Nacional,Dirección de Apropiación,Bogotá D.C.,Mensual,Español,Nacional
595,3iv5-72ms,VEINTE PRIMERAS CAUSAS DE MORBILIDAD 2019,VEINTE PRIMERAS CAUSAS DE MORBILIDAD POR CATEG...,ESE Hospital Departamental Universitario Santa...,Si,conjunto de datos,Salud y Protección Social,,https://www.datos.gov.co/d/3iv5-72ms,2020-01-31 20:30:52,...,,,Salud y Protección Social,Caldas,Territorial,Planeación e Información,Manizales,Anual,Español,Departamental
803,yvci-wdre:0,Atención al Usuario año 2019 Instituto Municip...,,Y,No,conjunto de datos,,,https://www.datos.gov.co/d/yvci-wdre/revisions/0,2020-01-02 15:41:58,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
38730,j2qs-kbnj,HUMEDALES DEL MUNICIPIO DE PEDRAZA,El municipio de Pedraza se encuentra rodeado d...,sistemas@pedraza-magdalena.gov.co,Si,conjunto de datos,Ambiente y Desarrollo Sostenible,"humedales,cienaga",https://www.datos.gov.co/d/j2qs-kbnj,2020-01-09 13:25:16,...,UMATA,http://www.pedraza-magdalena.gov.co/directorio...,Ambiente y Desarrollo Sostenible,Magdalena,Territorial,umata,Pedraza,Semestral,Español,Municipal
39148,ks74-rcfu:1,Cuadro Clasificación Documental CENS,Cuadro Clasificación Documental CENS,CENS Grupo EPM,No,conjunto de datos,Minas y Energía,"cuadros de clasificación documental,centrales ...",https://www.datos.gov.co/d/ks74-rcfu/revisions/1,2020-01-22 14:55:12,...,CENS S.A. E.S.P.,https://www.cens.com.co/Portals/Contingencia/l...,Minas y Energía,Norte de Santander,Territorial,Unidad Suministro y Soporte Administrativo,Cúcuta,Anual,Español,Nacional
39155,dnmb-8bgm:0,Integrantes de la Mesa de participación efecti...,,ALCALEJANDRIA,No,conjunto de datos,,,https://www.datos.gov.co/d/dnmb-8bgm/revisions/0,2020-01-16 17:18:02,...,,,,,,,,,,
39932,9et2-bf5i,Entrega y Retoma,Entrega y Retoma,Ministerio TIC Oficina TI Gestión de Informacion,Si,conjunto de datos,"Ciencia, Tecnología e Innovación",,https://www.datos.gov.co/d/9et2-bf5i,2020-01-27 21:17:01,...,Ministerio de Tecnologías de la Información y ...,https://colombiatic.mintic.gov.co,"Ciencia, Tecnología e innovación",Bogotá D.C.,Nacional,Dirección Computadores para Educar,Bogotá D.C.,Mensual,Español,Nacional


### Abrir un conjunto de datos del Portal de Datos Abiertos

Para abrir un conjunto de datos.gov.co es necesario tener el código API de ese conjunto e ingresarlo al método "cargar_base" de la clase DatosGov. Con esta función se crea un objeto que contiene el dataframe y el diccionario de metadatos del conjunto, los cuales se pueden obtener con los métodos "to_dataframe" y "metadatos"

Abajo está el código para cargar el conjunto de datos de "Pueblos indígenas a nivel Nacional 2020", el cual se encuentra en el último filtro de la tabla de inventario. 

#### Cargar conjunto de datos con número API

In [11]:
# Se define la variable "numero_api", que contiene el número API del conjunto "Pueblos indígenas a nivel Nacional 2020"
numero_api = "etwv-wj8f"
# Se descarga la información del conjunto de datos en la variable "data" con el método "cargar_base". 
# Al parámetro "api_id" se asigna el número API y "limite_filas" especifica que únicamente se descargan 200 filas del conjunto
data = DatosGov().cargar_base(api_id = numero_api, limite_filas=200)

#### Obtener dataframe del conjunto de datos

In [12]:
# Se obtiene el dataframe del conjunto de datos con el método "to_dataframe"
datos = data.to_dataframe()
# Se visualiza una versión reducida del dataframe
datos

Unnamed: 0,unnamed_column,departamento,pueblos_indigenas
0,,AMAZONAS,KAWIYARI
1,,AMAZONAS,SIONA
2,,AMAZONAS,YAGUA
3,,AMAZONAS,BARASANO
4,,AMAZONAS,LETUAMA
...,...,...,...
195,,VALLE DEL CAUCA,EMBERA CHAMI
196,,VALLE DEL CAUCA,EPERARA SIAPIDARA
197,,VALLE DEL CAUCA,NASA
198,,VALLE DEL CAUCA,PASTO


#### Obtener diccionario de metadatos del conjunto de datos

In [13]:
# Los metadatos se obtienen con el método "metadatos" y se asignan a la variable "meta"
meta = data.metadatos()
# Se visualiza el diccionario de metadatos
meta

{'numero_api': 'etwv-wj8f',
 'nombre': 'Pueblos indígenas a nivel Nacional 2020',
 'descripcion': 'Información de la ubicación de los pueblos indígenas por departamento y municipio a 31 de Diciembre de 2020.',
 'tipo': 'dataset',
 'url': 'https://www.datos.gov.co/d/etwv-wj8f',
 'categoria': 'NA',
 'fecha_creacion': '2020-01-27',
 'numero_vistas': 622,
 'numero_descargas': 110,
 'licencia': 'Creative Commons Attribution | Share Alike 4.0 International',
 'fecha_publicacion': '2020-01-27',
 'base_publica': 'published',
 'fecha_actualizacion': '2021-01-26',
 'numero_filas': 226,
 'numero_columnas': 3,
 'licencia_url': 'http://creativecommons.org/licenses/by-sa/4.0/legalcode',
 'entidad': 'Ministerio del Interior',
 'entidad_municipio': 'Bogotá D.C.',
 'entidad_sector': 'Interior',
 'entidad_departamento': 'Bogotá D.C.',
 'entidad_orden': 'Nacional',
 'entidad_dependencia': 'Dirección de Asuntos Indígenas ROM y Minorías',
 'cobertura': 'Nacional',
 'idioma': 'Español',
 'frecuencia_actuali