Skip to content
Datos para el datatón 2019
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
S2_SPC Datos S2 y S3 Dec 4, 2019
S3_Sancionados Datos S2 y S3 Dec 4, 2019
S6_Contrataciones large files Dec 4, 2019
.gitattributes datos Nov 26, 2019
.gitignore datos Nov 26, 2019
LICENSE datos Nov 26, 2019
README.md Datos S2 y S3 Dec 4, 2019

README.md

Dataton2019 - Datos

Las bases de datos que estarán disponibles para este año serán las de tres de los seis sistemas de la Plataforma Digital Nacional:

  • Sistema 2 (S2): Sistema de los Servidores públicos que intervengan en procedimientos de contrataciones públicas
  • Sistema 3 (S3): Sistema nacional de Servidores públicos y particulares sancionados
  • Sistema 6 (S6): Sistema de Información Pública de Contrataciones (incluyendo EDCA y sus extensiones)

Servidores públicos que intervienen en contrataciones (S2)

Nombre del archivo Formato Descripción
s2-bulk.zip JSON Array

Servidores públicos y particulares sancionados (S3)

Nombre del archivo Formato Descripción
s3-servidores-bulk.zip JSON Array Servidores públicos sancionados
s3-particulares-bulk.zip JSON Array Particulares sancionados

Contrataciones (S6)

Son los datos abiertos de las compras públicas del Gobierno Federal en formato OCDS, Open Contracting Data Standard (A.K.A EDCA = Estándar de Contrataciones Abiertas).

Fuente de datos

Plataforma Digital Nacional: https://plataformadigitalnacional.org/contrataciones

Periodo comprendido

2017-2019

Formato abierto de los datos

Json

Datos

Primero se partió del conjunto de datos de contrataciones (S6). Este conjunto de datos tiene cientos de variables, las cuales corresponden al formato OCDS pero en su implementación en México.

Nombre del archivo Formato Descripción
contrataciones_arr.json.zip JSON Array Datos de contrataciones públicas, organizados conforme al estandar OCDS (A.K.A. "EDCA")

Construcción de subconjuntos de Datos

Para poder ejemplificar el uso de grafos en los datos de contrataciones, se extrajeron del conjunto original los Instituciones compradores (buyers) y los Proveedores/contratistas (suppliers) para crear dos subconjuntos de datos adicionales.

Finalmente se creó otro subconjunto de datos adicional usando las siguientes variables:

  • ocid
  • buyer
  • parties
  • tender.procurementMethod
  • tender.title
  • contracts

Los subconjuntos generados son los siguientes:

Archivo Formato Descripción
buyers.json.zip JSON Array Instituciones compradoras
tenderers_suppliers.json.zip JSON Array Proveedores/contratistas
cp.json.zip JSON Array Varias variables de contrataciones_arr.json.zip

Importación de Datos

Instrucciones para importar los datos en una instancia local de MongoDB:

# Descomprime los datos:
unzip datos_ejemplo.json.zip

# Importa los datos a MongoDB:
mongoimport -d dataton2019 -c datos_ejemplo --jsonArray datos_ejemplo.json

Consultas básicas de los Datos

Consultas básicas en MongoDB (línea de comandos):

# Ingresa a la línea de comandos de MongoDB:
mongo
 // Seleccionar base de datos dataton2019
 use dataton2019;

 // Contar registros
 db.datos_ejemplo.count();

 // Buscar y mostrar el primer registro en la colección 
 db.datos_ejemplo.findOne();

Fuente

Construcción de una Base de datos de grafos

El objetivo de este Datatón es usar grafos para modelar los datos de contrataciones públicas, de servidores públicos que intervengan en procedimientos de contrataciones públicas y de servidores públicos y particulares sancionado con el fin de encontrar posibles redes de corrupción.

Para hacer esto, se construyó una Base de datos usando Neo4j y generada a partir de los conjuntos de datos de contrataciones que mencionamos arriba.

Hacer esto permite trazar las relaciones entre las Instituciones de Gobierno (buyers), los procesos de contrataciones y los participantes (tenderers, suppliers, etc.).

Archivo Formato Comentarios
oc_graph.dump Neo4j dump Base de datos de grafos

Instrucciones para construir la base de datos:

# Ingresa al directorio de neo4j y detén la base de datos
$neo4j-home> bin/neo4j stop

# Restaura la base de datos
$neo4j-home> bin/neo4j-admin load --from=/path/to/oc_graph.dump --database=graph.db --force

A continuación se presenta una consulta a la base de datos para su representación gráfica:

$ MATCH p=()-->() RETURN p LIMIT 5000

alt Graph database

¿Qué cosas interesantes puedes observar?

You can’t perform that action at this time.