Skip to content
No description, website, or topics provided.
Branch: master
Clone or download
Type Name Latest commit message Commit time
Failed to load latest commit information.
.gitignore Añadir al Gitignore QGIS Codes Mar 18, 2019 Divipola zip file Jun 28, 2019
DateTransform_TransformFechas.txt Update names Jun 17, 2019
LICENSE Create LICENSE Aug 5, 2018
ReporteValidación_EP.txt primer commit Jul 25, 2018
ValElevationAPIGeoNames_ValElevacionAPIGeoNames.txt Update Script Name Jun 28, 2019
ValNamesGeo_ValNombresGeo.txt Update names Jun 17, 2019
ValTaxonomicAPIGBIF_ValTaxonomicaAPIGBIF.txt Check consistency between taxonomic Scripts Jun 17, 2019
ValTaxonomicAPIWoRMS_ValTaxonomicaAPIWoRMS.txt Update according to the last Worms API update Aug 12, 2019
ValTaxonomicSpeciesMatchGBIF_ValTaxonomicaSpeciesMatchGBIF.txt Change deprecated species matching script Jun 17, 2019

Open Refine Scripts for Biodiversity Data Quality

-Versión en español abajo.

The biodiversity information system of Colombia -SiB Colombia developed a set of scripts in Open Refine for data quality management of primary biodiversity data.

About the Scripts

These scripts perform automatic validations of data facilitating data cleaning and format fixing:

  1. Taxonomic Validation with GBIF's API
  2. Taxonomic Validation with Species Matching web service
  3. Taxonomic Validation with WORMS's API (Marine data)
  4. Colombian Geographic Names Validation
  5. Dates transforming to ISO format with Canadensys conversion service
  6. Validation of geographic elevation with GeoNames API

Open Refine

"OpenRefine is a Java-based power tool that allows you to load data, understand it, clean it up, reconcile it, and augment it with data coming from the web. All from a web browser and the comfort and privacy of your own computer." From the Open Refine site

Target Public

Anyone working with primary biodiversity data, no prior knowledge of coding or Open Refine are required. Although SiB Colombia works mainly with a Spanish speaking community, all the information will be available both in Spanish and English. All the basics for uploading a file and running the scripts are documented on the Wiki; additional information for advanced users can be found directly in the Open Refine Wiki

Licensing and Credits

This work has been produced by the Biodiversity Information System of Colombia -SiB Colombia, the code is distributed under a GNU General Public License v3.0. SiB Colombia promotes collaboration, open data, and open knowledge. Please use and share this scripts with a proper citation:

Sistema de Información Sobre Biodiversidad de Colombia -SiB Colombia (2019). Biodiversity data quality Scripts in Open Refine (Version 1.0)[code].

Contact us

e-mail: Social Media: Twitter Facebook

Rutinas de calidad de datos sobre biodiversidad en Open Refine

El sistema de información sobre biodiversidad de Colombia Colombia -SiB Colombia desarrolló un grupo de rutinas en Open Refine para gestionar la calidad de los datos primarios sobre biodiversidad.

Acerca de las rutinas

Estas rutinas validan de manera automática los datos, facilitando la limpieza y estandarización:

  1. Validación taxonómica con el API de GBIF
  2. Validación taxonómica con el servicio web ‘Species Matching’
  3. Validación taxonómica con el API de Worms (Datos Marinos)
  4. Validación de los nombres geográficos de Colombia según el DANE
  5. Transformación de fechas al estándar ISO con el servicio de conversión de ‘Canadensys’
  6. Validación de elevaciones con el API de GeoNames

Open Refine

Open Refine es un programa que permite limpiar, transformar y dar formato a los datos, usar servicios web, corrección masiva campos, entre muchas otras.


Cualquier persona que trabaje con datos primarios sobre biodiversidad, no se requiere conocimiento previo de programación o sobre Open Refine. Aunque la comunidad del SiB Colombia habla principalmente español, toda la información también estará disponible en ingles. Toda la información básica sobre cargar los archivos y correr las rutinas esta documentada en la Wiki; información adicional para usuarios avanzados esta disponible directamente en la wiki de Open Refine Wiki

Licencia y créditos

Este trabajo fue producido por el sistema de información sobre biodiversidad de Colombia, el código esta bajo una licencia ‘ GNU General Public License v3.0’. El SiB Colombia promueve la colaboración y el acceso abierto a los datos y al conocimiento. Use y comparta este contenido dando el crédito apropiado:

Sistema de Información Sobre Biodiversidad de Colombia -SiB Colombia (2019). Biodiversity data quality Scripts in Open Refine (Version 1.0)[code].


e-mail: Redes Sociales: Twitter Facebook

You can’t perform that action at this time.