Localbiplot - Biblioteca de código abierto para el análisis de datos de alta dimensión utilizando biplots por localidades, como soporte a aplicaciones de agricultura de precisión
La biblioteca de código abierto desarrollada en Python para el análisis de datos de alta dimensión utilizando biplots por localidades (Localbiplot), como soporte a aplicaciones de agricultura de precisión, consiste en un conjunto de módulos diseñados para realizar un análisis basado en una extensión del biplot mediante la descomposición de Valores Singulares (SVD) a nivel de localidades. Su objetivo es resaltar, analizar e identificar patrones en subgrupos específicos de datos no estacionarios, utilizando relaciones tanto lineales como no lineales. Esto permite visualizar las relaciones entre muestras y variables en los diferentes conjuntos de ejes generados. La herramienta consta de varios módulos que se encargan de lo siguiente: i) Normalizar y centralizar datos; ii) Obtener representaciones de baja dimensión lineales (SVD) y no lineales (t-SNE) a nivel de todo el conjunto de datos; iii) Realizar análisis de subconjuntos de datos de alta y baja dimensión (clusters), basado en una variable específica del conjunto. Luego, se calcula el SVD local en cada grupo para obtener las matrices biplot; iv) Aplicar transformaciones afines con los parámetros que mejor escalan, traducen y rotan cada uno de los múltiples conjuntos de ejes generados para cada subespacio de los datos agrupados.
2. Requerimientos técnicos a nivel de hardware y software para instalar y operar el software desarrollado
localbiplot necesita Python >= 3.8 y acceso a internet para descargar las librerias
2.1 Instalar desde el código fuente
!pip install -U git+https://github.com/Jectrianama/python-gcpds.localbiplot.git --quiet
2.2 Añadir la librería en su código como :
import gcpds.localbiplot as lb
La biblioteca local biplot esta desarrollado utilizando python 3.11. Ademas, el núcleo principal de este software se encuentra en librerias como matplotlib, y scipy, diseñadas para manejar todo lo relacionado con graficas y manejo de estructuras de datos para asi amplíar las capacidades de la herramienta.