Manual Técnico Software¶
Localbiplot - Biblioteca de código abierto para el análisis de datos de alta dimensión utilizando biplots por localidades, como soporte a aplicaciones de agricultura de precisión¶
1. Descripción general del sistema de información desarrollado¶
La biblioteca de código abierto desarrollada en Python para el análisis de datos de alta dimensión utilizando biplots por localidades (Localbiplot), como soporte a aplicaciones de agricultura de precisión, consiste en un conjunto de módulos diseñados para realizar un análisis basado en una extensión del biplot mediante la descomposición de Valores Singulares (SVD) a nivel de localidades. Su objetivo es resaltar, analizar e identificar patrones en subgrupos específicos de datos no estacionarios, utilizando relaciones tanto lineales como no lineales. Esto permite visualizar las relaciones entre muestras y variables en los diferentes conjuntos de ejes generados. La herramienta consta de varios módulos que se encargan de lo siguiente: i) Normalizar y centralizar datos; ii) Obtener representaciones de baja dimensión lineales (SVD) y no lineales (t-SNE) a nivel de todo el conjunto de datos; iii) Realizar análisis de subconjuntos de datos de alta y baja dimensión (clusters), basado en una variable específica del conjunto. Luego, se calcula el SVD local en cada grupo para obtener las matrices biplot; iv) Aplicar transformaciones afines con los parámetros que mejor escalan, traducen y rotan cada uno de los múltiples conjuntos de ejes generados para cada subespacio de los datos agrupados.
2. Requerimientos técnicos a nivel de hardware y software para instalar y operar el software desarrollado¶
localbiplot necesita Python >= 3.8 y acceso a internet para descargar las librerias
2.1 Instalar desde el código fuente
!pip install -U git+https://github.com/Jectrianama/python-gcpds.localbiplot.git --quiet
2.2 Añadir la librería en su código como :
import gcpds.localbiplot as lb
3. Entorno y/o Lenguaje de desarrollo utilizado¶
La biblioteca local biplot esta desarrollado utilizando python 3.11. Ademas, el núcleo principal de este software se encuentra en librerias como matplotlib, y scipy, diseñadas para manejar todo lo relacionado con graficas y manejo de estructuras de datos para asi amplíar las capacidades de la herramienta.