Skip to content

FactoQGIS: a GUI tool based on an R script to perform Geometric Data Analysis in QGIS

License

Notifications You must be signed in to change notification settings

ESO-Rennes/FactoQGIS

Repository files navigation

FactoQGIS

FactoQGIS: a GUI tool based on an R script to perform Geometric Data Analysis in QGIS

Main Author: Florent Demoraes , UMR ESO CNRS 6590, Université Rennes 2, France

Contributors: SIGAT Master Degree students (Université Rennes 2, 2018-2019 and 2019-2020)



Current release of FactoQGIS: June 2021


FactoQGIS works with:
Processing R Provider --> version 2.x and newer
QGIS --> version 3.4 and newer
R --> version 3.5.3 and newer

The output html file now includes new features
--> A table with all the input parameters, a table with the number of spatial units in each cluster
--> The x-axis of the bar plots which describe the clusters now adjust automatically
--> A factor map showing the individuals differentiated according to the additional qualitative variable(s). This factor map only appears if at least one additional qualitative variable has been selected
--> A map of the typology rendered with the same color palette as the one used on the 3D dendrogram

Forewords
--> FactoQGIS works with polygons layers which contain data (counts, %, ratios, categories, etc.) in the table of attributes
--> Allowed input layer formats: shapefile, geopackage, geojson (etc.)
--> When using FactoQGIS for the first time, the required R packages are automatically installed and loaded
--> Known issues: NA (missing data, unknown values) are not allowed in the table of attributes


A full description of the first release of the algorithm is available here : https://hal.science/hal-02181611


ENGLISH-------------------------------

This algorithm implements in QGIS a typological analysis based on quantitative data aggregated in spatial units. First, it performs a PCA (Principal Component Analysis) on N variables and second, a HAC (Hierarchical Ascending Classification also called Hierarchical Agglomerative Clustering) on the first factors. This algorithm is mainly based on the FactoMineR package developed by François Husson et al. (Agrocampus Ouest, Rennes, France). The output tables and plots are exported respectively to Excel and to png format and then are inserted into an html file that automatically pops up in a web browser at the end of the process. The Eigenvalue table and the variable coordinate table are also added to the table of contents in QGIS. Finally, the algorithm creates a new layer which contains an attribute field indicating the cluster each spatial unit belongs to, so as to make it easy to map the typology. For this purpose, a style file in QML format is generated and can be used as default rendering (the colors of the clusters are the same as those on the 3D hierarchical tree). FactoQGIS is accessible from a graphical user interface directly in the QGIS environment. It will be of particular interest to any user who wishes to simply build and map a multidimensional typology without knowing the R language.

To use FactoQGIS, just download the NEW_FactoQGIS_English_Version_2021.zip file, unzip and save it to C:\Users...\AppData\Roaming\QGIS\QGIS3\profiles\default\processing\rscripts folder. A poster (in French) which presents FactoQGIS is available HERE. A video tutorial (in French) is viewable HERE. To see an example of report containing the results generated by FactoQGIS, click HERE.


FRANCAIS-------------------------------

Cet algorithme met en œuvre dans QGIS une analyse typologique à partir de données quantitatives agrégées dans un découpage spatial. Il permet dans un premier temps d’exécuter une ACP (Analyse en Composante Principale) sur N variables et dans un deuxième temps d’appliquer une CAH (Classification Ascendante Hiérarchique) sur les premiers facteurs. Cet algorithme repose principalement sur le package FactoMineR développé par François Husson et al. (Agrocampus Ouest, Rennes, France). Les résultats produits (tableaux et graphiques) sont exportés respectivement au format Excel et au format png puis insérés dans un fichier html qui s’ouvre automatiquement dans un navigateur web à la fin du calcul. Le tableau des valeurs propres et le tableau des coordonnées des variables sur les axes sont également ajoutés à la liste des couches dans QGIS. Enfin, l’algorithme crée une nouvelle couche comportant une colonne indiquant l’appartenance des unités spatiales aux classes issues de la typologie, classes qui peuvent ensuite être directement cartographiées. A cet effet, un fichier de style au format QML est créé et peut être utilisé comme rendu par défaut (les couleurs des classes sont les mêmes que celles sur l'arbre hiérarchique 3D). FactoQGIS est accessible depuis une interface graphique directement dans l'environnement QGIS. Il sera ainsi particulièrement utile pour les utilisateurs qui souhaitent simplement construire et cartographier une typologie multidimensionnelle sans connaître le langage R.

Pour utiliser FactoQGIS, télécharger le fichier NOUVEAU_FactoQGIS_Version_Francaise_2021.zip. Décompressez-le et sauvegardez-le dans le dossier C:\Users...\AppData\Roaming\QGIS\QGIS3\profiles\default\processing\rscripts.

Un poster de présentation élaboré par un groupe d'étudiants du Master 2 SIGAT (2019-2020) est disponible ICI. Un tutoriel vidéo réalisé par un deuxième groupe d'étudiants du Master 2 SIGAT (2019-2020) est également accessible ICI. Le jeu de données d'exemple utilisé dans le tutoriel est téléchargeable ICI. Pour avoir un aperçu du type de rapport contenant les résultats produits par FactoQGIS, cliquer ICI.


REFERENCES---------------

  1. BENZECRI, J.P., (1973) L'Analyse des données, Dunod, 619 p. ISBN 2-04-007225-X
  2. CORNILLON P.A., GUYADER A., HUSSON F., JEGOU N., JOSSE J., KLUTCHNIKOFF N., LE PENNEC E., MATZNER-LØBER E., ROUVIERE L. & THIEURMEL B. (2018). R pour la statistique et la science des données. Presses Universitaires de Rennes, 1 ed. 415 p., ISBN : 978-2-7535-7573-8
  3. GRASER, A.; OLAYA, V. (2015) Processing: A Python Framework for the Seamless Integration of Geoprocessing Tools in QGIS. Vol. 4, ISPRS Int. J. Geo-Information, 2219-2245. Available online: https://doi.org/10.3390/ijgi4042219 (accessed on May 13, 2019)
  4. GREENACRE M. J.; BLASIUS J. (2006), Multiple Correspondence Analysis and Related Methods. CRC press. ISBN 978-1-58488-628-0.
  5. HUSSON F., LÊ S., PAGÈS J., (2009), Analyse de données avec R, Presses Universitaires de Rennes, 224 p. ISBN 978-2753509382
  6. LE ROUX B., ROUANET H. (2005), Geometric Data Analysis - From Correspondence Analysis to Structured Data Analysis, Springer Netherlands, 475 p. ISBN 978-1-4020-2236-4
  7. LEBART L., PIRON M., MORINEAU A., (2006), Statistique exploratoire multidimensionnelle : visualisation et inférence en fouille de données, Dunod, 464 p.


ONLINE RESOURCES---------------

  1. Processing R Provider Plugin for QGIS 3.x. https://github.com/north-road/qgis-processing-r
  2. Documentation of the FactoMineR package used in FactoQGIS. https://www.rdocumentation.org/packages/FactoMineR/versions/1.41
  3. Documentation of the factoextra package used in FactoQGIS. https://www.rdocumentation.org/packages/factoextra/versions/1.0.5
  4. Documentation of the openxlsx package used in FactoQGIS. https://www.rdocumentation.org/packages/openxlsx/versions/4.1.0
  5. Documentation of the R2HTML package used in FactoQGIS. https://www.rdocumentation.org/packages/R2HTML/versions/2.3.2
  6. Documentation of the corrplot package used in FactoQGIS. https://www.rdocumentation.org/packages/corrplot/versions/0.84
  7. Documentation on how to use R script in QGIS. https://docs.qgis.org/3.16/en/docs/training_manual/processing/r_intro.html

About

FactoQGIS: a GUI tool based on an R script to perform Geometric Data Analysis in QGIS

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published