Questo progetto permette di analizzare e visualizzare i dati relativi alle università italiane (Open Data MIUR). Il progetto usa R ed è riproducibile facilmente, essendo i dati e tutte le risorse disponibili online..
Per l'esecuzione sono richiesti i seguenti pacchetti R:
- tidyverse
- factoextra
- NbClust
- RColorBrewer
- ggplot2
- plotly
- fpc
- dbscan
- caret
I dati iniziali disponibili sul sito del MIUR (http://dati.ustat.miur.it/dataset/iscritti/resource/32d26e28-a0b5-45f3-9152-6072164f3e63) riguardano il numero di iscritti divisi per genere, anno e ateneo Italiano per il periodo 2010-2020.
Dopo il calcolo della media degli iscritti per ogni ateneo viene calcolato il numero K ottimo di cluster da usare nell'analisi KMeans. L'analisi K means permetterà di ottenere una divisione dimensionale degli atenei.