Risultato di un'attività di tirocinio curricolare. In diversi incontri con dei liceali si è cercato di sensibilizzare all'utilizzo dei dati, ma anche di stimolare un interesse ed una maggiore consapevolezza in merito.
- 01/02 (9.00-16.00): Parola chiave -> attendibilità
- introduzione all'argomento del progetto (brainstorming, spiegazione concetti rilevanti)
- discorso sui affidabilità dei dati e ricerca di fonti attendibili
- download dei dati e inizio studio variabili
- 10/02: Parola chiave: elaborazione
- fine studio e selezione variabili (dplyr, tidyverse)
- esempi di come calcolare analiticamente i missing data e spiegazione di come la NASA abbia riorgnizzato i dati in una nuova tabella senza ripetizioni e con molti meno NA
- discorso su come i dati vadano spesso "puliti" per essere utilizzati (trash in, trash out)
- 24/02: Parola chiave: visualizzazione
- importanza del visualizzare i dati in modo preciso, consono e comunicativo (ggplot)
- 10/03: Parola chiave -> stima
- errori di misura *(t-test media intervalli di errore): i dati sono approssimazioni e stime, molto importante interpretarli e tenere presente che non costituiscono una verità assoluta.
- 22/03: Parola chiave -> clustering
- idea di metodo per raggruppare esopianeti simili tra di loro (k-means): analisi "confermativa", per ottenere i 4 gruppi principali (terrestri, superterre, nettuniani, giganti gassosi)
- (dalla curiosità di uno studente del gruppo) come rappresentare in un grafico bidimensionale gruppi di pianeti descritti da più di tre variabili? (PCA: affrontata non in modo approfondito, come meccanismo con il quale è possibile plottare il grafico dei clusters ottenuti in sole due dimensioni)
- 11/04: Parola chiave -> pianeti simili alla terra
- focus sul sistema Trappist, gemello del nostro sistema solare. Bubble plot e confronto variabili rilevanti per comparare i pianeti di questo sistema con la terra. Potrebbero ospitare vita?
I dati sono disponibili al seguente link: https://datascience4citizens.cms.webnode.it/progetti/