# Esercitazione su Moduli Python in Ambito Scientifico

Per alcune esercitazioni vengino usati dei dati disponibili nel repositori github legato al corso.

Il file da utilizzare saranno: 
* _kplr010666592-2011240104155_slc.csv_
* _ExoplanetsPars_2024.csv_

## Esercizio 1 - Lettura file CSV e produzione grafici di Flusso in funzione del Tempo 
    

Per il primo esercizio useremo dei dati della missione Kepler / K2  (https://science.nasa.gov/mission/kepler/)  sul transito di pianeti extrasolari messi a disposizione dalla NASA.

![image-2.png](attachment:image-2.png)

#### Dati Originali
Link al portale con i dati: https://archive.stsci.edu/missions-and-data/kepler  
Portale di Ricerca:  https://archive.stsci.edu/kepler/data_search/search.php

Nome Esopianeta: _HAT-P-7 b_ 


#### File di Dati
Il file di dati da utilizzare è `kplr010666592-2011240104155_slc.csv`, che è equivalente a quello che si può scaricare direttamente dal portale ufficiale (ma in formato `fits`).

Si può aprire direttamente il file tramite `pandas` usando come percorso il link:
https://raw.githubusercontent.com/s-germani/metodi-computazionali-fisica-2024/refs/heads/main/dati/moduli_scientifici/kplr010666592-2011240104155_slc.csv

Oppure si può scaricare il file localmente:
`wget https://raw.githubusercontent.com/s-germani/metodi-computazionali-fisica-2024/refs/heads/main/dati/moduli_scientifici/kplr010666592-2011240104155_slc.csv`

si consiglia di spostarlo in una sottocartella apposita.


##### Colonne usate per i grafici 
`TIME`           : $BJD - 2454833$ $\rightarrow$ Barycenter corrected Julian Date  

`PDCSAP_FLUX`    : $e^-/s$          $\rightarrow$ Pre-search Data Conditioning (PDC)
                                      aperture photometry flux, (electrons per second) 

`PDCSAP_FLUX_ERR`: $e^-/s$          $\rightarrow$ PDC aperture photometry flux error

#### Barycenter corrected Julian Date

https://en.wikipedia.org/wiki/Barycentric_Julian_Date


### Richieste

Creare uno script python che: 
1. legga il file `kplr010666592-2011240104155_slc.csv` e crei il DataFrame _pandas_ corrispondente;
2. stampi il nome delle colonne del DataFrame;
3. produca un grafico del flusso in funzione del tempo
    * suggerimento: usare `pyplot.plot`;
4. produca un grafico del flusso in funzione del tempo coi punti del grafico demarcati da un simbolo (no linea);
    * suggerimento: usare `pyplot.plot` con opzione `'o'` o equivalente;
5. produca un grafico del flusso in funzione del tempo con barre di errore e salvi il risultato in un file png e/o pdf;
    * suggerimento: usare `pyplot.errorbar`;
6. produca un grafico simile al precedente selezionando un intervallo temporale attorno ad uno dei minimi;
    * suggerimento: usare `.loc` per la serezione dei valori nel DataFrame;
7. produca un grafico come per il punto 5 ma con la selezione del punto 6 mostrata come riquadro.
    * suggerimento: utilizzare `inset_axes`

In [None]:
# Esempio Inset 
fig, ax = plt.subplots(figsize=(12,6))
...
ins_ax = ax.inset_axes([x, y, width, height]) # w.r.t. ax
ins_ax.errorbar( datax, datay, .... )


**Soluzione:** _kepler.py_ 

## Esercizio 2 - Lettura file CSV e produzione Scatter Plot e Istogrammi

#### Dati Originali

Per il secondo esercizio useremo un catalogo esopianeti messo a disposizione di nuovo  dal Caltech.

Link al portale con i dati:  https://exoplanetarchive.ipac.caltech.edu/


#### File di Dati
Il file di dati da utilizzare è `ExoplanetsPars_2024.csv`, che si può scaricare direttamente dal portale ufficiale, eventualmente selezionando solo le cartelle di interesse.


Si può aprire direttamente il file tramite `pandas` usando come percorso il link:

`https://raw.githubusercontent.com/s-germani/metodi-computazionali-fisica-2024/refs/heads/main/dati/moduli_scientifici/ExoplanetsPars_2024.csv`


Oppure si può scaricare il file localmente:
`wget https://raw.githubusercontent.com/s-germani/metodi-computazionali-fisica-2024/refs/heads/main/dati/moduli_scientifici/ExoplanetsPars_2024.csv`

si consiglia di spostarlo in una sottocartella apposita. 

##### Colonne usate per i grafici 
* `pl_orbper`:  Orbital Period [days]
* `pl_bmassj`:  Planet Mass or Mass*sin(i) [Jupiter Mass]
* `pl_orbsmax`: Orbit Semi-Major Axis [au]
* `st_mass`:    Stellar Mass [Solar mass]
* `discoverymethod`: Discovery Method



### Richieste

Per ogni richiesta che segue mostrare il grafico per i pianeti extrasolari e per quelli del Sistema Solore (opportunamente identificati).

Creare un secondo script python che: 
1. legga il file `ExoplanetsPars_2024.csv` e crei il DtaFrame _pandas_ corrispondente;
    * suggerimento: usare l'opzione `comment='#'`
2. stampi il nome delle colonne del DataFrame;
3. stampi un estratto del contenuto del DataFrame;
4. produca un grafico con assi logaritmici della massa del pianeta  in funzione del periodo orbitale;
    * suggerimento: usare `pyplot.scatter`;
5. produca un grafico con assi logaritmici della grandezza $R_{max}^2/m_*$ in funzione del periodo orbitale;
    * $R_{max}$: Orbit Semi-Major Axis
    * $m_*$: Stellar Mass
6. produca un grafico con assi logaritmici della massa del pianeta  in funzione del periodo orbitale distinguendo gli esopianeti per metodo di scoperta (`Transit` o `Radial Velocity`) con la corrispondente legenda (gli altri tipi di esopianeti non vanno considerate nel grafico);
    * suggerimento: usare `.loc` per la serezione dei valori nel DataFrame;
    * suggerimento: usare l'opzione `alpha` per la trasparenza;
7. produca l'istogramma sovrapposto   della massa del pianeta distinguendo gli esopianeti per metodo di scoperta (`Transit` o `Radial Velocity`) con la corrispondente legenda con la relativa legenda;
    * suggerimento: usare `pyplot.hist` definendo lo stesso numero di bin e lo stesso intervallo per l'asse x;
    * suggerimento: usare l'opzione `alpha` per la trasparenza;
8. produca un grafico analogo al precedente per il logaritmo in base 10 della massa del pianeta.

**Soluzione:** _exoplanets.py_ 

## Esercizio 2A (OPZIONALE)

Creare uno script python che combini: 
* il grafico del punto 2.6, ma graficando direttamente il logaritmo in base 10 dei valori invece di usare la scala logaritmica per gli assi, 
* l'istogramma dei punti 2.8,
* un istogramma simile a quello del punto 2.8 ma per il periodo orbitale,
in un'unica immagine come in figura e salvi il risultato in un file png e in un file pdf.

![Exoplanets_Period_vs_Mass_Detection.png](attachment:Exoplanets_Period_vs_Mass_Detection.png)

Suggerimenti:
* controllare gli esempi al seguente link per capire come gestire più riquadri nello stesso grafico: https://matplotlib.org/stable/gallery/subplots_axes_and_figures/subplots_demo.html
* per gli istogrammi con barre orizzontali usare l'opzione :`orientation='horizontal'`;
    * https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html

**Soluzione:** _exoplanets.py_ 

## Esercizio 3 (OPZIONALE)

Riprendendo i dati dell' Esercizio 1, determinare il periodo orbitale $T$ e mostrare tutti i transiti in un unico grafico con tempo compreso fra $-\frac{T}{2}$ e $+\frac{T}{2}$ (folding).

**Soluzione:** _kepler_fold.py_ 