<img align="left" src = https://www.linea.gov.br/wp-content/themes/LIneA/imagens/logo-header.png width=180 style="padding: 20px"> <br>

## Curso básico de ferramentas computacionais para astronomia
Contato: Julia Gschwend ([julia@linea.gov.br](mailto:julia@linea.gov.br)) <br>
Github: https://github.com/linea-it/minicurso-jupyter  <br>
Site: https://minicurso-ed2.linea.gov.br/ <br> 
Última verificação: 30/08/2021<br> 

# Aula 4 - Visualização de dados



### Objetivo: Color-magnitude diagram (CMD) de galáxias

Depois de explorar os comandos para criar e customizar gráficos básicos, ao final do notebook faremos um diagrama cor-magnitude de galáxias com dados observacionais do levantamento DES (Y1). Esta amostra faz parte do produto da publicação [Aguena et al. 2021](https://academic.oup.com/mnras/article-abstract/502/3/4435/6137813?redirectedFrom=PDF) e estão disponíveis para download no repositório de produtos científicos [LIneA Dataverse](https://dataverse.linea.gov.br/dataset.xhtml?persistentId=doi:10.5072/FK2/WQQOBC).

No arquivo `cluster_members.csv` dentro da pasta `dados` vamos encontrar um catálogo de objetos classificados como membros de aglomerados de galáxias com alto valor de "riqueza", ou seja, que possuem muitos membros (neste caso > 250 membros).  


#### CMD teórico:

<img src="http://www-astro.physics.ox.ac.uk/~mxc/gedg/cm_diagram.png" width="500"/> 

Fonte da imagem: [University of Oxford's Galaxy Evolution Discussion Group web page](http://www-astro.physics.ox.ac.uk/~mxc/gedg/index_2010-04-07.html) 

#### "_Caveats_" e adaptações necessárias:

+ As bandas $U$ e $B$ não fazem parte do conjunto de filtros disponíveis no DES (filtros $grizY$). Usaremos então as cores $g-r$ ou $g-i$. 
+ O redshift fotométrico (photo-$z$) é utilizado como um indicador de distância (redshift cosmológico). 
+ No diagrama teórico, o eixo $x$ se refere à massa das galáxias, que poderia ser substituída pela magnitude absoluta. Entretanto, as magnitudes disponíveis no catálogo são aparentes. Se os objetos estiverem todos a uma mesma distância (mesmo photo-$z$), podemos usar a magnitude aparente como indicador do brilho intrínseco de forma comparativa. 


**Dica: Para navegar nas seções do notebook, use o índice da barra lateral do Jupyter Lab.**


## 0. Setup

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

**Leitura dos dados**

In [None]:
dados = pd.read_csv("dados/cluster_members.csv")

In [None]:
dados.head()

In [None]:
dados.size

In [None]:
dados.info()

In [None]:
dados.describe()

# 1. Gráficos com a biblioteca Matplotlib

[matplotlib.org](https://matplotlib.org/)

[cheatsheets](https://github.com/matplotlib/cheatsheets#cheatsheets)

## 1.1 Histogramas (1D)

**Freedman–Diaconis rule**

Regra da estatística para calcular a largura de bin ótima para exibir uma distribuição de dados. Fonte: [Wikipedia](https://en.wikipedia.org/wiki/Freedman%E2%80%93Diaconis_rule)



$$ bin \ width = 2 \  \frac{Q_{3}-Q_{1}}{\sqrt[3]{N}}  $$








In [None]:
q1, q2, q3 = dados.mag_i.quantile(q=[0.25, 0.50, 0.75])
q1, q2, q3

In [None]:
def bin_width(series):
    """Return optimal bin width for a given pandas Series 
        object based on the Freedman–Diaconis rule"""   
    
    q1, q3 = series.quantile(q=[0.25, 0.75])
    width = 2 * ((q3-q1)/(series.count()**(1./3.)))
    
    return width

In [None]:
bin_width(dados.mag_i) #aplicando na coluna mag_i

In [2]:
#help(plt.hist)

In [None]:
#help(np.histogram_bin_edges)

## 1.2 Plot (xy) and Scatter plots

Plot

Scatter plot

## 1.3 Density plots

In [None]:
from scipy.stats import gaussian_kde

#### Mapas de densidade

Histogram 2D

Hexbin

# 2. Gráficos com a biblioteca Seaborn

In [None]:
sns.set(color_codes=True, font_scale=1.5) # seaborn plot config

## 2.1 Histogramas (1D)

## 2.2 Scatter plot

## 2.3 Density plots

## 2.4 Joint Plots

# 3. CMD

Cálculo da cor

In [None]:
dados["gmi"] = dados.mag_g - dados.mag_i

Seleção de objetos em uma faixa estreita de redshift. 

In [None]:
zmin = 0.5
zmax = 0.6

In [None]:
same_distance = dados.query(f'z_gal > {zmin} & z_gal < {zmax}')

In [None]:
same_distance.size

CMD

Red and blue

In [None]:
red = same_distance.query('gmi > 2 & gmi < 5')
blue = same_distance.query('gmi > -1 & gmi < 2')

# 4. Export  

Para exportar seu notebook com resultados para uma versão estática e leve que abre em qualquer navegador, basta ir no menu em:

`File > Export Notebook As > Export to HTML`

Antes de salvar o arquivo **.ipynb**, não se esqueça de limpar todos os outputs:

`Edit > Clear All Outputs`