In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sdss_tools import sdss_jpg, sdss_fits, sdss_spectra, sdss_template

from astropy import units as u
from astropy.coordinates import SkyCoord, Angle
from astroquery.sdss import SDSS

from astroML.plotting import setup_text_plots
setup_text_plots(usetex=True,fontsize=18)

%matplotlib inline

##Introduccion

En este tallere aprenderemos a descargar catalogos, imagenes y espectros del Sloan Digital Sky Survey (SDSS). El SDSS es un survey astronómico que cubre gran parte del cielo y que ha producido una gran cantidad de datos de las estrellas y galaxias que habitan en el Universo.

Más info en el link http://www.sdss.org/surveys/
Video del SDSS en https://www.youtube.com/watch?v=UD6cOMpJlZU

El SDSS survey ha permitido que cualquier persona interesada en la Astronomia pueda visitar el sitio web y explorar las imagenes y catalogos del survey. Un ejemplo muy exitoso del uso de los datos del SDSS es el sitio web llamado Galaxy Zoo (https://www.galaxyzoo.org/?lang=es), el cual invitó a la gente de todo el mundo a revisar las galaxias detectadas por el SDSS y clasificarlas morfologicamente

##Parte 1

Partiremos descargando un catalogo de galaxias elipticas de Galaxy Zoo y analizando los datos. Ejecute el siguiente codigo para descargar los datos

In [None]:
# Ejecute
cat_url='https://raw.githubusercontent.com/rpmunoz/PentaUC/master/Astronomia%20era%20informacion/data/SDSS_galaxyzoo_elipticas.csv'
cat_galaxyzoo=pd.read_csv(cat_url,header=0,sep=',')
cat_galaxyzoo.head()

**Ejercicio**

El catalogo de galaxy zoo contiene el ID y las coordenadas de las galaxias clasificadas como elipticas. Además, contiene el número de personas que votaron y clasificaron estas galaxias como elipticas. Haga un histograma que muestre la distribucion del numero de votos y use al menos 10 bines.

¿En torno a que valor se concentra el numero de votaciones?

In [None]:
# Su codigo y respuesta aqui


Como pueden apreciar, la tabla de galaxy zoo solo contiene coordenadas y votos de las galaxias. ¿Qué sucede con la informacion fotométrica y espectroscópica de estas galaxias? Esta información no se encuentra en el catalogo y es por ello que debemos usar query_region.

Para hacer consultas, lo primero es definir en que coordenadas del cielo estamos buscando un objeto. Para ello se usa la funcion SkyCoord.

In [None]:
# Ejecute aqui
ra=180.
dec=0.
coo=SkyCoord(ra, dec, unit=(u.deg,u.deg))
print coo

Para hacer una consulta si existe o no un objeto en esa posicion se usa la funcion query_region de astroquery
Ejecute el siguiente codigo

In [None]:
# Ejecute aqui
result = SDSS.query_region(coo, spectro=True, photoobj_fields=['ra','dec','u','g','r','i','z'], specobj_fields=['z'], radius=2*u.arcsec)
print result

**Pregunta**
¿Cual fue el resultado? ¿Encontramos alguna galaxia en esa posicion?

**Ejercicio**

Complete el siguiente codigo para consultar los datos del primer objeto de nuestra tabla de galaxyzoo. ¿Aparece algun valor en la tabla al hacer print result?

In [None]:
# Complete donde aparecen ...
coo=SkyCoord(cat_galaxyzoo['ra'][...], cat_galaxyzoo['dec'][...], unit=(u.deg,u.deg))
result = SDSS.query_region(coo, spectro=True, photoobj_fields=['ra','dec','u','g','r','i','z'], specobj_fields=['z'], radius=2*u.arcsec)
print result

** Ejercicio **

Ahora haremos la consulta de todos los objetos que estan en nuestro catalogo cat_galaxyzoo. Complete el siguiente codigo. ¿Aparecen los resultados para todas las galaxias? 

In [None]:
# Complete donde aparecen ...
coo=SkyCoord(cat_galaxyzoo[...], cat_galaxyzoo[...], unit=(u.deg,u.deg))

for i in range(len(coo)):
    print 'Processing galaxy ', i+1
    result = SDSS.query_region(..., spectro=True, photoobj_fields=['ra','dec','u','g','r','i','z'], specobj_fields=['z'], radius=2*u.arcsec)
    if i==0:
        sdss_data=result
    else:
        sdss_data.add_row(np.array(result)[0])

print sdss_data

Nuestro nuevo catalogo ya no se muestra de forma tan bonita y aparece como una matriz con muchos numeros. Para arreglarla, usamos la funcion DataFrame de pandas. Ejcute el sigiuiente codigo

In [None]:
# Ejecute aqui
cat_sdss_elipticas=pd.DataFrame(np.array(sdss_data))
cat_sdss_elipticas.head()

##Parte 2

Ahor comenzaremos a descargar imagenes jpeg de nuestras galaxias de galaxy zoo. Para ello nos conectaremos al servidor de SDSS y usaremos la funcion sdss_jpg.

El siguiente codigo descargamos la imagen de las priemras dos galaxias

In [None]:
# Ejecute
sdss_jpg(coo[0:2])

**Ejercicio**

Descague las images jpeg para las primeras 10 imagenes de la lista. ¿Que tipo morfologico son las galaxias?

In [None]:
# Complete su codigo aqui
sdss_jpg(...)

Los astronomos en la vida real no toman imagenes a colores y mas bien toman imagenes en blanco y negro. El tipo de archivo que usamos se llama fits.

Usaremos la funcion sdss_fits para descargar las imagenes de las priemras dos galaxias

In [None]:
#Ejecute aqui
sdss_fits(coo[0:2])

**Ejercicio**

Descague las images fits para las primeras 10 imagenes de la lista. ¿Son iguales o distitnas las imagenes fits y jpeg?

In [None]:
# Complete el codigo aqui
sdss_fits(...)

##Parte 3

Ahora comenzaremos a descargar espectros de nuestras galaxias de galaxyzoo. El espectro es la firma que poseen las galaxias.

El siguiente codigo descargamos el espectro de una tipica galaxia eliptica

In [None]:
sdss_template(tipo='eliptica')

Ahora descargaremos el espectro de las primeras dos galaxias

In [None]:
#Ejecute aqui
sdss_spectra(coo[0:2], redshift=[0.,0.])

**Ejercicio**

Comience a cambiar los valores de la variable redshift y trate de recuperar el grafico de sdss_template.

In [None]:
#Complete aqui donde aparecen los ...
sdss_spectra(coo[0:2], redshift=[...,...])

**Ejercicio**

Ahora descagaremos los espectros para las priemras 10 galaxias. Complete el codigo y determine el redshift de cada una

In [None]:
#Complete aqui donde aparecen los ...
sdss_spectra(..., redshift=[...])

##Parte 4


### Repita el mismo procedimiento anterior, pero esta vez usando las galaxias espirales

In [None]:
cat_url='https://raw.githubusercontent.com/rpmunoz/PentaUC/master/Astronomia%20era%20informacion/data/SDSS_galaxyzoo_espirales.csv'
cat_galaxyzoo=pd.read_csv(cat_url,header=0,sep=',')
cat_galaxyzoo.head()

In [None]:
coo=SkyCoord(cat_galaxyzoo['ra'], cat_galaxyzoo['dec'], unit=(u.deg,u.deg))
for i in range(len(coo)):
    print 'Processing galaxy ', i
    result = SDSS.query_region(coo[i], spectro=True, photoobj_fields=['ra','dec','u','g','r','i','z'], radius=2*u.arcsec)
    if i==0:
        sdss_data=result
    else:
        sdss_data.add_row(np.array(result)[0])

cat_sdss_espirales=pd.DataFrame(np.array(sdss_data))
cat_sdss_espirales

## Apendices

Descargar el catalogo completo de Galaxy zoo

In [None]:
import requests, zipfile, StringIO

In [None]:
cat_url='http://galaxy-zoo-1.s3.amazonaws.com/GalaxyZoo1_DR_table2.csv.zip'

r = requests.get(cat_url)
z = zipfile.ZipFile(StringIO.StringIO(r.content))

cat_file='GalaxyZoo1_DR_table2.csv'
cat_data=pd.read_csv(z.open(cat_file))
cat_data.head()

In [None]:
cat_data=cat_data.sort_values('P_EL_DEBIASED',ascending=0)
cat_elliptical=cat_data[cat_data['ELLIPTICAL']==1][0:100]
cat_elliptical['ra']=Angle(cat_elliptical['RA'], unit=u.hourangle).degree
cat_elliptical['dec']=Angle(cat_elliptical['DEC'], unit=u.degree).degree
cat_elliptical=cat_elliptical.rename(columns = {'OBJID':'ID','NVOTE':'votos'})
cat_elliptical=cat_elliptical[['ID','ra','dec','votos']].reset_index(drop=True)

cat_elliptical.to_csv('../data/SDSS_galaxyzoo_elipticas.csv',index=False)

In [None]:
cat_data=cat_data.sort_values('P_CS_DEBIASED',ascending=0)
cat_spiral=cat_data[cat_data['SPIRAL']==1][0:100]
cat_spiral['ra']=Angle(cat_spiral['RA'], unit=u.hourangle).degree
cat_spiral['dec']=Angle(cat_spiral['DEC'], unit=u.degree).degree
cat_spiral=cat_spiral.rename(columns = {'OBJID':'ID','NVOTE':'votos'})
cat_spiral=cat_spiral[['ID','ra','dec','votos']].reset_index(drop=True)

cat_spiral.to_csv('../data/SDSS_galaxyzoo_espirales.csv',index=False)