#Proyecto 2: Clasificación morfológica y espectral de galaxias

![alt text](https://raw.githubusercontent.com/rpmunoz/PentaUC/master/Astronomia%20era%20informacion/data/clasificacion_hubble.jpg)

En este taller trabajaremos con un catálogo de galaxias del survey astronómico Sloan Digital Sky Survey (SDSS). El SDSS es un proyecto internacional que comenzó a ejecutarse el año 2000 y desde entonces ha producido catálogos que contiene cientos de miles de galaxias. Mas información del survey en el link http://www.sdss.org/surveys/

El SDSS survey ha permitido que cualquier persona interesada en la Astronomia pueda visitar el sitio web y explorar las imagenes y catalogos del survey. Un ejemplo muy exitoso del uso de los datos del SDSS es el sitio web llamado Galaxy Zoo, el cual se puede visitar usando el siguiente link https://www.galaxyzoo.org/?lang=es

##Objetivo

Los alumnos deberán entender en qué consiste un sistema de clasificación y comprender la importancia de éste para ordenar y sistematizar el conocimiento. Deberán ser capaces de definir un sistema de clasificación de galaxias basado en información disponible en catálogos, imágenes y espectros de galaxias.


##Catálogo del SDSS con galaxias de diferentes tipos (data1)

Contiene una lista 40 galaxias que fueron observadas en el SDSS. Estas galaxias están relativamente cercanas y se pueden distinguir de buena manera sus caracteristicas morfologicas. El catálogo contiene las siguientes columnas,

- **ra**: Ascensión recta de la galaxia en unidades de grados
- **dec**: Declinación recta de la galaxias en unidades de grados
- **u**: Magnitud de la galaxias en el filtro u
- **g**: Magnitud de la galaxias en el filtro g
- **r**: Magnitud de la galaxias en el filtro r
- **i**: Magnitud de la galaxias en el filtro i
- **z**: Magnitud de la galaxias en el filtro z


##Catálogo del SDSS con 10.000 galaxias (data2)

Contiene una lista 10.000 galaxias que fueron observadas en el SDSS. Algunas de estas galaxias son cercanas y otras son muy lejanas. Contiene las mismas columnas que el catalogo data1, y solo aparecen estas nuevas columnas

- **l_gal**: Longitud galactica medida en unidades de grados
- **b_gal**: Latitud galactica medida en unidades de grados


##Ideas para desarrollar el taller

###1. Diseñar un sistema de clasificacion de tipos de galaxias usando imagenes
**Usar data1**

Desplegar imágenes JPG o FITS de las galaxias del catálogo data1. Inspeccionar cada uno de las imagens y definir que caracterísitcas diferencian unas de otras. Definir un criterio de clasificacón de galaxias basado solamente en el uso de imágenes y formas de las galaxias.
Ver taller 4 y 9.

###2. Diseñar un sistema de clasificacion de tipos de galaxias usando espectros 
**Usar data1**

Desplegar espectros de las galaxias del catálogo data1. Inspeccionar cada uno de los espectros y definir que caracterísitcas diferencian unos de otros. Definir un sistema de clasificación de galaxias basado solamente en el uso de espectros y formas de los espectros.
Ver taller 9

###3. Diseñar un sistema de clasificacion usando de manera conjunta imagenes y espectros
**Usar data1**

Desplegar tanto imágenes como espectros de las galaxias del catálogo data1. Definir un sistema de clasificación que este basado tanto en la morfología de las galaxias como la forma de sus espectros.
Ver taller 9

###4. Analizar propiedades físicas de las galaxias y definir una clasificación cuantitativa
**Usar data1**

Hacer gráficos del tipo scatter e histogramas 2D usando la información como la magnitud y color de las galaxias. Deberá usar los valores disponibles en el catalogo data1 y calcular colores en base a las columnas de magnitud. Deberá ser capaz de distinguir diferentes secuencias de galaxias usando gráficos de puntos e histogramas.
Ver taller 4

###5. Aplicar el criterio cuantitativo derivado en la pregunta 4 y clasificar galaxias de manera automatizada
**Usar data2**

En base al sistema de clasificacón desarrollado entre las partes 1 a la 4, definir los tipos de galaxias de sus sistema de clasificación y los rangos de valores en magnitud y color para cada tipo de galaxia. A esto último le llamaremos criterios. Use estos criterios para clasificar de manera automatizada las 10.000 galaxias del catalogo data2.

In [None]:
integrante1 = ''
integrante2 = ''
integrante3 = ''

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import rc
%matplotlib inline

from sdss_tools import sdss_jpg, sdss_fits, sdss_spectra, sdss_template

from astropy import units as u
from astropy.coordinates import SkyCoord, Angle
from astroquery.sdss import SDSS

rc('font', size=14)
rc('axes', labelsize=22)

In [None]:
# Catalogo que contiene una muestra pequeña galaxias observadas en el SDSS y que fueron clasificadas en Galaxy Zoo

url='https://raw.githubusercontent.com/rpmunoz/PentaUC/master/Astronomia%20era%20informacion/data/SDSS_galaxyzoo_sample_n40.csv'
data1=pd.read_csv(url, sep=',', comment='#', header=0)
data1.head()

In [None]:
# Catalogo que contiene una muestra grande de galaxias observadas en el SDSS

url='https://raw.githubusercontent.com/rpmunoz/PentaUC/master/Astronomia%20era%20informacion/data/SDSS_galaxias_colores.csv'
data2=pd.read_csv(url, sep=',', comment='#', header=0)
data2.head()

### Parte 1

### Parte 2

### Parte 3

### Parte 4

### Parte 5

# Una vez terminada la sesion del taller, debera ejecutar las siguientes dos celdas para subir su trabajo al servidor donde quedara almacenada

In [None]:
%%javascript
var kernel = IPython.notebook.kernel;
var thename = window.document.getElementById("notebook_name").innerHTML;
var command = "notebook_file = " + "'"+thename+"'";
kernel.execute(command);

In [None]:
from IPython.display import display,Javascript,HTML
import dropbox
import socket
import string

# Get the hostname
hostname=string.split(socket.gethostname(),'.')[0]

# Save the notebook
display(Javascript('IPython.notebook.save_checkpoint();'))

try:
    integrante_exist= (integrante1 != '' and integrante2!= '')
except NameError:
    display(HTML("<big><b><br>Los nombres de los integrantes no estan definidos. Revise la primera celda y escriba los nombres.</b></big>"))
else:
    if integrante_exist:
        output_file='/'+notebook_file+'_'+hostname+'_'+integrante1+'_'+integrante2+'_'+integrante3+'.ipynb'
        
        display(HTML("<big><b><br>Nombres de los integrantes:</b></big>"))
        display(HTML("<big>{}<br>{}</big>".format(integrante1,integrante2,integrante3)))
        display(HTML("<big><b><br>Nombre del archivo:</b></big>"))
        display(HTML("<big>{}</big>".format(output_file)))

        client=dropbox.client.DropboxClient('q96bL4l9oyAAAAAAAAAACEK7gCFwoO-PtZu5jJ6gynNwriiBjzTLsN0eV51YQhNe')

        f = open(notebook_file+'.ipynb', 'rb')
        response = client.put_file(output_file,f)
        f.close()
        display(HTML("<big><b><br>Registro del servidor de Dropbox:</b></big>"))
        print response
    else:
        display(HTML("<big><b><br>Los nombres de los integrantes no estan definidos. Revise la primera celda y escriba los nombres.</b></big>"))