<a href="https://colab.research.google.com/github/gmhoward/amalia20-taller_ml/blob/master/Welcome_To_Colaboratory.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p><img alt="Colaboratory logo" height="45px" src="img/colab_favicon_256px.png" align="left" hspace="10px" vspace="0px"></p>

<h1>Qué es Colaboratory?</h1>

Colaboratory o "Colab" es una plataforma de Google que te permite escribir y ejecutar codigo Python desde tu navegador web y sin tener que instalar ningun software: 
- No requiere configuración
- Ofrece acceso a computadoras con GPUs (procesadores que facilitan la implementación de algorítmos de Deep Learning)
- Fácil de compartir y colaborar con otras personas

Ya sea que eres un(a) **estudiante**, **cientifico(a) de datos**, **desarrollador(a) de software**, o un(a)  **investigador(a) de inteligencia artificial**, Colab te permite trabajar y colaborar en proyectos de Python y Machine Learning. Puedes observar el video (en inglés) [Introduction to Colab](https://www.youtube.com/watch?v=inN8seMm7UI) para aprender más sobre esta plataforma o simplemente utiliza las prácticas de abajo.

## **Primeros Pasos**

Este documento no es una página web estática, sino un entorno interactivo llamado un **`Colab notebook`** (cuaderno) que te permite escribir y ejecutar código. Estos `notebooks` están basados en los notebooks del proyecto Jupyter y son hospedados en los servidores de la plataforma Google Colab. [para aprender más sobre el proyecto Jupyter, puedes visitar [jupyter.org](https://www.jupyter.org)]

Como dijimos, el `notebook` es un entorno interactivo para escribir y ejecutar código, que también permite incluir otros tipos de datos, como **texto** (por ejemplo, el que estás leyendo ahora), **figuras** y **video**. Esto permite que los `notebooks` sirvan para incluir explicaciones, comentarios y graficas que complementan el codigo utilizado cuando se hace ciencia de datos (data science).

En un `notebook`, todo el codigo y los datos se colocan en celdas. Por ejemplo, he aquí una **celda de codigo** que contiene un pequeno programa de Python para calcular el numero de segundos en un dia, guarda el resultado en una variable y luego lo imprime. Para ejecutar la celda, debes:
1. seleccionar la celda que quieres ejecutar, haciendo click sobre ella.
2. Apretar simultaneamente las teclas `Shift` y `Enter (Return)`.

Esto ejecutara la celda y pondra el cursor en la siguiente celda (abajo) o creara una celda nueva si estas en la ultima celda del notebook. Intentalo ahora con la celda de abajo para calcular el numero de segundos que tiene un dia.

In [5]:
segundos_en_un_dia = 24 * 60 * 60
segundos_en_un_dia

86400

Para ejecutar el codigo de una celda, tambien puedes utilizar `Command` y `Enter` o presionar el boton `play` que aparece a la izquierda de la celda. Para editar el codigo, simplemente haz click sobre la celda.

Un par de opciones adicionales cuando trabajas con celdas:
- Si presionas `Alt` y `Enter`, crearas una nueva celda (util para cuando insertas nuevo contenido en el medio de un notebook).
- Si presionas `Control` y `Enter`, se ejecutara la celda seleccionada y se mantendra el cursor en la misma celda. Esta opcion puede ser muy util para hacer pruebas rapidas de codigo que no deseas mantener en el notebook o que necesitas probar continuamente.

Las variables que tu defines en una celda, pueden ser utilizadas posteriormente en otras celdas:

In [4]:
segundos_en_una_semana = 7 * segundos_en_un_dia
segundos_en_una_semana

604800

Los notebooks tambien te permiten acceder el sistema operativo de la computadora en donde se ejecutan. Para hacerlo, usas los comandos del sistema operativo, precedido del caracter `!`. Por ejemplo, para listar los archivos del directorio en que estas trabajando, usando el sistema operativo Linux/Unix, se utiliza el comando `ls` (list). He aqui un ejemplo de como utilizarlo en el notebook:

In [None]:
archivos = !ls
print("Los archivos ubicados en le directorio actual:")
print(archivos)

Como indicamos anteriormente, los `notebooks` te permiten combinar **codigo ejecutable** con **texto** en un solo documento, junto a **imagenes**, **HTML**, **LaTeX** y mucho mas. Cuando tu creas tus propios Colab notebooks, ellos son almacenados en tu cuenta de Google Drive. Importante entonces que utilices tu cuenta de Google cuando utilizas Colab.

Puedes compartir facilmente tus Colab notebooks con colegas y amigos, permitiendoles que comenten en ellos o incluso editarlos. Para aprender mas, puedes revisar el notebook [Overview of Colab].

Para crear un nuevo Colab notebook puedes utilizar el menu `File` (arriba) o utilizar el siguiente enlace: [create a new Colab notebook](http://colab.research.google.com#create=true).

## Ciencia de Datos (Data science)

Con Colab puedes aprovechar las populares librerias de Python para analizar y visualizar datos. La celda de abajo utiliza dos de estas librerias, **numpy** y **matplotlib**. Primero se usa **numpy** para generar datos aleatorios y luego **matplotlib** para visualizarlos. 

Explicando un poco mas el codigo:
- en las primeras dos lineas se importan las librerias a utilizar. Notese que usamos el alias `np` para numpy y `plt` para `matplotlib.pyplot`. 
- en las lineas 3 y 4 se crean los datos (`x` y `ys`) que usaremos para imprimir la grafica.
- en el resto del codigo, se crea la grafica. Primero indicamos el tipo de grafica que queremos utilizar (`plot`) y su formato (colores, tipo de lineas a utilizar), luego le damos un titulo a la grafica y finalmente 

Para editar el codigo, recuerda que solo necesitas hacer click sobre la celda.

In [8]:
import numpy as np
from matplotlib import pyplot as plt

ys = 200 + np.random.randn(100)
x = [x for x in range(len(ys))]

plt.plot(x, ys, '-')
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)

plt.title("Ejemplo de Visualizacion")
plt.show()

<Figure size 640x480 with 1 Axes>

## Analisis de Datos

Puedes importar y utilizar tus propios datos ubicados en tu cuenta de Google Drive (incluyendo hojas de calculo), asi como desde Github, el web y otras fuentes.

En el siguiente ejemplo, vamos a utilizar otra popular libreria de Python, `pandas` para descargar la lista de pasajeros y tripulacion en el tragicamente famoso barco Titanic. Al ejecutar la celda, es posible que se demore varios segundos.

In [10]:
# Cargar la libreria Pandas y asignarle el alias 'pd'
import pandas as pd

# Variable con la direccion web donde se encuentra la lista de pasajeros
url = 'https://raw.githubusercontent.com/chrisalbon/sim_data/master/titanic.csv'

# Descargar los datos del Internet y colocarlos en un dataframe (matriz)
dataframe = pd.read_csv(url)

# Mostrar las cinco primeras filas del dataframe
dataframe.head(5)

Unnamed: 0,Name,PClass,Age,Sex,Survived,SexCode
0,"Allen, Miss Elisabeth Walton",1st,29.0,female,1,1
1,"Allison, Miss Helen Loraine",1st,2.0,female,0,1
2,"Allison, Mr Hudson Joshua Creighton",1st,30.0,male,0,0
3,"Allison, Mrs Hudson JC (Bessie Waldo Daniels)",1st,25.0,female,0,1
4,"Allison, Master Hudson Trevor",1st,0.92,male,1,0


Cuando se analiza un conjunto de datos, es necesario conocer sus caracteristicas. Para determinar las dimensiones (numero de filas y de columnas) del dataframe, se puede utilizar la funcion `shape`.

In [12]:
dataframe.shape

(1313, 6)

Ahora determinemos el numero de hombres y mujeres abordo. Para ello, podemos aplicar la funcion `value_counts()` a la columna `Sex`. Esta funcion cuenta la cantidad de veces que aparece cada valor en una columna.

In [13]:
dataframe['Sex'].value_counts()

male      851
female    462
Name: Sex, dtype: int64

**Pregunta:** Puedes escribir el comando necesario para determinar el numero de personas que sobrevivieron el incidente?

Para aprender mas sobre como importar datos y como Colab puede ser utilizado para ciencia de datos, puedes revisar los enlaces de la seccion [Trabajando con Datos](#trabajando-con-datos).

## Aprendizaje de Maquina (Machine learning)

Con Colab puedes crear modelos de machine learning para realizar operaciones como decidir, predecir, o clasificar muestras. Por ejemplo, puede importar un conjunto de imagenes, entrenar una clasificador de imagenes y evaluar el modelo para determinar su rendimiento [ejemplo](https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/quickstart/beginner.ipynb). 

Los notebooks de Colab ejecutan el codigo en los servidores de la nuba de Google, lo que incluye el uso de procesadores especializados como [GPUs y TPUs](#usando-hardware-especializado).

Colab puede ser utilizado para distintas tareas de aprendizaje de maquina:
- Explorar la libreria TensorFlow
- Desarrollar y entrenar redes neuronales
- Experimentar con TPUs
- Compartir investigaciones
- Crear tutoriales

Para ver ejemplos de Colab notebooks que muestran distintas aplicaciones de aprendizaje de maquina, puedes consultar la seccion [Ejemplos de Machine Learning](#ejemplos-aprendizaje-maquina) abajo.

## Mas Recursos (en ingles)

### Trabajando con Recursos en Colab
- [Overview of Colaboratory](/notebooks/basic_features_overview.ipynb)
- [Guide to Markdown](/notebooks/markdown_guide.ipynb)
- [Importing libraries and installing dependencies](/notebooks/snippets/importing_libraries.ipynb)
- [Saving and loading notebooks in GitHub](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
- [Interactive forms](/notebooks/forms.ipynb)
- [Interactive widgets](/notebooks/widgets.ipynb)
- [TensorFlow 2 in Colab](/notebooks/tensorflow_version.ipynb)

<a name="trabajando-con-datos"></a>
### Trabajando con Datos
- [Loading data: Drive, Sheets, and Google Cloud Storage](/notebooks/io.ipynb) 
- [Charts: visualizing data](/notebooks/charts.ipynb)
- [Getting started with BigQuery](/notebooks/bigquery.ipynb)

### Curso Rapido de Machine Learning
Existen varios notebooks del curso (en linea) de Google sobre Machine Learning. Visita el sitio del curso para mayor informacion [full course website](https://developers.google.com/machine-learning/crash-course/).
- [Intro to Pandas](/notebooks/mlcc/intro_to_pandas.ipynb)
- [Tensorflow concepts](/notebooks/mlcc/tensorflow_programming_concepts.ipynb)
- [First steps with TensorFlow](/notebooks/mlcc/first_steps_with_tensor_flow.ipynb)
- [Intro to neural nets](/notebooks/mlcc/intro_to_neural_nets.ipynb)
- [Intro to sparse data and embeddings](/notebooks/mlcc/intro_to_sparse_data_and_embeddings.ipynb)

<a name="utilizando-hardware-especializado"></a>
### Usando Hardware Especializado
- [TensorFlow with GPUs](/notebooks/gpu.ipynb)
- [TensorFlow with TPUs](/notebooks/tpu.ipynb)

<a name="ejemplos-aprendizaje-maquina"></a>

## Ejemplos de Machine Learning

Para ver ejemplos completos de , puedes trabajar con los 

To see end-to-end examples of the interactive machine learning analyses that Colaboratory makes possible, check out these  tutorials using models from [TensorFlow Hub](https://tfhub.dev).

A few featured examples:

- [Retraining an Image Classifier](https://tensorflow.org/hub/tutorials/tf2_image_retraining): Build a Keras model on top of a pre-trained image classifier to distinguish flowers.
- [Text Classification](https://tensorflow.org/hub/tutorials/tf2_text_classification): Classify IMDB movie reviews as either *positive* or *negative*.
- [Style Transfer](https://tensorflow.org/hub/tutorials/tf2_arbitrary_image_stylization): Use deep learning to transfer style between images.
- [Multilingual Universal Sentence Encoder Q&A](https://tensorflow.org/hub/tutorials/retrieval_with_tf_hub_universal_encoder_qa): Use a machine learning model to answer questions from the SQuAD dataset.
- [Video Interpolation](https://tensorflow.org/hub/tutorials/tweening_conv3d): Predict what happened in a video between the first and the last frame.


## Referencias

- Google. [Welcome to Colaboratory](https://colab.research.google.com/notebooks/intro.ipynb).
- Jupyter Project. [The Jupyter Notebook](https://jupyter-notebook.readthedocs.io/en/stable/)