<a href="https://colab.research.google.com/github/gmhoward/amalia20-taller_ml/blob/master/Welcome_To_Colaboratory.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p><img alt="Colaboratory logo" height="45px" src="img/colab_favicon_256px.png" align="left" hspace="10px" vspace="0px"></p>

<h1>Qué es Colaboratory?</h1>

Colaboratory o "Colab" es una plataforma de Google que te permite escribir y ejecutar código Python desde tu navegador web y sin tener que instalar ningún software: 
- No requiere configuración
- Ofrece acceso a computadoras con GPUs (procesadores que facilitan la implementación de algoritmos de Deep Learning)
- Fácil de compartir y colaborar con otras personas

Ya sea que eres un(a) **estudiante**, **científico(a) de datos**, **desarrollador(a) de software**, o un(a)  **investigador(a) de inteligencia artificial**, Colab te permite trabajar y colaborar en proyectos de Python y Machine Learning. Puedes observar el video (en inglés) [Introduction to Colab](https://www.youtube.com/watch?v=inN8seMm7UI) para aprender más sobre esta plataforma o simplemente utiliza las prácticas de abajo.

## **Primeros Pasos**

Este documento no es una página web estática, sino un entorno interactivo llamado un **`Colab notebook`** (cuaderno) que te permite escribir y ejecutar código. Estos `notebooks` están basados en los notebooks del proyecto Jupyter y son hospedados en los servidores de la plataforma Google Colab. [para aprender más sobre el proyecto Jupyter, puedes visitar [jupyter.org](https://www.jupyter.org)]

Como dijimos, el `notebook` es un entorno interactivo para escribir y ejecutar código, que también permite incluir otros tipos de datos, como **texto** (por ejemplo, el que estás leyendo ahora), **figuras** y **video**. Esto permite que los `notebooks` sirvan para incluir explicaciones, comentarios y gráficas que complementan el código utilizado cuando se hace ciencia de datos (data science).

En un `notebook`, todo el código y los datos se colocan en celdas. Por ejemplo, he aquí una **celda de código** que contiene un pequeño programa de Python para calcular el número de segundos en un día, guarda el resultado en una variable y luego lo imprime. Para ejecutar la celda, debes:
1. Seleccionar la celda que quieres ejecutar, haciendo click sobre ella.
2. Apretar simultáneamente las teclas `Shift` y `Enter (Return)`.

Esto ejecutará la celda y pondrá el cursor en la siguiente celda (abajo) o creará una celda nueva si estás en la última celda del notebook. Inténtalo ahora con la celda de abajo para calcular el número de segundos que tiene un día.

In [None]:
segundos_en_un_dia = 24 * 60 * 60
segundos_en_un_dia

Para ejecutar el código de una celda, también puedes utilizar `Command` y `Enter` o presionar el botón `play` que aparece a la izquierda de la celda. Para editar el código, simplemente haz click sobre la celda.

Un par de opciones adicionales cuando trabajas con celdas:
- Si presionas `Alt` y `Enter`, crearás una nueva celda (útil para cuando insertas nuevo contenido en el medio de un notebook).
- Si presionas `Control` y `Enter`, se ejecutará la celda seleccionada y se mantendrá el cursor en la misma celda. Esta opción puede ser muy útil para hacer pruebas rápidas de código que no deseas mantener en el notebook o que necesitas probar contínuamente.

Las variables que tu defines en una celda, pueden ser utilizadas posteriormente en otras celdas:

In [None]:
segundos_en_una_semana = 7 * segundos_en_un_dia
segundos_en_una_semana

Los notebooks también te permiten acceder el sistema operativo de la computadora en donde se ejecutan. Para hacerlo, usas los comandos del sistema operativo, precedido del caracter `!`. Por ejemplo, para listar los archivos del directorio en que estás trabajando, usando el sistema operativo Linux/Unix, se utiliza el comando `ls` (list). He aquí un ejemplo de como utilizarlo en el notebook:

In [None]:
archivos = !ls
print("Los archivos ubicados en le directorio actual (en el servidor de Google Colab):")
print(archivos)

Como indicamos anteriormente, los `notebooks` te permiten combinar **código ejecutable** con **texto** en un sólo documento, junto a **imágenes**, **HTML**, **LaTeX** y mucho más. Cuando creas tus propios Colab notebooks, ellos son almacenados en tu cuenta de Google Drive. Importante entonces que uses tu cuenta de Google cuando utilizas Colab.

Puedes compartir fácilmente tus Colab notebooks con colegas y amigos, permitiéndoles que comenten en ellos o incluso editarlos. Para aprender más, puedes revisar el notebook [Overview of Colab].

Para crear un nuevo Colab notebook puedes utilizar el menú `File` (arriba) o utilizar el siguiente enlace: [create a new Colab notebook](http://colab.research.google.com#create=true).

## Ciencia de Datos (Data science)

Con Colab puedes aprovechar las populares librerías de Python para analizar y visualizar datos. La celda de abajo utiliza dos de estas librerías, **numpy** y **matplotlib**. Primero se usa **numpy** para generar datos aleatorios y luego **matplotlib** para visualizarlos. 

Explicando un poco más el codigo:
- en las primeras dos líneas se importan las librerias a utilizar. Nota que usamos el alias `np` para numpy y `plt` para `matplotlib.pyplot`. 
- en las líneas 3 y 4 se crean los datos (`x` y `ys`) que usaremos para imprimir la gráfica.
- en el resto del código, se crea la gráfica. Primero indicamos el tipo de gráfica que queremos utilizar (`plot`) y su formato (colores, tipo de lineas a utilizar), luego le damos un título a la gráfica y finalmente se muestra (`show`).

Para editar el código, recuerda que sólo necesitas hacer click sobre la celda.

In [None]:
import numpy as np
from matplotlib import pyplot as plt

ys = 200 + np.random.randn(100)
x = [x for x in range(len(ys))]

plt.plot(x, ys, '-')
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)

plt.title("Ejemplo de Visualización")
plt.show()

## Análisis de Datos

Puedes importar y utilizar los datos ubicados en tu cuenta de Google Drive (incluyendo hojas de cálculo), así como desde Github, el web y otras fuentes.

En el siguiente ejemplo, vamos a utilizar otra popular librería de Python, `pandas` para descargar la lista de pasajeros y tripulación del trágicamente famoso barco Titanic. Al ejecutar la celda, es posible que se demore varios segundos.

In [None]:
# Cargar la librería Pandas y asignarle el alias 'pd'
import pandas as pd

# Variable con la dirección web donde se encuentra la lista de pasajeros
url = 'https://raw.githubusercontent.com/chrisalbon/sim_data/master/titanic.csv'

# Descargar los datos del Internet y colocarlos en un dataframe (matriz)
dataframe = pd.read_csv(url)

# Mostrar las cinco primeras filas del dataframe
dataframe.head(5)

Cuando se analiza un conjunto de datos, es necesario conocer sus características. Para determinar las dimensiones (número de filas y de columnas) del dataframe, se puede utilizar la función `shape`.

In [None]:
dataframe.shape

Ahora determinemos el número de hombres y mujeres abordo. Para ello, podemos aplicar la función `value_counts()` a la columna `Sex`. Esta función cuenta la cantidad de veces que aparece cada valor en una columna.

In [None]:
dataframe['Sex'].value_counts()

**Pregunta:** Puedes escribir el comando necesario para determinar el número de personas que sobrevivieron el incidente?

Para aprender más sobre como importar datos y como Colab puede ser utilizado para ciencia de datos, puedes revisar los enlaces de la sección [Trabajando con Datos](#trabajando-con-datos).

## Aprendizaje de Máquina (Machine learning)

Con Colab puedes crear modelos de machine learning para realizar operaciones como decidir, predecir, o clasificar muestras. Por ejemplo, puede importar un conjunto de imagenes, entrenar una clasificador de imagenes y evaluar el modelo para determinar su rendimiento [ejemplo](https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/quickstart/beginner.ipynb). 

Los notebooks de Colab ejecutan el codigo en los servidores de la nube de Google, lo que incluye el uso de procesadores especializados como [GPUs y TPUs](#usando-hardware-especializado).

Colab puede ser utilizado para distintas tareas de aprendizaje de máquina:
- Explorar la librería TensorFlow
- Desarrollar y entrenar redes neuronales
- Experimentar con TPUs
- Compartir investigaciones
- Crear tutoriales

Para ver ejemplos de Colab notebooks que muestran distintas aplicaciones de aprendizaje de máquina, puedes consultar la sección [Ejemplos de Machine Learning](#ejemplos-aprendizaje-maquina) abajo.

## Más Recursos (en inglés)

### Trabajando con Recursos en Colab
- [Overview of Colaboratory](/notebooks/basic_features_overview.ipynb)
- [Guide to Markdown](/notebooks/markdown_guide.ipynb)
- [Importing libraries and installing dependencies](/notebooks/snippets/importing_libraries.ipynb)
- [Saving and loading notebooks in GitHub](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
- [Interactive forms](/notebooks/forms.ipynb)
- [Interactive widgets](/notebooks/widgets.ipynb)
- [TensorFlow 2 in Colab](/notebooks/tensorflow_version.ipynb)

<a name="trabajando-con-datos"></a>
### Trabajando con Datos
- [Loading data: Drive, Sheets, and Google Cloud Storage](/notebooks/io.ipynb) 
- [Charts: visualizing data](/notebooks/charts.ipynb)
- [Getting started with BigQuery](/notebooks/bigquery.ipynb)

### Curso Rápido de Machine Learning
Existen varios notebooks del curso (en línea) de Google sobre Machine Learning. Visita el sitio del curso para mayor información [full course website](https://developers.google.com/machine-learning/crash-course/).
- [Intro to Pandas](/notebooks/mlcc/intro_to_pandas.ipynb)
- [Tensorflow concepts](/notebooks/mlcc/tensorflow_programming_concepts.ipynb)
- [First steps with TensorFlow](/notebooks/mlcc/first_steps_with_tensor_flow.ipynb)
- [Intro to neural nets](/notebooks/mlcc/intro_to_neural_nets.ipynb)
- [Intro to sparse data and embeddings](/notebooks/mlcc/intro_to_sparse_data_and_embeddings.ipynb)

<a name="utilizando-hardware-especializado"></a>
### Usando Hardware Especializado
- [TensorFlow with GPUs](/notebooks/gpu.ipynb)
- [TensorFlow with TPUs](/notebooks/tpu.ipynb)

<a name="ejemplos-aprendizaje-maquina"></a>

## Ejemplos de Machine Learning

Para ver ejemplos completos de analisis interactivo que pueden realizarse con Google Colab, puedes consultar los siguientes tutoriales que utilizan los modelos de [TensorFlow Hub](https://tfhub.dev).

Un par de estos ejemplos:

- [Retraining an Image Classifier - Reentrenar un Clasificador de Imágenes](https://tensorflow.org/hub/tutorials/tf2_image_retraining): Construye un modelo con la librería Keras, utilizando un clasificador de imágenes (previamente entrenado) para distingir flores.
- [Text Classification - Clasificación de Texto](https://tensorflow.org/hub/tutorials/tf2_text_classification): Clasifica las evaluaciones o críticas de películas en la base de datos IMDB, como *positivas* o *negativas*.
- [Style Transfer - Transferencia de Estilos](https://tensorflow.org/hub/tutorials/tf2_arbitrary_image_stylization): Usa deep learning para transferir estílos entre imágenes.
- [Multilingual Universal Sentence Encoder Q&A - Codificador Universal Multilingue de Oraciones](https://tensorflow.org/hub/tutorials/retrieval_with_tf_hub_universal_encoder_qa): Usa un modelo de ML para contestar preguntas del dataset SQuAD.
- [Video Interpolation - Interpolación de Video](https://tensorflow.org/hub/tutorials/tweening_conv3d): Predice que ocurre en un video entre el primer y el último cuadro.

## Referencias

- Google. [Welcome to Colaboratory](https://colab.research.google.com/notebooks/intro.ipynb).
- Jupyter Project. [The Jupyter Notebook](https://jupyter-notebook.readthedocs.io/en/stable/)