# <div class="clearfix" style="padding: 10px; padding-left: 0px">
<img src="https://raw.githubusercontent.com/jupyter/nature-demo/master/images/jupyter-logo.png" width="150px" style="display: inline-block; margin-top: 5px;">
</div>

## Bienvenidos al Jupyter Notebook del Master de Data Science!

¿Qué es?:

Es una aplicación que permite crear y compartir documentos los cuales pueden contener textos, ecuaciones e imágenes, junto con código que puede ser ejecutado para apoyar el resto del texto. 

En esta asignatura y en otras, vamos a utilizar este tipo de aplicaciones para hacer pruebas, prácticas y algunos desarrollos, ya que soporta distintos lenguajes de programación, incluyendo Python y R.

Entre sus características, encontramos:

- Soporte gran variedad de Kernels de cálculo, inlcuyendo los lenguajes de programación habitualmente utilizados en investigación (Python, Matlab/Octave, R, etc.).
- Computación paralelizada en procesadores y/o clusters.
- Formateado de documentos con Markdown.
- Compartir documentos.

El documento obtenido finalmente, por un lado, puede ser generado en formatos diferentes y, por otro lado, permite el uso e interacción de los elementos anteriores, entre otros, posibilitando la generación de un documento totalmente autocontenido.

<div class="alert alert-warning" role="alert" style="margin: 10px">
<p>**Atención**</p>

<p>Cada componente de un Jupyter Notebook es una celda. Las celdas puden ser de diversos tipos, como por ejemplo código a ejecutar, cabeceras (para títulos) y celdas de código, que son las que se ejecutan realmente.</p>
</div>

En ocasiones, las instrucciones vendrán dadas en una celda de texto o Markdown, mientras que, cuando queramos ejecutar algo, tendremos que hacerlo en celdas de código.

<code style="background-color:rgba(0, 0, 0, 0.0470588)"> print('Hello World') #Ejemplo de codigo</code>





# Seccion 1 - Celdas Markdown

Son las celdas básicas de texto. Aceptan código HTML para distintos tipos de texto, enlaces, añadir imágenes, etc.

Utiliza la celda siguiente para poner tu nombre como título, un fragmento de código, una lista (por ejemplo, los días de la semana) y un cuadro de aviso contando cual es tu background (estudios, interés, etc.). Puedes copiarlo de la primera celda (doble click) o buscar en estos ejemplos: https://daringfireball.net/projects/markdown/syntax

# Sección 2 - Opciones en Jupyter

Jupyter tiene varias opciones en el menú de arriba. Por ejemplo, puedes hacer copias del notebook, descargarlo en distintos formatos, guardar un checkpoint recuperable, operaciones con celdas, etc.

Uno de los elementos fundamentales de Jupyter es el kernel. Existen varios disponibles, de distintos lenguajes de programación que definen cómo son interpretados los comandos de las celdas tipo code.

Además de eso, Jupyter incluye ciertos comandos que pueden ser invocados desde este mismo notebook. Para comprobarlo, con el siguiente comando se listan todas las opciones disponibles:

<code style="background-color:rgba(0, 0, 0, 0.0470588)">!jupyter --help</code>

Puedes probarlo en la celda de abajo (No olvides dar al play)

Como se muestra en la ayuda hay diferentes comandos y modificadores (flags) que pueden utilizarse. Nosotros utilizaremos para el desarrollo de los documentos únicamente el notebook, el cual tiene la siguiente documentación:

<code style="background-color:rgba(0, 0, 0, 0.0470588)">!jupyter notebook --help</code>

# Sección 3 - Celdas de Código

Aunque lo ideal es no mezclar códigos, se puede modificar el kernel para ejecutar ciertas celdas. Por ejemplo, el siguiente código está hecho en R

In [None]:
# Esto es codigo en R
a <- runif(100, min=0, max=100)
plot(1:100,a,'l')
points(1:100,a,col = "red")

Prueba a esribir un hello world en python

In [None]:
print('Hello World')

In [None]:
# Esto es codigo en iPython
import random as random
import matplotlib.pyplot as plt
r = random.Random()
a = list(range(100))
for i in range(100):
    a[i] = r.random()
plt.plot(range(100),a, color="black", linewidth=1.0, linestyle="-")
plt.plot(range(100),a, "ro")
plt.show()

# Sección 4 - Análisis de datos con pandas

Durante la asignatura, vamos a utilizar algunas librerías de python diseñadas para el análisis de datos. Pandas es una de ellas. En las próximas celdas hay algunos ejemplos. No se trata ahora saber cómo programar, sino de entender cómo funciona.

### Timeseries con pandas

Trabajar con series temporales de datos es una parte muy importante en el análisis de datos.

Pandas, desde la versión v0.8, incluye varias funcionalidades que permiten la gestión de este tipo de datos, incluyendo:

- Manejar rangos de fechas
- Cargar desde fichero
- Crear desde 0
- Manipulacioones: Shift, resample, filter
- Acceso por campo (e.g., hour of day)
- Gráficas
- etc.

Probaremos con un dataset de ejemplo.

In [None]:
from datetime import datetime, date, time
import sys
sys.version

In [None]:
import pandas as pd
from pandas import Series, DataFrame, Panel
pd.__version__

In [None]:
import numpy as np
np.__version__

In [None]:
import matplotlib.pyplot as plt
import matplotlib as mpl
mpl.rc('figure', figsize=(10, 8))
mpl.__version__

Descargamos el dataset

In [1]:
import requests

response = requests.get('http://doriiie02.ifca.es/datasets/amt_2014.csv')
if response.status_code == 200:
    with open("./data.csv", 'wb') as f:
        f.write(response.content)

In [None]:
ls

## Ejemplos


Ejemplos con dataset de prueba

In [None]:
data = pd.read_csv('data.csv', index_col='date', parse_dates=True, sep=';')
data

In [None]:
ticks = data.ix[:, ["Press", "Temp"]]
ticks.head()

Filtrar por Fechas

In [2]:
data.ix['2014-08-01 09:27':'2014-09-01 09:32']

NameError: name 'data' is not defined

Seleccionar un rango horario

In [None]:
filtered = data['Temp'].between_time('10:00', '11:00')
filtered.head(20)

Obtener máximo valor de temperatura

In [None]:
data['Temp'].max()

¿Y de presión?

Si no te acuerdas del nombre de las columnas...

In [None]:
data.head()

Conociendo selecciones y filtros básicos, se pueden crear gráficas.

In [None]:
filtered.plot()
plt.ylim(0.5, 24.5)
plt.show()

Plot para el mes de agosto

Media diaria

In [None]:
data['Temp'].resample('d').mean()