## Github

Encuentra el repo en:

https://github.com/cwallaceh/Data-Bootcamp-Mty

## Anaconda (Open Source modern analytics platform)

- Anaconda es una distribución de Python completamente libre. Incluye más de 400 de los paquetes de Python más populares para la ciencia, las matemáticas, la ingeniería y el <b>análisis de datos</b>. 

- Anaconda es un producto gratuito de Continuum Analytics (www.continuum.io) que nos permite construir el stack científico de manera sencilla.

### Instalación de Anaconda

#### Windows | OS X | Linux

https://www.continuum.io/downloads

- Descargar el instalador para python 3 y seguir las instrucciones.
- Revisar si todo está en orden

Para más información:
http://conda.pydata.org/docs/install/full.html

In [None]:
conda update conda
conda update anaconda

### Virtual evironment

Un entorno virtual es un espacio aislado con una copia de Python que mantiene sus propios archivos, directorios y paths de tal manera que puedas trabajar con versiones especificas de las librerias de Python (incluso la versión de Python) sin afectar otros proyectos existentes. Ayuda a evitar problemas si se tienen diferentes dependencias y versiones de los mismos componentes.

http://conda.pydata.org/docs/using/envs.html

### Crear el entorno para el bootcamp

In [None]:
conda create -n databootcamp anaconda

### Activar el entorno

#### Linux, OS X:

In [None]:
source activate databootcamp

#### Windows

In [None]:
activate databootcamp

## IPython 3 (jupyter)
Durante el bootcamp usaremos IPython Notebook (jupyter). Este será nuestro entorno de desarrollo integrado (WebIDE)
http://jupyter.org/

In [None]:
# Iniciar notebook 
jupyter notebook

Jupyter es una aplicación web que te permite crear y compartir documentos que contienen código, ecuaciones, visualizaciones y texto. Los usos incluyen: limpieza y transformación de datos, simulación numérica, estadística, aprendizaje automático y mucho más.

- Es una herramienta importante para lograr investigación reproducible.
- Soporta diferentes lenguajes de programación como Julia, Octave, Python and R. (y muchos otros)
- Jupyter usa markdown para crear texto y además tiene implementación de LaTeX para crear tipografía matemática de alta calidad.

### Ejemplo Markdown

http://nbviewer.jupyter.org/github/jupyter/notebook/blob/master/docs/source/examples/Notebook/Working%20With%20Markdown%20Cells.ipynb

### Ejemplo LaTeX

https://en.wikibooks.org/wiki/LaTeX/Mathematics

$$ P(x, \sigma, \mu) = \frac{1}{\sigma\sqrt{2 \pi}}e^{-(x -\mu)^2/2\sigma^2}$$

## Programación en Python
- Creado por Guido van Rossum en 1989
- Python es un lenguaje de alto nivel y de propósito general
- Interpretado, de tipado dinámico con una sintaxis precisa y eficiente.
- Para este curso usaremos Python 3
https://www.python.org/downloads/  
- Usamos python 3 pues es el presente y futuro del lenguaje

### ¿Por qué Python para la ciencia de datos?

- Python es un lenguaje que puede actuar como una solución completa, puede encargarse de los servicios web, bases de datos, manejo y procesamiento de datos. Python, también se puede utilizar para escribir aplicaciones del lado del servidor, tales como sitios web dinámicos, aplicaciones para sistemas operativos con interfaces gráficas e incluso aplicaciones en IOS y Android.

https://www.quora.com/Why-is-Python-a-language-of-choice-for-data-scientists

> "The Python community invested in the mid-1990s in Numeric, an "extension to Python to support numeric analysis as naturally as [M]atlab does". Numeric later evolved into NumPy. Several years later, the plotting functionality from Matlab was ported to Python with matplotlib. Libraries for scientific computing were built around NumPy and matplotlib and bundled into the SciPy package, which was commercially supported by Enthought. Python's support for Matlab-like array manipulation and plotting is a major reason to prefer it over Perl and Ruby.

> Today, the most popular alternatives to Python for data scientists are R, Matlab/Octave, and Mathematica/Sage. In addition to the work mentioned above to port features from Matlab into Python, recent work has ported several popular features from R and Mathematica into Python.

> From R, the data frame and associated manipulations (from the plyr and reshape packages) have been implemented by the pandas library. The scikit-learn project presents a common interface to many machine learning algorithms, similar to the caret package in R."

<div align="right"><b>-Jeff Hammerbacher, Professor at Hammer Lab, founder at Cloudera, investor at Techammer</b></div>


### Filosofía de Python

In [2]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### ¡Hola Mundo!

In [2]:
# Soy un comentario
print("¡Hola Mundo!")

¡Hola Mundo!


### Sintaxis
Python usa sangría (espacios y tabulaciones) en lugar de llaves, el estándar es de 4 espacios.

In [4]:
x = 1
if x == 1:
    # 4 espacios (1 tab)
    print("x es 1")

x es 1


### Variables
 - Python es orientado a objetos, y de tipado dinámico, es decir, no es necesario declarar las variables antes de usarlas, o declarar su tipo. 
 - Cada variable en Python es un objeto.

### Tipos de datos
#### Tipos Numéricos
Hay tres tipos numéricos: enteros, números de punto flotante, y los números complejos.

In [5]:
mi_int = 1
mi_float = 7.0
mi_complex = 3.14j

type(mi_float)

float

#### Tipos secuenciales
 - Listas: Pueden contener cualquier tipo de variable, y pueden contener tantas variables como se desee.

In [6]:
mi_lista = []
mi_lista.append(1)
mi_lista.append("Monty")
mi_lista.append(True)

print(mi_lista)

[1, 'Monty', True]


 - Tuplas: A diferencia de las listas, las tuplas no se pueden cambiar y utilizan paréntesis.

In [7]:
mi_tupla = (1, "Monty", True);
print(mi_tupla)

(1, 'Monty', True)


In [8]:
mi_tupla[0] = 2

TypeError: 'tuple' object does not support item assignment

 - Rangos: Los rangos representan una secuencia de números

In [3]:
list(range(-5, 30, 5))

[-5, 0, 5, 10, 15, 20, 25]

In [4]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

#### Tipo String
El texto en Python se maneja con objetos str (strings), o cadenas. Se pueden escribir de distintas maneras:

¡Importante!: En python no existe el tipo "char", un sólo carácter es un string de tamaño 1

In [None]:
comillas_simples = 'permite usar "comillas" dobles'
comillas_dobles = "permite usar 'comillas' simples"
comillas_triples = '''permite correrse por varias lineas'''

print(comillas_simples[1:5])

comillas_simples.upper()

#### Tipo Mapping
- Diccionario: Un diccionario funciona con claves y valores en lugar de índices. Cada valor almacenado en un diccionario se puede acceder mediante una clave, es decir, cualquier tipo de objeto (una cadena, un número, una lista, etc.) en lugar de utilizar su índice de abordarlo.

In [None]:
mi_diccionario = {
    "Nombre" : "Carl W.",
    "Edad" : 26,
    "Apellido" : "Handlin"
}

mi_diccionario["Nombre"]

#### Tipo Booleano

In [None]:
mi_boolean = True
mi_boolean = False

### Operadores

#### Operaciones aritméticas

In [None]:
numero = 3 + 4 - 2 * 5 / 2 ** 9 % 1
print(numero)

import math

math.sqrt(numero)

#### Operaciones con strings

In [None]:
texto = comillas_simples + " " + comillas_dobles
print(texto)

texto = comillas_simples * 2
print(texto)

#### Operaciones con listas

In [None]:
bajos = [1,2,3,4,5]
altos = [6,7,8,9,10]
numeros = bajos + altos
print(numeros)

#### Operaciones booleanas

In [None]:
variable_or = True or False
variable_and = True and False
variable_not = not False

#### Comparadores

In [None]:
5 < 6 #Menor que

In [None]:
5 <= 6 #Menor o igual a

In [None]:
6 > 5 #Mayor que

In [None]:
6 >= 5 #Mayor o igual a

In [None]:
6 == 6 #Igual a

In [None]:
6 != 5 #Diferente a (No igual a)

In [None]:
x = [1,2,3]
y = [1,2,3]
print(x == y)
print(x is y)

In [None]:
x is not None

#### El operador "in"

El operador "in" se utiliza para comprobar si existe un objeto especificado dentro de un objeto iterable, tal como una lista:

In [5]:
"Carl" in ["Carl", "Edo", "Rick"]

True

### Control de flujo

#### If
"If" se utiliza para la ejecución condicional, es decir, "If" ejecuta algún código específico después de comprobar si su expresión es verdadera.

In [None]:
x = 5

if x < 0:
    x = 0
    print('Negative changed to zero')
elif x == 0:
    print('Zero')
elif x == 1:
    print('Single')
else:
    print('More')

#### For
For se utiliza para iterar sobre los elementos de una secuencia (como una cadena, tupla o lista) u otro objeto iterable:

In [None]:
for numero in numeros[1:3]:
    print(numero)

#### While
While se utiliza para la ejecución repetida, siempre y cuando se cumpla alguna condición

In [None]:
contador = 0
while contador < 3:
    print(contador)
    contador += 1  #contador = contador + 1

### Funciones

Las funciones son una manera conveniente dividir el código en bloques útiles, lo que nos permite pedir nuestro código, que sea más legible, reutilizar y ahorrar algo de tiempo. 

In [None]:
def hola_usuario(username, greeting):
    print "Hello, %s , From My Function!, I wish you %s" %(username, greeting)

### Clases
- Los objetos son una encapsulación de variables y funciones en una sola entidad.
- Los objetos toman sus variables y funciones de las clases. 
- Las clases son esencialmente una plantilla para crear sus objetos.

In [20]:
class MiClase:

    def __init__(self):
        self.data = []
    
    def function(self):
        print("Este mensaje se imprime desde la clase")

In [21]:
mi_objeto = MiClase()
mi_objeto.function()

Este mensaje se imprime desde la clase


In [25]:
mi_objeto.data

[]

### Métodos
Los métodos son funciones que pertenecen a cierto objeto

In [4]:
mi_lista = [1,2,3,"hola",5]
mi_lista.count("hola")

1

In [None]:
Los métodos pueden regresar o modificar el objeto

In [5]:
mi_lista.append("Nuevo")
print(mi_lista)

[1, 2, 3, 'hola', 5, 'Nuevo']


# Módulos y paquetes

- Los módulos en Python son simplemente archivos de Python con la extensión .py, que implementan un conjunto de funciones. 
- Los módulos se importan utilizando el comando de 'import'

Librerías estándar de python:
https://docs.python.org/2/library/

In [7]:
import math
help(math)

Help on built-in module math:

NAME
    math

DESCRIPTION
    This module is always available.  It provides access to the
    mathematical functions defined by the C standard.

FUNCTIONS
    acos(...)
        acos(x)
        
        Return the arc cosine (measured in radians) of x.
    
    acosh(...)
        acosh(x)
        
        Return the inverse hyperbolic cosine of x.
    
    asin(...)
        asin(x)
        
        Return the arc sine (measured in radians) of x.
    
    asinh(...)
        asinh(x)
        
        Return the inverse hyperbolic sine of x.
    
    atan(...)
        atan(x)
        
        Return the arc tangent (measured in radians) of x.
    
    atan2(...)
        atan2(y, x)
        
        Return the arc tangent (measured in radians) of y/x.
        Unlike atan(y/x), the signs of both x and y are considered.
    
    atanh(...)
        atanh(x)
        
        Return the inverse hyperbolic tangent of x.
    
    ceil(...)
        ceil(x)
        
 

- Los paquetes son colecciones de módulos (puedes imaginarlos como un directorio)

In [20]:
import mipaquete
mipaquete

<module 'mipaquete' from 'C:\\Users\\dibujoatm\\Documents\\GitHub\\Data-Bootcamp-Mty\\1. Programación en Python\\mipaquete\\__init__.py'>

In [22]:
from mipaquete import saludos
saludos.hola()

Hola alumnos


<font color="red">¡NOTA IMPORTANTE!</font>

evitar el uso de:
from module import *