# <font color=green> PYTHON PARA DATA SCIENCE
---

# <font color=green> 1. INTRODUCCIÓN A PYTHON
---

# 1.1 Introducción

> Python es un lenguaje de programación de alto nivel con soporte para múltiples paradigmas de programación. Es un proyecto *open source* y desde su aparición en 1991, se ha convertido en uno de los lenguajes de programación interpretados más populares. 
>
> En los últimos años, Python ha desarrollado una comunidad activa de procesamiento científico y análisis de datos y se ha destacado como uno de los lenguajes más relevantes en lo que respecta a la ciencia de datos y el aprendizaje automático, tanto en el entorno académico como en el mercado.

# 1.2 Instalación y ambiente de desarrollo

### Instalación Local

### https://www.python.org/downloads/
### o
### https://www.anaconda.com/distribution/

### Google Colaboratory

### https://colab.research.google.com

### Verificando la versión

In [None]:
!python -V

# <font color=green> 2. CARACTERÍSTICAS BÁSICAS DEL LENGUAJE
---

# 2.1 Operaciones matemáticas

### Operadores aritméticos: $+$, $-$, $*$, $/$, $**$, $\%$, $//$

### Adición ($+$)

In [None]:
2 + 2

### Subtracción ($-$)

In [None]:
2 - 2

### Multiplicación ($*$)

In [None]:
2 * 3

### División ($/$) e ($//$)
La operación división siempre retorna un número de punto flotante

In [None]:
10 / 3

In [None]:
10 // 3

### Exponenciación ($**$)

In [None]:
2 ** 3

### Resto de la división ($\%$)

In [None]:
10 % 3

In [None]:
10 % 2

### Expresiones matemáticas

In [None]:
5 * 2 + 3 * 2

In [None]:
(5 * 2) + (3 * 2)

In [None]:
5 * (2 + 3) * 2

### La variáble _

En el modo interactivo, el último resultado impreso es atribuído a la variáble _

In [None]:
5 * 2

In [None]:
_ + 3 * 2

In [None]:
_ / 2

# 2.2 Variábles 

### Nombres de variábles

- Nombres de variábles pueden comenzar con letras (a - z, A - Z) o el caracter *underscore* (_):

    > Altura
    >
    > _peso
    
- El restante del nombre puede contener letras, números y/o el caracter "_":

    > nombre_de_la_variable
    >
    > _valor
    >
    > dia_28_11_
    

- Los nombres son *case sensitive*:

    > Nombre_De_La_Variable $\ne$ nombre_de_la_variable $\ne$ NOMBRE_DE_LA_VARIABLE
    
### <font color=red>Observaciones:
- Existen algunas palabras reservadas del lenguaje que no pueden ser utilizadas como nombres de variábles:

| |Lista de palabras <br>reservadas en Python| |
|:-------------:|:------------:|:-------------:|
| and           | as           | not           | 
| assert        | finally      | or            | 
| break         | for          | pass          | 
| class         | from         | nonlocal      | 
| continue      | global       | raise         | 
| def           | if           | return        | 
| del           | import       | try           | 
| elif          | in           | while         | 
| else          | is           | with          | 
| except        | lambda       | yield         | 
| False         | True         | None          | 

### Declaración de variábles

### Operadores de atribución: $=$, $+=$, $-=$, $*=$, $/=$, $**=$, $\%=$, $//=$

In [None]:
anho_actual = 2019
anho_fabricacion = 2003
km_total = 44410.0

In [None]:
anho_actual

In [None]:
anho_fabricacion

In [None]:
km_total

# $$km_{média} = \frac {km_{total}}{(Anho_{actual} - Anho_{fabricacion})}$$

### Operaciones con variábles

In [None]:
km_media = km_total / (anho_actual - anho_fabricacion)
km_media

In [None]:
anho_actual = 2019
anho_fabricacion = 2003
km_total = 44410.0
km_media = km_total / (anho_actual - anho_fabricacion)
km_media

In [None]:
anho_actual = 2019
anho_fabricacion = 2003
km_total = 44410.0
km_media = km_total / (anho_actual - anho_fabricacion)

km_total = km_total + km_media
km_total

In [None]:
anho_actual = 2019
anho_fabricacion = 2003
km_total = 44410.0
km_media = km_total / (anho_actual - anho_fabricacion)

km_total += km_media
km_total

### Conclusión:
```
"valor = valor + 1" es equivalente al "valor += 1"
```

### Declaración múltiple

In [None]:
anho_actual, anho_fabricacion, km_total = 2019, 2003, 44410.0

In [None]:
anho_actual

In [None]:
anho_fabricacion

In [None]:
km_total

In [None]:
anho_actual, anho_fabricacion, km_total = 2019, 2003, 44410.0
km_media = km_total / (anho_actual - anho_fabricacion)
km_media

# 2.3 Tipos de datos

Los tipos de datos especifican como números y caracteres serán almacenados y manipulados dentro de un programa. Los tipos de datos básicos de Python son:

1. **Números**
    1. ***int*** - Enteros
    - ***float*** - Punto flotante
- **Booleanos** - Asume los valores True o False. Esencial cuando comenzamos a trabajar con declaraciones condicionales
- ***Strings*** - Secuencia de uno o mas caracteres que puede incluir letras, números y otros tipos de caracteres. Representa un texto.
- **None** - Representa la ausencia de valor

### Números

In [None]:
anho_actual = 2019

In [None]:
type(anho_actual)

In [None]:
km_total = 44410.0

In [None]:
type(km_total)

### Booleanos

In [None]:
zero_km = True

In [None]:
type(zero_km)

In [None]:
zero_km = False

In [None]:
type(zero_km)

### Strings

In [None]:
nombre = 'Jetta Variant'
nombre

In [None]:
nombre = "Jetta Variant"
nombre

In [None]:
nombre = 'Jetta "Variant"'
nombre

In [None]:
nombre = "Jetta 'Variant'"
nombre

In [None]:
auto = '''
  Nome
  Idade
  Nota
'''

In [None]:
type(auto)

### None

In [None]:
kilometraje = None
kilometraje

In [None]:
type(kilometraje)

# 2.4 Conversión de tipos

In [None]:
a = 10
b = 20
c = 'Python es '
d = 'genial'

In [None]:
type(a)

In [None]:
type(b)

In [None]:
type(c)

In [None]:
type(d)

In [None]:
a + b

In [None]:
c + d

In [None]:
# c + a

### Conversiones de tipo

Funciones int(), float(), str()

In [None]:
str(a)

In [None]:
type(str(a))

In [None]:
c + str(a)

In [None]:
float(a)

In [None]:
var = 3.141592

In [None]:
int(var)

In [None]:
var = 3.99

In [None]:
int(var)

# 2.5 Indentación, comentários y formatación de *strings*

### Indentación

En Python, los programas se estructuran mediante sangría. En cualquier lenguaje de programación, la práctica de la sangría es muy útil, ya que facilita la lectura y el mantenimiento del código. En Python, la sangría no es solo una cuestión de organización y estilo, sino un requisito de lenguaje.

In [None]:
anho_actual = 2019
anho_fabricacion = 2019

if (anho_actual == anho_fabricacion):
  print('Verdadero')
else:
  print('Falso')

### Comentarios

Comentarios son extremamente importantes en un programa. Consiste en un texto que describe lo que el programa o una parte específica del programa está haciendo. Los comentarios son ignorados por el interpretador Python. 

Podemos tener comentarios de una única línea o de múltiples líneas.

In [None]:
# Esto es un comentário
anho_actual = 2019
anho_actual

In [None]:
# Esto
# es un 
# comentario
anho_actual = 2019
anho_actual

In [None]:
'''Esto es un
comentario'''
anho_actual = 2019
anho_actual

In [None]:
# Definiendo variábles
anho_actual = 2019
anho_fabricacion = 2019

'''
Estructura condicional 
'''
if (anho_actual == anho_fabricacion):   # Verificando si la condición es verdadera
  print('Verdadero')
else:                               # Verificando si la condiçión es falsa
  print('Falso')

### Formatación de *strings*

## *str.format()*

https://docs.python.org/3.6/library/stdtypes.html#str.format

In [None]:
print('Hola, {}!'.format('Rodrigo'))

In [None]:
print('Hola, {}! Este es su acceso de número {}'.format('Rodrigo', 32))

In [None]:
print('Hola, {nombre}! Este es su acceso de número {accesos}'.format(nombre = 'Rodrigo', accesos = 32))

## *f-Strings*

https://docs.python.org/3.6/reference/lexical_analysis.html#f-strings

In [None]:
nombre = 'Rodrigo'
accesos = 32

In [None]:
print(f'Olá, {nombre}! Este es su acceso de número {accesos}')

# <font color=green> 3. TRABAJANDO CON LISTAS
---

# 3.1 Creando listas

Listas son secuencias **mutábles** que son utilizadas para almacenar colecciones de itens, generalmente homogeneos. Pueden ser construídos de várias formas:
```
- Utilizando un par de corchetes: [ ], [ 1 ]
- Utilizando un par de corchetes con itens separados por comas: [ 1, 2, 3 ]
```

In [None]:
Accesorios = ['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire condicionado', 'Sensor de estacionamento', 'Sensor crepuscular', 'Sensor de lluvia']
Accesorios

In [None]:
type(Accesorios)

### Lista con tipos de datos variados

In [None]:
Auto_1 = ['Jetta Variant', 'Motor 4.0 Turbo', 2003, 44410.0, False, ['Llantas de aleación', 'Cerraduras elétricas', 'Piloto automático'], 88078.64]
Auto_2 = ['Passat', 'Motor Diesel', 1991, 5712.0, False, ['Central multimedia', 'Techo panoramico', 'Frenos ABS'], 106161.94]

In [None]:
Auto_1

In [None]:
Auto_2

In [None]:
Autos = [Auto_1, Auto_2]
Autos

# 3.2 Operaciones con listas

https://docs.python.org/3.6/library/stdtypes.html#common-sequence-operations

## *x in A*

Retorna **True** si un elemento de la lista *A* es igual a *x*.

In [None]:
Accesorios

In [None]:
'Llantas de aleación' in Accesorios

In [None]:
'4 X 4' in Accesorios

In [None]:
'Llantas de aleación' not in Accesorios

In [None]:
'4 X 4' not in Accesorios

## *A + B*

Concatena as listas *A* e *B*.

In [None]:
A = ['Llantas de aleación', 'Cerraduras elétricas', 'Piloto automático', 'Asientos de cuero']
B = ['Aire condicionado', 'Sensor de estacionamento', 'Sensor crepuscular', 'Sensor de lluvia']

In [None]:
A

In [None]:
B

In [None]:
A + B

## *len(A)*

Tamanho da lista A.

In [None]:
len(Accesorios)

# 3.3 Selecciones en listas

## *A[ i ]*

Retorna el i-ésimo item de la lista *A*.

<font color=red>**Observación:**</font> Listas tienen indexación con origen en cero.

In [None]:
Accesorios

In [None]:
Accesorios[0]

In [None]:
Accesorios[1]

In [None]:
Accesorios[-1]

In [None]:
Autos

In [None]:
Autos[0]

In [None]:
Autos[0][0]

In [None]:
Autos[0][-2]

In [None]:
Autos[0][-2][1]

## *A[ i : j ]*

Recorta a lista *A* do índice i até o j. Neste fatiamento o elemento com índice i é **incluído** e o elemento com índice j **não é incluído** no resultado.

In [None]:
Accesorios

In [None]:
Accesorios[2:5]

In [None]:
Accesorios[2:]

In [None]:
Accesorios[:5]

# 3.4 Métodos de listas

https://docs.python.org/3.6/library/stdtypes.html#mutable-sequence-types

In [None]:
Accesorios = ['Llantas de aleación', 'Cerraduras elétricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamento', 'Sensor crepuscular', 'Sensor de lluvia']

## *A.sort()*

Ordena a lista *A*.

In [None]:
Accesorios

In [None]:
Accesorios.sort()
Accesorios

## *A.append(x)*

Adiciona o elemento *x* no final da lista *A*.

In [None]:
Accesorios.append('4 X 4')
Accesorios

## *A.pop(i)*

Remove e retorna o elemento de índice i da lista *A*.

<font color=red>**Observação:**</font> Por *default* o método *pop()* remove e retorna o último elemento de uma lista.

In [None]:
Accesorios.pop()

In [None]:
Accesorios

In [None]:
Accesorios.pop(3)

In [None]:
Accesorios

## *A.copy()*

Cria uma cópia da lista *A*.

<font color=red>**Observação:**</font> O mesmo resultado pode ser obtido com o seguinte código: 
```
A[:]
```

In [None]:
Accesorios_2 = Accesorios
Accesorios_2

In [None]:
Accesorios_2.append('4 X 4')
Accesorios_2

In [None]:
Accesorios

In [None]:
Accesorios.pop()
Accesorios

In [None]:
Accesorios_2

In [None]:
Accesorios_2 = Accesorios.copy()
Accesorios_2

In [None]:
Accesorios_2.append('4 X 4')
Accesorios_2

In [None]:
Accesorios

In [None]:
Accesorios_2 = Accesorios[:]
Accesorios_2

# <font color=green> 4. ESTRUTURAS DE REPETIÇÃO E CONDICIONAIS
---

# 4.1 Instrução *for*

#### Formato padrão

```
for <variável> in <coleção>:
    <instruções>
```

### Loops com listas

In [None]:
Accesorios = ['Llantas de aleación', 'Cerraduras elétricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamento', 'Sensor crepuscular', 'Sensor de lluvia']
Accesorios

In [None]:
for item in Accesorios:
  print(item)

###  List comprehensions

https://docs.python.org/3.6/tutorial/datastructures.html#list-comprehensions

*range()* -> https://docs.python.org/3.6/library/functions.html#func-range

In [None]:
range(10)

In [None]:
list(range(10))

In [None]:
for i in range(10):
  print(i ** 2)

In [None]:
quadrado = []
for i in range(10):
  quadrado.append(i ** 2)
  
quadrado

In [None]:
[i ** 2 for i in range(10)]

# 4.2 Loops aninhados

In [None]:
datos = [ 
    ['Llantas de aleación', 'Cerraduras elétricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamento', 'Sensor crepuscular', 'Sensor de lluvia'],
    ['Central multimídia', 'Techo panorâmico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento'],
    ['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Cambio automático', 'Asientos de cuero', 'Central multimídia', 'Vidros eléctricos']
]
datos

In [None]:
for lista in datos:
  print(lista)

In [None]:
for lista in datos:
  for item in lista:
    print(item)

In [None]:
Accesorios = []

for lista in datos:
  for item in lista:
    Accesorios.append(item)
    
Accesorios

## *set()*

https://docs.python.org/3.6/library/stdtypes.html#types-set


In [None]:
list(set(Accesorios))

### List comprehensions

In [None]:
[item for lista in datos for item in lista]

In [None]:
list(set([item for lista in datos for item in lista]))

# 4.3 Instrucción *if*

#### Formato padrón

```
if <condición>:
     <instruciones en caso la condición sea  verdadera>
```

### Operadores de comparación: $==$, $!=$, $>$, $<$, $>=$, $<=$
### y
### Operadores lógicos: $and$, $or$, $not$

In [None]:
# 1º item de la lista - Nombre del vehículo
# 2º item de la lista - Año de fabricación
# 3º item de la lista - Vehículo es cero km?

datos = [
    ['Jetta Variant', 2003, False],
    ['Passat', 1991, False],
    ['Crossfox', 1990, False],
    ['DS5', 2019, True],
    ['Aston Martin DB4', 2006, False],
    ['Palio Weekend', 2012, False],
    ['A5', 2019, True],
    ['Série 3 Cabrio', 2009, False],
    ['Dodge Jorney', 2019, False],
    ['Carens', 2011, False]
]
datos

In [None]:
zero_km_Y = []

for lista in datos:
  if(lista[2] == True):
    zero_km_Y.append(lista)
    
zero_km_Y

In [None]:
zero_km_N = []

for lista in datos:
  if(lista[2] == False):
    zero_km_N.append(lista)
    
zero_km_N

### List comprehensions

In [None]:
[lista for lista in datos if lista[2] == True]

# 4.4 Instrucciones *if-else* e *if-elif-else*

#### Formato padrón

```
if <condición>:
    <instrucciones en caso la condición sea verdadera>
else:
    <instrucciones en caso la condición no sea verdadera>
```

In [None]:
zero_km_Y, zero_km_N = [], []

for lista in datos:
  if(lista[2] == True):
    zero_km_Y.append(lista)
  else:
    zero_km_N.append(lista)

In [None]:
zero_km_Y

In [None]:
zero_km_N

#### Formato padrón

```
if <condición 1>:
    <instrucciones en caso la condición 1 sea verdadera>
elif <condição 2>:
    <instrucciones en caso la condición 2 sea verdadera>
elif <condição 3>:
    <instrucciones en caso la condición 3 sea verdadera>
                        .
                        .
                        .
else:
    <instrucciones en caso las condiciones anteriores no sean verdaderas>
```

In [None]:
datos

In [None]:
print('AND')
print(f'(True and True) el resultado es: {True and True}')
print(f'(True and False) el resultado es: {True and False}')
print(f'(False and True) el resultado es: {False and True}')
print(f'(False and False) el resultado es: {False and False}')

In [None]:
print('OR')
print(f'(True or True) el resultado es: {True or True}')
print(f'(True or False) el resultado es: {True or False}')
print(f'(False or True) el resultado es: {False or True}')
print(f'(False or False) el resultado es: {False or False}')

In [None]:
A, B, C = [], [], []

for lista in datos:
  if(lista[1] <=2000):
    A.append(lista)
  elif(lista[1] > 2000 and lista[1] <= 2010):
    B.append(lista)
  else:
    C.append(lista)

In [None]:
A

In [None]:
B

In [None]:
C

In [None]:
A, B, C = [], [], []

for lista in datos:
  if(lista[1] <=2000):
    A.append(lista)
  elif(2000 < lista[1] <= 2010):
    B.append(lista)
  else:
    C.append(lista)