# <font color=green> PYTHON PARA DATA SCIENCE - NUMPY
---

# <font color=green> 1. INTRODUCCIÓN A PYTHON
---

# 1.1 Introducción

> Python es un lenguaje de programación de alto nivel con soporte a múltiples paradigmas de programación. Es un proyecto *open source* y desde su surgimiento, en 1991, viene convirtiéndose en uno de los lenguajes de programación interpretados más populares. 
>
> En los últimos años Python desarrolló una comunidad activa de procesamiento científico y análisis de datos y viene destacándose como uno de los lenguajes más relevantes cuando el asunto es ciencia de datos y machine learning, tanto en el entorno acadêmico como también en el entorno laboral.

# 1.2 Instalación y entorno de trabajo

### Instalación Local

### https://www.python.org/downloads/
### o
### https://www.anaconda.com/distribution/

### Google Colaboratory

### https://colab.research.google.com

### Verificando versión

In [1]:
!python -V

Python 3.7.1


# 1.3 Trabajando con Numpy

In [None]:
import numpy as np

In [None]:
km = np.loadtxt('carros-km.txt')

In [None]:
km

In [None]:
años = np.loadtxt('carros-años.txt', dtype = int)

In [None]:
años

### Obtener el promedio de kilometros recorridos por año

In [8]:
km_promedio = km / (2020 - años)

  """Entry point for launching an IPython kernel.


In [None]:
km_promedio

In [10]:
type(km_promedio)

numpy.ndarray

# <font color=green> 2. CARACTERÍSTICAS BÁSICAS DEL LENGUAJE
---

# 2.1 Operaciones matemáticas

### Operadores aritméticos: $+$, $-$, $*$, $/$, $**$, $\%$, $//$

### Suma ($+$)

In [1]:
2 + 2

4

### Resta ($-$)

In [2]:
2 - 2

0

### Multiplicación ($*$)

In [3]:
2 * 3

6

### División ($/$) y ($//$)
La operación división siempre devuelve un número con punto decimal

In [4]:
10 / 3

3.3333333333333335

In [5]:
10 // 3

3

### Exponenciación ($**$)

In [6]:
2 ** 3

8

### Resto de la división ($\%$)

In [7]:
10 % 3

1

In [8]:
10 % 2

0

### Expresiones matemáticas

In [9]:
5 * 2 + 3 * 2

16

In [10]:
(5 * 2) + (3 * 2)

16

In [11]:
5 * (2 + 3) * 2

50

### La variable _

En el modo interactivo, el último resultado impreso en pantalla es atribuído a la variable _

In [12]:
5 * 2

10

In [13]:
_ + 3 * 2

16

In [14]:
_ / 2

8.0

# 2.2 Variables

### Nombres de variables

- Nombres de variables pueden comenzar con letras (a - z, A - Z) o con el símbolo *underscore* (_):

    > Altura
    >
    > _peso
    
- El resto del nombre puede contener letras, números o el símbolo "_":

    > nombre_de_variable
    >
    > _valor
    >
    > dia_28_11_
    

- Los nombres son *case sensitive*:

    > Nombre_De_Variable $\ne$ nombre_de_variable $\ne$ NOMBRE_DE_VARIABLE
    
### <font color=red>Observaciones:
- Existen algumas palabras reservadas del lenguaje que no pueden ser utilizadas como nombres de variables:

| |Lista de palabras <br>reservadas en Python| |
|:-------------:|:------------:|:-------------:|
| and           | as           | not           | 
| assert        | finally      | or            | 
| break         | for          | pass          | 
| class         | from         | nonlocal      | 
| continue      | global       | raise         | 
| def           | if           | return        | 
| del           | import       | try           | 
| elif          | in           | while         | 
| else          | is           | with          | 
| except        | lambda       | yield         | 
| False         | True         | None          | 

### Declaración de variables

### Operadores de asignación: $=$, $+=$, $-=$, $*=$, $/=$, $**=$, $\%=$, $//=$

In [15]:
año_actual = 2020
año_fabricacion = 2003
km_total = 44410.0

In [17]:
año_actual

2020

In [18]:
año_fabricacion

2003

In [19]:
km_total

44410.0

# $$km_{promedio} = \frac {km_{total}}{(Año_{actual} - Año_{fabricación})}$$

### Operaciones con variables

In [20]:
km_promedio = km_total / (año_actual - año_fabricacion)
km_promedio

2612.3529411764707

In [22]:
año_actual = 2020
año_fabricacion = 2003
km_total = 44410.0
km_promedio = km_total / (año_actual - año_fabricacion)
km_promedio

2612.3529411764707

In [23]:
año_actual = 2020
año_fabricacion = 2003
km_total = 44410.0
km_promedio = km_total / (año_actual - año_fabricacion)

km_total = km_total + km_promedio
km_total

47022.35294117647

In [24]:
año_actual = 2020
año_fabricacion = 2003
km_total = 44410.0
km_promedio = km_total / (año_actual - año_fabricacion)

km_total += km_promedio
km_total

47022.35294117647

### Conclusión:
```
"valor = valor + 1" es equivalente a "valor += 1"
```

### Declaración múltiple

In [25]:
año_actual, año_fabricacion, km_total = 2020, 2003, 44410.0

In [26]:
año_actual

2020

In [27]:
año_fabricacion

2003

In [28]:
km_total

44410.0

In [29]:
año_actual, año_fabricacion, km_total = 2020, 2003, 44410.0
km_promedio = km_total / (año_actual - año_fabricacion)
km_promedio

2612.3529411764707

# 2.3 Tipos de datos

Los tipos de datos especifican como números y caracteres estarán guardados y manipulados dentro de un programa. Los tipos de datos básicos en Python son:

1. **Números**
    1. ***int*** - Enteros
    - ***float*** - Decimales
- **Booleanos** - Contiene valores True o False. Esencial cuando comenzamos a trabajar con declaraciones condicionales
- ***Strings*** - Secuencia de uno o más caracteres que puede incluir letras, números y otros tipos de caracteres. Representa un texto.
- **None** - Representa la ausencia de valor

### Números

In [2]:
año_actual = 2020

In [3]:
type(año_actual)

int

In [4]:
km_total = 44410.0

In [5]:
type(km_total)

float

### Booleanos

In [6]:
zero_km = True

In [7]:
type(zero_km)

bool

In [8]:
zero_km = False

In [9]:
type(zero_km)

bool

### Strings

In [10]:
nombre = 'Jetta Variant'
nombre

'Jetta Variant'

In [11]:
nombre = "Jetta Variant"
nombre

'Jetta Variant'

In [12]:
nombre = 'Jetta "Variant"'
nombre

'Jetta "Variant"'

In [13]:
nombre = "Jetta 'Variant'"
nombre

"Jetta 'Variant'"

In [14]:
carro = '''
  Nombre
  Edad
  Nota
'''

In [15]:
type(carro)

str

### None

In [16]:
kilometraje = None
kilometraje

In [17]:
type(kilometraje)

NoneType

# 2.4 Conversión de tipos

In [18]:
a = 10
b = 20
c = 'Python es '
d = 'genial'

In [19]:
type(a)

int

In [20]:
type(b)

int

In [21]:
type(c)

str

In [22]:
type(d)

str

In [23]:
a + b

30

In [24]:
c + d

'Python es genial'

In [27]:
# c + a

### Conversiones de tipo

Funciones int(), float(), str()

In [28]:
str(a)

'10'

In [29]:
type(str(a))

str

In [30]:
c + str(a)

'Python es 10'

In [31]:
float(a)

10.0

In [32]:
var = 3.141592

In [33]:
int(var)

3

In [34]:
var = 3.99

In [35]:
int(var)

3

# 2.5 Indentación, comentarios y formatación de *strings*

### Indentación

En el lenguaje Python los programas son estructurados por medio de indentación. En cualquier lenguaje de programación la práctica de colocar indentación es bastante útil, facilitando la lectura y también el mantenimiento del código. En Python la indentación no es solamente una cuestión de organización y estilo, sino que es un requisito del lenguaje.

In [36]:
año_actual = 2020
año_fabricacion = 2020

if (año_actual == año_fabricacion):
    print('Verdadero')
else:
    print('Falso')

Verdadero


### Comentarios

Comentarios son extremamente importantes en un programa. Consiste en un texto que describe lo que el programa o una parte específica del programa está haciendo. Los comentarios son ignorados por el interpretador Python. 

Podemos tener comentarios de una única linea o de múltiples líneas.

In [37]:
# Esto es un comentario
año_actual = 2020
año_actual

2020

In [38]:
# Esto
# es un 
# comentario
año_actual = 2020
año_actual

2020

In [39]:
'''Esto es un
comentario'''
año_actual = 2020
año_actual

2020

In [40]:
# Definiendo variables
año_actual = 2020
año_fabricacion = 2020

'''
Estructura condicional que vamos 
a aprender la próxima clase
'''
if (año_actual == año_fabricacion):   # Probando si la condición es verdadera
    print('Verdadero')
else:                               # Probando si la condición es falsa
    print('Falso')

Verdadero


## *str.format()*

https://docs.python.org/3.6/library/stdtypes.html#str.format

In [41]:
print('Hola, {}!'.format('Alejandro'))

Hola, Alejandro!


In [42]:
print('Hola, {}! Esta es su visita número {}'.format('Alejandro', 32))

Hola, Alejandro! Esta es su visita número 32


In [43]:
print('Hola, {nombre}! Esta es su visita número {visita}'.format(visita = 32, nombre = 'Alejandro'))

Hola, Alejandro! Esta es su visita número 32


## *f-Strings*

https://docs.python.org/3.6/reference/lexical_analysis.html#f-strings

In [44]:
nombre = 'Alejandro'
visita = 32

In [45]:
print(f'Hola, {nombre}! Esta es su visita número {visita}')

Hola, Alejandro! Esta es su visita número 32


# <font color=green> 3. TRABAJANDO CON LISTAS
---

# 3.1 Creando listas

Listas son secuencias **mutables** que son utilizadas para guardar colecciones de objetos, generalmente homogéneos. Pueden ser construídas de varias formas:
```
- Utilizando un par de corchetes: [ ], [ 1 ]
- Utilizando un par de corchetes con objetos separados por comas: [ 1, 2, 3 ]
```

In [1]:
Accesorios = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [2]:
type(Accesorios)

list

### Lista con tipos de datos variados

In [3]:
Carro_1 = ['Jetta Variant', 'Motor 4.0 Turbo', 2003, 44410.0, False, ['Cerraduras eléctricas', 'Piloto automático'], 88078.64]
Carro_2 = ['Passat', 'Motor Diesel', 1991, 5712.0, False, ['Central multimedia', 'Frenos ABS'], 106161.94]

In [4]:
Carro_1

['Jetta Variant',
 'Motor 4.0 Turbo',
 2003,
 44410.0,
 False,
 ['Cerraduras eléctricas', 'Piloto automático'],
 88078.64]

In [5]:
Carro_2

['Passat',
 'Motor Diesel',
 1991,
 5712.0,
 False,
 ['Central multimedia', 'Frenos ABS'],
 106161.94]

In [6]:
Carros = [Carro_1, Carro_2]
Carros

[['Jetta Variant',
  'Motor 4.0 Turbo',
  2003,
  44410.0,
  False,
  ['Cerraduras eléctricas', 'Piloto automático'],
  88078.64],
 ['Passat',
  'Motor Diesel',
  1991,
  5712.0,
  False,
  ['Central multimedia', 'Frenos ABS'],
  106161.94]]

# 3.2 Operaciones con listas

https://docs.python.org/3.6/library/stdtypes.html#common-sequence-operations

## *x in A*

Devuelve **True** si un elemento de la lista *A es igual a x*.

In [7]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [8]:
'Cerraduras eléctricas' in Accesorios

True

In [9]:
'4 X 4' in Accesorios

False

In [10]:
'Cerraduras eléctricas' not in Accesorios

False

In [11]:
'4 X 4' not in Accesorios

True

## *A + B*

Concatena las listas *A y B*.

In [12]:
A = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero']
B = ['Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']

In [13]:
A + B

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [14]:
A

['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero']

In [15]:
B

['Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']

## *len(A)*

Tamaño de la lista A.

In [16]:
len(Accesorios)

6

# 3.3 Selecciones en listas

## *A[ n ]*

Devuelve el n-ésimo objeto de la lista *A*.

<font color=red>**Observación:**</font> Listas tienen indexación con inicio en cero.

In [17]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [18]:
Accesorios[0]

'Cerraduras eléctricas'

In [19]:
Accesorios[1]

'Piloto automático'

In [20]:
Accesorios[-1]

'Sensor de lluvia'

In [21]:
Carros

[['Jetta Variant',
  'Motor 4.0 Turbo',
  2003,
  44410.0,
  False,
  ['Cerraduras eléctricas', 'Piloto automático'],
  88078.64],
 ['Passat',
  'Motor Diesel',
  1991,
  5712.0,
  False,
  ['Central multimedia', 'Frenos ABS'],
  106161.94]]

In [22]:
Carros[0]

['Jetta Variant',
 'Motor 4.0 Turbo',
 2003,
 44410.0,
 False,
 ['Cerraduras eléctricas', 'Piloto automático'],
 88078.64]

In [23]:
Carros[0][0]

'Jetta Variant'

In [24]:
Carros[0][-2]

['Cerraduras eléctricas', 'Piloto automático']

In [25]:
Carros[0][-2][1]

'Piloto automático'

## *A[ i : j ]*

Recorta la lista A desde el índice i hasta j. En este recorte el elemento con índice i **es incluído** y el elemento con índice j **no es incluído** en el resultado.

In [26]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [27]:
Accesorios[2:5]

['Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento']

In [28]:
Accesorios[2:]

['Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [29]:
Accesorios[:5]

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento']

# 3.4 Métodos en listas

https://docs.python.org/3.6/library/stdtypes.html#mutable-sequence-types

## *A.sort()*

Ordena la lista *A*.

In [30]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [31]:
Accesorios.sort()
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

## *A.append(x)*

Añade el elemento *x al final de la lista A*

In [32]:
Accesorios.append('4 x 4')
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4 x 4']

## *A.pop(i)*

Elimina y devuelve el elemento de índice i de la lista *A*.

<font color=red>**Observación:**</font> Por *defecto* el método *pop()* elimina y devuelve el último elemento de una lista.

In [33]:
Accesorios.pop()

'4 x 4'

In [34]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [35]:
Accesorios.pop(3)

'Piloto automático'

In [36]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

## *A.copy()*

Crea una copia de la lista *A*.

<font color=red>**Observación:**</font> El mismo resultado puede ser obtenido con el seguinte código: 
```
A[:]
```

In [37]:
Accesorios_2 = Accesorios
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [38]:
Accesorios_2.append('4 x 4')
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4 x 4']

In [39]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4 x 4']

In [40]:
Accesorios.pop()

'4 x 4'

In [41]:
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [42]:
Accesorios_2 = Accesorios.copy()
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [43]:
Accesorios_2.append('4 x 4')
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4 x 4']

In [44]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [45]:
Accesorios_2 = Accesorios[:]
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

# <font color=green> 4. ESTRUCTURAS DE REPETICIÓN Y CONDICIONALES
---

# 4.1 Instrucción *for*

#### Formato estándar

```
for <variable> in <coleccion>:
    <instrucciones>
```

### Loops con listas

In [1]:
Accesorios = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [2]:
for iten in Accesorios:
  print(iten)

Cerraduras eléctricas
Piloto automático
Asientos de cuero
Aire acondicionado
Sensor de estacionamiento
Sensor de lluvia


###  List comprehensions

https://docs.python.org/3.6/tutorial/datastructures.html#list-comprehensions

*range()* -> https://docs.python.org/3.6/library/functions.html#func-range

In [3]:
range(10)

range(0, 10)

In [4]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [5]:
for i in range(10):
  print(i ** 2)

0
1
4
9
16
25
36
49
64
81


In [6]:
cuadrado=[]
for i in range(10):
  cuadrado.append(i**2)

cuadrado

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [7]:
cuadrado=[i**2 for i in range(10)]

In [8]:
cuadrado

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 4.2 Loops anidados

In [9]:
datos = [ 
    ['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia'],
    ['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento'],
    ['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']
]
datos

[['Llantas de aleación',
  'Cerraduras eléctricas',
  'Piloto automático',
  'Asientos de cuero',
  'Aire acondicionado',
  'Sensor de estacionamiento',
  'Sensor de crepúsculo',
  'Sensor de lluvia'],
 ['Central multimedia',
  'Techo panorámico',
  'Frenos ABS',
  '4 X 4',
  'Panel digital',
  'Piloto automático',
  'Asientos de cuero',
  'Cámara de estacionamiento'],
 ['Piloto automático',
  'Control de estabilidad',
  'Sensor crepuscular',
  'Frenos ABS',
  'Transmisión automática',
  'Asientos de cuero',
  'Central multimedia',
  'Ventanas eléctricas']]

In [10]:
for lista in datos:
  print(lista)

['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia']
['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento']
['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']


In [11]:
for lista in datos:
  for iten in lista:
    print(iten)

Llantas de aleación
Cerraduras eléctricas
Piloto automático
Asientos de cuero
Aire acondicionado
Sensor de estacionamiento
Sensor de crepúsculo
Sensor de lluvia
Central multimedia
Techo panorámico
Frenos ABS
4 X 4
Panel digital
Piloto automático
Asientos de cuero
Cámara de estacionamiento
Piloto automático
Control de estabilidad
Sensor crepuscular
Frenos ABS
Transmisión automática
Asientos de cuero
Central multimedia
Ventanas eléctricas


In [12]:
Accesorios = []

for lista in datos:
  for iten in lista:
    Accesorios.append(iten)

Accesorios

['Llantas de aleación',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de crepúsculo',
 'Sensor de lluvia',
 'Central multimedia',
 'Techo panorámico',
 'Frenos ABS',
 '4 X 4',
 'Panel digital',
 'Piloto automático',
 'Asientos de cuero',
 'Cámara de estacionamiento',
 'Piloto automático',
 'Control de estabilidad',
 'Sensor crepuscular',
 'Frenos ABS',
 'Transmisión automática',
 'Asientos de cuero',
 'Central multimedia',
 'Ventanas eléctricas']

## *set()*

https://docs.python.org/3.6/library/stdtypes.html#types-set

https://docs.python.org/3.6/library/functions.html#func-set

In [14]:
set(Accesorios)

{'4 X 4',
 'Aire acondicionado',
 'Asientos de cuero',
 'Central multimedia',
 'Cerraduras eléctricas',
 'Control de estabilidad',
 'Cámara de estacionamiento',
 'Frenos ABS',
 'Llantas de aleación',
 'Panel digital',
 'Piloto automático',
 'Sensor crepuscular',
 'Sensor de crepúsculo',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 'Techo panorámico',
 'Transmisión automática',
 'Ventanas eléctricas'}

In [15]:
list(set(Accesorios))

['Techo panorámico',
 'Piloto automático',
 'Llantas de aleación',
 'Asientos de cuero',
 'Sensor de crepúsculo',
 'Aire acondicionado',
 'Control de estabilidad',
 'Cerraduras eléctricas',
 'Central multimedia',
 'Cámara de estacionamiento',
 'Frenos ABS',
 'Ventanas eléctricas',
 'Transmisión automática',
 'Panel digital',
 'Sensor crepuscular',
 '4 X 4',
 'Sensor de lluvia',
 'Sensor de estacionamiento']

### List comprehensions

In [16]:
Accesorios=list(set([iten for lista in datos for iten in lista]))

In [17]:
Accesorios

['Techo panorámico',
 'Piloto automático',
 'Llantas de aleación',
 'Asientos de cuero',
 'Sensor de crepúsculo',
 'Aire acondicionado',
 'Control de estabilidad',
 'Cerraduras eléctricas',
 'Central multimedia',
 'Cámara de estacionamiento',
 'Frenos ABS',
 'Ventanas eléctricas',
 'Transmisión automática',
 'Panel digital',
 'Sensor crepuscular',
 '4 X 4',
 'Sensor de lluvia',
 'Sensor de estacionamiento']

# 4.3 Instrucción *if*

#### Formato estándar

```
if <condicion>:
     <instrucciones en caso la condición sea verdadera>
```

### Operadores de comparación: $==$, $!=$, $>$, $<$, $>=$, $<=$
### y
### Operadores lógicos: $and$, $or$, $not$

In [18]:
# 1º objeto de la lista - Nombre del vehículo
# 2º objeto de la lista - Año de fabricación
# 3º objeto de la lista - Vehículo es cero km?

datos = [
    ['Jetta Variant', 2003, False],
    ['Passat', 1991, False],
    ['Crossfox', 1990, False],
    ['DS5', 2019, True],
    ['Aston Martin DB4', 2006, False],
    ['Palio Weekend', 2012, False],
    ['A5', 2019, True],
    ['Série 3 Cabrio', 2009, False],
    ['Dodge Jorney', 2019, False],
    ['Carens', 2011, False]
]
datos

[['Jetta Variant', 2003, False],
 ['Passat', 1991, False],
 ['Crossfox', 1990, False],
 ['DS5', 2019, True],
 ['Aston Martin DB4', 2006, False],
 ['Palio Weekend', 2012, False],
 ['A5', 2019, True],
 ['Série 3 Cabrio', 2009, False],
 ['Dodge Jorney', 2019, False],
 ['Carens', 2011, False]]

In [19]:
cero_km_T = []

for lista in datos:
  if(lista[2] == True):
    cero_km_T.append(lista)

cero_km_T

[['DS5', 2019, True], ['A5', 2019, True]]

In [20]:
cero_km_F = []

for lista in datos:
  if(lista[2] == False):
    cero_km_F.append(lista)

cero_km_F

[['Jetta Variant', 2003, False],
 ['Passat', 1991, False],
 ['Crossfox', 1990, False],
 ['Aston Martin DB4', 2006, False],
 ['Palio Weekend', 2012, False],
 ['Série 3 Cabrio', 2009, False],
 ['Dodge Jorney', 2019, False],
 ['Carens', 2011, False]]

### List comprehensions

In [21]:
[lista for lista in datos if(lista[2] == True)]

[['DS5', 2019, True], ['A5', 2019, True]]

# 4.4 Instrucciones *if-else* y *if-elif-else*

#### Formato estándar

```
if <condicion>:
    <instrucciones en caso la condición sea verdadera>
else:
    <instrucciones en caso la condición no sea verdadera>
```

In [22]:
cero_km_T, cero_km_F = [], []

for lista in datos:
  if(lista[2] == True):
    cero_km_T.append(lista)
  else:
    cero_km_F.append(lista)


In [23]:
cero_km_T

[['DS5', 2019, True], ['A5', 2019, True]]

In [24]:
cero_km_F

[['Jetta Variant', 2003, False],
 ['Passat', 1991, False],
 ['Crossfox', 1990, False],
 ['Aston Martin DB4', 2006, False],
 ['Palio Weekend', 2012, False],
 ['Série 3 Cabrio', 2009, False],
 ['Dodge Jorney', 2019, False],
 ['Carens', 2011, False]]

#### Formato estándar

```
if <condicion 1>:
    <instrucciones en caso la condición 1 sea verdadera>
elif <condicion 2>:
    <instrucciones en caso la condición 2 sea verdadera>
elif <condicion 3>:
    <instrucciones en caso la condición 3 sea verdadera>
                        .
                        .
                        .
else:
    <instrucciones en caso las condiciones anteriores no sean verdaderas>
```

In [25]:
datos

[['Jetta Variant', 2003, False],
 ['Passat', 1991, False],
 ['Crossfox', 1990, False],
 ['DS5', 2019, True],
 ['Aston Martin DB4', 2006, False],
 ['Palio Weekend', 2012, False],
 ['A5', 2019, True],
 ['Série 3 Cabrio', 2009, False],
 ['Dodge Jorney', 2019, False],
 ['Carens', 2011, False]]

In [None]:
print('AND')
print(f'(True and True) el resultado es: {True and True}')
print(f'(True and False) el resultado es: {True and False}')
print(f'(False and True) el resultado es: {False and True}')
print(f'(False and False) el resultado es: {False and False}')

In [None]:
print('OR')
print(f'(True or True) el resultado es: {True or True}')
print(f'(True or False) el resultado es: {True or False}')
print(f'(False or True) el resultado es: {False or True}')
print(f'(False or False) el resultado es: {False or False}')

In [26]:
A,B,C = [],[],[]

for lista in datos:
  if(lista[1] <= 2000):
    A.append(lista)
  elif(lista[1]>2000 and lista[1]<=2010):
    B.append(lista)
  else: 
    C.append(lista)

In [27]:
A

[['Passat', 1991, False], ['Crossfox', 1990, False]]

In [28]:
B

[['Jetta Variant', 2003, False],
 ['Aston Martin DB4', 2006, False],
 ['Série 3 Cabrio', 2009, False]]

In [29]:
C

[['DS5', 2019, True],
 ['Palio Weekend', 2012, False],
 ['A5', 2019, True],
 ['Dodge Jorney', 2019, False],
 ['Carens', 2011, False]]

In [30]:
A,B,C = [],[],[]

for lista in datos:
  if(lista[1] <= 2000):
    A.append(lista)
  elif( 2000< lista[1] <=2010):
    B.append(lista)
  else: 
    C.append(lista)

# <font color=green> 5. NUMPY BÁSICO
---

Numpy es la abreviación de Numerical Python y es uno de los paquetes más importantes para procesamiento numérico en Python. Numpy ofrece la base para la mayoría de los paquetes de aplicaciones científicas que usen datos numéricos en Python (estructuras de datos y algoritmos). Pueden destacarse los siguientes recursos que el paquete Numpy contiene:

- Un poderoso objeto array multidimensional;
- Funciones matemáticas sofisticadas para operaciones con arrays sin la necesidad de utilización de bucles *for*;
- Recursos de algebra linear y generación de números aleatórios

Además de sus obvios usos científicos, el paquete NumPy también es muy utilizado en análisis de datos como un eficiente contenedor multidimensional de datos genéricos para transporte entre diversos algoritmos y bibliotecas en Python.

**Versión:** 1.18.4

**Instalación:** https://scipy.org/install.html

**Documentación:** https://numpy.org/doc/1.18/

### Paquetes

Existen diversos paquetes Python disponibles para download en internet. Cada paquete tiene como objetivo la solución de determinado tipo de problema y para esto son desarrollados nuevos tipos, funciones y métodos.

Algunos paquetes son bastante utilizados en un contexto de ciencia de datos, como por ejemplo:

- Numpy
- Pandas
- Scikit-learn
- Matplotlib

Algunos paquetes no son distribuidos en la instalación estándar de Python. En este caso debemos instalar los paquetes que necesitamos en nuestro sistema para poder utilizar sus funcionalidades.

### Importando todo el paquete

In [None]:
import numpy 

https://numpy.org/doc/1.16/reference/generated/numpy.arange.html

In [None]:
numpy.arange(10)

### Importando todo el paquete y asignándole un nuevo nombre 

In [None]:
import numpy as np

In [None]:
np.arange(10)

### Importando parte del paquete

In [None]:
from numpy import arange

In [None]:
arange(10)

# 5.1 Creando arrays Numpy

In [None]:
import numpy as np

### A partir de listas

https://numpy.org/doc/1.16/user/basics.creation.html

In [None]:
km = np.array([1000, 2300, 4987, 1500])

In [None]:
km

In [None]:
type(km)

https://numpy.org/doc/1.16/user/basics.types.html

In [None]:
km.dtype

### A partir de datos externos

https://numpy.org/doc/1.16/reference/generated/numpy.loadtxt.html

In [None]:
km = np.loadtxt(fname= 'carros-km.txt', dtype = int)

In [None]:
km

In [None]:
km.dtype

### Arrays con dos dimensiones

In [None]:
datos = [ 
    ['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia'],
    ['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento'],
    ['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']
]
datos

In [None]:
Accesorios = np.array(datos)

In [None]:
Accesorios

In [None]:
km.shape

In [None]:
Accesorios.shape

### Comparando desempeño con listas

In [None]:
np_array = np.arange(1000000)

In [None]:
py_list = list(range(1000000))

In [None]:
%time for _ in range(100): np_array *= 2

In [None]:
%time for _ in range(100): py_list = [x*2 for x in py_list]

# 5.2 Operaciones aritméticas con arrays Numpy

### Operaciones entre arrays y constantes

In [None]:
km = [44410., 5712., 37123., 0., 25757.]
años = [2003, 1991, 1990, 2019, 2006]

In [None]:
edad = 2020 - años

In [None]:
km = np.array([44410., 5712., 37123., 0., 25757.])
años = np.array([2003, 1991, 1990, 2019, 2006])

In [None]:
edad = 2020 - años

In [None]:
edad

### Operaciones entre arrays

In [None]:
km_media = km / edad

In [None]:
km_media

In [None]:
44410. / 17

### Operaciones con arrays de dos dimensiones

In [None]:
datos = np.array([km, años])

In [None]:
datos

In [None]:
datos.shape

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

In [None]:
datos[0]

In [None]:
datos[1]

In [None]:
km_media = datos[0] / (2020 - datos[1])
km_media

# 5.3 Selecciones con arrays Numpy

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

In [None]:
datos

![1410-img02.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img02.png)

### Indexación 

<font color=red>**Observación:**</font> La indexación tiene inicio en cero.

In [None]:
contador = np.arange(10)
contador

In [None]:
contador[0]

In [None]:
contador[9]

In [None]:
contador[-1]

In [None]:
datos[0]

In [None]:
datos[1]

## <font color=green>**Consejo:**</font>
### *ndarray[ linea ][ columna ]* o *ndarray[ linea, columna ]*

In [None]:
datos[1][2]

In [None]:
datos[1, 2]

 ### Particiones
 
La sintaxis para realizar particiones en un array Numpy es $i : j : k$ donde $i$ es el índice inicial, $j$ es el índice final, y $k$ es el indicador de intervalo ($k\neq0$)
 
<font color=red>**Observación:**</font> En las particiones (*slices*) el objeto con índice i es **incluído** y el objeto con índice j **no es incluído** en el resultado.

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

In [None]:
contador = np.arange(10)
contador

In [None]:
contador[1:4:]

In [None]:
contador[1:8:2]

In [None]:
contador[::2]

In [None]:
contador[1::2]

In [None]:
datos

In [None]:
datos[::, 1:3:]

In [None]:
datos[::, 1:3:][0] / (2020 - datos[::, 1:3:][1])

In [None]:
datos[0] / (2020 - datos[1])

### Indexación con array booleano

<font color=red>**Observación:**</font> Selecciona un grupo de líneas y columnas siguiendo las etiquetas o un array booleano.

In [None]:
contador = np.arange(10)
contador

In [None]:
contador > 5

In [None]:
contador[contador > 5]

In [None]:
datos

In [None]:
datos[1]>2000

In [None]:
datos[::, datos[1]>2000]

# 5.4 Atributos y métodos de arrays Numpy

### Atributos

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#array-attributes

In [None]:
datos

## *ndarray.shape*

Devuelve una tupla con las dimensiones del array.

In [None]:
datos.shape

## *ndarray.ndim*

Devuelve el número de dimensiones del array.

In [None]:
datos.ndim

## *ndarray.size*

Devuelve el número de elementos del array.

In [None]:
datos.size

## *ndarray.dtype*

Devuelve el tipo de datos de los elementos del array.

In [None]:
datos.dtype

## *ndarray.T*

Devuelve el array transpuesto, es decir, convierte líneas en columnas y viceversa.

In [None]:
datos.T

In [None]:
datos.transpose()

### Métodos

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#array-methods

## *ndarray.tolist()*

Devuelve el array como una lista Python.

In [None]:
datos.tolist()

## *ndarray.reshape(shape[, order])*

Devuelve un array que contiene los mismos datos con una nueva forma.

In [None]:
contador=np.arange(10)
contador

In [None]:
contador.reshape((5, 2))

In [None]:
contador.reshape((5, 2), order = 'C')

In [None]:
contador.reshape((5, 2), order = 'F')

In [None]:
km = [44410, 5712, 37123, 0, 25757]
años = [2003, 1991, 1990, 2019, 2006]

In [None]:
info_carros = km + años
info_carros

In [None]:
np.array(info_carros).reshape((2, 5))

In [None]:
np.array(info_carros).reshape((5, 2),order ='F')

## *ndarray.resize(new_shape[, refcheck])*

Cambia la forma y el tamaño del array.

In [None]:
datos_new = datos.copy()
datos_new

In [None]:
datos_new.resize((3, 5), refcheck=False)

In [None]:
datos_new

In [None]:
datos_new[2] = datos_new[0] / (2020 - datos_new[1])

In [None]:
datos_new

# 5.5 Estadísticas con arrays Numpy

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#calculation

y

https://numpy.org/doc/1.16/reference/routines.statistics.html

y

https://numpy.org/doc/1.16/reference/routines.math.html

In [None]:
años = np.loadtxt(fname = "carros-años.txt", dtype = int)
km = np.loadtxt(fname = "carros-km.txt")
valor = np.loadtxt(fname = "carros-valor.txt")

In [None]:
años.shape

https://numpy.org/doc/1.16/reference/generated/numpy.column_stack.html

In [None]:
dataset = np.column_stack((años, km, valor))
dataset

In [None]:
dataset.shape

## *np.mean()*

Devuelve el promedio de los elementos del array a lo largo del eje especificado.

In [None]:
np.mean(dataset, axis = 0)

In [None]:
np.mean(dataset, axis = 1)

In [None]:
np.mean(dataset[::, 1])

In [None]:
np.mean(dataset[::, 2])

## *np.std()*

Devuelve la desviación estándar de los elementos del array a lo largo del eje especificado.

In [None]:
np.std(dataset[::, 2])

## *ndarray.sum()*

Devuelve la suma de los elementos del array a lo largo del eje especificado.

In [None]:
dataset.sum(axis = 0)

In [None]:
dataset[::, 1].sum()

## *np.sum()*

Devuelve la suma de los elementos del array a lo largo del eje especificado.

In [None]:
np.sum(dataset, axis = 0)

In [None]:
np.sum(dataset[::, 2])

In [None]:
import pandas as pd

df = pd.DataFrame(data=dataset, columns=["años", "km", "valor"])
result = df.groupby('años').mean()
print(result)