# <font color=green> PYTHON PARA DATA SCIENCE - NUMPY
---

# <font color=green> 1. INTRODUCCIÓN A PYTHON
---

# 1.1 Introducción

> Python es un lenguaje de programación de alto nivel con soporte a múltiples paradigmas de programación. Es un proyecto *open source* y desde su surgimiento, en 1991, viene convirtiéndose en uno de los lenguajes de programación interpretados más populares. 
>
> En los últimos años Python desarrolló una comunidad activa de procesamiento científico y análisis de datos y viene destacándose como uno de los lenguajes más relevantes cuando el asunto es ciencia de datos y machine learning, tanto en el entorno acadêmico como también en el entorno laboral.

# 1.2 Instalación y entorno de trabajo

### Instalación Local

### https://www.python.org/downloads/
### o
### https://www.anaconda.com/distribution/

### Google Colaboratory

### https://colab.research.google.com

### Verificando versión

In [None]:
!python -V

Python 3.9.16


# 1.3 Trabajando con Numpy

In [None]:
import numpy as np


In [None]:
km = np.loadtxt('carros-km.txt', dtype = int)

In [None]:
km

In [None]:
years = np.loadtxt('carros-años.txt', dtype = int)

In [None]:
years

In [None]:
nombres = np.loadtxt('carros-nombres.txt')

ValueError: ignored

In [None]:
nombres

In [None]:
valor = np.loadtxt('carros-valor.txt', dtype=float)

In [None]:
valor

In [None]:
zero_km = np.loadtxt('carros-zero-km.txt', dtype=int)

In [None]:
zero_km

### Obtener el promedio de kilometros recorridos por año

In [None]:
km_promedio = km/(2020-years)

  km_promedio = km/(2020-years)


In [None]:
km_promedio

In [None]:
type(km_promedio)

numpy.ndarray

# <font color=green> 2. CARACTERÍSTICAS BÁSICAS DEL LENGUAJE
---

# 2.1 Operaciones matemáticas

### Operadores aritméticos: $+$, $-$, $*$, $/$, $**$, $\%$, $//$

### Suma ($+$)

In [None]:
2+2

4

### Resta ($-$)

In [None]:
2-2

0

### Multiplicación ($*$)

In [None]:
2*3

6

### División ($/$) y ($//$)
La operación división siempre devuelve un número con punto decimal

In [None]:
10/3

3.3333333333333335

In [None]:
10//3

3

### Exponenciación ($**$)

In [None]:
2**3

8

### Resto de la división ($\%$)

In [None]:
10%3

1

In [None]:
10%2

0

### Expresiones matemáticas

In [None]:
5*2+3*2

16

In [None]:
(5*2)+(3*2)

16

In [None]:
5*(2+3)*2

50

### La variable _

En el modo interactivo, el último resultado impreso en pantalla es atribuído a la variable _

In [None]:
5*2

10

In [None]:
_+3*2

16

In [None]:
_/2

8.0

##Resolviendo expresiones_reto_operaciones_matematicas

In [None]:
10 % 2 + 3 // 10

0

In [None]:
5 * (2 + 3) / 2

12.5

In [None]:
2 ** 3 * 4

32

# 2.2 Variables

### Nombres de variables

- Nombres de variables pueden comenzar con letras (a - z, A - Z) o con el símbolo *underscore* (_):

    > Altura
    >
    > _peso
    
- El resto del nombre puede contener letras, números o el símbolo "_":

    > nombre_de_variable
    >
    > _valor
    >
    > dia_28_11_
    

- Los nombres son *case sensitive*:

    > Nombre_De_Variable $\ne$ nombre_de_variable $\ne$ NOMBRE_DE_VARIABLE
    
### <font color=red>Observaciones:
- Existen algumas palabras reservadas del lenguaje que no pueden ser utilizadas como nombres de variables:

| |Lista de palabras <br>reservadas en Python| |
|:-------------:|:------------:|:-------------:|
| and           | as           | not           | 
| assert        | finally      | or            | 
| break         | for          | pass          | 
| class         | from         | nonlocal      | 
| continue      | global       | raise         | 
| def           | if           | return        | 
| del           | import       | try           | 
| elif          | in           | while         | 
| else          | is           | with          | 
| except        | lambda       | yield         | 
| False         | True         | None          | 

### Declaración de variables

### Operadores de asignación: $=$, $+=$, $-=$, $*=$, $/=$, $**=$, $\%=$, $//=$

In [None]:
year_actual = 2020
year_fabricacion = 2003
km_total = 44410.0

In [None]:
year_actual

2020

In [None]:
year_fabricacion

2003

In [None]:
km_total

44410.0

# $$km_{promedio} = \frac {km_{total}}{(Año_{actual} - Año_{fabricación})}$$

### Operaciones con variables

In [None]:
km_promedio_dos = km_total / (year_actual-year_fabricacion)
km_promedio_dos

2612.3529411764707

In [None]:
year_actual = 2020
year_fabricacion = 2003
km_total = 44410.0
km_promedio_dos = km_total / (year_actual-year_fabricacion)
km_promedio_dos

2612.3529411764707

In [None]:
year_actual = 2020
year_fabricacion = 2003
km_total = 44410.0
km_promedio_dos = km_total / (year_actual-year_fabricacion)
km_promedio_dos

km_total = km_total + km_promedio_dos
km_total

47022.35294117647

In [None]:
year_actual = 2020
year_fabricacion = 2003
km_total = 44410.0
km_promedio_dos = km_total / (year_actual-year_fabricacion)
km_promedio_dos

km_total += km_promedio_dos
km_total

47022.35294117647

### Conclusión:
```
"valor = valor + 1" es equivalente a "valor += 1"
```

### Declaración múltiple

In [None]:
year_actual,year_fabricacion,km_total = 2020,2003,44410.0

In [None]:
year_actual

2020

In [None]:
year_fabricacion

2003

In [None]:
km_total

47022.35294117647

# 2.3 Tipos de datos

Los tipos de datos especifican como números y caracteres estarán guardados y manipulados dentro de un programa. Los tipos de datos básicos en Python son:

1. **Números**
    1. ***int*** - Enteros
    - ***float*** - Decimales
- **Booleanos** - Contiene valores True o False. Esencial cuando comenzamos a trabajar con declaraciones condicionales
- ***Strings*** - Secuencia de uno o más caracteres que puede incluir letras, números y otros tipos de caracteres. Representa un texto.
- **None** - Representa la ausencia de valor

### Números

In [None]:
year_actual_one = 2023

In [None]:
type(year_actual_one)

int

In [None]:
km_total = 44410.0

In [None]:
type(km_total)

float

### Booleanos

In [None]:
zero_km = True

In [None]:
type(zero_km)

bool

In [None]:
zero_km = False

In [None]:
type(zero_km)

bool

### Strings

In [None]:
nombre = 'Jetta'
nombre

'Jetta'

In [None]:
nombre = "Jetta"
nombre

'Jetta'

In [None]:
nombre = 'Jetta "variant"'
nombre

'Jetta "variant"'

In [None]:
nombre = "Jetta 'variant'"
nombre

"Jetta 'variant'"

In [None]:
carro ='''
  Nombre
  Edad
  Nota
'''

In [None]:
type(carro)

str

### None

In [None]:
kilometraje = None

In [None]:
type(kilometraje)

NoneType

# 2.4 Conversión de tipos

In [None]:
a = 10
b = 20
c = 'Python es'
d = 'genial'

In [None]:
type(a)

int

In [None]:
type(b)

int

In [None]:
type(c)

str

In [None]:
type(d)

str

In [None]:
a + b

30

In [None]:
c + d

'Python esgenial'

In [None]:
c + a

TypeError: ignored

### Conversiones de tipo

Funciones int(), float(), str()

In [None]:
str(a)

'10'

In [None]:
type(str(a))

str

In [None]:
c + str(a)

'Python es10'

In [None]:
float(a)

10.0

In [None]:
var = 3.1415

In [None]:
int(var)

3

In [None]:
var = 3.99

In [None]:
int(var)

3

# 2.5 Indentación, comentarios y formatación de *strings*

### Indentación

En el lenguaje Python los programas son estructurados por medio de indentación. En cualquier lenguaje de programación la práctica de colocar indentación es bastante útil, facilitando la lectura y también el mantenimiento del código. En Python la indentación no es solamente una cuestión de organización y estilo, sino que es un requisito del lenguaje.

In [None]:
año_actual = 2020
año_fabricacion = 2020

if (año_actual == año_fabricacion):
    print('Verdadero')
else:
    print('Falso')

Verdadero


### Comentarios

Comentarios son extremamente importantes en un programa. Consiste en un texto que describe lo que el programa o una parte específica del programa está haciendo. Los comentarios son ignorados por el interpretador Python. 

Podemos tener comentarios de una única linea o de múltiples líneas.

In [None]:
# Esto es un comentario
año_actual = 2020
año_actual

2020

In [None]:
# Esto
# es un 
# comentario
año_actual = 2020
año_actual

In [None]:
'''Esto es un
comentario'''
año_actual = 2020
año_actual

2020

In [None]:
# Definiendo variables
año_actual = 2020
año_fabricacion = 2020

'''
Estructura condicional que vamos 
a aprender la próxima clase
'''
if (año_actual == año_fabricacion):   # Probando si la condición es verdadera
    print('Verdadero')
else:                               # Probando si la condición es falsa
    print('Falso')

### Formatación de *strings*

## *str.format()*

https://docs.python.org/3.6/library/stdtypes.html#str.format

In [None]:
print('Hola,{}'.format('Alejandro'))

Hola,Alejandro


In [None]:
print('Hola,{}! Esta es su visita numero{}'.format('Alejandro', 32))

Hola,Alejandro! Esta es su visita numero32


In [None]:
print('Hola,{nombre}! Esta es su visita numero{visita}'.format(visita=32, nombre='Alejandro'))

Hola,Alejandro! Esta es su visita numero32


## *f-Strings*

https://docs.python.org/3.6/reference/lexical_analysis.html#f-strings

In [None]:
nombre = 'Alejandro'
visita = 32

In [None]:
print(f'Hola, {nombre}! Esta es su visita numero {visita}')

Hola, Alejandro! Esta es su visita numero 32


En esta aula, aprendimos:

A realizar operaciones matemáticas con Python.

Cómo crear y asignar valores a variables en Python.

Los tipos de datos básicos en Python.

A realizar transformaciones de tipos de datos.

Las reglas y características básicas del lenguaje Python (indentación, comentarios y manipulación de strings).

# <font color=green> 3. TRABAJANDO CON LISTAS
---

# 3.1 Creando listas

Listas son secuencias **mutables** que son utilizadas para guardar colecciones de objetos, generalmente homogéneos. Pueden ser construídas de varias formas:
```
- Utilizando un par de corchetes: [ ], [ 1 ]
- Utilizando un par de corchetes con objetos separados por comas: [ 1, 2, 3 ]
```

In [None]:
Accesorios = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

### Lista con tipos de datos variados

In [None]:
Carro_1 = ['Jetta Variant', 'Motor 4.0 Turbo', 2003, 44410.0, False, ['Cerraduras eléctricas', 'Piloto automático'], 88078.64]
Carro_2 = ['Passat', 'Motor Diesel', 1991, 5712.0, False, ['Central multimedia', 'Frenos ABS'], 106161.94]

In [None]:
Carro_1

['Jetta Variant',
 'Motor 4.0 Turbo',
 2003,
 44410.0,
 False,
 ['Cerraduras eléctricas', 'Piloto automático'],
 88078.64]

In [None]:
Carro_2

['Passat',
 'Motor Diesel',
 1991,
 5712.0,
 False,
 ['Central multimedia', 'Frenos ABS'],
 106161.94]

In [None]:
Carros = [Carro_1,Carro_2]
Carros

[['Jetta Variant',
  'Motor 4.0 Turbo',
  2003,
  44410.0,
  False,
  ['Cerraduras eléctricas', 'Piloto automático'],
  88078.64],
 ['Passat',
  'Motor Diesel',
  1991,
  5712.0,
  False,
  ['Central multimedia', 'Frenos ABS'],
  106161.94]]

# 3.2 Operaciones con listas

https://docs.python.org/3.6/library/stdtypes.html#common-sequence-operations

## *x in A*

Devuelve **True** si un elemento de la lista *A es igual a x*.

In [None]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
'Cerraduras eléctricas' in Accesorios

True

In [None]:
'4x4' in Accesorios

False

In [None]:
'Cerraduras eléctricas' not in Accesorios

False

In [None]:
'4x4' not in Accesorios

True

## *A + B*

Concatena las listas *A y B*.

In [None]:
A = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero']
B = ['Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']

In [None]:
A+B

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

## *len(A)*

Tamaño de la lista A.

In [None]:
len(Accesorios)

6

# 3.3 Selecciones en listas

## *A[ n ]*

Devuelve el n-ésimo objeto de la lista *A*.

<font color=red>**Observación:**</font> Listas tienen indexación con inicio en cero.

In [None]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios[0]

'Cerraduras eléctricas'

In [None]:
Accesorios[1]

'Piloto automático'

In [None]:
Accesorios[-1]

'Sensor de lluvia'

In [None]:
Accesorios[5]

'Sensor de lluvia'

In [None]:
Carros

[['Jetta Variant',
  'Motor 4.0 Turbo',
  2003,
  44410.0,
  False,
  ['Cerraduras eléctricas', 'Piloto automático'],
  88078.64],
 ['Passat',
  'Motor Diesel',
  1991,
  5712.0,
  False,
  ['Central multimedia', 'Frenos ABS'],
  106161.94]]

In [None]:
Carros[0]

['Jetta Variant',
 'Motor 4.0 Turbo',
 2003,
 44410.0,
 False,
 ['Cerraduras eléctricas', 'Piloto automático'],
 88078.64]

In [None]:
Carros[0][0]

'Jetta Variant'

In [None]:
Carros[0][-2]

['Cerraduras eléctricas', 'Piloto automático']

In [None]:
Carros[0][-2][1]

'Piloto automático'

## *A[ i : j ]*

Recorta la lista A desde el índice i hasta j. En este recorte el elemento con índice i **es incluído** y el elemento con índice j **no es incluído** en el resultado.

In [None]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios[2:5]

['Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento']

In [None]:
Accesorios[2:6]

['Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios[2:]

['Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios[:5]

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento']

# 3.4 Métodos en listas

https://docs.python.org/3.6/library/stdtypes.html#mutable-sequence-types

## *A.sort()*

Ordena la lista *A*.

In [None]:
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios.sort()
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

## *A.append(x)*

Añade el elemento *x al final de la lista A*

In [None]:
Accesorios.append('4x4')
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4x4']

## *A.pop(i)*

Elimina y devuelve el elemento de índice i de la lista *A*.

<font color=red>**Observación:**</font> Por *defecto* el método *pop()* elimina y devuelve el último elemento de una lista.

In [None]:
Accesorios.pop()

'4x4'

In [None]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios.pop(3)

'Piloto automático'

In [None]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

## *A.copy()*

Crea una copia de la lista *A*.

<font color=red>**Observación:**</font> El mismo resultado puede ser obtenido con el seguinte código: 
```
A[:]
```

In [None]:
Accesorios_2 = Accesorios
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios_2.append('4x4')
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4x4']

In [None]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4x4']

In [None]:
Accesorios.pop()

'4x4'

In [None]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios_2 = Accesorios.copy()
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios_2.append('4x4')
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 '4x4',
 '4x4']

In [None]:
Accesorios

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
Accesorios_2 = Accesorios[:]
Accesorios_2

['Aire acondicionado',
 'Asientos de cuero',
 'Cerraduras eléctricas',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

###RETO ALURA

Considera la siguiente lista de Python y el resultado obtenido después de un conjunto de manipulaciones:

In [None]:
Accesorios = [
    'Llantas de aleación', 
    'Cerraduras eléctricas', 
    'Piloto automático',
    'Bancos de cuero',
    'Aire acondicionado'
]

In [None]:
Accesorios.append('Airbag')
Accesorios.sort()
Accesorios.pop()
Accesorios.append('Ventanas eléctricas')
Accesorios

['Airbag',
 'Aire acondicionado',
 'Bancos de cuero',
 'Cerraduras eléctricas',
 'Llantas de aleación',
 'Ventanas eléctricas']

# <font color=green> 4. ESTRUCTURAS DE REPETICIÓN Y CONDICIONALES
---

# 4.1 Instrucción *for*

#### Formato estándar

```
for <variable> in <coleccion>:
    <instrucciones>
```

### Loops con listas

In [None]:
Accesorios = ['Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de lluvia']
Accesorios

['Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de lluvia']

In [None]:
for item in Accesorios:
  print(item)

Cerraduras eléctricas
Piloto automático
Asientos de cuero
Aire acondicionado
Sensor de estacionamiento
Sensor de lluvia


###  List comprehensions

https://docs.python.org/3.6/tutorial/datastructures.html#list-comprehensions

*range()* -> https://docs.python.org/3.6/library/functions.html#func-range

In [None]:
range(10)

range(0, 10)

In [None]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
for i in range(10):
  print(i**2)

0
1
4
9
16
25
36
49
64
81


In [None]:
cuadrado=[]
for i in range(10):
  cuadrado.append(i**2)

cuadrado


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [None]:
cuadrado=[i**2 for i in range(10)]

In [None]:
cuadrado

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

# 4.2 Loops anidados

In [1]:
datos = [ 
    ['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia'],
    ['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento'],
    ['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']
]
datos

[['Llantas de aleación',
  'Cerraduras eléctricas',
  'Piloto automático',
  'Asientos de cuero',
  'Aire acondicionado',
  'Sensor de estacionamiento',
  'Sensor de crepúsculo',
  'Sensor de lluvia'],
 ['Central multimedia',
  'Techo panorámico',
  'Frenos ABS',
  '4 X 4',
  'Panel digital',
  'Piloto automático',
  'Asientos de cuero',
  'Cámara de estacionamiento'],
 ['Piloto automático',
  'Control de estabilidad',
  'Sensor crepuscular',
  'Frenos ABS',
  'Transmisión automática',
  'Asientos de cuero',
  'Central multimedia',
  'Ventanas eléctricas']]

In [2]:
for lista in datos:
  print(lista)

['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia']
['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento']
['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']


In [None]:
for lista in datos:
  for item in lista:
    print(item)

In [4]:
Accesorios=[]

for lista in datos:
  for item in lista:
    Accesorios.append(item)

Accesorios

['Llantas de aleación',
 'Cerraduras eléctricas',
 'Piloto automático',
 'Asientos de cuero',
 'Aire acondicionado',
 'Sensor de estacionamiento',
 'Sensor de crepúsculo',
 'Sensor de lluvia',
 'Central multimedia',
 'Techo panorámico',
 'Frenos ABS',
 '4 X 4',
 'Panel digital',
 'Piloto automático',
 'Asientos de cuero',
 'Cámara de estacionamiento',
 'Piloto automático',
 'Control de estabilidad',
 'Sensor crepuscular',
 'Frenos ABS',
 'Transmisión automática',
 'Asientos de cuero',
 'Central multimedia',
 'Ventanas eléctricas']

## *set()*

https://docs.python.org/3.6/library/stdtypes.html#types-set

https://docs.python.org/3.6/library/functions.html#func-set

In [5]:
set(Accesorios)

{'4 X 4',
 'Aire acondicionado',
 'Asientos de cuero',
 'Central multimedia',
 'Cerraduras eléctricas',
 'Control de estabilidad',
 'Cámara de estacionamiento',
 'Frenos ABS',
 'Llantas de aleación',
 'Panel digital',
 'Piloto automático',
 'Sensor crepuscular',
 'Sensor de crepúsculo',
 'Sensor de estacionamiento',
 'Sensor de lluvia',
 'Techo panorámico',
 'Transmisión automática',
 'Ventanas eléctricas'}

In [6]:
list(set(Accesorios))

['Cerraduras eléctricas',
 'Asientos de cuero',
 'Aire acondicionado',
 'Llantas de aleación',
 'Panel digital',
 'Transmisión automática',
 'Ventanas eléctricas',
 'Sensor de crepúsculo',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor crepuscular',
 'Frenos ABS',
 'Cámara de estacionamiento',
 'Techo panorámico',
 '4 X 4',
 'Control de estabilidad',
 'Central multimedia',
 'Sensor de lluvia']

### List comprehensions

In [9]:
Accesorios=list(set([item for lista in datos for item in lista]))
Accesorios

['Cerraduras eléctricas',
 'Asientos de cuero',
 'Aire acondicionado',
 'Llantas de aleación',
 'Panel digital',
 'Transmisión automática',
 'Ventanas eléctricas',
 'Sensor de crepúsculo',
 'Piloto automático',
 'Sensor de estacionamiento',
 'Sensor crepuscular',
 'Frenos ABS',
 'Cámara de estacionamiento',
 'Techo panorámico',
 '4 X 4',
 'Control de estabilidad',
 'Central multimedia',
 'Sensor de lluvia']

# 4.3 Instrucción *if*

#### Formato estándar

```
if <condicion>:
     <instrucciones en caso la condición sea verdadera>
```

### Operadores de comparación: $==$, $!=$, $>$, $<$, $>=$, $<=$
### y
### Operadores lógicos: $and$, $or$, $not$

In [None]:
# 1º objeto de la lista - Nombre del vehículo
# 2º objeto de la lista - Año de fabricación
# 3º objeto de la lista - Vehículo es cero km?

datos = [
    ['Jetta Variant', 2003, False],
    ['Passat', 1991, False],
    ['Crossfox', 1990, False],
    ['DS5', 2019, True],
    ['Aston Martin DB4', 2006, False],
    ['Palio Weekend', 2012, False],
    ['A5', 2019, True],
    ['Série 3 Cabrio', 2009, False],
    ['Dodge Jorney', 2019, False],
    ['Carens', 2011, False]
]
datos

### List comprehensions

# 4.4 Instrucciones *if-else* y *if-elif-else*

#### Formato estándar

```
if <condicion>:
    <instrucciones en caso la condición sea verdadera>
else:
    <instrucciones en caso la condición no sea verdadera>
```

#### Formato estándar

```
if <condicion 1>:
    <instrucciones en caso la condición 1 sea verdadera>
elif <condicion 2>:
    <instrucciones en caso la condición 2 sea verdadera>
elif <condicion 3>:
    <instrucciones en caso la condición 3 sea verdadera>
                        .
                        .
                        .
else:
    <instrucciones en caso las condiciones anteriores no sean verdaderas>
```

In [None]:
print('AND')
print(f'(True and True) el resultado es: {True and True}')
print(f'(True and False) el resultado es: {True and False}')
print(f'(False and True) el resultado es: {False and True}')
print(f'(False and False) el resultado es: {False and False}')

In [None]:
print('OR')
print(f'(True or True) el resultado es: {True or True}')
print(f'(True or False) el resultado es: {True or False}')
print(f'(False or True) el resultado es: {False or True}')
print(f'(False or False) el resultado es: {False or False}')

# <font color=green> 5. NUMPY BÁSICO
---

Numpy es la abreviación de Numerical Python y es uno de los paquetes más importantes para procesamiento numérico en Python. Numpy ofrece la base para la mayoría de los paquetes de aplicaciones científicas que usen datos numéricos en Python (estructuras de datos y algoritmos). Pueden destacarse los siguientes recursos que el paquete Numpy contiene:

- Un poderoso objeto array multidimensional;
- Funciones matemáticas sofisticadas para operaciones con arrays sin la necesidad de utilización de bucles *for*;
- Recursos de algebra linear y generación de números aleatórios

Además de sus obvios usos científicos, el paquete NumPy también es muy utilizado en análisis de datos como un eficiente contenedor multidimensional de datos genéricos para transporte entre diversos algoritmos y bibliotecas en Python.

**Versión:** 1.18.4

**Instalación:** https://scipy.org/install.html

**Documentación:** https://numpy.org/doc/1.18/

### Paquetes

Existen diversos paquetes Python disponibles para download en internet. Cada paquete tiene como objetivo la solución de determinado tipo de problema y para esto son desarrollados nuevos tipos, funciones y métodos.

Algunos paquetes son bastante utilizados en un contexto de ciencia de datos, como por ejemplo:

- Numpy
- Pandas
- Scikit-learn
- Matplotlib

Algunos paquetes no son distribuidos en la instalación estándar de Python. En este caso debemos instalar los paquetes que necesitamos en nuestro sistema para poder utilizar sus funcionalidades.

### Importando todo el paquete

https://numpy.org/doc/1.16/reference/generated/numpy.arange.html

### Importando todo el paquete y asignándole un nuevo nombre 

### Importando parte del paquete

# 5.1 Creando arrays Numpy

### A partir de listas

https://numpy.org/doc/1.16/user/basics.creation.html

https://numpy.org/doc/1.16/user/basics.types.html

### A partir de datos externos

https://numpy.org/doc/1.16/reference/generated/numpy.loadtxt.html

### Arrays con dos dimensiones

In [None]:
datos = [ 
    ['Llantas de aleación', 'Cerraduras eléctricas', 'Piloto automático', 'Asientos de cuero', 'Aire acondicionado', 'Sensor de estacionamiento', 'Sensor de crepúsculo', 'Sensor de lluvia'],
    ['Central multimedia', 'Techo panorámico', 'Frenos ABS', '4 X 4', 'Panel digital', 'Piloto automático', 'Asientos de cuero', 'Cámara de estacionamiento'],
    ['Piloto automático', 'Control de estabilidad', 'Sensor crepuscular', 'Frenos ABS', 'Transmisión automática', 'Asientos de cuero', 'Central multimedia', 'Ventanas eléctricas']
]
datos

### Comparando desempeño con listas

# 5.2 Operaciones aritméticas con arrays Numpy

### Operaciones entre arrays y constantes

In [None]:
km = [44410., 5712., 37123., 0., 25757.]
años = [2003, 1991, 1990, 2019, 2006]

In [None]:
km = np.array([44410., 5712., 37123., 0., 25757.])
años = np.array([2003, 1991, 1990, 2019, 2006])

### Operaciones entre arrays

### Operaciones con arrays de dos dimensiones

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

# 5.3 Selecciones con arrays Numpy

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

![1410-img02.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img02.png)

### Indexación 

<font color=red>**Observación:**</font> La indexación tiene inicio en cero.

## <font color=green>**Consejo:**</font>
### *ndarray[ linea ][ columna ]* o *ndarray[ linea, columna ]*

 ### Particiones
 
La sintaxis para realizar particiones en un array Numpy es $i : j : k$ donde $i$ es el índice inicial, $j$ es el índice final, y $k$ es el indicador de intervalo ($k\neq0$)
 
<font color=red>**Observación:**</font> En las particiones (*slices*) el objeto con índice i es **incluído** y el objeto con índice j **no es incluído** en el resultado.

![1410-img01.png](https://caelum-online-public.s3.amazonaws.com/1410-pythondatascience/01/1410-img01.png)

### Indexación con array booleano

<font color=red>**Observación:**</font> Selecciona un grupo de líneas y columnas siguiendo las etiquetas o un array booleano.

# 5.4 Atributos y métodos de arrays Numpy

### Atributos

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#array-attributes

## *ndarray.shape*

Devuelve una tupla con las dimensiones del array.

## *ndarray.ndim*

Devuelve el número de dimensiones del array.

## *ndarray.size*

Devuelve el número de elementos del array.

## *ndarray.dtype*

Devuelve el tipo de datos de los elementos del array.

## *ndarray.T*

Devuelve el array transpuesto, es decir, convierte líneas en columnas y viceversa.

### Métodos

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#array-methods

## *ndarray.tolist()*

Devuelve el array como una lista Python.

## *ndarray.reshape(shape[, order])*

Devuelve un array que contiene los mismos datos con una nueva forma.

In [None]:
km = [44410, 5712, 37123, 0, 25757]
años = [2003, 1991, 1990, 2019, 2006]

## *ndarray.resize(new_shape[, refcheck])*

Cambia la forma y el tamaño del array.

# 5.5 Estadísticas con arrays Numpy

https://numpy.org/doc/1.16/reference/arrays.ndarray.html#calculation

y

https://numpy.org/doc/1.16/reference/routines.statistics.html

y

https://numpy.org/doc/1.16/reference/routines.math.html

In [None]:
años = np.loadtxt(fname = "carros-años.txt", dtype = int)
km = np.loadtxt(fname = "carros-km.txt")
valor = np.loadtxt(fname = "carros-valor.txt")

https://numpy.org/doc/1.16/reference/generated/numpy.column_stack.html

## *np.mean()*

Devuelve el promedio de los elementos del array a lo largo del eje especificado.

## *np.std()*

Devuelve la desviación estándar de los elementos del array a lo largo del eje especificado.

## *ndarray.sum()*

Devuelve la suma de los elementos del array a lo largo del eje especificado.

## *np.sum()*

Devuelve la suma de los elementos del array a lo largo del eje especificado.