# Tabla de Contenidos

* [Contenidos](#Tabla-de-Contenidos)
    * [Arreglos](#Arreglos)
        * [Importar librerías externas](#Importar-librerías-externas)
        * [De lista a arreglos](#De-lista-a-arreglos)
        * [Operaciones con arreglos](#Operaciones-con-arreglos)
        * [Indexación y Rebanadas](#Indexación-y-Rebanadas)
        * [Búsqueda (filtrado) de valores](#Búsqueda-(filtrado)-de-valores)
    * [Archivos](#Archivos)
        * [Carga de datos](#Carga-de-datos)
* [Ejercicios](#Ejercicios)

## Arreglos

Los arreglos, y matrices, son tipos de datos estructurados homogéneos (un solo tipo de dato), optimizados para el cálculo usando vectores y matrices. Los arrays suelen contener números enteros, reales y complejos. 

Python no tiene soporte integrado para arreglos. Para esto, utilizamos el librería [NumPy](https://numpy.org/), cuya documentación se encuentra en [NumPy documentation](https://numpy.org/doc/stable/).

<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/logo.svg?raw=true" width="15%">
</div>

## Importar librerías externas

In [1]:
# Importe la librería numpy con el alias np
# Importe la libreria matplotlib con el alias plt

import numpy as np
import matplotlib.pyplot as plt

[Regresar a la TC](#Tabla-de-Contenidos)

<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
import numpy as np
import matplotlib.pyplot as plt
  </code></pre>
</details> 

## De lista a arreglos

Para crear [un arreglo a partir de una lista](https://numpy.org/doc/stable/user/basics.creation.html#converting-python-sequences-to-numpy-arrays), utilizaremos la función **array**.



<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/arr_ini.png?raw=true" width="40%">
</div>

In [2]:
# Cargue las listas nombres_libros, genero_literario y ventas

nombres_libros = ['El señor de los anillos', 'Cien años de soledad', 'Harry Potter', '1984', 'Orgullo y prejuicio', 'Crimen y castigo', 'El gran Gatsby', 'Matar un ruiseñor', 'La Odisea', 'Don Quijote de la Mancha']
genero_literario = ['Fantasía', 'Realismo mágico', 'Fantasía', 'Distopía', 'Novela romántica', 'Novela psicológica', 'Ficción moderna', 'Novela clásica', 'Epopeya', 'Novela clásica']
ventas = [150, 120, 200, 90, 80, 110, 95, 130, 75, 160]

In [3]:
# Convierta las listas en los arreglos nombres_librosArr, genero_literarioArr y ventasArr correspondientes


nombres_librosArr = np.array(nombres_libros)
genero_literarioArr = np.array(genero_literario)
ventasArr = np.array(ventas)

<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
nombres_librosArr = np.array(nombres_libros)
genero_literarioArr = np.array(genero_literario)
ventasArr = np.array(ventas)
  </code></pre>
</details> 

In [4]:
# Muestre por pantalla la lista nombres_libros y el arreglo nombres_librosArr.

print(f"Lista: {nombres_libros}",)
print(f"Arreglo: {nombres_librosArr}")

Lista: ['El señor de los anillos', 'Cien años de soledad', 'Harry Potter', '1984', 'Orgullo y prejuicio', 'Crimen y castigo', 'El gran Gatsby', 'Matar un ruiseñor', 'La Odisea', 'Don Quijote de la Mancha']
Arreglo: ['El señor de los anillos' 'Cien años de soledad' 'Harry Potter' '1984'
 'Orgullo y prejuicio' 'Crimen y castigo' 'El gran Gatsby'
 'Matar un ruiseñor' 'La Odisea' 'Don Quijote de la Mancha']


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
print(f"Lista: {nombres_libros}",)
print(f"Arreglo: {nombres_librosArr}")
  </code></pre>
</details> 

[Regresar a la TC](#Tabla-de-Contenidos)

## Operaciones con arreglos

Numpy ofrece un grupo de [funciones agregadas](https://www.tutorialgateway.org/python-numpy-aggregate-functions/), como: **sum**, **mean**, **std**,  **max**, **min**, **argmin**, **argmax** y muchas más.

La lista completa de [funciones matemáticas](https://numpy.org/doc/stable/reference/routines.math.html) puede encontrarla en la documentación de Numpy.




<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/arr_aggr.png?raw=true" width="60%">
</div>



In [5]:
# Utilice el alias np con la función max, para obtener el valor máximo del arreglo ventasArr. 
# Muestre el valor máximo

maximo = np.max(ventasArr)
print(f"El valor máximo: {maximo}")

El valor máximo: 200


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
maximo = np.max(ventasArr)
print(f"El valor máximo: {maximo}")
  </code></pre>
</details> 

In [6]:
# Utilice el alias np con la función argmax, para obtener el INDICE del valor máximo del arreglo ventasArr. 
# Muestre el índice del valor máximo

indice = np.argmax(ventasArr)
print(f"El índice del máximo es: {indice}")

El índice del máximo es: 2


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
indice = np.argmax(ventasArr)
print(f"El índice del máximo es: {indice}")
  </code></pre>
</details> 

In [7]:
# Utilice el indice para obtener los elementos en los arreglos nombres_librosArr y genero_literarioArr
# Muestre el nombre y el género del libro obtenidos

nombre = nombres_librosArr[indice]
genero = genero_literarioArr[indice]

print(f"El libro {nombre} tiene el valor máximo ${maximo}, cuyo género es {genero}")

El libro Harry Potter tiene el valor máximo $200, cuyo género es Fantasía


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
nombre = nombres_librosArr[indice]
genero = genero_literarioArr[indice]

print(f"El libro {nombre} tiene el valor máximo ${maximo}, cuyo género es {genero}")
  </code></pre>
</details> 

In [8]:
# Utilice el alias np con la función sum para obtener el total del arreglo ventasArr. 
# Muestre el total

total = np.sum(ventasArr)
print(f"El total es ${total}")

El total es $1210


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
total = np.sum(ventasArr)
print(f"El total es ${total}")
  </code></pre>
</details> 

[Regresar a la TC](#Tabla-de-Contenidos)

## Indexación y Rebanadas

Al igual que las listas, es posible acceder a un elemento (indexación) o a un grupo de elementos (rebanadas) de en un arreglo.

<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/arr_index_slicing.png?raw=true" width="50%">
</div>

In [9]:
# Muestre los 3 primeros elementos de cada uno de los arreglos nombres_librosArr, genero_literarioArr y ventasArr

tresNombres = nombres_librosArr[0:3]
print("Tres primeros libros: ", tresNombres)

tresGeneros = genero_literarioArr[0:3]
print("Tres primeros libros: ", tresGeneros)

tresVenta = ventasArr[ :3]
print("Tres primeros libros: ", tresVenta)

Tres primeros libros:  ['El señor de los anillos' 'Cien años de soledad' 'Harry Potter']
Tres primeros libros:  ['Fantasía' 'Realismo mágico' 'Fantasía']
Tres primeros libros:  [150 120 200]


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
tresNombres = nombres_librosArr[0:3]
print("Tres primeros libros: ", tresNombres)

tresGeneros = genero_literarioArr[0:3]
print("Tres primeros libros: ", tresGeneros)

tresVenta = ventasArr[0:3]
print("Tres primeros libros: ", tresVenta)
  </code></pre>
</details> 

[Regresar a la TC](#Tabla-de-Contenidos)

## Búsqueda (filtrado) de valores

A diferencia de las listas, es posible crear un arreglo (mascaraArr) a partir de aplicar una **condición** a todos los elementos de un arreglo.



<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/arr_mask.png?raw=true" width="60%">
</div>

In [10]:
# Cree una máscara con el arreglo genero_literarioArr que sea igual a 'Fantasía'
# Muestre por pantalla la máscara

mascaraArr = genero_literarioArr == 'Fantasía'
print("Arreglo con el resultado de la comparción con el texto 'Fantasía'")
print(mascaraArr)

Arreglo con el resultado de la comparción con el texto 'Fantasía'
[ True False  True False False False False False False False]


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
mascaraArr = genero_literarioArr == 'Fantasía'

print(f"Máscara sobre el arreglo genero_literarioArr: {mascaraArr}")
  </code></pre>
</details> 

In [12]:
# Utilice la máscara como filtro del arreglo nombres_librosArr
# Muestre el arreglo resultante

librosFantasiaArr = nombres_librosArr[mascaraArr]
print("Nombres de libros del género 'Fantasía'")
print(librosFantasiaArr)

Nombres de libros del género 'Fantasía'
['El señor de los anillos' 'Harry Potter']


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
librosFantasia = nombres_librosArr[mascaraArr]
print(f"Nombres de libros de fantasía: {librosFantasia}")
  </code></pre>
</details> 

In [15]:
# Utilice la máscara como filtro del arreglo ventasArr
# Muestre el arreglo resultante

ventasFantasiasArr = ventasArr[mascaraArr]
print('Ventas de libros de "Fantasía"')
print(ventasFantasiArr)

Ventas de libros de "Fantasía"
[150 200]


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
ventasFantasia = ventasArr[mascaraArr]
print(f"Ventas de libros de fantasía: {ventasFantasia}")
  </code></pre>
</details> 

In [17]:
# Obtenga y muestre el total de ventas en los libros de fantasía 

total = np.sum( ventasFantasiasArr )
print(f"Total de ventas de libros de fantasía ${total}")

Total de ventas de libros de fantasía $350


<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
total = np.sum( ventasFantasia )
print(f"El total por venta de libros de fantasía es: ${total}")
  </code></pre>
</details> 

[Regresar a la TC](#Tabla-de-Contenidos)

## Archivos

Descargue los archivos [titles.csv](https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/titles.csv) y [rating.csv](https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/rating.csv). Luego, coloque los archivos csv en el mismo directorio que este cuaderno.

### Carga de datos


Utilice la función [loadtxt](https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html) para cargar los datos de un archivo de texto.



<div align="center">
    <img src="https://github.com/MCD-ESPOL/PCD/blob/main/notebooks/images/arr_load1.png?raw=true" width="50%">
</div>




In [18]:
# En la variable titlesArr, asigne la carga los datos del archivo 'titles.csv', 
#                           cuyo delimitador es ';' y el tipo de dato (dtype) es str 

titlesArr = np.loadtxt( 'titles.csv'  , delimiter = ';', dtype= str)

<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
titlesArr = np.loadtxt('titles.csv', delimiter =";", dtype=str)
  </code></pre>
</details> 

In [19]:
# Muestre el arreglo titlesArr con todos los nombres de los títulos de películas

print(titlesArr)

['The Shawshank Redemption' 'The Godfather' 'The Godfather: Part II'
 'The Dark Knight' '12 Angry Men' "Schindler's List"
 'The Lord of the Rings: The Return of the King' 'Pulp Fiction'
 '"The Good, the Bad and the Ugly"'
 'The Lord of the Rings: The Fellowship of the Ring' 'Fight Club'
 'Forrest Gump' 'Inception' 'The Lord of the Rings: The Two Towers'
 'The Empire Strikes Back' 'The Matrix' 'GoodFellas'
 "One Flew Over the Cuckoo's Nest" 'Seven Samurai' 'Se7en'
 'Life Is Beautiful' 'City of God' 'The Silence of the Lambs'
 "It's a Wonderful Life" 'Star Wars' 'Saving Private Ryan'
 'The Green Mile' 'Spirited Away' 'Interstellar' 'Parasite'
 'LÃ©on: The Professional' 'Harakiri' 'The Usual Suspects' 'The Lion King'
 'The Pianist' 'Terminator 2: Judgment Day' 'Back to the Future'
 'American History X' 'Modern Times' 'Gladiator' 'Psycho' 'The Departed'
 'City Lights' 'The Intouchables' 'Whiplash' 'Grave of the Fireflies'
 'The Prestige' 'Once Upon a Time in the West' 'Casablanca'
 'Cinema

<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
print(f"Títulos de películas en el arreglo: {titlesArr}")
  </code></pre>
</details> 

In [22]:
# En la variable ratingArr, asigne la carga los datos del archivo 'rating.csv', 
#                           cuyo delimitador es ';' y el tipo de dato (dtype) es float 

ratingArr = np.loadtxt( 'rating.csv', delimiter = ';', dtype = float )
print("Arreglo con el rating")
print(ratingArr)

Arreglo con el rating
[9.3 9.2 9.  9.  8.9 8.9 8.9 8.9 8.9 8.8 8.8 8.8 8.8 8.7 8.8 8.7 8.7 8.7
 8.6 8.6 8.6 8.6 8.6 8.6 8.6 8.6 8.5 8.6 8.6 8.7 8.6 8.7 8.6 8.5 8.5 8.5
 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5 8.5
 8.5 8.5 8.4 8.4 8.4 8.4 8.5 8.4 8.4 8.5 8.4 8.4 8.4 8.4 8.4 8.4 8.4 8.4
 8.4 8.4 8.4 8.4 8.4 8.4 8.4 8.4 8.4 8.3 8.4 8.3 8.3 8.3 8.3 8.4 8.3 8.3
 8.3 8.3 8.3 8.3 8.3 8.4 8.5 8.3 8.3 8.3 8.3 8.2 8.3 8.3 8.3 8.3 8.3 8.3
 8.3 8.2 8.3 8.3 8.3 8.3 8.3 8.3 8.3 8.3 8.3 8.3 8.3 8.2 8.2 8.3 8.3 8.2
 8.3 8.3 8.2 8.2 8.2 8.3 8.2 8.2 8.2 8.2 8.3 8.2 8.2 8.2 8.2 8.2 8.1 8.2
 8.2 8.2 8.2 8.2 8.3 8.2 8.2 8.1 8.2 8.2 8.4 8.1 8.2 8.2 8.1 8.2 8.2 8.2
 8.1 8.1 8.1 8.2 8.1 8.2 8.1 8.1 8.2 8.1 8.1 8.2 8.2 8.1 8.2 8.1 8.1 8.2
 8.2 8.2 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.5 8.2 8.1 8.1 8.2 8.2
 8.1 8.1 8.3 8.1 8.3 8.2 8.8 8.1 8.1 8.5 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1
 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.1 8.2 8.1 8.1 8.1 8.2 8.2 8.1 8.1 8.1
 8.1 8.2 8.1 8.1 8.2 8.2 8.1 

<details>
  <summary><div>→ Haga click aquí para ver la solución</div></summary>
  <pre lang="python"><code>
ratingArr = np.loadtxt( 'rating.csv', delimiter = ";", dtype = float )
print(f"Puntuación de películas en el arreglo:  {ratingArr}")
  </code></pre>
</details> 

## Ejercicios

**Ejercicio 01:** Muestre el o los títulos de películas con la mayor calificación.


In [None]:
# Opción 1:
# 1. Obtenga el índice de la calificación máxima (np.argmax)
# 2. Obtenga el nombre de la película al indexar (1.) al arreglo titlesArr 
# 3. Muestre el nombre de la película y su calificación
#    p.e. "La película The Shawshank Redemption tiene la máxima puntuación de 9.3 puntos"



In [27]:
# Opción 2:
# 1. Obtenga el valor con la calificación más alta (np.max)
# 2. Cree una máscara comparando el arreglo de calificaciones (ratingArr) igual a la calificación más alta (1.)
# 3. Obtenga el nombre de la película al aplicar la máscara al arreglo titlesArr
# 3. Muestre el nombre de la película y su calificación
#    p.e. "La película The Shawshank Redemption tiene la máxima puntuación de 9.3 puntos"

maximo = np.max( ratingArr )
mascaraRating = ratingArr == maximo

tituloMaximo = titlesArr[mascaraRating]


print(f"La películoa {tituloMaximo} tiene la máxima puntuación de {maximo} puntos")

La películoa ['The Shawshank Redemption'] tiene la máxima puntuación de 9.3 puntos


**Ejercicio 02:** Muestre el o los títulos de películas con la menor calificación.

**Ejercicio 03:** Ingreso el un valor de una calificación y muestre las películas con dicha calificación.

**Ejercicio 04:** Muestre la cantidad de películas cuya calificación sea mayor que 8.5

In [37]:
mascaraValor = ratingArr > 8.5
peliculasValor = titlesArr[mascaraValor]

In [38]:
cantidadValor = len(peliculasValor)
print(f"Cantidad de películas {cantidadValor}")

Cantidad de películas 34



**Ejercicio 05:** Muestre los nombres de las películas cuya calificación sea mayor que 8.5

In [39]:
print("Películas cuya calificación sea mayor que 8.5")
print(peliculasValor)

Películas cuya calificación sea mayor que 8.5
['The Shawshank Redemption' 'The Godfather' 'The Godfather: Part II'
 'The Dark Knight' '12 Angry Men' "Schindler's List"
 'The Lord of the Rings: The Return of the King' 'Pulp Fiction'
 '"The Good, the Bad and the Ugly"'
 'The Lord of the Rings: The Fellowship of the Ring' 'Fight Club'
 'Forrest Gump' 'Inception' 'The Lord of the Rings: The Two Towers'
 'The Empire Strikes Back' 'The Matrix' 'GoodFellas'
 "One Flew Over the Cuckoo's Nest" 'Seven Samurai' 'Se7en'
 'Life Is Beautiful' 'City of God' 'The Silence of the Lambs'
 "It's a Wonderful Life" 'Star Wars' 'Saving Private Ryan' 'Spirited Away'
 'Interstellar' 'Parasite' 'LÃ©on: The Professional' 'Harakiri'
 'The Usual Suspects' 'Anand' 'Drishyam']



**Ejercicio 06:** Muestre los nombres de las películas cuya calificación esté en el rango \[8.2, 8.4\]. Utilice [where](https://numpy.org/doc/stable/reference/generated/numpy.where.html) para crear una condición múltiple. Tome como referencia los ejemplos del sitio [NumPy where() Multiple Conditions](https://sparkbyexamples.com/python/numpy-where-multiple-conditions/).

In [44]:
mascaraRango = np.where((ratingArr >= 8.2) & (ratingArr <= 8.4))
titulosRango = titlesArr[ mascaraRango ]

print(titulosRango)

['Django Unchained' 'The Lives of Others' 'Hamilton' 'Paths of Glory'
 'WALLÂ·E' 'The Shining' 'Sunset Boulevard' 'Witness for the Prosecution'
 'Oldboy' 'Spider-Man: Into the Spider-Verse' 'Princess Mononoke'
 'Dr. Strangelove' 'The Dark Knight Rises' 'Once Upon a Time in America'
 'Your Name.' 'Aliens' 'Coco' 'Avengers: Endgame' 'Capernaum'
 'American Beauty' 'Braveheart' 'High and Low' 'Das Boot' 'Toy Story'
 '3 Idiots' 'Amadeus' 'Inglourious Basterds' 'Good Will Hunting'
 'Return of the Jedi' 'Like Stars on Earth' 'Reservoir Dogs'
 '2001: A Space Odyssey' 'Requiem for a Dream' 'The Hunt' 'Vertigo' 'M'
 'Eternal Sunshine of the Spotless Mind' 'Citizen Kane'
 "Singin' in the Rain" 'Bicycle Thieves' 'The Kid' 'Full Metal Jacket'
 'Come and See' 'Snatch' 'Ikiru' 'North by Northwest' 'A Clockwork Orange'
 'Scarface' '1917' 'Taxi Driver' 'Incendies' 'A Separation' 'Toy Story 3'
 'Lawrence of Arabia' 'The Sting' 'AmÃ©lie' 'Metropolis' 'The Apartment'
 'For a Few Dollars More' 'Double Inde


**Ejercicio 07:** Muestre la cantidad de películas cuya calificación esté en el rango \[8.2, 8.4\].

In [45]:
cantidadRango = len(titulosRango)
print(f"La cantidad de películas en el rango [8.2, 8.4] es {cantidadRango}")

La cantidad de películas en el rango [8.2, 8.4] es 122
