<p><img alt="Colaboratory logo" height="140px" src="https://upload.wikimedia.org/wikipedia/commons/archive/f/fb/20161010213812%21Escudo-UdeA.svg" align="left" hspace="10px" vspace="0px"></p>

# **Análisis de Datos y Machine Learning en Python 1**

Juan Camilo Zapata Ceballos   
Facultad de Ciencias Exactas y Naturales   
Universidad de Antioquia   
2023

# **9. NumPy I**

* <a href="#n1">9.1. Introducción</a><br>

* <a href="#n2">9.2. Arreglos</a><br>
  - <a href="#n21">9.2.1. Atributos</a><br>
  - <a href="#n22">9.2.2. Métodos</a><br>

* <a href="#n3">9.3. Lectura y Escritura de Archivos</a><br>
  - <a href="#n31">9.3.1. Lectura</a><br>
  - <a href="#n32">9.3.2. Escritura</a><br>

* <a href="#n4">9.4. Problemas Adicionales I</a><br>


Para empezar se debe importar NumPy:

In [None]:
import numpy as np

<p><a name="n"></a></p>

## **9.1. Introducción**

NumPy (Numerical Python) es una librería de Python que toma un rol importante en el ámbito científico y en el tratamiento de datos. Esta herramienta agrega soporte, de alto desempeño, para manipular listas y tablas (matrices) de gran tamaño. Carga consigo una gran colección de funciones para ser efectuadas sobre dichos arreglos. Entre las más usadas se encuentran las funciones elementales, trigonométricas y estadísticas, así como tambíen, la generación de numéros aleatorios. NumPy agregar velocidad, versatilidad y simpleza en comparación con las listas nativas de Python. *NumPy hace que Python sea súper fácil y ridiculamente intuitivo*.

<p><img alt="Colaboratory logo" height="100px" src="https://www.freecodecamp.org/espanol/news/content/images/2021/04/numpy-1-1-.png" align="left" hspace="10px" vspace="0px"></p>   

<br clear="left"/>

**Objetivos:**

* Aprender la sintáxis básica para trabajar con NumPy.
* Implementar los métodos de NumPy para generar arreglos 1D y 2D.
* Conocer los atributos y los métodos relacionados con la manipulación y modificación de arreglos.
* Experimentar con la lectura y la escritura de archivos de texto plano, y personalizar la presentación de resultados numéricos.
* Trabajar con las funciones universales y de agregación para la creación, la modiicación y el procesamiento de datos.
* Comprender los conceptos de indexar, de segmentar, de enmascarar y de filtrar conjuntos de datos.
* Usar el módulo $random$ para la generación de números aleatorios.

**Palabras Claves:** arreglo, indexar, segmentar, enmascarar, filtrar.

<p><a name="n2"></a></p>

## **9.2. Arreglos**

Un Arreglo es similar a una lista de Python a excepción que sólo puede contener un único tipo de dato. Se inicializa como:

In [None]:
#Lista (Arreglo 1D/Vector)
a = np.array([0,1,2,3])
a, type(a)

In [None]:
#Tabla (Arreglo 2D/Matriz)
a = np.array([[1,2,3], [4,5,6], [7,8,9]])
a, type(a)

Además, NumPy proporciona funciones para la creación de diversos Arreglos:

In [None]:
print('    Zeros:', np.zeros(10))
print('     Ones:', np.ones(10))
print('     Full:', np.full(10,8))
print('    Empty:', np.empty(3))
print('   Arange:', np.arange(0,20))
print(' Linspace:', np.linspace(0,1,5))

Los Arreglos son objetos, entonces poseen atributos y métodos. Veamos:

<p><a name="n21"></a></p>

### **9.2.1. Atributos**

Algunos atributos o características de los Arreglos son:

<center>

| Atributo | Descripción |
|-:|:-|
| a.ndim     | Devuelve el número de dimensiones (ejes) del Arreglo. |
| a.shape    | Devuelve el tamaño de cada dimensión del Arreglo. |
| a.size     | Devuelve el número de elementos en el Arreglo. |
| a.itemsize | Devuelve el tamaño en bytes que ocupa cada elemento del Arreglo. |
| a.nbytes   | Devuelve el tamaño total en bytes que ocupa el Arreglo. |
| a.dtype    | Devuelve el tipo de los elementos del Arreglo. |
| a.T        | Trasponer el Arreglo. |

</center>

Veamos:

In [None]:
a1 = np.array([0,1,2,3], dtype=np.int32)
a1

In [None]:
a2 = np.array([[1,2,3], [4,5,6], [7,8,9]], dtype=np.float64)
a2

In [None]:
print('Dimension:', a1.ndim, a2.ndim)
print('    Shape:', a1.shape, a2.shape)
print('     Size:', a1.size, a2.size)
print(' Itemsize:', a1.itemsize, a2.itemsize)
print('   Nbytes:', a1.nbytes, a2.nbytes)
print('     Type:', a1.dtype, a2.dtype)

In [None]:
#Traspose
a2.T

Para más información visite [Array](https://numpy.org/doc/stable/reference/arrays.ndarray.html).

### <font color='green'>**Ejercicio 1** </font>

Genere los siguientes arreglos 1D:

1. $[0.0 , 0.5, 1.0 , 1.5, 2.0 ]$
2. $[0,  5, 10, 15, 20, 25]$
3. $[1,   4,   9,  16,  25,  36,  49,  64,  81, 100]$

***Ayuda:*** Puede que le sean útiles los métodos $arange$ y $linspace$.




### <font color='green'>**Ejercicio 2** </font>

Genere los siguientes arreglos 2D:

1. $\begin{pmatrix}
     1 & 2 \\
     3 & 4 \\
  \end{pmatrix}$

2. $\begin{pmatrix}
     1 & 3 \\
     2 & 4 \\
   \end{pmatrix}$

***Ayuda:*** Puede que le sea útil el atributo $T$ para trasponer.





<p><a name="n22"></a></p>

### **9.2.2. Métodos**

Algunos métodos o funcionalidades de los Arreglos son:

<center>

| Atributo | Descripción |
|-:|:-|
| a.reshape(shape) | Devuelve un Array que contiene los mismos datos con una nueva forma. |
| a.resize(shape)  | Cambia la forma del Arreglo. |
| a.flatten()      | Devuelve una copia del Arreglo colapsado en una dimensión. |
| a.copy()         | Devuelve un copa exacta del Arreglo. |
| a.sort(axis)     | Ordena un Arreglo. |
| a.argsort(axis)  | Devuelve los índices del Arreglo ordenado. |
| a.nonzero()      | Devuelve los índices de los elementos del Arreglo que no son cero. |
| a.diagonal()     | Devuelve la diagonal de un Arreglo 2D. |

</center>

Veamos:

In [None]:
a1 = np.array([0,1,2,3])
a1

In [None]:
a2 = np.array([[1,4], [3,2]])
a2

In [None]:
#Reshape
a1.reshape((2,2))

In [None]:
#Resize
a1.resize((2,2))
a1

In [None]:
#Flatten
a1.flatten()

In [None]:
#Copy
a1.copy()

In [None]:
#Sort
a2.sort(axis=0) #Rows
#a2.sort(axis=1) #Columns
a2

In [None]:
#Arg-Sort
a2.argsort(axis=0) #Rows
#a2.argsort(axis=1) #Columns

In [None]:
#Non-Zero
a1.nonzero()

In [None]:
#Diagonal
a2.diagonal()

Para más información visitar [Array](https://numpy.org/doc/stable/reference/arrays.ndarray.html).

### <font color='green'>**Ejercicio 3** </font>

A partir del siguiente arreglo, efectúe:

&emsp; $a = np.array([0,1,2,3,4,5,6,7,8,9])$

1. Reestructure para que quede con una forma $2\times5$.
2. Reestructure para que quede con una forma $5\times2$.
3. ¿Puede tener una forma diferente a las anteriores? Explique.

***Ayuda:*** Puede que le sean útiles los métodos $reshape$ o $resize$.



### <font color='green'>**Ejercicio 4** </font>

Escriba un código que muestre la importancia del método $copy$.




<p><a name="n3"></a></p>

## **9.3. Lectura y Escritura de Archivos**

<p><a name="n31"></a></p>

### **9.3.1. Lectura**

In [None]:
x, y = np.loadtxt('sesion_13_lectura.txt', usecols=(0,1), delimiter=' ', unpack=True)

In [None]:
x

In [None]:
y

<p><a name="n32"></a></p>

### **9.3.2. Escritura**

In [None]:
x = np.linspace(0,10,11)
x

In [None]:
y = x**2

In [None]:
np.savetxt('sesion_13_escritura.txt', np.c_[x,y], fmt=['%0.2f','%0.4f'], delimiter=' ', header='x y=x^2')

### <font color='green'>**Ejercicio 5** </font>

Lea las columnas 1 y 3 del archivo *ER_9_5.txt* como un arreglo 2D. Explique que modificaciones debe hacer para obtener dos arreglos 1D.

***Ayuda 1:*** El archivo se encuentra en la carpeta *Datos/NumPy*.   
***Ayuda 2:*** Intente usar el parámetro $usecols$ del método $loadtxt$.   
***Ayuda 3:*** Intente usar el parámetro $unpack$ del método $loadtxt$.




### <font color='green'>**Ejercicio 6** </font>

Guarde en un archivo el siguiente conjunto de datos y efectúe:

&emsp;&emsp;&emsp; $x \in [0,1]$,    
&emsp;&emsp;&emsp; $y_1=x^2$,   
&emsp;&emsp;&emsp; $y_2=x/2$.   

1. Los datos de $x$ deben contener un decimal.
2. Los datos de $y_1$ y $y_2$ deben contener dos decimales.
3. Agregue una cabecera y los espacios necesarios entre columnas.

***Ayuda 1:*** Intente usar el parámetro $fmt$ del método $savetxt$.   
***Ayuda 2:*** Intente usar el parámetro $header$ del método $savetxt$.




<p><a name="n4"></a></p>

## **9.4. Problemas Adicionales I**

### <font color='green'>**Ejercicio Propuesto 2** </font>

Explique las semejanzas y diferencias entre $arange$ y $linspace$.

### <font color='green'>**Ejercicio Propuesto 4** </font>

Cree un arreglo bidimensional (2D) de tamaño $3\times3$ que contenga en todas las entradas el buleano $False$.




### <font color='green'>**Ejercicio Propuesto 6** </font>

Genere el siguiente arreglo bidimensional:

&emsp;&emsp;&emsp; $\begin{pmatrix}
                      \ \ \ 1 & \ \ \ 2 & \ \ \ 3\\
                     -1 & -2 & -3\\
                      \ \ \ 3 & \ \ \ 2 & \ \ \ 1
  \end{pmatrix}$

### <font color='green'>**Ejercicio Propuesto 9** </font>

A partir de un arreglo unidimensional (1D) de tamaño aleatorio:

1. Cree un arreglo 2D cuadrado si el número de elementos de dicho arreglo es un cuadrado perfecto.
2. Muestre un mensaje de error en caso contrario.

***Ayuda 1:*** Puede que le sea útil el atributo $size$.   
***Ayuda 2:*** Puede que le sean útiles los métodos $reshape$ o $resize$.





### <font color='green'>**Ejercicio Propuesto 11** </font>

Guarde en un archivo el siguiente conjunto de datos y efectúe:

&emsp;&emsp; $x = np.linspace(-1,1,100)$,      
&emsp;&emsp; $y = x**-1$,      
&emsp;&emsp; $z = x**3$.

1. Los datos de $x$ deben contener un decimal.
2. Los datos de $y$ y $z$ deben contener dos decimales.
3. Los datos de $y$ y $z$ deben estar en notación científica.
4. Agregue una cabecera y los espacios necesarios entre columnas.



