[![img/pythonista.png](img/pythonista.png)](https://www.pythonista.io)

# Conceptos básicos de *Numpy*.

[*Numpy*](http://www.numpy.org/) es un paquete que contiene una biblioteca de recursos especializados en realizar operaciones optimizadas en arreglos de datos.

El proyecto *Numpy* cuenta con una extensa documentación, la cual está disponible en https://docs.scipy.org/doc/numpy/.

## Instalación y carga del paquete ```numpy```.

La instalación del paquete [*numpy*](https://pypi.org/project/numpy/) puede ser hecha mediante ```pip```.

In [None]:
!pip install numpy

In [None]:
!conda install numpy

**Nota:** Por convención se sustituye el nombre del  módulo ```numpy``` por ```np``` al importarlo. En adelante, se utilizará dicha convención.

In [None]:
import numpy as np

## Los arreglos en *Numpy*.

Los elementos primordiales de *Numpy* son los arreglos (arrays), los cuales son colecciones ordenadas e indexables de datos del mismo tipo.

### Particularidades de los arreglos.

Los arreglos de *Numpy* no son estructuras de datos que contiene referencias a objetos, tal como ocurre con las colecciones de Python. Dichos arreglos son estructuras de datos que contienen valores en memoria, tal como ocurre con *C* o *FORTRAN*.

## Los objetos ```np.ndarray```.

*Numpy* cuenta con una amplia variedad de funciones capaces de crear arreglos, pero todos ellos son de tipo ```np.ndarray```.

Un arreglo genérico se define mediante la siguiente sintaxis:

``` 
np.array(<estructura del arreglo>, dtype=<tipo>)
```
* La estructura del arreglo se conforma por colecciones de datos indexables que pueden contener a su vez otras colecciones de datos indexables. 

* El parámetro ```dtype``` indica el tipo de los datos que contiene el arreglo. En caso de que no se defina el tipo de dato, *Numpy*  tratará de definirlo.

**Ejemplo:**

A continuación se definirá un arreglo con las siguientes características:
* Es un arreglo de una dimensión que contiene tres elementos.
* Los elementos son enteros.
* No se define un tipo de dato con el parámetro ```dtype```.
* Al arreglo se le asignará el nombre ```arreglo```.

In [None]:
arreglo = np.array((1, 2, 3))

In [None]:
arreglo

In [None]:
type(arreglo)

* A continuación se desplegará el tipo al que corresponde cada dato de ```arreglo```.

In [None]:
for item in arreglo:
    print(f'valor: {item}, tipo: {type(item)}')

### El tipo ```np.object```.

Cuando *Numpy* no puede identificar un tipo único de dato o los elementos contenidos en el arreglo son objetos de Python distintos a tipos númericos, booleanos o cadenas de caracteres; el arreglo será del tipo ```np.object```.

**Ejemplos:**

* La siguiente celda define un arreglo con diversos tipos de datos y por lo tanto ```dytpe=object```.

In [None]:
np.array(['d', 3 , (12, 6, True)], dtype=object)

* A continuación se creará un arreglo de nombre ```arreglo``` con datos de diversos tipos.

In [None]:
arreglo = np.array(['d', 3 , (12, 6, True)], dtype=object)

* La siguiente celda desplegará el tipo de cada dato en ```arreglo```.

In [None]:
for item in arreglo:
    print('valor: {}, tipo: {}'.format(item, type(item)))

## Dimensiones y formas de los arreglos.

Los arreglos de *Numpy* son estructuras que a su vez pueden contener arreglos en varios niveles o "dimensiones". 

Todos los arreglos en una dimensión específica deben de contener el mismo número de elementos. Al número de objetos que contiene un arreglo en cada dimensión se conoce como forma (shape).

### El atributo ```ndim```.

Los arreglos cuentan con el atributo ```ndim```, el cual indica el número de dimensiones del arreglo.

El valor de ```ndim``` es un número entero.

### El atributo ```shape```.

Los arreglos cuentan con el atributo ```shape```, el cual describe el número de elementos que contiene cada dimensión del arreglo.

El valor de ```shape``` es un objeto tipo tuple que contiene una sucesión de números.

```
(<n1>, <n2>, <n3> ... <nm>)
```

* Donde ```<n1>``` corresponde al número de elementos en la primera dimensión,  ```<n2>``` corresponde al número de elementos en la segunda dimensión y así sucesivamente hasta ```<nm>``` , la cual corrersponde al número de elementos de la dimensión ```m```.

### El atributo ```size```.

El atributo ```size``` de los arreglos de numpy contiene el número total de elementos que conforman a un arreglo.

**Ejemplos:**

* En la siguiente celda se definirá un arreglo de una dimensión con un solo elemento.

In [None]:
np.array([1])

In [None]:
np.array([1]).ndim

* La forma de dicho arreglo es ```(1,)```.

In [None]:
np.array([1]).shape

* El tamaño de dicho arreglo es ```1```.

In [None]:
np.array([1]).size

* En la siguiente celda se definirá un arreglo llamado ```unidimensional``` con cuatro elementos.

In [None]:
unidimensional = np.array([1, 2, 3, 4])

* El arreglo ```unidimensional``` tiene ```1``` dimensión.

In [None]:
unidimensional.ndim

* La forma del arreglo ```unidimensional``` es ```(4,)```.

In [None]:
unidimensional.shape

* El tamaño del arreglo ```unidimensional``` es ```4```.

In [None]:
unidimensional.size

* El arreglo con nombre ```bidimensional``` que se creará a continuación tiene las siguientes características.
    * Es un arreglo de 2 dimensiones.
    * La primera dimensión tiene 3 elementos.
    * Cada elemento de la primera dimensión tiene 2 elementos en la segunda dimensión.

In [None]:
bidimensional = np.array([[1, 2, 3],
                          [4, 5, 6]])

* El arreglo ```bidimensional``` tiene ```2``` dimensiones.

In [None]:
bidimensional.ndim

La forma del arreglo ```bidimensional``` es  ```(2, 3)```.

In [None]:
bidimensional.shape

* El tamaño del arreglo ```bidimensional``` es ```6```.

In [None]:
bidimensional.size

* El arreglo ```tridimensional``` tiene tres dimensiones. 
* Cada dimensión es de 2 elementos.

In [None]:
tridimiensional = np.array([[[1, 2], [3, 4]],
                            [[5, 6], [7, 8]]])

* El arreglo ```tridimensional``` tiene ```3``` dimensiones.

In [None]:
tridimiensional.ndim

* La forma del arreglo ```tridimensional```es ```(2, 2, 2)```. 

In [None]:
tridimiensional.shape

* El tamaño del arreglo ```tridimensional```es ```8```. 

In [None]:
tridimiensional.size

## Tipos de datos de *Numpy*.

*Numpy* define tipos de datos que extienden a los tipos con los que cuenta  *Python* y que están más relacionados con los tipos de datos definidos por los lenguajes *C* y *FORTRAN*.

Estos tipos de datos pueden tener diversos tamaños dependiendo del número de bits asignado para almacenar dichos tipos.

Para mayor referencia es posible consultar la siguiente liga: https://numpy.org/devdocs/user/basics.types.html

### El atributo ```dtype```.

Este atributo contiene el tipo de dato de un arreglo.

**Ejemplo:**

* La siguiente celda define a un arreglo que contiene enteros. El tipo de datos del arreglo será ```int32``` o ```int64``` dependiendo del sistema en el que se ejecute esta notebook.

In [None]:
np.array([[1, 2, 3],
         [4, 5, 6]]).dtype

### Tipos enteros.

* Es posible definir enteros de distintos tamaños como ```np.int```, ```np.int8```, ```np.int16```, ```np.int32``` e ```np.int64```, los cuales pueden ser positivos, negativos o cero.

* Es posible definir enteros sin signo, tales como ```np.uint```,  ```np.uint8```, ```np.uint16```, ```np.uint32``` e ```np.uint64```.

Si no se define el tipo de dato, Python utilizará ```np.int64``` por defecto.

**Nota:** En el caso de que esta notebook sea ejecutada desde Anaconda, es posible que el tipo por defecto sea ```np.int32```.

**Ejemplos:**

* Las siguientes celdas define arreglos enteros de diversos tipos. 

In [None]:
np.array(((1, 2), (3, 4)))

In [None]:
np.array(((1, 2), (3, 4))).dtype

In [None]:
np.array(((-1, 2), (3, 4)), dtype = np.uint8)

In [None]:
np.array(((-1, 2), (3, 4)), dtype = np.uint64)

### Tipos de bytes ```np.byte```.

Numpy puede gestionar arreglos de *bytes*. 

* Cada *byte* puede contener un valor que va de -255 a 255. 


#### El tipo ```np.byte```.

Este tipo de dato contiene valores enteros que van de ```-255``` a ```255```.

* Si se ingresa un valor positivo mayor que 255, a dicho  valor se le restarán 256 unidades.
* Si se ingresa un valor negativo menor que -255, a dicho  valor se le sumarán 256 unidades.

**Ejemplo:**

* A continuación se creará un arreglo de tipo  ```np.byte``` con valores que exceden los límites del tipo de dato.

In [None]:
np.array(((101,-256),(101, 255)), dtype = np.byte)

#### El tipo ```np.ubyte```.

Este tipo de dato contiene valores enteros que van de ```0``` a ```255```.

* Si se ingresa un valor positivo mayor que ```255```, a dicho  valor se le restarán ```256``` unidades.
* Si se ingresa un valor negativo, a este se le sumarrán ```256``` unidades.

**Ejemplo:**

* A continuación se creará un arreglo de tipo  ```np.ubyte``` con valores que exceden los límites del tipo de dato.

In [None]:
np.array(((101,-1),(101, 257)), dtype = np.ubyte)

### Tipos de punto flotante.

Los tipos de punto flotante siempre tendrán un signo y son ```np.float``` ```np.float16```, ```np.float32```, ```np.float64```, ```np.float128```. 

Si no se define, Python utilizará ```np.float32``` o ```np.float64``` dependiendo del sistema en el que se ejecute esta notebook.

**Ejemplos:**

* Las siguientes celdas define arreglos de diversos tipos de punto flotante. 

In [None]:
np.array(((11., 2), (15, 43)))

In [None]:
type(np.array(((11., 2), (15, 43)))[0,0])

### Tipos complejos.

Los tipos de número complejo de *Numpy* son:

* ```np.complex_```
* ```np.complex64```
* ```np.complex128```
* ```np.complex256```

**Ejemplo:**

* La siguiente celda define un arreglo de números complejos.

In [None]:
complejos = np.array([[25.6j, 11.24],
                     [-21.890-15702174.43j, 0]])

In [None]:
complejos

In [None]:
complejos.dtype

### Tipos booleanos.

El tipo ```np.bool_``` permite crear arreglos con valores booleanos.

Cabe recordar que Python identfica como ```True``` a cualquier valor distinto de ```0```.

**Ejemplo:**

In [None]:
np.array(((1,'Hola'), (False, 0)), dtype = np.bool_)

### Tipos de texto.

Pueden ser de tipo ```np.string_```, ```np.unicode_``` o ```np.bytes_```. El tamaño de los elementos del arreglo corresponderá al elemento de texto más extenso.

A diferencia de Python 3, *Numpy* aún diferencia los tipos ```string``` y ```unicode```.

Es posible definir el tamaño de los elementos por defecto utilizando la siguiente sintaxis al ingresar el argumento de ```dtype```, siendo ```S``` para ```str ``` y ```U``` para unicode:

``` python

dtype="<S<entero>"
dtype="<U<entero>"
```



**Ejemplos:**

In [None]:
np.array((['Hugo', 'Paco'],['Luis Ignacio', 'Donald']))

In [None]:
np.array((['Hugo', 'Paco'],['Luis Ignacio', 'Donald']), dtype = np.unicode_)

In [None]:
np.array((['Hugo', 'Paco'],['Luis Ignacio', 'Donald']), dtype = np.bytes_)

In [None]:
np.array((['Hugo', 'Paco'],['Luis Ignacio', 'Donald']), dtype = np.string_)

In [None]:
np.array((['Hugo', 'Paco'],['Luis Ignacio', 'Donaldo']), dtype = "<U6")

## Tipos de fecha.

### El tipo ```np.datetime64```.

Este tipo de datos permite crear arreglos compatIbles con onjetos de tipo ```datetime``` de Python.

Un valor de tipo ```np.datetime``` puede definirse también de la siguiente forma. 
```
np.daytime64('<aaaa>-<mm>-<dd>T<hh>:<mm>:<seg>')
```

**Ejemplo:**

* La siguiente celda importará el tipo ```datetime``` del módulo ```datetime```.

In [None]:
from datetime import datetime

* La siguiente celda creará un arreglo llamado ```fechas```, de forma ```(2, 2)``` que incluye 4 fechas.

In [None]:
fechas = np.array([[np.datetime64("2019-08-25T23:59:45.231"), 
                   np.datetime64("2020-07-23")],
                   [np.datetime64(datetime(year=2018, month=12, day=22)),
                   np.datetime64("2019-03-01T11:25")]])

In [None]:
fechas

In [None]:
fechas.shape

### El tipo ```np.deltatime```.

El tipo ```np.deltatime``` es un valor numérico que corresponde a los segundos en un laspo de tiempo específico usando microsegundos como unidades.

**Ejemplo:**

* La siguiente celda utilizará la propiedad de "broadcasting" para calcular el tiempo transcurrido entre las fechas definidas en el arreglo ```fechas``` y el momento en le que se ejecute la celda.

In [None]:
np.datetime64(datetime.now())- fechas 

## Valores numéricos especiales.

*Numpy* es capaz de reconocer números indeterminados e infintios.

### El valor ```np.nan```.

*Numpy* utiliza ```np.nan``` cuando el valor no se trata de un número o es una indeterminación.

### El valor ```np.inf```.

El valor ```np.inf``` representa un número tan grande que no puede ser calculado o bien, el infinito. Dicho valor puede llevar signo.

**Ejemplos:**

* La siguiente celda creará un arreglo de números llamado ```numeros```.

In [None]:
numeros = np.array(([1, 0],[-1, 1]))

In [None]:
numeros

* La siguiente celda dividirá entre ```0``` a cada elemento del arreglo ```numeros```. Debido a esto, es posible que el intérprete muestre algunas advertencias. Sin embargo, el resultado será un arreglo que contiene valores ```np.inf```, ```-np.inf``` y ```np.nan```.  

In [None]:
numeros / 0

* La siguiente celda definirá un arreglo con ```np.inf```, ```np.nan```

In [None]:
np.array([[np.inf, np.nan],[1, 3]])

* Aún cuando el resultado de la operación da por resultado números finitos, el valor del segundo elemento excede la capacidad del sistema.

In [None]:
np.array((1, 2.5)) ** 2654

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2021.</p>