# <font color = red> Numpy

NumPy es una biblioteca para el lenguaje de programación Python que da soporte para crear vectores y matrices, junto con una gran colección de funciones matemáticas de alto nivel para operar con ellas. El precursor de NumPy, Numeric, fue creado originalmente por Jim Hugunin con contribuciones de varios otros desarrolladores. En 2005, Travis Oliphant creó NumPy incorporando características de la competencia Numarray en Numeric, con amplias modificaciones. NumPy es un software de código abierto y cuenta con muchos colaboradores.

<center> <img src = "numpy_logo.png" width="600"></center>

## <font color = darkblue> Creación y manejo de arrays 
Los arrays son la base de toda la ciencia de datos en <b>Python</b>. Las matrices pueden ser multidimensionales, y todos los elementos de una matriz deben ser del mismo tipo, todos enteros o todos flotantes, por ejemplo.

<center> <img src="Array_gift.gif" width="450"></center>

### Ventajas de utilizar una matriz

* Las matrices pueden manejar con eficacia conjuntos de datos muy grandes.
* Eficiencia computacional y de memoria.
* Cálculos y análisis más rápidos que las listas.
* Funcionalidad con diversos paquetes de Python.

### Conceptos básicos de una matriz en Numpy

En Python, se pueden crear arrays o arreglos utilizando el paquete Numpy. Las matrices Numpy están optimizadas para análisis numéricos y contienen un único tipo de datos.

Para trabajar con Numpy es necesario importar el paquete *numpy* de la siguiente manera:

Ya que se tiene el paquete se procede a la creación de las matrices utilizando listas y la función *np.array()*

### Crear vectores

### Crear matrices

### Crear arreglos en tres dimensiones

## <font color = darkblue> Métodos útiles para crear arrays

### Arrays con ceros

### Arrays con unos

### Arrays con valores constantes

### Arrays con rango de valores

### Arrays con valores distribuidos uniformemente

### Diagrama de lineas

Un diagrama de líneas es un gráfico que muestra datos en forma de puntos conectados por líneas. Se usa para representar eventos que ocurren en un intervalo de tiempo, como el número de visitantes por mes.

## <font color = darkblue> Propiedades de los arrays

### Número de dimensiones

### Forma del array

In [None]:
array = np.zeros((3,2,2))
array.shape

### Forma de los elementos (¿Cuántos elementos hay?)

### Obtener el tipo de dato

### Definir tipo de datos


Para optimizar el uso de los recursos del sistema es importante definir el tipo de dato apropiado de los arrays en función a los datos y al tamaño que se prevean van a contener y procesar.

#### Enteros

* np.int8: (1 byte) -  Para enteros entre -128 y 127.
* np.int16: (2 bytes) - Para enteros entre -32768 y 32767.
* np.int32: (4 bytes) - Para números enteros entre -2147483648 y 2147483647.
* np.int64: (8 bytes) - Para números enteros entre -9223372036854775808 y 8223372036854775807.

#### Enteros sin signo

* np.uint8: (1 byte) -  Para enteros hasta 255.
* np.uint16: (2 bytes) - Para enteros hasta 65535.
* np.uint32: (4 bytes) - Para números enteros hasta 4294967295.
* np.uint64: (8 bytes) - Para números enteros hasta 18446744073709551615.


#### Flotantes
* np.float16
* np.float32
* np.float64

#### Tipos de datos abreviados

* Booleanos: 'b1'.
* Enteros: 'i1' (int8), 'i2' (int16), 'i4' (int32), 'i8' (int64).
* Cadenas unicode con distintas longitudes: 'u1', 'u2', 'u4', 'u8'.
* Cadenas de bytes con distintas longitudes: 'S1', 'S2', 'S3', 'S4'.
* Flotantes: 'f2' (float16), 'f4' (float32), 'f8' (float64).
* Complejos: 'c8' (complex64), 'c16' (complex128).

### Cambiar tipo de datos

## <font color = darkblue> Operaciones con arrays

### Operaciones elementales

In [None]:
A

### Operaciones comunes

### Álgebra Lineal

#### Multiplicación de matrices

<center> <img src="multiplicacion entre matrices.gif" width="450"></center>

#### Transpuesta de una matriz

<center> <img src="transpuesta.gif" width="450"></center>

#### Determinante de una matriz

Para obtener el determinante de una matriz, la matriz debe ser cuadrada. El resultado es un escalar.

#### Inversa de una matriz

Para obtener la inversa de una matriz, esta debe ser cuadrada. El resultado es una matriz con las mismas dimensiones.

## <font color = darkblue> Indexación y Slicing
La indexación y el slicing son dos formas de acceder a elementos en Python, pero se diferencian en que la indexación devuelve un único elemento, mientras que el slicing devuelve una lista de elementos.

### Acceso a elementos

### Indexación avanzada

### Modificación de valores

## <font color = darkblue> Manipulación de arrays

Con las funciones que se verán a continuación se permite el manejo de las matrices para obtener una estructura distinta del arreglo.

#### Cambiar la forma del array

#### Concatenación 

#### División

#### Aplanar un array

## <font color = darkblue> Generación de números aleatorios

NumPy utiliza como base el generador de números pseudoaleatorios PCG64 (Permuted Congruential Generator) desde la versión 1.17.0. Este generador reemplazó al previamente usado Mersenne Twister como el generador predeterminado.

### Números aleatorios entre 0 y 1

### Numeros aleatorios enteros en un rango

### Configurar una semilla para reproducibilidad

np.random.seed(42)

## <font color = darkblue> Estadística descriptiva

La estadística descriptiva es una rama de la estadística que se encarga de organizar, resumir y representar datos numéricos. Su objetivo es facilitar la interpretación de los resultados de una investigación. Dentro de la estadística descriptiva se tienen medidas de tendencia central o posición, con las cuales se permite obtener de manera analítica la localización de un conjunto de datos. Y también se tienen medidas de dispersión, que de manera analítica permiten obtener una medida de la dispersión de los datos. Esta parte de la estadística se puede desarrollar en numpy.

### Medidas de posición

#### Media aritmética
La media aritmética cuya fórmula se muestra a continuación:

$$\bar{x} = \frac{1}{n} \sum_{i=1}^{n}x_{i}$$

se puede calcular con la función np.mean(array).

#### Mediana

Otra medida de posición es la mediana, con ella se encuentra el valor central del conjunto de datos ordenados, se utiliza la siguiente expresión.

$$\tilde{x} =
\begin{cases}
x_{\frac{n+1}{2}} & \text{si n es impar}  \\
\frac{x_{\frac{n}{2}} + x_{\frac{n+1}{2}}}{2}& \text{si n es par} 
\end{cases}
$$

se puede obtener con np.median

#### Cuartiles 

Los cuartiles son medidas de posición que representan en intervalos de 25\% el conjunto de datos observado. Permiten encontrar el punto en que se encuentra el 25\%, 50\%, y 75\% de la información en un conjunto de datos ordenados.

### Medidas de dispersión

#### Desviación estándar
La desviación estándar es una medida de la dispersión de un conjunto de datos. Se utiliza para estudiar la variabilidad de una variable continua en una muestra.  Su fórmula es la siguiente:

$$s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \bar{x})^{2}} $$

con numpy se obtiene utilizando np.std


#### Varianza
La varianza es una medida de dispersión que indica la variabilidad de un conjunto de datos en relación con su media. Es decir, la varianza cuantifica qué tan dispersos están los datos alrededor de la media.

$$s^{2} = \frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \bar{x})^{2} $$

con numpy se obtiene utilizando np.var

#### Rango

El rango en estadística es la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. También se le conoce como amplitud o recorrido.

$$R = \max{x_{i}} - \min{x_{i}} $$

### Histograma 
Representación gráfica de una distribución de frecuencias por medio de barras, cuyas alturas representan las correspondientes frecuencias.


#### Boxplot

Un boxplot, también conocido como diagrama de caja, es un gráfico que muestra la distribución de datos numéricos mediante sus cuartiles. Este tipo de gráfico permite visualizar la mediana, los cuartiles, los valores atípicos y la simetría de los datos.

#### Scatter plot 
Un scatter plot, o diagrama de dispersión, es una herramienta que se utiliza para mostrar y comparar valores numéricos. Se usa para identificar relaciones entre variables y comprobar su solidez. 
