<a href="https://colab.research.google.com/github/yamadrid/Python/blob/main/Numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

*Este notebook hecho exclusivamente para educación, es una adaptación de  [Python Data Science Handbook](http://shop.oreilly.com/product/0636920034919.do) por Jake VanderPlas; contenido original disponible [on GitHub](https://github.com/jakevdp/PythonDataScienceHandbook).*

# Numpy

NumPy es una biblioteca que da soporte para crear vectores y matrices grandes multidimensionales, junto con una gran colección de funciones matemáticas de alto nivel para operar con ellas

## Arreglos de tipo fijo en Python

Numpy provee una forma eficiente de almacenamiento de datos basados en arreglos, además, de la gran variedad de operaciones también eficientes sumadas en esta librería

In [None]:
import numpy as np

## Creando arreglos desde listas de Python

Primero, podemos usar `np.array` para crear arreglos a partir de listas de Python:

In [None]:
# integer array:
np.array([1, 4, 2, 5, 3])

array([1, 4, 2, 5, 3])

Es preciso saber que, a diferencia de las listas de Python, NumPy está restringido a arreglos que contienen el mismo tipo.

Si los tipos no coinciden, NumPy se convertirá en upcast si es posible (aquí, los enteros se convertirán en punto flotante):

In [None]:
np.array([3.14, 4, 2, 3])

Si queremos establecer explícitamente el tipo de datos de la matriz resultante, podemos usar la palabra clave `dtype`:

In [None]:
np.array([1, 2, 3, 4], dtype='float32')

array([ 1.,  2.,  3.,  4.], dtype=float32)

Finalmente, a diferencia de las listas de Python, las matrices NumPy pueden ser explícitamente multidimensionales; aquí hay una forma de inicializar una matriz multidimensional usando una lista de listas:

In [None]:
# nested lists result in multi-dimensional arrays
np.array([range(i, i + 3) for i in [2, 4, 6]])

Las listas internas se tratan como filas de la matriz bidimensional resultante.

## Creando arreglos desde cero

Especialmente para arreglos más grandes, es más eficiente crear arreglos desde cero usando rutinas integradas en NumPy. A continuación se muestran varios ejemplos:

In [None]:
# Create a length-10 integer array filled with zeros
np.zeros(10, dtype=int)

In [None]:
# Create a 3x5 floating-point array filled with ones
np.ones((3, 5), dtype=float)

In [None]:
# Create a 3x5 array filled with 3.14
np.full((3, 5), 3.14)

In [None]:
# Create an array filled with a linear sequence
# Starting at 0, ending at 20, stepping by 2
# (this is similar to the built-in range() function)
np.arange(0, 20, 2)

In [None]:
# Create an array of five values evenly spaced between 0 and 1
np.linspace(0, 1, 5)

In [None]:
# Create a 3x3 array of uniformly distributed
# random values between 0 and 1
np.random.random((3, 3))

In [None]:
# Create a 3x3 array of normally distributed random values
# with mean 0 and standard deviation 1
np.random.normal(0, 1, (3, 3))

In [None]:
# Create a 3x3 array of random integers in the interval [0, 10)
np.random.randint(0, 10, (3, 3))

In [None]:
# Create a 3x3 identity matrix
np.eye(3)

In [None]:
# Create an uninitialized array of three integers
# The values will be whatever happens to already exist at that memory location
np.empty(3)

## Tipos de datos estandar de Numpy

Los arreglos NumPy contienen valores de un solo tipo, por lo que es importante tener un conocimiento detallado de esos tipos y sus limitaciones. Debido a que NumPy está construido en C, los tipos serán familiares para los usuarios de C, Fortran y otros lenguajes relacionados.

Los tipos de datos estándar de NumPy se enumeran en la siguiente tabla. Tenga en cuenta que al construir una matriz, se pueden especificar mediante una cadena:

`np.zeros(10, dtype='int16')`


O usando el objeto NumPy asociado:

`np.zeros(10, dtype=np.int16)`

| Data type	    | Description |
|---------------|-------------|
| ``bool_``     | Boolean (True or False) stored as a byte |
| ``int_``      | Default integer type (same as C ``long``; normally either ``int64`` or ``int32``)| 
| ``intc``      | Identical to C ``int`` (normally ``int32`` or ``int64``)| 
| ``intp``      | Integer used for indexing (same as C ``ssize_t``; normally either ``int32`` or ``int64``)| 
| ``int8``      | Byte (-128 to 127)| 
| ``int16``     | Integer (-32768 to 32767)|
| ``int32``     | Integer (-2147483648 to 2147483647)|
| ``int64``     | Integer (-9223372036854775808 to 9223372036854775807)| 
| ``uint8``     | Unsigned integer (0 to 255)| 
| ``uint16``    | Unsigned integer (0 to 65535)| 
| ``uint32``    | Unsigned integer (0 to 4294967295)| 
| ``uint64``    | Unsigned integer (0 to 18446744073709551615)| 
| ``float_``    | Shorthand for ``float64``.| 
| ``float16``   | Half precision float: sign bit, 5 bits exponent, 10 bits mantissa| 
| ``float32``   | Single precision float: sign bit, 8 bits exponent, 23 bits mantissa| 
| ``float64``   | Double precision float: sign bit, 11 bits exponent, 52 bits mantissa| 
| ``complex_``  | Shorthand for ``complex128``.| 
| ``complex64`` | Complex number, represented by two 32-bit floats| 
| ``complex128``| Complex number, represented by two 64-bit floats| 

## Fundamentos de los arreglos en Numpy

La manipulación de datos en Python es casi sinónimo de la manipulación de arreglos NumPy se construyen alrededor del arreglo NumPy. Si bien los tipos de operaciones que se muestran aquí pueden parecer un poco abstractos, comprenden los componentes básicos de muchos otros ejemplos utilizados a lo largo del libro.

### Atributos del arreglo Numpy

Primero, analicemos algunos atributos útiles del arreglo. Usaremos el generador de números aleatorios de NumPy, que sembraremos con un valor establecido para asegurarnos de que se generen los mismos arreglos aleatorios cada vez que se ejecute este código:

In [None]:
import numpy as np
np.random.seed(0)  # seed for reproducibility

x1 = np.random.randint(10, size=6)  # One-dimensional array
x2 = np.random.randint(10, size=(3, 4))  # Two-dimensional array
x3 = np.random.randint(10, size=(3, 4, 5))  # Three-dimensional array

Cada matriz tiene atributos `ndim`(el número de dimensiones), `shape`(el tamaño de cada dimensión) y `size`(el tamaño total de la matriz):

In [None]:
print("x3 ndim: ", x3.ndim)
print("x3 shape:", x3.shape)
print("x3 size: ", x3.size)

Otro atributo útil es el tipo `dtype` del arreglo

In [None]:
print("dtype:", x3.dtype)

Otros atributos incluyen `itemsize`, que enumera el tamaño (en bytes) de cada elemento del arreglos y `nbytes`, que enumera el tamaño total (en bytes) del arreglo:

In [None]:
print("itemsize:", x3.itemsize, "bytes")
print("nbytes:", x3.nbytes, "bytes")

En general, esperamos que `nbytes` sea ​​igual a `itemsize` veces `size`.

### Indexación de arreglos: acceso a elementos individuales

En un arreglo unidimensional, el $1^{th}$ puede ser accedido (contando desde cero) especificando el índice deseado entre corchetes, al igual que con las listas de Python:

In [None]:
x1

In [None]:
x1[0]

In [None]:
x1[4]

Para indexar desde el final del arreglo, podemos usar índices negativos:

In [None]:
x1[-1]

In [None]:
x1[-2]

En un arreglo multidimensional, se puede acceder a los elementos mediante una tupla de índices separados por comas:

In [None]:
x2

In [None]:
x2[0, 0]

In [None]:
x2[2, 0]

In [None]:
x2[2, -1]

Los valores también se pueden modificar utilizando cualquiera de las notación de índice anterior:

In [None]:
x2[0, 0] = 12
x2

Tengamos en cuenta que, a diferencia de las listas de Python, las matrices NumPy tienen un tipo fijo. Esto significa, por ejemplo, que si intentamos insertar un valor de punto flotante en una matriz de enteros, el valor se truncará silenciosamente.

In [None]:
x1[0] = 3.14159  # this will be truncated!
x1

### División de arreglos: acceso a subarreglos

Del mismo modo que podemos utilizar corchetes para acceder a elementos de la matriz, también podemos usarlas para subconjuntos de acceso con la rebanada de notación, marcadas por los dos puntos ( :carácter). La sintaxis de corte de NumPy sigue la de la lista estándar de Python; para acceder a una porción de un arreglo x, se usa:

`x[inicio:parada:paso]`

Si cualquiera de estos son sin especificar, que por defecto a los valores `start=0`, `stop=size`, `step=1`. Veremos cómo acceder a submatrices en una dimensión y en múltiples dimensiones

#### Subarreglo unidimensionales

In [None]:
x = np.arange(10)
x

In [None]:
x[:5]  # first five elements

In [None]:
x[5:]  # elements after index 5

In [None]:
x[4:7]  # middle sub-array

In [None]:
x[::2]  # every other element

In [None]:
x[1::2]  # every other element, starting at index 1

Un caso potencialmente confuso es cuando el valor `step` es negativo. En este caso, los valores predeterminados de `start` y `stop` se intercambian. Esta se convierte en una forma conveniente de invertir un arreglo:

In [None]:
x[::-1]  # all elements, reversed

In [None]:
x[5::-2]  # reversed every other from index 5

### Subarreglos Multidimensionales

Los arreglos multidimensionales funcionan de la misma manera, con varios arreglos separados por comas. Por ejemplo:

In [None]:
x2

In [None]:
x2[:2, :3]  # two rows, three columns

In [None]:
x2[:3, ::2]  # all rows, every other column

Finalmente, las dimensiones del subarreglo incluso se pueden invertir juntas:

In [None]:
x2[::-1, ::-1]

#### Accediendo a filas y columnas de un arreglo

Una rutina comúnmente necesaria es acceder a filas o columnas individuales de una matriz. Esto se puede hacer combinando indexación y división, utilizando una división vacía marcada con dos puntos ( :):

In [None]:
print(x2[:, 0])  # first column of x2

In [None]:
print(x2[0, :])  # first row of x2

En el caso del acceso a filas, el segmento vacío se puede omitir para obtener una sintaxis más compacta:

In [None]:
print(x2[0])  # equivalent to x2[0, :]

#### Subarreglos como vistas sin copia

Una cosa importante, y extremadamente útil, que debemos saber sobre los segmentos de arreglo es que devuelven vistas en lugar de copias de los datos de la matriz. Esta es un área en la que la división de matrices de NumPy difiere de la división de listas de Python: en las listas, las divisiones serán copias. Consideremos nuestra matriz bidimensional de antes:

In [None]:
print(x2)

Extraigamos un subarreglo $2 \times 2$:

In [None]:
x2_sub = x2[:2, :2]
print(x2_sub)

Ahora, si modificamos este subarreglo, veremos que se cambia el arreglo original:

In [None]:
x2_sub[0, 0] = 99
print(x2_sub)

In [None]:
print(x2)

Este comportamiento predeterminado es bastante útil: significa que cuando trabajamos con grandes conjuntos de datos, podemos acceder y procesar partes de estos conjuntos de datos sin la necesidad de copiar el búfer de datos subyacente.

#### Creando copias de arreglos

A pesar de las buenas características de las vistas de matriz, a veces es útil copiar explícitamente los datos dentro de una matriz o submatriz. Esto se puede hacer más fácilmente con el método `copy()`:

In [None]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

Si ahora modificamos este subarreglo, el arreglo original no se toca:

In [None]:
x2_sub_copy[0, 0] = 42
print(x2_sub_copy)

In [None]:
print(x2)

### Remodelación de Arreglos

Otro tipo útil de operación es la remodelación de matrices. La forma más flexible de hacer esto es con el método `reshape`. Por ejemplo, si deseamos poner los números del 1 al 9 en un grid $3 \times 3$, se puede hacer lo siguiente:

In [None]:
grid = np.arange(1, 10).reshape((3, 3))
print(grid)

Tengamos en cuenta que para que esto funcione, el tamaño del arreglo inicial debe coincidir con el tamaño del arreglo reformado. Cuando sea posible, el método `reshape` utilizará una vista sin copia del arreglo inicial.

Otro patrón de remodelación común es la conversión de una matriz unidimensional en una matriz de fila o columna bidimensional. Esto se puede hacer con el método `reshape` o más fácilmente haciendo uso de la palabra clave `newaxis` dentro de una operación de corte:

In [None]:
x = np.array([1, 2, 3])

# row vector via reshape
x.reshape((1, 3))

In [None]:
# row vector via newaxis
x[np.newaxis, :]

In [None]:
# column vector via reshape
x.reshape((3, 1))

In [None]:
# column vector via newaxis
x[:, np.newaxis]

### Concatenación y división de Arreglos

Todas las rutinas anteriores funcionaron en arreglos únicos. También es posible combinar varias arreglos en uno y, a la inversa, dividir un solo arreglo en varios arreglos.

#### Concatenación de arreglos

Concatenación, o unión de dos arreglos en NumPy, se logra principalmente utilizando las rutinas `np.concatenate`, `np.vstack` y `np.hstack`. n`p.concatenate` toma una tupla o lista de arreglos como primer argumento, como podemos ver aquí:

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

También podemos concatenar más de dos arreglos a la vez:

In [None]:
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

También lo podemos utilizar para arreglos bidimensionales:

In [None]:
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])

In [None]:
# concatenate along the first axis
np.concatenate([grid, grid])

In [None]:
# concatenate along the second axis (zero-indexed)
np.concatenate([grid, grid], axis=1)

Para trabajar con matrices de dimensiones mixtas, puede resultar más claro utilizar las funciones `np.vstack` (pila vertical) y `np.hstack`(pila horizontal):

In [None]:
x = np.array([1, 2, 3])
grid = np.array([[9, 8, 7],
                 [6, 5, 4]])

# vertically stack the arrays
np.vstack([x, grid])

In [None]:
# horizontally stack the arrays
y = np.array([[99],
              [99]])
np.hstack([grid, y])

#### División de arreglos

Lo contrario de concatenación es la división, que es implementado por las funciones `np.split`, `np.hsplit`, y `np.vsplit`. Para cada uno de estos, podemos pasar una lista de índices con los puntos de división:

In [None]:
x = [1, 2, 3, 99, 99, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

Observemos que *N* puntos de división conduce a *N + 1* subarreglos. Las funciones relacionadas `np.hsplit` y `np.vsplit` son similares:

In [None]:
grid = np.arange(16).reshape((4, 4))
grid

In [None]:
upper, lower = np.vsplit(grid, [2])
print(upper)
print(lower)

In [None]:
left, right = np.hsplit(grid, [2])
print(left)
print(right)

## Cálculo en arreglos NumPy: funciones universales

El cálculo en arreglos NumPy puede ser muy rápido o muy lento. La clave para hacerlo rápido es usar operaciones vectorizadas, generalmente implementadas a través de las funciones universales de NumPy (ufuncs).

### La lentitud de los bucles

La implementación predeterminada de Python (conocida como CPython) realiza algunas operaciones muy lentamente. Esto se debe en parte a la naturaleza dinámica e interpretada del lenguaje: el hecho de que los tipos son flexibles, de modo que las secuencias de operaciones no se pueden compilar en un código de máquina eficiente como en lenguajes como C y Fortran. 

La relativa lentitud de Python generalmente se manifiesta en situaciones en las que se repiten muchas operaciones pequeñas, por ejemplo, en bucle sobre matrices para operar en cada elemento. Por ejemplo, imagina que tenemos un arreglo de valores y nos gustaría calcular el recíproco de cada uno. Un enfoque sencillo podría verse así:

In [None]:
import numpy as np
np.random.seed(0)

def compute_reciprocals(values):
    output = np.empty(len(values))
    for i in range(len(values)):
        output[i] = 1.0 / values[i]
    return output
        
values = np.random.randint(1, 10, size=5)
compute_reciprocals(values)

Si medimos el tiempo de ejecución de este código para una entrada grande, vemos que esta operación es muy lenta:

In [None]:
big_array = np.random.randint(1, 100, size=1000000)
%timeit compute_reciprocals(big_array)

¡Se necesitan varios segundos para calcular estos millones de operaciones y almacenar el resultado! Cuando incluso los teléfonos móviles tienen velocidades de procesamiento medidas en Giga-FLOPS (es decir, miles de millones de operaciones numéricas por segundo), esto parece casi absurdamente lento. Resulta que el cuello de botella aquí no son las operaciones en sí mismas, sino la verificación de tipos y los despachos de funciones que CPython debe hacer en cada ciclo del ciclo. Cada vez que se calcula el recíproco, Python primero examina el tipo del objeto y realiza una búsqueda dinámica de la función correcta para usar para ese tipo. Si estuviéramos trabajando en código compilado, esta especificación de tipo se conocería antes de que se ejecute el código y el resultado podría calcularse de manera mucho más eficiente.

### Introduciendo UFuncs

Para muchos tipos de operaciones, NumPy proporciona una interfaz conveniente en este tipo de rutina compilada de tipo estático. Esto se conoce como operación vectorizada. Esto se puede lograr simplemente realizando una operación en el arreglo, que luego se aplicará a cada elemento. Este enfoque vectorizado está diseñado para empujar el bucle a la capa compilada que subyace a NumPy, lo que lleva a una ejecución mucho más rápida.

Compare los resultados de los dos siguientes:

In [None]:
print(compute_reciprocals(values))
print(1.0 / values)

Al observar el tiempo de ejecución de nuestra gran matriz, vemos que completa órdenes de magnitud más rápido que el ciclo de Python:

In [None]:
%timeit (1.0 / big_array)

Las operaciones vectorizadas en NumPy se implementan a través de ufuncs, cuyo objetivo principal es ejecutar rápidamente operaciones repetidas en valores en matrices NumPy. Los Ufuncs son extremadamente flexibles, antes de que viéramos una operación entre un escalar y un arreglo, pero también podemos operar entre dos arreglos:

In [None]:
np.arange(5) / np.arange(1, 6)

Y las operaciones de ufunc no se limitan a arreglos unidimensionales, también pueden actuar en arreglos multidimensionales:

In [None]:
x = np.arange(9).reshape((3, 3))
2 ** x

Los cálculos que usan vectorización a través de ufuncs son casi siempre más eficientes que sus contrapartes implementadas usando bucles de Python, especialmente a medida que las matrices aumentan de tamaño.

### Explorando las UFuncs de NumPy

Existen dos tipos de Ufuncs: ufuncs unarios, que operan en una sola entrada, y ufuncs binarios, que operan en dos entradas. Veremos ejemplos de ambos tipos de funciones aquí.

#### Aritmetica de arreglo

Los ufuncs de NumPy se sienten muy naturales de usar porque hacen uso de los operadores aritméticos nativos de Python. La suma, resta, multiplicación y división estándar se pueden usar:

In [None]:
x = np.arange(4)
print("x     =", x)
print("x + 5 =", x + 5)
print("x - 5 =", x - 5)
print("x * 2 =", x * 2)
print("x / 2 =", x / 2)
print("x // 2 =", x // 2)  # floor division

También hay un ufunc unario para negación, un operador `**` para exponenciación y un operador `%` para módulo:

In [None]:
print("-x     = ", -x)
print("x ** 2 = ", x ** 2)
print("x % 2  = ", x % 2)

Además, estos se pueden unir como se desee y se respeta el orden estándar de operaciones:

In [None]:
-(0.5*x + 1) ** 2

Cada una de estas operaciones aritméticas son simplemente envoltorios convenientes alrededor de funciones específicas integradas en NumPy; por ejemplo, el operador `+` es un contenedor para la función `add`:

In [None]:
np.add(x, 2)

La siguiente tabla enumera los operadores aritméticos implementados en NumPy:

| Operator	    | Equivalent ufunc    | Description                           |
|---------------|---------------------|---------------------------------------|
|``+``          |``np.add``           |Addition (e.g., ``1 + 1 = 2``)         |
|``-``          |``np.subtract``      |Subtraction (e.g., ``3 - 2 = 1``)      |
|``-``          |``np.negative``      |Unary negation (e.g., ``-2``)          |
|``*``          |``np.multiply``      |Multiplication (e.g., ``2 * 3 = 6``)   |
|``/``          |``np.divide``        |Division (e.g., ``3 / 2 = 1.5``)       |
|``//``         |``np.floor_divide``  |Floor division (e.g., ``3 // 2 = 1``)  |
|``**``         |``np.power``         |Exponentiation (e.g., ``2 ** 3 = 8``)  |
|``%``          |``np.mod``           |Modulus/remainder (e.g., ``9 % 4 = 1``)|

#### Valor absoluto

Así como NumPy entiende los operadores aritméticos incorporados de Python, también comprende la función de valor absoluto incorporada de Python:

In [None]:
x = np.array([-2, -1, 0, 1, 2])
abs(x)

El ufunc de NumPy correspondiente es `np.absolute`, que también está disponible bajo el alias `np.abs`:

In [None]:
np.absolute(x)

In [None]:
np.abs(x)

Este ufunc también puede manejar datos complejos, en los que el valor absoluto devuelve la magnitud:

In [None]:
x = np.array([3 - 4j, 4 - 3j, 2 + 0j, 0 + 1j])
np.abs(x)

#### Funciones trigonométricas

NumPy proporciona una gran cantidad de ufuncs útiles, y algunas de las más útiles para el científico de datos son las funciones trigonométricas. Comenzaremos definiendo una matriz de ángulos:

In [None]:
theta = np.linspace(0, np.pi, 3)

Ahora podemos calcular algunas funciones trigonométricas sobre estos valores:

In [None]:
print("theta      = ", theta)
print("sin(theta) = ", np.sin(theta))
print("cos(theta) = ", np.cos(theta))
print("tan(theta) = ", np.tan(theta))

Los valores se calculan dentro de la precisión de la máquina, por lo que los valores que deberían ser cero no siempre llegan exactamente a cero. Las funciones trigonométricas inversas también están disponibles:

In [None]:
x = [-1, 0, 1]
print("x         = ", x)
print("arcsin(x) = ", np.arcsin(x))
print("arccos(x) = ", np.arccos(x))
print("arctan(x) = ", np.arctan(x))

#### Exponentes y logaritmos

Otro tipo común de operación disponible en una ufunc de NumPy son las exponenciales:

In [None]:
x = [1, 2, 3]
print("x     =", x)
print("e^x   =", np.exp(x))
print("2^x   =", np.exp2(x))
print("3^x   =", np.power(3, x))

La inversa de las exponenciales, los logaritmos, también están disponibles. El básico `np.log` da el logaritmo natural; Si prefiere calcular el logaritmo en base 2 o el logaritmo en base 10, también están disponibles:

In [None]:
x = [1, 2, 4, 10]
print("x        =", x)
print("ln(x)    =", np.log(x))
print("log2(x)  =", np.log2(x))
print("log10(x) =", np.log10(x))

También hay algunas versiones especializadas que son útiles para mantener la precisión con una entrada muy pequeña:

In [None]:
x = [0, 0.001, 0.01, 0.1]
print("exp(x) - 1 =", np.expm1(x))
print("log(1 + x) =", np.log1p(x))

Cuando `x` es muy pequeño, estas funciones dan valores más precisos que si se usara `np.log` o `np.exp`.

### Ufuncs especializadas

NumPy tiene muchas más funciones ufuncs disponibles, incluidas funciones trigonométricas hiperbólicas, aritmética bit a bit, operadores de comparación, conversiones de radianes a grados, redondeo y residuos, y mucho más. Un vistazo a la documentación de NumPy revela muchas funciones interesantes.

Otra fuente excelente de ufuncs más especializados y poco conocidos es el submódulo `scipy.special`. Si deseamos calcular alguna función matemática oscura en sus datos, es probable que esté implementada en `scipy.special`. Hay demasiadas funciones para enumerarlas todas, pero el siguiente fragmento muestra algunas que pueden aparecer en un contexto de estadísticas:

In [None]:
from scipy import special

In [None]:
# Gamma functions (generalized factorials) and related functions
x = [1, 5, 10]
print("gamma(x)     =", special.gamma(x))
print("ln|gamma(x)| =", special.gammaln(x))
print("beta(x, 2)   =", special.beta(x, 2))

In [None]:
# Error function (integral of Gaussian)
# its complement, and its inverse
x = np.array([0, 0.3, 0.7, 1.0])
print("erf(x)  =", special.erf(x))
print("erfc(x) =", special.erfc(x))
print("erfinv(x) =", special.erfinv(x))

Hay muchos, muchos más ufuncs disponibles tanto en NumPy como en `scipy.special`. Debido a que la documentación de estos paquetes está disponible en línea, una búsqueda web en la línea de "función gamma python" generalmente encontrará la información relevante.

### Funciones avanzadas de Ufunc

Muchos usuarios de NumPy hacen uso de ufuncs sin tener que aprender su conjunto completo de funciones. Aquí describiremos algunas características especializadas de ufuncs.

#### Especificando la salida

Para cálculos grandes, a veces es útil poder especificar el arrego donde se almacenará el resultado del cálculo. En lugar de crear un arreglo temporal, esto se puede usar para escribir los resultados del cálculo directamente en la ubicación de la memoria donde le gustaría que estuvieran. Para todas las ufuncs, esto se puede hacer usando el outargumento de la función:

In [None]:
x = np.arange(5)
y = np.empty(5)
np.multiply(x, 10, out=y)
print(y)

Esto incluso se puede usar con vistas de arreglos. Por ejemplo, podemos escribir los resultados de un cálculo en todos los demás elementos de un arreglo específico:

In [None]:
y = np.zeros(10)
np.power(2, x, out=y[::2])
print(y)

Si en cambio hubiéramos escrito `y[::2] = 2 ** x`, esto habría resultado en la creación de una matriz temporal para contener los resultados `2 ** x`, seguida de una segunda operación copiando esos valores en el arreglo `y`. Esto no hace mucha diferencia para un cálculo tan pequeño, pero para arreglos muy grandes, el ahorro de memoria por el uso cuidadoso del argumento `out` puede ser significativo.

#### Aggregates

Para ufuncs binarios, hay algunos agregados interesantes que se pueden calcular directamente desde el objeto. Por ejemplo, si queremos reducir una matriz con una operación en particular, podemos usar el método `reduce` de cualquier ufunc. Reducir aplica repetidamente una operación determinada a los elementos de una matriz hasta que solo queda un resultado.

Por ejemplo, llamar `reduce` al ufunc `add` devuelve la suma de todos los elementos de la matriz:

In [None]:
x = np.arange(1, 6)
np.add.reduce(x)

15

De manera similar, llamar `reduce` a la ufunc `multiply` da como resultado el producto de todos los elementos de la matriz:

In [None]:
np.multiply.reduce(x)

Si queremos almacenar todos los resultados intermedios del cálculo, podemos usar en su lugar `accumulate`:

In [None]:
np.add.accumulate(x)

In [None]:
np.multiply.accumulate(x)

#### Producto Externo

Finalmente, cualquier ufunc puede calcular la salida de todos los pares de dos entradas diferentes usando el método `outer`. Esto le permite, en una línea, hacer cosas como crear una tabla de multiplicar:

In [None]:
x = np.arange(1, 6)
np.multiply.outer(x, x)

## Agregaciones: Min, Max y todo lo demás

A menudo, cuando se enfrenta a una gran cantidad de datos, un primer paso es calcular estadísticas resumidas para los datos en cuestión. Quizás las estadísticas de resumen más comunes son la media y la desviación estándar, que le permiten resumir los valores "típicos" en un conjunto de datos, pero otros agregados también son útiles (la suma, el producto, la mediana, el mínimo y el máximo, los cuantiles, etc. ).

NumPy tiene funciones de agregación integradas rápidas para trabajar en arreglos.

## Sumar los valores en un arreglo

Como ejemplo rápido, considere calcular la suma de todos los valores en un arreglo. Python mismo puede hacer esto usando la función `sum` incorporada:

In [None]:
import numpy as np

In [None]:
L = np.random.random(100)
sum(L)

La sintaxis es bastante similar a la de la función `sum` de NumPy, y el resultado es el mismo en el caso más simple:

In [None]:
np.sum(L)

Sin embargo, debido a que ejecuta la operación en código compilado, la versión de la operación de NumPy se calcula mucho más rápidamente:

In [None]:
big_array = np.random.rand(1000000)
%timeit sum(big_array)
%timeit np.sum(big_array)

Sin embargo, tenga cuidado: la función `sum` y la función `np.sum` no son idénticas, lo que a veces puede generar confusión. En particular, sus argumentos opcionales tienen diferentes significados y `np.sum` es consciente de múltiples dimensiones de arreglos.

### Mínimo y Máximo

De manera similar, Python tiene funciones `min` y `max` incorporadas, que se utilizan para encontrar el valor mínimo y el valor máximo de cualquier matriz dada:

In [None]:
min(big_array), max(big_array)

Las funciones correspondientes de NumPy tienen una sintaxis similar y, nuevamente, operan mucho más rápidamente:

In [None]:
np.min(big_array), np.max(big_array)

In [None]:
%timeit min(big_array)
%timeit np.min(big_array)

Para `min`, `max`, `sum`, y varios otros agregados NumPy, una sintaxis más corta es a métodos de uso de la propia objeto de matriz:

In [None]:
print(big_array.min(), big_array.max(), big_array.sum())

Siempre que sea posible, asegúrese de estar utilizando la versión NumPy de estos agregados cuando opere en matrices NumPy

### Otras funciones de agregación

NumPy proporciona muchas otras funciones de agregación, pero no las discutiremos en detalle aquí. Además, la mayoría de los agregados tienen una NaN contraparte segura que calcula el resultado ignorando los valores perdidos.

La siguiente tabla proporciona una lista de funciones de agregación útiles disponibles en NumPy:

|Function Name      |   NaN-safe Version  | Description                                   |
|-------------------|---------------------|-----------------------------------------------|
| ``np.sum``        | ``np.nansum``       | Compute sum of elements                       |
| ``np.prod``       | ``np.nanprod``      | Compute product of elements                   |
| ``np.mean``       | ``np.nanmean``      | Compute mean of elements                      |
| ``np.std``        | ``np.nanstd``       | Compute standard deviation                    |
| ``np.var``        | ``np.nanvar``       | Compute variance                              |
| ``np.min``        | ``np.nanmin``       | Find minimum value                            |
| ``np.max``        | ``np.nanmax``       | Find maximum value                            |
| ``np.argmin``     | ``np.nanargmin``    | Find index of minimum value                   |
| ``np.argmax``     | ``np.nanargmax``    | Find index of maximum value                   |
| ``np.median``     | ``np.nanmedian``    | Compute median of elements                    |
| ``np.percentile`` | ``np.nanpercentile``| Compute rank-based statistics of elements     |
| ``np.any``        | N/A                 | Evaluate whether any elements are true        |
| ``np.all``        | N/A                 | Evaluate whether all elements are true        |


## Indexación Elegante

En esta sección, veremos otro estilo de indexación de arreglos, conocido como indexación elegante . La indexación elegante es como la indexación simple que ya hemos visto, pero pasamos matrices de índices en lugar de escalares simples. Esto nos permite acceder y modificar muy rápidamente subconjuntos complicados de los valores de una matriz.

### Explorando la indexación elegante

La indexación elegante es conceptualmente simple: significa pasar un arreglo de índices para acceder a varios elementos de la matriz a la vez. Por ejemplo, consideremos la siguiente matriz:

In [None]:
import numpy as np
rand = np.random.RandomState(42)

x = rand.randint(100, size=10)
print(x)

Supongamos que queremos acceder a tres elementos diferentes. Podríamos hacerlo así:

In [None]:
[x[3], x[7], x[2]]

Alternativamente, podemos pasar una sola lista o matriz de índices para obtener el mismo resultado:

In [None]:
ind = [3, 7, 4]
x[ind]

Cuando se usa una indexación elegante, la forma del resultado refleja la forma de las matrices de índice en lugar de la forma de la matriz que se indexa :

In [None]:
ind = np.array([[3, 7],
                [4, 5]])
x[ind]

La indexación elegante también funciona en múltiples dimensiones. Considere la siguiente matriz:

In [None]:
X = np.arange(12).reshape((3, 4))
X

Al igual que con la indexación estándar, el primer índice se refiere a la fila y el segundo a la columna:

In [None]:
row = np.array([0, 1, 2])
col = np.array([2, 1, 3])
X[row, col]

Observe que el primer valor en el resultado es `X[0, 2]`, el segundo es `X[1, 1]` y el tercero es `X[2, 3]`. Entonces, por ejemplo, si combinamos un vector de columna y un vector de fila dentro de los índices, obtenemos un resultado bidimensional:

In [None]:
X[row[:, np.newaxis], col]

Aquí, cada valor de fila se compara con cada vector de columna, exactamente como vimos en la transmisión de operaciones aritméticas. Por ejemplo:

In [None]:
row[:, np.newaxis] * col

array([[0, 0, 0],
       [2, 1, 3],
       [4, 2, 6]])

Siempre es importante recordar con una indexación elegante que el valor de retorno refleja la forma transmitida de los índices, en lugar de la forma del arreglo que se indexa.

### Indexación combinada

Para operaciones aún más poderosas, la indexación sofisticada se puede combinar con los otros esquemas de indexación que hemos visto:

In [None]:
print(X)

Podemos combinar índices elegantes y simples:

In [None]:
X[2, [2, 0, 1]]

También podemos combinar la indexación elegante con la división:

In [None]:
X[1:, [2, 0, 1]]

Y podemos combinar la indexación elegante con el enmascaramiento:

In [None]:
mask = np.array([1, 0, 1, 0], dtype=bool)
X[row[:, np.newaxis], mask]

Todas estas opciones de indexación combinadas conducen a un conjunto muy flexible de operaciones para acceder y modificar los valores de la matriz.

## Ordenar arreglos

uUna ordenación de selección simple encuentra repetidamente el valor mínimo de una lista y realiza intercambios hasta que se ordena la lista. Podemos codificar esto en solo unas pocas líneas de Python:

In [None]:
import numpy as np

def selection_sort(x):
    for i in range(len(x)):
        swap = i + np.argmin(x[i:])
        (x[i], x[swap]) = (x[swap], x[i])
    return x

In [None]:
x = np.array([2, 1, 4, 3, 5])
selection_sort(x)

El tipo de selección es útil por su simplicidad, pero es demasiado lento para ser útil para arreglos más grandes. Para obtener una lista de $N$ valores, requiere $N$ bucles, cada uno de los cuales hace $N$ comparaciones para encontrar el valor de intercambio. En términos de la notación "Big-O" que se usa a menudo para caracterizar estos algoritmos [Big-O Notation](#Aside:-Big-O-Notation), el orden de selección promedia $\mathcal{O}[N^2]$: si duplica el número de elementos de la lista, el tiempo de ejecución aumentará aproximadamente en un factor de cuatro.

Afortunadamente, Python contiene algoritmos de ordenación integrados que son mucho más eficientes que cualquiera de los algoritmos simplistas que se conocen.

### Ordenamiento rápido en NumPy: `np.sort` y `np.argsort`

La función `np.sort` resulta ser mucho más eficiente y útil para nuestros propósitos. Por defecto `np.sort` utiliza un $\mathcal{O}[N\log N]$, algoritmo *quicksort*, aunque también están disponibles *mergesort* y *heapsort*. Para la mayoría de las aplicaciones, la clasificación rápida predeterminada es más que suficiente.

Para devolver una versión ordenada de la matriz sin modificar la entrada, puede usar `np.sort`:

In [None]:
x = np.array([2, 1, 4, 3, 5])
np.sort(x)

Si prefierimos ordenar el arreglo en el lugar, podemos usar el método sort de arreglos:

In [None]:
x.sort()
print(x)

Una función relacionada es `argsort`, que en su lugar devuelve los índices de los elementos ordenados:

In [None]:
x = np.array([2, 1, 4, 3, 5])
i = np.argsort(x)
print(i)

[1 0 3 2 4]


El primer elemento de este resultado da el índice del elemento más pequeño, el segundo valor da el índice del segundo más pequeño, y así sucesivamente. Estos índices se pueden usar (a través de una indexación elegante) para construir el arreglo ordenada si se desea:

In [None]:
x[i]

#### Ordenar por filas o columnas

Una característica útil de los algoritmos de ordenamiento de NumPy es la capacidad de ordenar filas o columnas específicas de una matriz multidimensional utilizando el argumento `axis`. Por ejemplo:

In [None]:
rand = np.random.RandomState(42)
X = rand.randint(0, 10, (4, 6))
print(X)

In [None]:
# sort each column of X
np.sort(X, axis=0)

In [None]:
# sort each row of X
np.sort(X, axis=1)

### Ordenamiento parcial: particionamiento

A veces no estamos interesados ​​en ordenar el arreglo completo, 
simplemente queremos encontrar los `k` valores más pequeños en el arreglo. NumPy proporciona esto en la función `np.partition`. `np.partition` toma una matriz y un número `K`; el resultado es un nuevo arreglo con los valores de `K` más pequeños a la izquierda de la partición y los valores restantes a la derecha, en orden arbitrario:

In [None]:
x = np.array([7, 2, 3, 1, 6, 5, 4])
np.partition(x, 3)

De manera similar a la ordenación, podemos dividir a lo largo de un eje arbitrario de una matriz multidimensional:

In [None]:
np.partition(X, 2, axis=1)

El resultado es un arreglo en la que los dos primeros espacios de cada fila contienen los valores más pequeños de esa fila, y los valores restantes llenan los espacios restantes.