# Agregaciones de datos

A menudo, cuando se enfrenta a una gran cantidad de datos, un primer paso es calcular estadísticas resumidas para los datos en cuestión. Quizás las estadísticas de resumen más comunes son la media y la desviación estándar, que le permiten resumir los valores "típicos" en un conjunto de datos, pero otros agregados también son útiles (la suma, el producto, la mediana, el mínimo y el máximo, los cuantiles, etc. ).

NumPy tiene funciones de agregación integradas rápidas para trabajar en matrices; discutiremos y demostraremos algunos de ellos aquí.


**Sumar los valores en una matriz:**

Como ejemplo rápido, considere calcular la suma de todos los valores en una matriz. Python mismo puede hacer esto usando la función de suma incorporada:

In [None]:
import numpy as np

In [None]:
L = np.random.random(100)
sum(L)

**Mínimo y Máximo:**
De manera similar, Python tiene funciones mínimas y máximas integradas, que se utilizan para encontrar el valor mínimo y el valor máximo de cualquier matriz dada:

In [None]:
big_array = np.random.rand(1000000)

In [None]:
min(big_array), max(big_array)

Las funciones correspondientes de NumPy tienen una sintaxis similar y operan mucho más rápidamente:

In [None]:
np.min(big_array), np.max(big_array)

Para min, max, sum y varios otros agregados de NumPy, una sintaxis más corta es usar métodos del objeto de matriz en sí:

In [None]:
print(big_array.min(), big_array.max(), big_array.sum())

Existen muchas herramientas para agregar datos:

    np.sum    np.nansum Calcular la suma de elementos
    np.prod   np.nanprod Calcular producto de elementos
    np.mean   np.nanmean Calcular la media de elementos
    np.std    np.nanstd Calcular la desviación estándar
    np.var    np.nanvar Calcular varianza
    np.min    np.nanmin Encuentra el valor mínimo
    np.max    np.nanmax Encuentra el valor máximo
    np.argmin np.nanargmin Encontrar índice de valor mínimo
    np.argmax np.nanargmax Encontrar índice de valor máximo
    np.median np.nanmedian Calcular la mediana de los elementos
    np.percentile np.nanpercentile Calcular estadísticas de elementos basadas en rangos
    np. any N / A Evaluar si algún elemento es verdadero
    np.all N / A Evaluar si todos los elementos son verdaderos