# Introducción a NumPy

Los conjuntos de datos pueden provenir de una amplia gama de fuentes y una amplia gama de formatos, incluyendo ser colecciones de documentos, colecciones de imágenes, colecciones de clips de sonido, colecciones de medidas numéricas, o casi cualquier otra cosa.
A pesar de esta aparente heterogeneidad, nos ayudará pensar en todos los datos fundamentalmente como matrices de números.

Por ejemplo, las imágenes, sobre todo las digitales, pueden considerarse simplemente como matrices bidimensionales de números que representan el brillo de los píxeles de una zona.
Los clips de sonido pueden considerarse matrices unidimensionales de intensidad en función del tiempo.
El texto puede convertirse de varias formas en representaciones numéricas, como dígitos binarios que representan la frecuencia de ciertas palabras o pares de palabras.
Sean cuales sean los datos, el primer paso para hacerlos analizables será transformarlos en matrices de números.

Por esta razón, el almacenamiento y la manipulación eficiente de matrices numéricas es absolutamente fundamental para el proceso de hacer ciencia de datos.
A continuación veremos las herramientas especializadas que tiene Python para manejar tales matrices numéricas: el paquete NumPy, y el paquete Pandas.

NumPy (abreviatura de *Numerical Python*) proporciona una interfaz eficiente para almacenar y operar con buffers de datos densos.
En cierto modo, las matrices NumPy son como el tipo ``list`` incorporado en Python, pero las matrices NumPy proporcionan un almacenamiento mucho más eficiente y operaciones de datos a medida que las matrices crecen en tamaño.
Las matrices NumPy forman el núcleo de casi todo el ecosistema de herramientas de ciencia de datos en Python, por lo que el tiempo dedicado a aprender a utilizar NumPy de manera eficaz será valioso independientemente del aspecto de la ciencia de datos que le interese.

```bash
pip install numpy
```
```bash
poetry add numpy
```

In [None]:
import numpy
numpy.__version__

Por convención, encontrarás que la mayoría de la gente en el mundo SciPy/PyData importará NumPy usando ``np`` como alias:

In [None]:
import numpy as np

## Recordatorio sobre la documentación incorporada

No olvides que IPython le ofrece la posibilidad de explorar rápidamente el contenido de un paquete (utilizando la función de completar tabulador), así como la documentación de varias funciones (utilizando el carácter ``?``.

Por ejemplo, para mostrar todo el contenido del espacio de nombres numpy, puedes escribir esto:

```ipython
In [3]: np.<TAB>
```

Y para mostrar la documentación incorporada de NumPy, puedes usar esto:

```ipython
In [4]: np?
```


<!--NAVIGATION-->
## Próxima lección: [Data Types en Python](1-Data_types_en_python.ipynb)
