# Manipulación de datos con Pandas

En este notebook vamos a profundizar en este conocimiento mediante un análisis detallado de las estructuras de datos proporcionadas por la librería Pandas.
Pandas es un paquete más reciente construido sobre NumPy, y proporciona una implementación eficiente de un ``DataFrame``.
Los ``DataFrame`` son esencialmente matrices multidimensionales con etiquetas de fila y columna adjuntas, y a menudo con tipos heterogéneos y/o datos que faltan.
Además de ofrecer una cómoda interfaz de almacenamiento para datos etiquetados, Pandas implementa una serie de potentes operaciones de datos familiares para los usuarios tanto de marcos de bases de datos como de programas de hojas de cálculo.

Como hemos visto, la estructura de datos ``ndarray`` de NumPy proporciona características esenciales para el tipo de datos limpios y bien organizados que se ven típicamente en tareas de cálculo numérico.
Aunque sirve muy bien a este propósito, sus limitaciones se hacen evidentes cuando necesitamos más flexibilidad (por ejemplo, adjuntar etiquetas a los datos, trabajar con datos que faltan, etc.) y cuando intentamos realizar operaciones que no se corresponden bien con la transmisión por elementos (por ejemplo, agrupaciones, pivotes, etc.), cada una de las cuales es una pieza importante del análisis de los datos menos estructurados disponibles en muchas formas en el mundo que nos rodea.
Pandas, y en particular sus objetos ``Series`` y ``DataFrame``, se basa en la estructura de array de NumPy y proporciona un acceso eficiente a este tipo de tareas de "manipulación de datos" que ocupan gran parte del tiempo de un científico de datos.

En este notebook, nos centraremos en la mecánica de uso de ``Series``, ``DataFrame``, y estructuras relacionadas de manera efectiva.

## Instalación y uso de Pandas

La instalación de Pandas en su sistema requiere que NumPy esté instalado, y si se construye la librería desde el código fuente, requiere las herramientas apropiadas para compilar los fuentes C y Cython sobre los que se construye Pandas.
Los detalles de esta instalación se pueden encontrar en la [documentación de Pandas](http://pandas.pydata.org/).

```bash
pip install pandas
```

```bash
poetry add pandas
```

Una vez instalado Pandas, puede importarlo y comprobar la versión:

In [None]:
import pandas
pandas.__version__

Así como generalmente importamos NumPy bajo el alias ``np``, importaremos Pandas bajo el alias ``pd``:

In [None]:
import pandas as pd

<!--NAVIGATION-->
[Introducción a los objetos Pandas](1-Objetos_pandas.ipynb) >
