# Manipulación de datos con Pandas

En el capítulo anterior, profundizamos en los detalles de NumPy y su objeto ``ndarray``, que proporciona un almacenamiento y manipulación eficiente de arrays de tipado denso en Python.
En este capítulo vamos a profundizar en este conocimiento, examinando en detalle las estructuras de datos proporcionadas por la biblioteca Pandas.
Pandas es un paquete más reciente construido sobre NumPy, y proporciona una implementación eficiente de un ``DataFrame``.
Los ``DataFrame`` son esencialmente matrices multidimensionales con etiquetas de filas y columnas adjuntas, y a menudo con tipos heterogéneos y/o datos perdidos.
Además de ofrecer una interfaz de almacenamiento conveniente para los datos etiquetados, Pandas implementa una serie de poderosas operaciones de datos familiares para los usuarios de los marcos de bases de datos y programas de hojas de cálculo.

Como hemos visto, la estructura de datos ``ndarray`` de NumPy proporciona características esenciales para el tipo de datos limpios y bien organizados que se ven normalmente en las tareas de cálculo numérico.
Aunque sirve muy bien a este propósito, sus limitaciones se hacen evidentes cuando necesitamos más flexibilidad (por ejemplo, adjuntar etiquetas a los datos, trabajar con datos que faltan, etc.) y cuando intentamos realizar operaciones que no se corresponden bien con la transmisión por elementos (por ejemplo, agrupaciones, pivotes, etc.), cada una de las cuales es una pieza importante para analizar los datos menos estructurados disponibles en muchas formas en el mundo que nos rodea.
Pandas, y en particular sus objetos ``Series`` y ``DataFrame``, se basa en la estructura de arrays de NumPy y proporciona un acceso eficiente a este tipo de tareas de "manipulación de datos" que ocupan gran parte del tiempo de un científico de datos.

En este capítulo, nos centraremos en la mecánica del uso de ``Series``, ``DataFrame`` y estructuras relacionadas de forma efectiva.
Utilizaremos ejemplos extraídos de conjuntos de datos reales cuando sea apropiado, pero estos ejemplos no son necesariamente el centro de atención.

Traducción realizada con la versión gratuita del traductor www.DeepL.com/Translator

## Instalación y uso de Pandas

La instalación de Pandas en su sistema requiere la instalación de NumPy, y si se construye la librería desde el código fuente, requiere las herramientas apropiadas para compilar las fuentes C y Cython sobre las que se construye Pandas.
Los detalles de esta instalación se pueden encontrar en la [documentación de Pandas](http://pandas.pydata.org/).
Si ha seguido los consejos del [Prefacio](00.00-Prefacio.ipynb) y ha utilizado la pila Anaconda, ya tiene Pandas instalado.

Una vez instalado Pandas, puede importarlo y comprobar la versión:


In [None]:
import pandas
pandas.__version__

'0.18.1'

Just as we generally import NumPy under the alias ``np``, we will import Pandas under the alias ``pd``:

In [None]:
import pandas as pd

This import convention will be used throughout the remainder of this book.

## Reminder about Built-In Documentation

As you read through this chapter, don't forget that IPython gives you the ability to quickly explore the contents of a package (by using the tab-completion feature) as well as the documentation of various functions (using the ``?`` character). (Refer back to [Help and Documentation in IPython](01.01-Help-And-Documentation.ipynb) if you need a refresher on this.)

For example, to display all the contents of the pandas namespace, you can type

```ipython
In [3]: pd.<TAB>
```

And to display Pandas's built-in documentation, you can use this:

```ipython
In [4]: pd?
```

More detailed documentation, along with tutorials and other resources, can be found at http://pandas.pydata.org/.

<!--NAVIGATION-->
< [Structured Data: NumPy's Structured Arrays](02.09-Structured-Data-NumPy.ipynb) | [Contents](Index.ipynb) | [Introducing Pandas Objects](03.01-Introducing-Pandas-Objects.ipynb) >

<a href="https://colab.research.google.com/github/jakevdp/PythonDataScienceHandbook/blob/master/notebooks/03.00-Introduction-to-Pandas.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>
