[![imagenes/pythonista.png](imagenes/pythonista.png)](https://pythonista.io)

El proyecto Pandas es una herramienta escrita en Python y compatible con dicho lenguaje, especializada en la gestión de conjuntos de datos (data frames), utilizándolos como materia prima para la realización de operaciones de análisis de datos.

El sitio del proyecto Pandas es https://pandas.pydata.org/

Pandas cuenta con las siguientes funcionalidades.


* Los Dataframes.
* Lectura y escritura de datos entre estructuras en memoria y diversos formatos de archivos y bases de datos.
* Alineación de datos y manejo de datos faltantes.
* Modificación de conjuntos de datos.
* Manejo de series de tiempo.

Por convención, Pandas es importado con el nombre *pd*.

In [None]:
!pip install pandas

In [None]:
import pandas as pd

## Series y dataframes. 

Pandas incluye dos tipos de colecciones de números similares a los arreglos de Numpy.

* Series, las cuales son una sucesion de datos en una dimesión.
* Dataframes, los cuales son similares a un aerreglo en 2 dimensiones de Numpy. Sin embargo, a diferencia de los arreglos de Numpy, no todas las columnas de estos objetos deben de ser necesariamente del mismo tipo.

### La clase *pandas.DataFrame*.

La clase *pandas.DataFrame* permite crear dataframes a partir de datos que pueden corresponder a:
* Objetos de tipo *dict*.
* Series objetos tipo *tuple*.
* Objetos *numpy.ndarray* (arreglos que contienen sólo números).
* Otros objetos instanciado de *pandas.DataFrame*.

Dichos datos pueden ser ingresados como argumentos del parámetro *data* al instanciarlos.

Los dataframes indexan por defecto las columnas y los encabrezados con valores numéricos. Sin embargo, estos pueden ser modificados por el usuario.

**Ejemplos:**

Se creará un dataframe a partir de una colección de objetos tipo *tuple*.

In [None]:
pd.DataFrame(data=[(0, 1, 2), (1, 2, 3), (2, 3, 4), (3, 4, 5)])

Se creará un dataframe a partir de un objeto tipo *dict*.

En este caso, el identificador de cada colección de datos corresponderá al encabezado de cada columna.

In [None]:
diccionarios = {'py101':[10, 5, 33 ,45, 25, 22], 
                'py111':[0, 15, 21 , 30, 31, 11], 
                'py121':[15, 5, 1 ,10, 42, 21], 
                'py301':[20, 35, 3 ,15, 0, 0], }

In [None]:
pd.DataFrame(data=diccionarios)

Se creará un dataframe a partir de un objeto creado con *numpy.arange()*.

In [None]:
import numpy as np

In [None]:
matriz = np.arange(9).reshape(3,3)

In [None]:
matriz

In [None]:
pd.DataFrame(matriz)

El parámetro *index*, permite incluir un índice a cada renglón.

**Ejemplo:**

In [None]:
indice = ('enero', 'febrero', 'marzo', 'abril', 'mayo', 'junio')

In [None]:
pd.DataFrame(data=diccionarios, index=indice)

El parámetro *columns* permite nombrar a las columnas. 

**Ejemplo:**

In [None]:
pd.DataFrame(matriz, index=['uno','dos','tres'], columns=['a', 'b', 'c'])

### La clase *pandas.Series*.

Los objetos instanciado de la clase *pandas.Series* son de una sola dimensión y pueden ser al ingresar como argumento de *data* objetos de tipo:

* *tulpe*
* *list*
* *dict* 
* *numpy.ndarray*

A las series se les puede asignar un nombre mediante el parametro *name*.

**Ejemplo:**

In [None]:
pd.Series([12, 4, 32, 41, 33, 28], name='py201')

Al igual que con los dataframes, es posible asignarle un índice.

In [None]:
pd.Series([12, 4, 32, 41, 33, 28], index=indice, name='py201')

In [None]:
pd.Series([12, 4, 32, 41, 33, 28], index=indice, name='py201').to_frame()

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2018.</p>