# Pandas

Pandas es una librería de Python muy usada en el mundo de las Ciencias de Datos. Dicha librería está contruida sobre Numpy, y nos ofrece dos estructuras de datos: el **DataFrame** y las **Series** para el análisis y la manipulación de datos.
  
Para importar Pandas, hacemos lo siguiente:

In [1]:
import pandas as pd
import numpy as np

Usamos el **import** como lo usamos para importar cualquier librería Python, y, usamos el alias **pd**, esto por convención y para perder menos tiempo escribiendo.  
  
Ahora sí, podemos gozar del poder de Pandas.

## Series

Una **Series** es una estructura de datos de **una sola dimensión** que puede contener cualquier tipo de dato, pero todos los miembros deben ser homgéneos, es decir, todos los datos de una Serie deben ser del mismo tipo.  
  
De ésta forma instanciamos una Series:

In [2]:
s = pd.Series(dtype=int)

In [3]:
s

Series([], dtype: int64)

Nuestra Series está vacía. Lo único que hicimos fue pasarle como argumento **int** al parámetro **dtype**; el tipo de dato que queremos que maneje dicha Series. Pero... ¿Por qué nuestra instancia dice que es de tipo **int64**. si le pasamos un tipo **int**? Recordemos que Pandas está contruido sobre Numpy, por ello, los tipos de datos que usan las **Series** y los **DataFrames** son los *data types* o **dtypes** que provee Numpy.  
  
También podemos específicar el tipo de dato *dtype* como **'int64'** (con comillas simples o dobles).

In [4]:
s = pd.Series(dtype='int64')

In [5]:
s

Series([], dtype: int64)

Así pasemos como argumento **int** o **'int64'**, **pd.Series()** lo interpretará como un *dtype* int de 64 bits. Ésto es igual para el tipo de dato **float**, será interpretado como un *dtype* float de 64 bits.  
  
Para las cadenas de carácteres, el tipo de dato *dtype* es **object**, a diferencia de que en Python nativo es **str**. Object puede ser, también, cualquier tipo de objeto Python; esto no es para nada recomendable, pues puede afectar el funcionamiento de Pandas.

In [6]:
s = pd.Series(dtype='object')

In [7]:
s

Series([], dtype: object)

### Crear Series con estructuras de datos nativas

Ya vimos como instanciar Series. Ahora veremos como instanciar Series con datos a través de estructuras de datos nativas de Python.

- Con listas

In [8]:
nombres = ['Paquito', 'Pablito', 'Menganito', 'Lucía', 'Laura']

In [9]:
s = pd.Series(nombres)

In [10]:
s

0      Paquito
1      Pablito
2    Menganito
3        Lucía
4        Laura
dtype: object

pd.Series() contiene varios parametros, uno de ellos bastante útil es **index** el cual recibe como argumento una lista con los indices para cada entrada de la Serie (una entrada es cualquier dato dentro de una Serie o un DataFrame.

In [11]:
indices = [10, 9, 8, 7, 6]

In [12]:
indices

[10, 9, 8, 7, 6]

In [13]:
s = pd.Series(nombres, index=indices)

In [14]:
s

10      Paquito
9       Pablito
8     Menganito
7         Lucía
6         Laura
dtype: object

Los indices no pueden ser solamente numéricos, tambié pueden ser carácteres. Veamos:

In [15]:
indices = ['A', 'B', 'C', 'D', 'E']

In [16]:
s = pd.Series(nombres, index=indices)

In [17]:
s

A      Paquito
B      Pablito
C    Menganito
D        Lucía
E        Laura
dtype: object

- Con diccionarios

In [18]:
d = {
    'A': 'Paquito',
    'B': 'Pablito',
    'C': 'Menganito',
    'D': 'Lucía',
    'E': 'Laura'
}

In [19]:
s = pd.Series(d)

In [20]:
s

A      Paquito
B      Pablito
C    Menganito
D        Lucía
E        Laura
dtype: object

## Selección de datos en Series

Al igual que en Python nativo, para acceder a los elementos de una Series usamos el nombre de la estructura, seguido de los corchetes **[ ]** y dentro de ellos el ídentificador del elemento que queremos obtener.

In [21]:
s['C']

'Menganito'

Los índices pueden ser de cualquier tipo de dato, siempre y cuando éstos sean homogéneos.

In [22]:
indices = [i for i in range(0, 10, 2)]

In [23]:
s.index = indices

**index** es un miembro del objeto Series, y por ende podemos acceder a el en cualquier momento y poder modificarlo como lo acabamos de hacer.

In [24]:
s

0      Paquito
2      Pablito
4    Menganito
6        Lucía
8        Laura
dtype: object

In [25]:
s[4]

'Menganito'

Podemos ver que una Serie tiene una gran similitud con un diccionario de Python, ¡Pero es más genial qué eso!