# Pandas I

## Index

#### Documentación 
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.html

Una instancia de `Index` puede pensarse como un _array inmutable_  o como un conjunto (set) ordenado.

Los `DataFrames` tienen asociadas dos instancias de la clase `Index`, uno describe a las filas y el otro describe a las columnas. 

Para acceder a la instacia de `Index` asociada a las filas de un DataFrame usamos `df.index` y para la instancia asociada a las columnas usamos `df.columns`.


<a id="section_index_array"></a> 
### `Index` como una array inmutable

¿Qué significa que sea inmutable? 

Un objeto inmutable es aquel cuyo estado (valor de cada uno de sus atributos) no puede ser modificado una vez creado.

¿Y qué pasa si intentamos modificarlo? Intentemoslo

In [5]:
import pandas as pd
ind = pd.Index([2, 3, 5, 7, 11])
ind

Int64Index([2, 3, 5, 7, 11], dtype='int64')

In [6]:
#ind[1] = 0

Podemos indexar y hacer slicing de forma similar a un array


In [7]:
ind[1]

3

In [8]:
ind[::2]

Int64Index([2, 5, 11], dtype='int64')

Las instancias de Index tienen atributos similares a los arrays de Numpy:

In [9]:
print(ind.size, ind.shape, ind.ndim, ind.dtype)

5 (5,) 1 int64


<a id="section_index_set"></a> 
### `Index` como un set ordenado
[volver a TOC](#section_toc)

Podemos utilizar operaciones sobre conjuntos con las instancias de `Index` siguiendo las convenciones de Python

In [10]:
indA = pd.Index([1, 3, 5, 7, 9])
indB = pd.Index([2, 3, 5, 7, 11])

#### intersection

dados dos conjuntos A y B, su intersección es otro conjunto que tiene aquellos elementos que pertenecen a A y que pertenecen a B

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.intersection.html

In [11]:
indA & indB  

Int64Index([3, 5, 7], dtype='int64')

#### union

dados dos conjuntos A y B, su unión es otro conjunto que tiene todos los elementos que pertencen a A más todos los elementos que pertencen a B

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.union.html

In [12]:
indA | indB  

Int64Index([1, 2, 3, 5, 7, 9, 11], dtype='int64')

#### symmetric difference

dados dos conjuntos A y B, la diferencia simétrica es otro conjunto cuyos elementos son aquellos que pertenecen a alguno de los conjuntos iniciales, sin pertenecer a ambos a la vez

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.symmetric_difference.html

In [13]:
indA ^ indB  

Int64Index([1, 2, 9, 11], dtype='int64')

#### difference

dados dos conjuntos A y B, la diferencia es otro conjunto con los elementos del primer conjunto sin los elementos del segundo conjunto.

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Index.difference.html

In [14]:
indA.difference(indB) # indA - indB

Int64Index([1, 9], dtype='int64')

<a id="section_constructor"></a> 
## Constructor
[volver a TOC](#section_toc)


In [15]:
ind = pd.Index([2, 3, 5, 7, 11])
ind

Int64Index([2, 3, 5, 7, 11], dtype='int64')