# Intro a los Objetos Pandas
pg 98

Los principales objetos de estructura de datos son: **Series, DataFrame e Index**

### Series

Es un array de una dimension con datos indexados.
Una serie es una secuencia de indices y de valores.

In [2]:
import pandas as pd

In [2]:
data = pd.Series([0.25, 0.5, 0.75, 1.0])

In [5]:
data

0    0.25
1    0.50
2    0.75
3    1.00
dtype: float64

In [3]:
data.values

array([0.25, 0.5 , 0.75, 1.  ])

In [4]:
data.index

RangeIndex(start=0, stop=4, step=1)

Las series tienen un indice explicito asociado a los valores. No tiene que ser un int puede ser str.

In [6]:
data = pd.Series([0.25, 0.5, 0.75, 1.0], index=['a', 'b', 'c', 'd'])

In [7]:
data

a    0.25
b    0.50
c    0.75
d    1.00
dtype: float64

Se puede entender como si fuese un diccionario especializado. Es más eficiente y soporta slicing.

In [8]:
data['c':'d']

c    0.75
d    1.00
dtype: float64

La manera de construirlos es:


```python
pd.Series(data, index=index)
```

Donde data puede ser una lista, un escalar, un diccionario. Si es diccionario el indice serán las keys del diccionario.
En index se pude seleccionar explicitamente que keys queremos.

In [9]:
pd.Series({2:'a', 1:'b', 3:'c'}, index=[3, 2])

3    c
2    a
dtype: object

### DataFrame

Si la serie es como un array de una dimensión con indices flexibles, el DataFrame es un analogo al array de dos dimensiones. Con indices flexibles de linea y de nombres de columnas.

```python
pd.Dataframe(data, columns=[])
```

Se puede construir un DF de diversas formas. 
* Desde un objeto serie.
* Una lista de diccionarios.
* Un diccionario de series.
* Un array de np de 2 dimensiones

### Index

El index es un objeto interesante en si mismo. Se puede considerar como un array **inmutable**.

In [3]:
indice = pd.Index([2,3,5,7,11])

In [4]:
indice

Int64Index([2, 3, 5, 7, 11], dtype='int64')

Tiene atributos familiares a las arrays de np.

In [5]:
print(indice.size, indice.shape, indice.ndim, indice.dtype)

5 (5,) 1 int64


In [6]:
index = pd.Index([1,3,5,7,9])

In [7]:
indice & index # interseccion

Int64Index([3, 5, 7], dtype='int64')

In [8]:
indice | index # Union

Int64Index([1, 2, 3, 5, 7, 9, 11], dtype='int64')

In [9]:
indice ^ index # diff

Int64Index([1, 2, 9, 11], dtype='int64')