# Operaciones básicas

Trataremos aquí las operaciones más básicas que se pueden realizar sobre las estructuras de datos de pandas. Se separan en un notebook aparte porque estas operaciones tienen un funcionamiento prácticamente idéntico en Series y DataFrames. En caso de que esto no sea así en algún caso concreto se indicará explícitamente.

In [1]:
import numpy as np
import pandas as pd

## Tratamiento de Series y DataFrames como diccionarios

Dado que internamente tanto las Series como los DataFrames pueden verse como diccionarios, podemos apilcar sobre los mismos cualquier funcionalidad que aplicaríamos sobre diccionarios básicos del core de Python.<br/>
<b>IMPORTANTE:</b> Hay que tener en cuenta que en DataFrames el diccionario es un diccionario de "columnas".

In [13]:
serie = pd.Series([1,2,3,4], index=['a','b','c','d'])

dataframe = pd.DataFrame({'var1':serie,'var2':serie})

print('datos')
print(serie,'\n')
print(dataframe)

datos
a    1
b    2
c    3
d    4
dtype: int64 

   var1  var2
a     1     1
b     2     2
c     3     3
d     4     4


#### Indexación por clave

In [16]:
print("Indexación por clave")
print(serie['a'],'\n')
print(dataframe['var2'])

Indexación por clave
1 

a    1
b    2
c    3
d    4
Name: var2, dtype: int64


#### Comprobación de la existencia de una clave

In [21]:
print("Comprobación de la existencia de una clave")
print('b' in serie, '\n')
print('b' in dataframe, '\n')
print('var1' in serie, '\n')

Comprobación de la existencia de una clave
True 

False 

False 



#### Adición de elementos

<b>IMPORTANTE:</b> Al añadir columnas a un DataFrame, el tamaño del vector añadido deberá coincidir con el del DataFrame original. En caso contrario se recibirá un error.

In [28]:
print("Adición de elementos")
serie['e']=5
dataframe['var3']=[5,6,7,8]

print(serie,'\n')
print(dataframe)

Adición de elementos
a    1
b    2
c    3
d    4
e    5
dtype: int64 

   var1  var2  var3
a     1     1     5
b     2     2     6
c     3     3     7
d     4     4     8


#### Eliminación de elementos

In [29]:
print("Eliminación de elementos")
del serie['e']
del dataframe['var3']

print(serie,'\n')
print(dataframe)

Eliminación de elementos
a    1
b    2
c    3
d    4
dtype: int64 

   var1  var2
a     1     1
b     2     2
c     3     3
d     4     4


## Tratamiento de Series y DataFrames como ndarrays

Dado que, internamente, cualquier estructura de pandas está implementada sobre ndarrays de NumPy, es posible realizar sobre Series y DataFrames todas las operaciones que se pueden realizar sobre un ndarrays.<br/>
<b>IMPORTANTE:</b> Dado que un ndarray no puede mezclar elementos de diferentes tipos y un DataFrame sí, algunas de las operaciones sobre DataFrames estarán supeditadas a que todas sus columnas tengan el mismo tipo.