## Reindexación de un DataFrame

- Pueden existir ocasiones en las que se desee modificar el índice de una estructura tras haberla creado. 

- En este caso no se trata de cambiar los índices asignados sino de reordenaciones, eliminación o adición de índices. 

- Para ello, pandas nos ofrece el método <b>reindex</b>. 

- Lo que obtendremos será una nueva estructura (copia) con el índice seleccionado. <br/><br/>


En el caso de que con el nuevo índice se generen nuevos elementos, estos  se rellenarán a NaN. Para evitarlo, disponemos de los siguientes parámetros:<br/>
<ul>
<li><b>fill_value:</b> Relleno a un valor fijo establecido.</li>
<li><b>method:</b> Relleno según un método definido.
<ul>
<li>ffill: Relleno mediante la observación de los últimos valores rellenos.</li>
<li>bfill: Relleno mediante la observación de los próximos valores rellenos.</li>
<li>nearest: Relleno mediante la observación del valor más próximo.</li>
</ul>
</li>
</ul>

In [1]:
import pandas as pd
import numpy as np

In [2]:
serie1 = pd.Series([0.1, 0.2, 0.3, 0.4, 0.5], index=[2, 3, 5, 1, 4])
serie1

2    0.1
3    0.2
5    0.3
1    0.4
4    0.5
dtype: float64

Modificamos el índice y lo asignamos a una nueva variable. OJO, como no tenemos  valor pare el índice 6, se rellena con NAN

In [3]:
serie2 = serie1.reindex([1, 2, 3, 4, 5, 6])
serie2

1    0.4
2    0.1
3    0.2
4    0.5
5    0.3
6    NaN
dtype: float64

Al hacer reindex, me devuelve una copia. Si modifico la copia, no modifico el original

In [4]:
serie2.loc[2] = 200
print('Serie2:\n', serie2)
print('Serie1:\n', serie1)

Serie2:
 1      0.4
2    200.0
3      0.2
4      0.5
5      0.3
6      NaN
dtype: float64
Serie1:
 2    0.1
3    0.2
5    0.3
1    0.4
4    0.5
dtype: float64


¿Pasa lo mismo tras una asignación normal?

In [5]:
serie3 = serie1
serie3.loc[2]=300
print('Serie3:\n', serie3)
print('Serie1:\n', serie1) 

Serie3:
 2    300.0
3      0.2
5      0.3
1      0.4
4      0.5
dtype: float64
Serie1:
 2    300.0
3      0.2
5      0.3
1      0.4
4      0.5
dtype: float64


### Métodos de relleno


* __fill_value__: Relleno a un valor fijo establecido.

* __method__: Relleno según un método definido.

    - __ffill__: Relleno mediante la observación de los últimos valores rellenos.

    - __bfill__: Relleno mediante la observación de los próximos valores rellenos.
nearest: Relleno mediante la observación del valor más próximo.


In [6]:
serie1 = pd.Series([0.0, 0.1, 0.2, 0.3, 0.4], index=range(5))
serie1

0    0.0
1    0.1
2    0.2
3    0.3
4    0.4
dtype: float64

In [7]:
serie1.reindex(range(7))

0    0.0
1    0.1
2    0.2
3    0.3
4    0.4
5    NaN
6    NaN
dtype: float64

In [8]:
# ffill

serie1.reindex(range(7), method='ffill')

0    0.0
1    0.1
2    0.2
3    0.3
4    0.4
5    0.4
6    0.4
dtype: float64

In [9]:
# bfill

serie1.reindex(range(7), method='bfill')

0    0.0
1    0.1
2    0.2
3    0.3
4    0.4
5    NaN
6    NaN
dtype: float64

In [10]:
# nearest

serie1.reindex(range(7), method='nearest')

0    0.0
1    0.1
2    0.2
3    0.3
4    0.4
5    0.4
6    0.4
dtype: float64

In [11]:
serie4 = pd.Series([0.0, 0.1, 0.6, 0.7], index=[0, 1, 10, 20])
serie4

0     0.0
1     0.1
10    0.6
20    0.7
dtype: float64

In [46]:
serie4.reindex([0, 1, 3, 10, 20], method='bfill')

0     0.0
1     0.1
3     0.6
10    0.6
20    0.7
dtype: float64

In [49]:
# ffill

serie4.reindex([0, 1, 3, 10, 20], method='ffill')

0     0.0
1     0.1
3     0.1
10    0.6
20    0.7
dtype: float64

In [50]:
# ffill

serie4.reindex([0, 1, 3, 10, 20], method='nearest')

0     0.0
1     0.1
3     0.1
10    0.6
20    0.7
dtype: float64