[![imagenes/pythonista.png](imagenes/pythonista.png)](https://pythonista.io)

# Operaciones de adición.

*Pandas* permite realizar operaciones que permiten añadir columnas y/o renglones a dataframes existentes.

Este capítulo explorará:

* El método ```append()``` de los dataframes de *Pandas*.
* El método ```join()```  de los dataframes de *Pandas*.
* La función ```pd.concat()```.

In [None]:
import pandas as pd
import numpy as np

## El método ```pd.DataFrame.append()```.

El método ```pd.DataFrame.append()``` regresa un nuevo dataframe al cual se le ha añadido en el eje ```1``` (columnas) el contenido de una estructura compatibles. 

```
<dataframe>.append(<objeto>)
```

Donde:

* ```<dataframe>``` es un dataframe de *Pandas*.
* ```<objeto>``` es un dataframe, objeto tipo ```dict``` u otro objeto compatible que puede ser transformado en un dataframe.

Este método procurará hacer que los índices y coluimnas compartidas entre el arreglo y el objeto ingresado como argumento se compaginen. En caso de que los índices y/o columnas sean distintos, los elementos faltantes serán sustituidos por ```np.NaN```.

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html

**Ejemplos:**

* La siguiente celda creará al dataframe ```marco_1``` con la siguiente estructura.
    * Contendrá las columnas ```'Centro'```, ```'Sur'``` y ```'Oriente'```.
    * Contendrá los índices ```'lunes'```, ```'martes'``` y ```'miércoles'```.

In [None]:
indice_1 = ("lunes", "martes", "miércoles")
marco_1 = pd.DataFrame({'Centro':[1520, 
                                 1640, 
                                 1043], 
                       'Sur':[1422, 
                              1673, 
                              1534],
                      'Oriente':[1021,
                                1073,
                                1100]},
                      index=indice_1)

In [None]:
marco_1

* La siguiente celda creará al dataframe ```marco_2``` con la siguiente estructura.
    * Contendrá las columnas ```'Centro'```, ```'Sur'``` y ```'Oriente'```.
    * Contendrá los índices ```'jueves'```, ```'viernes'``` y ```'sábado'```.

In [None]:
indice_2 = ("jueves", "viernes", "sábado")
marco_2 = pd.DataFrame({'Centro':[1321, 
                                 1459, 
                                 1875], 
                       'Sur':[1622, 
                              1841, 
                              1920],
                      'Oriente':[1500,
                                1432,
                                1491]},
                      index=indice_2)

In [None]:
marco_2

* La siguiente celda regresará un dataframe usando el método ```marco_1.append()``` e ingresando ```marco_2``` como argumento. Dicho dataframe tendrá la siguiente estructura:

    * Contendrá las columnas ```'Centro'```, ```'Sur'``` y ```'Oriente'```.
    * Contendrá los índices ```lunes```, ```martes```, ```miércoles```, ```'jueves'```, ```'viernes'``` y ```'sábado'```.

In [None]:
marco_1.append(marco_2)

* La siguiente celda creará al dataframe ```marco_3``` con la siguiente estructura.
    * Contendrá las columnas ```'Centro'```, ```'Matriz'```.
    * Contendrá el índice ```'domingo'```.

In [None]:
marco_3 = pd.DataFrame({'Centro':[2210],
                        'Matriz':[3120]},
                      index=['Domingo'])

In [None]:
marco_3

* La siguiente celda regresará un dataframe a partir del método ```marco_1.append(marco_2).append()```, ingresando ```marco_3``` como argumento. Dicho dataframe tendrá la siguiente estructura:

    * Contendrá las columnas ```'Centro'```, ```'Sur'```, ```'Oriente'``` y ```'Matriz'```.
    * Contendrá los índices ```lunes```, ```martes```, ```miércoles```, ```'jueves'```, ```'viernes'```, ```'sábado'``` y  ```Domingo```.
    * Aquellos elementos que no correspondan serán sutituidos por ```np.NaN```.

In [None]:
marco_1.append(marco_2).append(marco_3)

## El método ```pd.DataFrame.join()```.

El método ```pd.DataFrame.join()``` regresa un nuevo dataframe al cual se le ha añadido el contenido de otro dataframe, pero no los mezcla, sino que crea un índice izquierdo y otro derecho. El modo en el que se añade  dependiendo de paramétos adicionales que se ingresen.

```
<dataframe 1>.join(<dataframe 2>, lsuffix=<izquierdo>, rsuffix=<derecho>, how=<forma de unión>)
```
    
Donde:

* ```<dataframe 1>``` y ```<dataframe 2>``` son dataframes de *Pandas*.
* ```<izquierdo>``` es un objeto de tipo ```str``` que corresponderá al elemento de la izquierda.
* ```<derecho>``` es un objeto de tipo ```str``` que corresponderá al elemento de la derecha.
* ```<forma de unión>``` e sla forma en la que se combinarán los elementos del dataframe resultante.

Este método procurará hacer que los índices y coluimnas compartidas entre el arreglo y el objeto ingresado como argumento se compaginen. En caso de que los índices y/o columnas sean distintos, los elementos faltantes serán sustituidos por ```np.NaN```.

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.join.html

**Ejemplo:**

* La siguiente celda creará al dataframe ```region_1``` con la siguiente estructura.
    * Contendrá la columna ```'animal'```.
    * Contendrá el índice con identificador ```'poblacion'``` que a su vez contiene los índices ```'zorro'```, ```'conejo'```, ```liebre``` y ```'halcón'```.

In [None]:
region_1 = pd.DataFrame({'animal':['zorro', 
                     'conejo', 
                     'liebre', 
                     'halcón'],
          'población':[12,
                      436,
                      315,
                      7]}).set_index('animal')

In [None]:
region_1

* La siguiente celda creará al dataframe ```region_2``` con la siguiente estructura.
    * Contendrá la columna ```'animal'```.
    * Contendrá el índice con identificador ```'poblacion'``` que a su vez contiene los índices ```'conejo'```, ```'jabalí'```, ```venado```, ```'jaguar'```, ```'águila``` y ```'halcón'```.

In [None]:
region_2 = pd.DataFrame({'animal':['conejo',
                                  'jabalí',
                                  'venado',
                                  'jaguar',
                                  'águila',
                                  'halcón'],
                        'población':[2015,
                                     450,
                                     56,
                                     2,
                                     30,
                                     25]}).set_index('animal')

In [None]:
region_2

### Argumentos para el parámetro ```how```.

* ```'left'``` toma como referencia a los índice del dataframe al que pertenece el método. Si el dataframe que se ingresa como argumento tiene índices con el mismo nombre, los tomará y los alineará.
* ```'right'``` va a tomar como referencia al dataframe de la derecha y va a ajustar el tamaño al de dicho dataframe a sus índices.
* ```'inner'``` toma como referencia únicamente a los índices compartidos entre los dataframes.
* ```'outer'``` toma como referencia a todos los índices de los dataframes.

**Ejemplos:**

In [None]:
region_1.join(region_2,
              lsuffix=' region 1',
              rsuffix=' region 2')

In [None]:
region_1.join(region_2,
              lsuffix=' region 1',
              rsuffix=' region 2',
              how='left')

In [None]:
region_1.join(region_2,
              lsuffix=' region 1',
              rsuffix=' region 2',
              how='right')

In [None]:
region_1.join(region_2,
              lsuffix=' region 1',
              rsuffix=' region 2',
              how='inner')

In [None]:
region_1.join(region_2,
              lsuffix=' region 1',
              rsuffix=' region 2',
              how='outer')

## La función ```pd.concat()```.

* ```axis```
* ```sort```
* ```ignore_index```
* ```join```
* ```keys```

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html

In [None]:
marco_1

In [None]:
marco_2

In [None]:
pd.concat([marco_1, marco_2])

In [None]:
 pd.concat([marco_1, marco_2], axis=1)

In [None]:
 pd.concat([marco_1, marco_2], axis=1, sort=True)

In [None]:
 pd.concat([marco_1, marco_2], axis=1, sort=False)['Centro']

In [None]:
 pd.concat([marco_1, marco_2], axis=1, sort=False)['Centro']

In [None]:
semanales = pd.concat([marco_1, marco_2], axis=1, keys=['semana 1', 'semana 2'],
                      sort=False)

In [None]:
semanales

In [None]:
semanales['semana 1']

In [None]:
semanales['semana 1']['Centro']

In [None]:
semanales['semana 2']['Centro']

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2020.</p>