# PREWORK de APIs, automatización y concatenación de DataFrames

## Introducción
En este Prework vamos a aprender a adquirir datos de una nueva fuente: las APIs. 

También vamos a aprovechar esto para aprender a automatizar procesos. Vamos a aprender un poquito sobre un par de estructuras que podemos usar en Python para hacer automatizaciones: for loops y excepciones.

Para terminar vamos a realizar un exploración acerca de una de las maneras que tenemos de unir DataFrames: la concatenación.


## Objetivos
- Hacer peticiones a APIs.
- Automatizar peticiones a APIs utilizando For loops y Excepciones.
- Usar concat para unir múltiples Series.
- Indexar usando Multiíndices en filas
- Usar concat para unir múltiples DataFrames.
- Guardar datasets localmente en formato .csv.

### APIs

Una API es una interfaz para comunicarnos con un software que está corriendo en algún servidor remoto. Normalmente, una API se usa para obtener datos acerca de algún tema en específico. Diferentes compañías, instituciones, universidades, etc, tienen APIs para que nosotros (programadores/desarrolladores/científicos de datos) podamos construir programas usando los datos que ofrecen. Hay una infinidad de APIs que ofrecen una gran diversidad de información.

Hoy vamos a aprender a comunicarnos con una para pedir datos y vamos a aprender a automatizar nuestras peticiones. Pero primero, un poquito de teoría.

#### Peticiones HTTP
Una peticiones HTTP es una solicitud de información de un cliente a un servidor usando el protocolo HTTP. El protocolo HTTP es simplemente una serie de reglas que nos dicen cuál es la manera apropiada de comunicarnos con el servidor.

#### Endpoints y URLs
Los URLs son las direcciones a donde pedimos información. Una API tiene normalmente una documentación donde te indica cuáles son los URLs disponibles. Cada URL apunta hacia información o recursos distintos. Usamos algún tipo de software (Postman o Request) para "llamar" dicho endpoint (URL) y aplicar una acción.

#### Verbos HTTP
Cuando realizamos una petición HTTP usamos 1 tipo de "verbo", que indica la acción que queremos realizar. Hay muchos verbos, pero 5 son los más importantes:

1. GET: Lo usamos cuando queremos pedir información
2. POST: Lo usamos cuando queremos enviar información para crear algo (una cuenta de usuario, por ejemplo)
3. PUT: Lo usamos cuando queremos sustituir algún dato por otro
4. PATCH: Lo usamos cuando queremos modificar algún dato
5. DELETE: Lo usamos cuando queremos eliminar algún dato

Para los propósitos de la adquisición de datos, el verbo que más nos interesa es el verbo GET (si quieres saber más sobre los demás verbos, puedes ir aquí), así que usaremos solamente ése.

#### Parámetros

Cuando hacemos una solicitud HTTP, normalmente vamos a tener que enviar parámetros para delimitar nuestras búsquedas. Los parámetros funcionan de manera similar a los parámetros de las funciones, tienen un nombre y le pasamos un valor como argumento. Los parámetros que enviemos determinarán qué datos vamos a obtener de regreso y en qué forma.

#### Respuestas
Las respuestas son los datos que recibimos de una API. Normalmente los datos que se transifieren a través de una API están en formato JSON. Las respuestas contienen los datos que solicitamos, algo "metadata" (datos acerca de los datos) y un estatus de la petición.

#### Estatus de la petición
Cuando recibimos una respuesta, vamos también a recibir un código de estatus que sirve para identificar cuál fue el resultado de nuestra solicitud. También hay muchísimos estatus distintos, pero los más importantes son los siguientes:

1. 200: Todo salió bien.
1. 201: Los recursos que querías crear fueron creados con éxito
1. 404: El recurso no fue encontrado en ese URL
1. 400: Los datos que enviaste son incorrectos
1. 500: Hubo un error interno en el servidor

#### Librería Requests

¡Estamos listos para hacer nuestras peticiones HTTP! Antes que nada, hay que instalar la librería de Python que usaremos para hacer nuestras peticiones: requests. Google Colab no incluye esta librería y por lo tanto es necesario instalarla manualmente

En una celda de tu JN escribe el comando !pip install requests y corre la celda para instalar la librería. Ahora se ha instalado esta librería en esta celda. Cada vez que quieras usar esta librería en un JN distinto tendrás que volver a realizar la instalación, puesto que todo se resetea.

Entonces, vamos a importar requests en un Jupyter Notebooks:

In [1]:
import requests

Vamos a obtener datos de fotos

In [2]:
url = 'https://api.nasa.gov/neo/rest/v1/feed'
api_key={'api_key':'2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d'}

Vamos a realizar una petición GET usando requests a ver qué pasa:

In [4]:
response = requests.get(url, params=api_key)

Ok... ¿Y ahora qué?

Un primer paso sería revisar el estatus de la llamada:



In [4]:
response.status_code

200

Podemos ver un poco más de información pidiendo el cuerpo de la respuest en formato json:

In [5]:
data = response.json()
data

{'links': {'next': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-23&end_date=2024-06-30&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d',
  'previous': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-09&end_date=2024-06-16&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d',
  'self': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-16&end_date=2024-06-23&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d'},
 'element_count': 102,
 'near_earth_objects': {'2024-06-19': [{'links': {'self': 'http://api.nasa.gov/neo/rest/v1/neo/2137158?api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d'},
    'id': '2137158',
    'neo_reference_id': '2137158',
    'name': '137158 (1999 FB)',
    'nasa_jpl_url': 'https://ssd.jpl.nasa.gov/tools/sbdb_lookup.html#/?sstr=2137158',
    'absolute_magnitude_h': 17.92,
    'estimated_diameter': {'kilometers': {'estimated_diameter_min': 0.6927156136,
      'estimated_diameter_max': 1.5489592011},
  

Para entender mejor este json, vamos a revisar las keys primero:

In [6]:
data.keys()

dict_keys(['links', 'element_count', 'near_earth_objects'])

In [7]:
data['links']

{'next': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-23&end_date=2024-06-30&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d',
 'previous': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-09&end_date=2024-06-16&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d',
 'self': 'http://api.nasa.gov/neo/rest/v1/feed?start_date=2024-06-16&end_date=2024-06-23&detailed=false&api_key=2XGCNsKXdktTyQ3CV9rpVD233gV1xPhghaktuu0d'}

Esta metadata nos dice qué link es el que solicitamos (self) y el siguiente link que tendríamos que usar para pedir los datos posteriores (next). Esto está buenísimo porque nos permite automatizar nuestras llamadas. Al siempre saber cuál es el link que sigue, podemos extraerlo de ahí y realizar una nueva llamada.

In [8]:
data['element_count']

102

In [9]:
data['near_earth_objects'].keys()

dict_keys(['2024-06-19', '2024-06-18', '2024-06-17', '2024-06-23', '2024-06-22', '2024-06-21', '2024-06-20', '2024-06-16'])

¡Estos son nuestros datos! Podemos ver que tenemos una lista con diccionarios dentro. Esto es algo que podemos leer directamente en pandas. Vamos a hacer eso. Debido a que el json que tenemos tiene muchos datos "anidados" (diccionarios dentro de diccionarios dentro de diccionarios), necesitamos primero "normalizar" nuestros datos. Esto básicamente significa extraer los datos anidados para convertirlos en su propia columna (puedes aprender más sobre este proceso aquí). Simplemente hay que usar el siguiente código:

In [10]:
import pandas as pd

In [11]:
normalized = pd.json_normalize(data['near_earth_objects']['2024-09-10'])

KeyError: '2024-09-10'

In [None]:
type(normalized)

pandas.core.frame.DataFrame

In [None]:
df = pd.DataFrame(normalized)

In [None]:
df.head()

Unnamed: 0,id,neo_reference_id,name,nasa_jpl_url,absolute_magnitude_h,is_potentially_hazardous_asteroid,close_approach_data,is_sentry_object,links.self,estimated_diameter.kilometers.estimated_diameter_min,estimated_diameter.kilometers.estimated_diameter_max,estimated_diameter.meters.estimated_diameter_min,estimated_diameter.meters.estimated_diameter_max,estimated_diameter.miles.estimated_diameter_min,estimated_diameter.miles.estimated_diameter_max,estimated_diameter.feet.estimated_diameter_min,estimated_diameter.feet.estimated_diameter_max
0,3304382,3304382,(2005 WR2),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,19.52,False,"[{'close_approach_date': '2024-09-10', 'close_...",False,http://api.nasa.gov/neo/rest/v1/neo/3304382?ap...,0.331555,0.741378,331.554538,741.378485,0.206018,0.460671,1087.777391,2432.34419
1,3426807,3426807,(2008 RQ24),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,20.8,False,"[{'close_approach_date': '2024-09-10', 'close_...",False,http://api.nasa.gov/neo/rest/v1/neo/3426807?ap...,0.183889,0.411188,183.888672,411.187571,0.114263,0.2555,603.309311,1349.040631
2,3616348,3616348,(2012 VH5),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,22.49,False,"[{'close_approach_date': '2024-09-10', 'close_...",False,http://api.nasa.gov/neo/rest/v1/neo/3616348?ap...,0.084441,0.188817,84.441313,188.816516,0.052469,0.117325,277.038437,619.476777
3,3648844,3648844,(2013 TR4),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,23.24,False,"[{'close_approach_date': '2024-09-10', 'close_...",False,http://api.nasa.gov/neo/rest/v1/neo/3648844?ap...,0.05978,0.133672,59.779871,133.671856,0.037145,0.08306,196.128193,438.555973
4,3826885,3826885,(2018 QR),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,24.7,False,"[{'close_approach_date': '2024-09-10', 'close_...",False,http://api.nasa.gov/neo/rest/v1/neo/3826885?ap...,0.030518,0.06824,30.517923,68.240151,0.018963,0.042402,100.124423,223.885017


In [None]:
df.columns

Index(['id', 'neo_reference_id', 'name', 'nasa_jpl_url',
       'absolute_magnitude_h', 'is_potentially_hazardous_asteroid',
       'close_approach_data', 'is_sentry_object', 'links.self',
       'estimated_diameter.kilometers.estimated_diameter_min',
       'estimated_diameter.kilometers.estimated_diameter_max',
       'estimated_diameter.meters.estimated_diameter_min',
       'estimated_diameter.meters.estimated_diameter_max',
       'estimated_diameter.miles.estimated_diameter_min',
       'estimated_diameter.miles.estimated_diameter_max',
       'estimated_diameter.feet.estimated_diameter_min',
       'estimated_diameter.feet.estimated_diameter_max'],
      dtype='object')

In [None]:
df['close_approach_data']

0     [{'close_approach_date': '2024-09-10', 'close_...
1     [{'close_approach_date': '2024-09-10', 'close_...
2     [{'close_approach_date': '2024-09-10', 'close_...
3     [{'close_approach_date': '2024-09-10', 'close_...
4     [{'close_approach_date': '2024-09-10', 'close_...
5     [{'close_approach_date': '2024-09-10', 'close_...
6     [{'close_approach_date': '2024-09-10', 'close_...
7     [{'close_approach_date': '2024-09-10', 'close_...
8     [{'close_approach_date': '2024-09-10', 'close_...
9     [{'close_approach_date': '2024-09-10', 'close_...
10    [{'close_approach_date': '2024-09-10', 'close_...
11    [{'close_approach_date': '2024-09-10', 'close_...
12    [{'close_approach_date': '2024-09-10', 'close_...
Name: close_approach_data, dtype: object

In [None]:
df_lista_flat = df.explode('close_approach_data')

In [None]:
df_lista_flat

Unnamed: 0,id,neo_reference_id,name,nasa_jpl_url,absolute_magnitude_h,is_potentially_hazardous_asteroid,close_approach_data,is_sentry_object,links.self,estimated_diameter.kilometers.estimated_diameter_min,estimated_diameter.kilometers.estimated_diameter_max,estimated_diameter.meters.estimated_diameter_min,estimated_diameter.meters.estimated_diameter_max,estimated_diameter.miles.estimated_diameter_min,estimated_diameter.miles.estimated_diameter_max,estimated_diameter.feet.estimated_diameter_min,estimated_diameter.feet.estimated_diameter_max
0,3304382,3304382,(2005 WR2),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,19.52,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/3304382?ap...,0.331555,0.741378,331.554538,741.378485,0.206018,0.460671,1087.777391,2432.34419
1,3426807,3426807,(2008 RQ24),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,20.8,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/3426807?ap...,0.183889,0.411188,183.888672,411.187571,0.114263,0.2555,603.309311,1349.040631
2,3616348,3616348,(2012 VH5),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,22.49,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/3616348?ap...,0.084441,0.188817,84.441313,188.816516,0.052469,0.117325,277.038437,619.476777
3,3648844,3648844,(2013 TR4),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,23.24,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/3648844?ap...,0.05978,0.133672,59.779871,133.671856,0.037145,0.08306,196.128193,438.555973
4,3826885,3826885,(2018 QR),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,24.7,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/3826885?ap...,0.030518,0.06824,30.517923,68.240151,0.018963,0.042402,100.124423,223.885017
5,54016590,54016590,(2020 HP1),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,28.6,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/54016590?a...,0.005065,0.011325,5.064715,11.325046,0.003147,0.007037,16.616518,37.155664
6,54053850,54053850,(2020 PM7),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,22.31,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/54053850?a...,0.091739,0.205135,91.739206,205.135101,0.057004,0.127465,300.981656,673.015444
7,54194978,54194978,(2021 RU7),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,23.47,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/54194978?a...,0.053772,0.120238,53.77185,120.237511,0.033412,0.074712,176.416836,394.480037
8,54239834,54239834,(2022 BA1),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,22.58,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/54239834?a...,0.081013,0.181151,81.013049,181.150684,0.050339,0.112562,265.790851,594.326411
9,54293318,54293318,(2020 CO8),https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,28.0,False,"{'close_approach_date': '2024-09-10', 'close_a...",False,http://api.nasa.gov/neo/rest/v1/neo/54293318?a...,0.006677,0.014929,6.676594,14.929318,0.004149,0.009277,21.904837,48.980705


In [None]:
df_lista_flat = pd.json_normalize(df_lista_flat['close_approach_data'])

In [None]:
df_lista_flat

Unnamed: 0,close_approach_date,close_approach_date_full,epoch_date_close_approach,orbiting_body,relative_velocity.kilometers_per_second,relative_velocity.kilometers_per_hour,relative_velocity.miles_per_hour,miss_distance.astronomical,miss_distance.lunar,miss_distance.kilometers,miss_distance.miles
0,2024-09-10,2024-Sep-10 11:45,1725968700000,Earth,14.6351290871,52686.4647136903,32737.320255015,0.3201471511,124.5372417779,47893331.89112816,29759536.469104286
1,2024-09-10,2024-Sep-10 03:23,1725938580000,Earth,3.6435135721,13116.648859541,8150.1755094187,0.2460051145,95.6959895405,36801841.13830612,22867603.698469788
2,2024-09-10,2024-Sep-10 16:30,1725985800000,Earth,7.8735077501,28344.6279002435,17612.2494861263,0.3124953362,121.5606857818,46748636.68045389,29048255.847711977
3,2024-09-10,2024-Sep-10 00:30,1725928200000,Earth,9.1901151332,33084.4144796243,20557.3685415199,0.2288848305,89.0361990645,34240683.11811104,21276173.900300883
4,2024-09-10,2024-Sep-10 18:37,1725993420000,Earth,10.7313597,38632.8949200436,24004.9785129571,0.2945986168,114.5988619352,44071325.578226216,27384651.87112914
5,2024-09-10,2024-Sep-10 00:26,1725927960000,Earth,9.7341157063,35042.8165427157,21774.2434234446,0.2072319934,80.6132454326,31001464.808494058,19263416.97548368
6,2024-09-10,2024-Sep-10 00:16,1725927360000,Earth,10.3710086039,37335.6309741995,23198.909146163,0.0762722876,29.6699198764,11410171.764987413,7089951.969321806
7,2024-09-10,2024-Sep-10 20:52,1726001520000,Earth,11.658214134,41969.5708822506,26078.2591962518,0.2540391989,98.8212483721,38003723.051946335,23614418.48934381
8,2024-09-10,2024-Sep-10 13:13,1725973980000,Earth,24.9481370409,89813.293347231,55806.4877467836,0.3591632805,139.7145161145,53730061.74501254,33386312.224481583
9,2024-09-10,2024-Sep-10 19:39,1725997140000,Earth,9.0363532405,32530.8716658842,20213.4185637268,0.1064886516,41.4240854724,15930475.458532091,9898738.439331187


# Excepciones

Hay veces que algún error (una Exception) sucede durante la ejecución de nuestro programa, Python lo detecta y detiene el programa completo para evitar que el error cause problemas. Por ejemplo, aquí tenemos un error que sucede durante la lectura de una llave inexistente en un diccionario:

In [13]:
diccionario = {
    0:['a','b','c'],
    1:['d','e','f'],
    2:['g','h','i']
}

In [14]:
diccionario[3]

KeyError: 3

In [15]:
try:
    diccionario[3]
except:
    print("La llave no existe en el diccionario")

La llave no existe en el diccionario


# Concatenación de DataFrames

pandas ofrece varias maneras de unir DataFrames un solo DataFrame. Una de ellas es la función pd.concat. pd.concat te permite concatenar Series y DataFrames usando diferentes axis. Comencemos con las Series.

pd.concat con Series
Tenemos las siguientes dos Series:

In [37]:
serie_1 = pd.Series([1,2,3], index=['a','b', 'c'])
serie_2 = pd.Series([4,5,6], index=['d','f', 'g'])


In [38]:
serie_1

a    1
b    2
c    3
dtype: int64

In [39]:
serie_2

d    4
f    5
g    6
dtype: int64

Podemos unirlas de manera vertical llamando pd.concat con axis=0. Observa que tenemos que pasarle las dos Series dentro de una lista:

In [40]:
pd.concat([serie_1, serie_2], axis=0)
pd.concat([serie_1, serie_2], axis='index')

a    1
b    2
c    3
d    4
f    5
g    6
dtype: int64

Si queremos unirlas horizontalmente, podemos llamar la función usando axis=1:

In [41]:
pd.concat([serie_1, serie_2], axis=1)
pd.concat([serie_1, serie_2], axis="columns")

Unnamed: 0,0,1
a,1.0,
b,2.0,
c,3.0,
d,,4.0
f,,5.0
g,,6.0


Aquí hay dos cosas que observar:

1. Usé el argumento keys para ponerle nombre a las columnas (ya que las Series originales no tenían nombres).
2. Debido a que las Series tienen diferentes índices, la concatenación horizontal deja muchos valores vacíos. Esto se debe a que la serie_1 no tiene valores que correspondan a los índices 'd', 'f', y 'e'; mientras que la serie_2 no tiene valores que correspondan a los índices 'a', 'b', y 'c'.

Mira lo que pasa si concatenamos dos Series que compartan el mismo índice:

In [42]:
serie_3 = pd.Series([7,8,9], index=['a','b','c'])
serie_3

a    7
b    8
c    9
dtype: int64

In [25]:
serie_1

a    1
b    2
c    3
dtype: int64

In [43]:
pd.concat([serie_1,serie_3], axis=1, keys=['serie1', 'serie2'])

Unnamed: 0,serie1,serie2
a,1,7
b,2,8
c,3,9


Si concatenamos verticalmente dos Series que comparten el mismo índice, tenemos un pequeño problema:

In [44]:
pd.concat([serie_1,serie_3], axis=0)

a    1
b    2
c    3
a    7
b    8
c    9
dtype: int64

Como ves, el índice se repite. Hay veces que esto es justo lo que queremos, pero en este caso, no parece muy deseable. En este caso tenemos dos opciones.

1. Si no nos interesa mucho el índice actual, podemos resetearlo para obtener uno nuevo donde no haya repeticiones:

In [29]:
pd.concat([serie_1,serie_3], axis=0).reset_index(drop=True)

0    1
1    2
2    3
3    7
4    8
5    9
dtype: int64

2. En caso de que sí nos interese el índice, pero queramos poder diferenciar entre los índices que vienen de la serie_1 y los que vienen de la serie_3, podemos usar el argumento keys para agregar un segundo nivel en el índice:



In [30]:
pd.concat([serie_1,serie_3], axis=0, keys=['serie_1', 'serie_3'])

serie_1  a    1
         b    2
         c    3
serie_3  a    7
         b    8
         c    9
dtype: int64

¡¿Khá?! ¿Y eso qué es? ¿Un segundo nivel de índice? Pues sí, aunque no lo creas, podemos crear diferentes niveles de índices que nos ayudan a segmentar nuestros datos a más detalle. Existen los Multiíndices de filas y también de columnas. En este caso, tenemos uno de filas.

Pequeña digresión para hablar sobre Multíndices en Filas

Que no cunda el pánico. Si quisieras acceder a tus datos usando loc simplemente tendrías que hacer algo como esto:

In [31]:
concat_1 =pd.concat([serie_1,serie_3], axis=0, keys=['serie_1', 'serie_3'])

In [32]:
concat_1.loc['serie_1', 'b']

2

¿Ves? como primer argumento a nuestro loc, en vez de un solo valor, le pasamos una tupla de valores. Una tupla es eso que ves dentro de dos paréntesis (('serie_1', 'b')). Es una manera de contener dos o más valores. En este caso, nuestros dos valores son los dos niveles de nuestro índice que queremos acceder: primero serie_1 y después b. Si queremos acceder al índice b de la serie_3, haríamos lo siguiente:

In [47]:
concat_1.loc['serie_3', 'b']

8

Podríamos concatenar muchas Series con los mismos índices y mantenerlas segmentadas usando multiíndices:

In [58]:
serie_4 = pd.Series([10,11,12], index=['a','b','c'])
serie_5 = pd.Series([13,14,15], index=['a','b','c'])

concat_2 = pd.concat([serie_1,serie_3,serie_4, serie_5], axis=0,keys=['serie_1','serie_3', 'serie_4', 'serie_5'])

concat_2

serie_1  a     1
         b     2
         c     3
serie_3  a     7
         b     8
         c     9
serie_4  a    10
         b    11
         c    12
serie_5  a    13
         b    14
         c    15
dtype: int64

Lo más genial es que si accedemos a la nueva Serie usando sólo el primer nivel, obtenemos una de nuestras Series completa:

In [59]:
concat_2.loc['serie_4']

a    10
b    11
c    12
dtype: int64

Pero bueno, salgamos de nuestra pequeña digresión para hablar sobre concatenación de DataFrames.

pd.concat con DataFrames
La misma lógica aplica para la unión de DataFrames. Tenemos ahora dos DataFrames:

In [63]:
data_1 ={
    'column_1':[1,2,3],
    'column_2':[4,5,6]
}

df_1 =pd.DataFrame(data_1,  index=['a','b','c'])
df_1

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6


In [62]:
data_1 ={
    'column_1':[7,8,9],
    'column_2':[10,11,12]
}

df_2 =pd.DataFrame(data_1, index=['d','e','f'])
df_2

Unnamed: 0,column_1,column_2
d,7,10
e,8,11
f,9,12


Usamos axis=0 para concatenarlos verticalmente:

In [66]:
pd.concat([df_1,df_2], axis='index')

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6
d,7,10
e,8,11
f,9,12


Si usamos axis=1 de nuevo vamos a tener valores NaN porque los DataFrames no comparten índice:

In [67]:
pd.concat([df_1,df_2], axis='columns')

Unnamed: 0,column_1,column_2,column_1.1,column_2.1
a,1.0,4.0,,
b,2.0,5.0,,
c,3.0,6.0,,
d,,,7.0,10.0
e,,,8.0,11.0
f,,,9.0,12.0


Si los DataFrames comparten índice y queremos concatenarlos verticalmente, también podemos usar un multiíndice en las filas para diferenciarlos: