# Fusionar DataFrames con merge 1

Tienes dos DataFrames, `libros` y `autores`, que necesitas fusionar.

El objetivo es fusionar `libros` con `autores` para obtener un DataFrame que contenga toda la información disponible, asociando cada libro con su autor correspondiente. Debes nombrar el **DataFrame fusionado** como: `libros_autores`

Utiliza el método de fusión **adecuado** para asegurar que no se pierda ningún libro o autor, incluso si no hay una correspondencia directa entre ellos. El resultado debe tener **NaN** donde no haya información disponible.

In [1]:
import pandas as pd


libros: pd.DataFrame = pd.DataFrame({
    'ID': [1, 2, 3, 4],
    'titulo': ['El Quijote', 'La Odisea', 'Cien Años de Soledad', 'El Principito']
})

autores: pd.DataFrame = pd.DataFrame({
    'ID': [1, 2, 3, 5],
    'nombre': ['Miguel de Cervantes', 'Homero', 'Gabriel García Márquez', 'J.K. Rowling']
})

libros_autores: pd.DataFrame = pd.merge(libros, autores, on='ID', how='outer')
print(libros_autores)

   ID                titulo                  nombre
0   1            El Quijote     Miguel de Cervantes
1   2             La Odisea                  Homero
2   3  Cien Años de Soledad  Gabriel García Márquez
3   4         El Principito                     NaN
4   5                   NaN            J.K. Rowling


# Fusionar DataFrames con merge 2

Imagina que estás trabajando con dos conjuntos de datos: uno que contiene información sobre cursos en línea ofrecidos (`cursos`) y otro que contiene información sobre las inscripciones a estos cursos (`inscripciones`).

Tu tarea es fusionar `cursos` con `inscripciones` (en un DataFrame llamado: `cursos_inscripciones`) de tal manera que el resultado final incluya todos los registros de `inscripciones`, completándolos con la información disponible en `cursos`.

Utiliza el método de fusión adecuado para garantizar que no se pierda ninguna inscripción, incluso si el curso correspondiente no está listado en el DataFrame `cursos`. Es importante que el DataFrame resultante `cursos_inscripciones` muestre claramente qué inscripciones no tienen un curso correspondiente, rellenando esos espacios con NaN.

In [8]:
import pandas as pd


cursos: pd.DataFrame = pd.DataFrame({
    'curso_id': [101, 102, 103],
    'nombre_curso': ['Introducción a Python', 'Data Science con Python', 'Machine Learning Avanzado']
})

inscripciones: pd.DataFrame = pd.DataFrame({
    'curso_id': [102, 102, 101, 104],
    'fecha_inscripcion': ['2023-01-15', '2023-02-01', '2023-01-20', '2023-03-05']
})

cursos_inscripciones: pd.DataFrame = pd.merge(
    inscripciones,
    cursos,
    on='curso_id',
    how='left'
)

print(cursos_inscripciones)

   curso_id fecha_inscripcion             nombre_curso
0       102        2023-01-15  Data Science con Python
1       102        2023-02-01  Data Science con Python
2       101        2023-01-20    Introducción a Python
3       104        2023-03-05                      NaN
