In [None]:
import pandas as pd
from typing import List

# Ejemplo de uso de la función para añadir a un dataset A a los registros de un dataset B que no existan ya en A

`dataset_a = pd.read_csv('ruta_a_dataset_a.csv')`

`dataset_b = pd.read_csv('ruta_a_dataset_b.csv')`

<h4>Comparación por 'song_name' y 'artist_name'</h4>

`updated_dataset_a = add_unique_records(dataset_a, dataset_b, key_columns=['song_name', 'artist_name'])`

<h4>Comparación por 'recording_id'</h4>

`updated_dataset_a = add_unique_records(dataset_a, dataset_b, key_columns=['recording_id'])`

`print(f"Número total de registros en el dataset actualizado: {len(updated_dataset_a)}")`

# Función para añadir a un dataset A a los registros de un dataset B que no existan ya en A

In [None]:
def add_unique_records(dataset_a: pd.DataFrame, dataset_b: pd.DataFrame, key_columns: List[str]) -> pd.DataFrame:
    if not all(column in dataset_a.columns for column in key_columns):
        raise ValueError("Algunas columnas clave no están presentes en dataset_a.")
    if not all(column in dataset_b.columns for column in key_columns):
        raise ValueError("Algunas columnas clave no están presentes en dataset_b.")

    # Crear un DataFrame de comparación solo con las columnas clave
    a_subset = dataset_a[key_columns]
    b_subset = dataset_b[key_columns]

    # Identificar los registros únicos en B que no están en A
    unique_to_b = ~b_subset.apply(tuple, axis=1).isin(a_subset.apply(tuple, axis=1))

    # Filtrar los registros únicos de B
    unique_records = dataset_b[unique_to_b]

    # Concatenar los registros únicos al dataset A
    updated_dataset_a = pd.concat([dataset_a, unique_records], ignore_index=True)

    return updated_dataset_a


# Comparar datasets por la columna `recording_id`

In [None]:
df_A = pd.read_csv('ruta_a_tu_csv_A.csv')
df_B = pd.read_csv('ruta_a_tu_csv_B.csv')

In [None]:
updated_dataset_a = add_unique_records(df_A, df_B, key_columns=['recording_id'])

print(f"Número total de registros en el dataset actualizado: {len(updated_dataset_a)}")