In [1]:
import pandas as pd

def comparar_csvs(archivo1, archivo2):
    """
    Compara dos archivos CSV usando la columna Name como clave.
    Muestra las filas que son diferentes entre ambos archivos.
    
    Args:
        archivo1: Ruta al primer archivo CSV
        archivo2: Ruta al segundo archivo CSV
    """
    # Leer los archivos CSV
    df1 = pd.read_csv(archivo1)
    df2 = pd.read_csv(archivo2)
    
    print(f"Registros en archivo1: {len(df1)}")
    print(f"Registros en archivo2: {len(df2)}")
    
    # Verificar que ambos tienen la columna Name
    if 'Name' not in df1.columns or 'Name' not in df2.columns:
        print("Error: Ambos archivos deben tener una columna 'Name'")
        return
    
    # Encontrar nombres únicos en cada archivo
    nombres1 = set(df1['Name'])
    nombres2 = set(df2['Name'])
    
    # Nombres que están en archivo1 pero no en archivo2
    solo_en_1 = nombres1 - nombres2
    if solo_en_1:
        print("\nRegistros que solo están en el primer archivo:")
        for nombre in sorted(solo_en_1):
            print(f"- {nombre}")
    
    # Nombres que están en archivo2 pero no en archivo1
    solo_en_2 = nombres2 - nombres1
    if solo_en_2:
        print("\nRegistros que solo están en el segundo archivo:")
        for nombre in sorted(solo_en_2):
            print(f"- {nombre}")
    
    # Nombres que están en ambos archivos
    nombres_comunes = nombres1.intersection(nombres2)
    print(f"\nRegistros comunes en ambos archivos: {len(nombres_comunes)}")
    
    # Comparar valores para registros que están en ambos archivos
    if nombres_comunes:
        print("\nDiferencias en registros comunes:")
        for nombre in sorted(nombres_comunes):
            row1 = df1[df1['Name'] == nombre].iloc[0]
            row2 = df2[df2['Name'] == nombre].iloc[0]
            
            # Comparar todas las columnas comunes
            columnas_comunes = set(df1.columns).intersection(set(df2.columns))
            diferencias = []
            
            for col in columnas_comunes:
                if row1[col] != row2[col]:
                    diferencias.append(f"{col}: '{row1[col]}' -> '{row2[col]}'")
            
            if diferencias:
                print(f"\nNombre: {nombre}")
                for diff in diferencias:
                    print(f"  - {diff}")

# Ejemplo de uso:
# comparar_csvs('archivo1.csv', 'archivo2.csv')

In [3]:
comparar_csvs('Skyrim_Named_Characters_Propio.csv', 'Skyrim_Named_Characters.csv')

Registros en archivo1: 1017
Registros en archivo2: 1009

Registros que solo están en el primer archivo:
- Agnis
- Azadi
- Bandit Leader
- Inimoro
- Isabelle Rolaine
- Josla
- Lynea
- Reclamation Priest
- Rulnik Wind-Strider
- Sirayar

Registros que solo están en el segundo archivo:
- Dark Brotherhood Initiate
- Fjola

Registros comunes en ambos archivos: 998

Diferencias en registros comunes:

Nombre: Abelone
  - Magicka (PC=10): '60.0' -> '60.0'
  - Gold: 'nan' -> 'nan'
  - Store: 'nan' -> 'nan'
  - Training: 'nan' -> 'nan'
  - Race Details: 'nan' -> 'nan'
  - Buys: 'nan' -> 'nan'
  - Sells: 'nan' -> 'nan'
  - Health (PC=10): '75.0' -> '75.0'
  - Merchant: 'nan' -> 'nan'
  - Perks: 'nan' -> 'nan'
  - House: 'nan' -> 'nan'
  - Horses: 'nan' -> 'nan'
  - Class Details: 'nan' -> 'nan'
  - Stamina (PC=10): '60.0' -> '60.0'

Nombre: Acolyte Jenssen
  - Magicka (PC=10): '50.0' -> '50.0'
  - Gold: 'nan' -> 'nan'
  - Store: 'nan' -> 'nan'
  - Training: 'nan' -> 'nan'
  - Race Details: 'nan' -

In [7]:
import pandas as pd


# Cargar los archivos CSV
df1 = pd.read_csv('Skyrim_Named_Characters_Propio.csv')
df2 = pd.read_csv('skyrim_books.csv')

# Obtener el número de columnas de cada CSV
num_columnas_csv1 = len(df1.columns)
num_columnas_csv2 = len(df2.columns)


print("Columnas en Skyrim_Named_Characters_Propio:", num_columnas_csv1)
print("Columnas en skyrim_books.csv:", num_columnas_csv2)
print("Columnas en Skyrim_Named_Characters_Propio:",df1.columns)
print("Columnas en skyrim_books.csv:",df2.columns)

Columnas en Skyrim_Named_Characters_Propio: 41
Columnas en skyrim_books.csv: 5
Columnas en Skyrim_Named_Characters_Propio: Index(['Source', 'Name', 'Home City', 'House', 'Race', 'Gender', 'Level',
       'Class', 'RefID', 'BaseID', 'Health', 'Magicka', 'Stamina',
       'Primary Skills', 'Morality', 'Aggression', 'Voice Type', 'Faction(s)',
       'Class Details', 'Essential', 'Location', 'Training', 'Merchant',
       'Gold', 'Sells', 'Buys', 'Race Details', 'Follower', 'Store', 'AdoptHF',
       'Protected', 'Respawns', 'Perks', 'Marry', 'StewardHF', 'Horses',
       'Added by', 'Level (PC=10)', 'Health (PC=10)', 'Magicka (PC=10)',
       'Stamina (PC=10)'],
      dtype='object')
Columnas en skyrim_books.csv: Index(['Title', 'Cost', 'Author', 'Description', 'Skill'], dtype='object')
