In [1]:
import pandas as pd

# DataFrame mit persönlichen Daten
df_personal = pd.DataFrame({
    'Matrikelnummer': [101, 102, 103, 104],
    'Name': ['Anna', 'Mark', 'Julia', 'Tom'],
    'Studiengang': ['Informatik', 'BWL', 'Maschinenbau', 'Informatik']
})

# DataFrame mit Noten (beachte: Tom (104) fehlt, eine unbekannte Matrikelnr. (105) ist dabei)
df_noten = pd.DataFrame({
    'Matrikelnummer': [101, 102, 103, 105],
    'Prüfung': ['Mathe I', 'Marketing', 'Mechanik I', 'Programmieren I'],
    'Note': [1.3, 2.0, 1.7, 2.7]
})

# DataFrame mit Kontaktdaten (Index entspricht den ersten drei Matrikelnummern)
df_kontakt = pd.DataFrame({
    'Email': ['anna@mail.de', 'mark@mail.de', 'julia@mail.de']
}, index=[101, 102, 103])


print("--- Persönliche Daten ---")
print(df_personal)
print("\n--- Noten ---")
print(df_noten)
print("\n--- Kontaktdaten (Index ist Matrikelnummer) ---")
print(df_kontakt)

--- Persönliche Daten ---
   Matrikelnummer   Name   Studiengang
0             101   Anna    Informatik
1             102   Mark           BWL
2             103  Julia  Maschinenbau
3             104    Tom    Informatik

--- Noten ---
   Matrikelnummer          Prüfung  Note
0             101          Mathe I   1.3
1             102        Marketing   2.0
2             103       Mechanik I   1.7
3             105  Programmieren I   2.7

--- Kontaktdaten (Index ist Matrikelnummer) ---
             Email
101   anna@mail.de
102   mark@mail.de
103  julia@mail.de


In [2]:
# DataFrame mit neuen Studierenden
df_neue = pd.DataFrame({
    'Matrikelnummer': [106, 107],
    'Name': ['Laura', 'Peter'],
    'Studiengang': ['BWL', 'Medizin']
})

# Hängt die Zeilen von df_neue an df_personal an
df_alle_studierende = pd.concat([df_personal, df_neue], ignore_index=True)
# ignore_index=True erstellt einen neuen, durchgehenden Index (0, 1, 2, 3, 4, 5)

print("--- Alle Studierenden (concatenated) ---")
print(df_alle_studierende)

--- Alle Studierenden (concatenated) ---
   Matrikelnummer   Name   Studiengang
0             101   Anna    Informatik
1             102   Mark           BWL
2             103  Julia  Maschinenbau
3             104    Tom    Informatik
4             106  Laura           BWL
5             107  Peter       Medizin


In [3]:
# Führe einen inner join über die Spalte 'Matrikelnummer' aus
df_inner = pd.merge(df_personal, df_noten, how='inner', on='Matrikelnummer')

print("--- Inner Join ---")
print(df_inner)

--- Inner Join ---
   Matrikelnummer   Name   Studiengang     Prüfung  Note
0             101   Anna    Informatik     Mathe I   1.3
1             102   Mark           BWL   Marketing   2.0
2             103  Julia  Maschinenbau  Mechanik I   1.7


In [4]:
# Führe einen left join aus
df_left = pd.merge(df_personal, df_noten, how='left', on='Matrikelnummer')

print("--- Left Join ---")
print(df_left)

--- Left Join ---
   Matrikelnummer   Name   Studiengang     Prüfung  Note
0             101   Anna    Informatik     Mathe I   1.3
1             102   Mark           BWL   Marketing   2.0
2             103  Julia  Maschinenbau  Mechanik I   1.7
3             104    Tom    Informatik         NaN   NaN


In [5]:
# .join() für mergen mit indizes
# df_personal mit Matrikelnummer als Index
df_personal_indexed = df_personal.set_index('Matrikelnummer')

# Führe den Join auf dem Index aus
df_joined = df_personal_indexed.join(df_kontakt)

print("--- Mit .join() zusammengefügt ---")
print(df_joined)

--- Mit .join() zusammengefügt ---
                 Name   Studiengang          Email
Matrikelnummer                                    
101              Anna    Informatik   anna@mail.de
102              Mark           BWL   mark@mail.de
103             Julia  Maschinenbau  julia@mail.de
104               Tom    Informatik            NaN
