In [None]:
!pip install matplotlib

In [None]:
import json
import matplotlib.pyplot as plt
from collections import defaultdict

In [None]:
# Pfade definieren
responses_file = "   " # Pfad zur JSON-Datei mit den Detektionsergebnissen
output_file = "   " # Pfad zur Ausgabe der Auswertung (JSON)

In [None]:
#Einlesen der JSON-Datei
with open(responses_file, 'r') as f:
    chatgpt_data = json.load(f)

# Extrahieren der Anzahl der Tiere pro Bild
animals_per_image_chatgpt = {}
for image_file, count in chatgpt_data.items():
    animals_per_image_chatgpt[image_file] = count

In [None]:
# Berechnen der Statistiken
book_counts = defaultdict(int)
for image_file, count in animals_per_image_chatgpt.items():
    book_id = '_'.join(image_file.split('_')[:-2]) # Entfernt Seitenzahl und Illustrationsnummer
    book_counts[book_id] += count

In [None]:
# Speichern der Ergebnisse in einer JSON-Datei
book_counts_output = {str(book_id): count for book_id, count in book_counts.items()}
with open(output_file, 'w') as f:
    json.dump(book_counts_output, f, indent=4)

print(f"Die Auswertung wurde erfolgreich unter {output_file} gespeichert.")

In [None]:
# Visualisierung der Anzahl der Tiere pro Buch
counts_distribution = defaultdict(int)
for count in book_counts.values():
    counts_distribution[count] += 1

# Sortieren der Kategorien für die Darstellung
categories = sorted(counts_distribution.keys())
values = [counts_distribution[category] for category in categories]

# Erstellen des Balkendiagramms
plt.figure(figsize=(15, 6))
plt.bar([f'{cat} Tiere' for cat in categories], values, color='skyblue')
plt.xlabel('Anzahl der Tiere pro Buch')
plt.ylabel('Anzahl der Bücher')
plt.title('Verteilung der Anzahl der Tiere pro Buch')
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.xticks(rotation=45)

# Hinzufügen der Anzahl über jedem Balken
for idx, value in enumerate(values):
    plt.text(idx, value + 0.5, str(value), ha='center', va='bottom')

plt.tight_layout()
plt.show()