# XLSX

**XLSX** ist ein Dateiformat, das von **Microsoft Excel** verwendet wird, um Tabellenkalkulationen zu speichern. Es basiert auf dem Open XML-Format und ist der Nachfolger des älteren **XLS**-Formats. XLSX-Dateien können komplexe tabellarische Daten, Formeln, Diagramme, Formatierungen und mehr speichern.

### Eigenschaften von XLSX:

- **Tabellenkalkulationen:** Speichert Daten in Zellen, die in Spalten und Zeilen angeordnet sind.
- **Komplexe Inhalte:** Neben einfachen Text- und Zahlwerten können XLSX-Dateien auch Formeln, Diagramme, bedingte Formatierungen, Pivot-Tabellen und weitere Excel-spezifische Features enthalten.
- **Open XML:** Das XLSX-Format verwendet eine Kombination aus XML-Dateien und ZIP-Kompression, um Daten effizient zu speichern. Eine XLSX-Datei ist im Grunde eine ZIP-Datei, die eine Sammlung von XML-Dateien enthält.
- **Multiplattform:** Es kann von verschiedenen Softwareprogrammen, nicht nur von Microsoft Excel, gelesen werden (z. B. **Google Sheets**, **LibreOffice**, **pandas** in Python).

### Beispiel:

In einer XLSX-Datei könnten sich mehrere Tabellenblätter befinden, die unterschiedliche Daten enthalten, etwa:

- Ein Tabellenblatt mit Verkaufszahlen,
- Ein Tabellenblatt mit Formeln, die Berechnungen auf Basis der Verkaufszahlen durchführen,
- Ein Diagramm zur Visualisierung der Verkaufszahlen.

### XLSX-Datei in Python einlesen:

XLSX-Dateien können mit der `pandas`-Bibliothek und dem Modul `openpyxl` oder `xlrd` verarbeitet werden.

```python
import pandas as pd

# XLSX-Datei einlesen
data = pd.read_excel('datei.xlsx')

# Ausgabe der Daten
print(data)
```

Mit `pandas` wird die XLSX-Datei in ein DataFrame geladen, wodurch du die Daten einfach analysieren und manipulieren kannst.

# Next

2. XML (Extensible Markup Language)
- Vorteile:
    - Gut für hierarchische Datenstrukturen und Metadaten.
    - Sehr flexibel und wird in vielen unterschiedlichen Domänen verwendet (z.B. Webdienste, Konfigurationsdateien).
    - Unterstützt das Hinzufügen von Attributen und Metadaten.
    - Gut geeignet für die Übertragung von komplexen und vernetzten Daten.
- Nachteile:
    - Sehr verbose, d.h., es braucht mehr Speicherplatz und Bandbreite im Vergleich zu JSON.
    - Parsing kann langsamer und ressourcenintensiver sein.
    - Schwieriger von Menschen zu lesen und zu verstehen, insbesondere bei großen Dateien.

4. XML-Dateien: Import und Export

- XML (Extensible Markup Language) für hierarchisch organisierte Daten.
- Vorteil: Weit verbreitet bei Web-Diensten und Konfigurationsdateien.

vgl. https://www.geeksforgeeks.org/reading-and-writing-xml-files-in-python/


Python Beispiel: Import und Export von XML-Dateien

In [None]:
import xml.etree.ElementTree as ET

# XML-Datei importieren
tree = ET.parse('data.xml')
root = tree.getroot()
for employee in root.findall('employee'):
    name = employee.find('name').text
    age = employee.find('age').text
    print(f'Name: {name}, Age: {age}')

# XML-Datei exportieren
data = ET.Element('employees')
employee = ET.SubElement(data, 'employee')
name = ET.SubElement(employee, 'name')
name.text = 'Alice'
age = ET.SubElement(employee, 'age')
age.text = '30'

tree = ET.ElementTree(data)
tree.write('output.xml')
