# Transfromirung von Datentypen in Query Editor

## Flat Files

Flat Files (auch als flache Dateien oder Flat-File-Datenbanken bekannt) sind einfache, textbasierte Dateien zur Speicherung strukturierter Daten ohne komplexe hierarchische oder relationale Strukturen. Typischerweise werden Flat Files verwendet, um Daten in einer einfachen Form, meist zeilenweise, abzulegen. Dabei entspricht jede Zeile üblicherweise einem Datensatz, während jedes einzelne Datenfeld in diesem Datensatz oft durch bestimmte Trennzeichen voneinander abgegrenzt wird.

Die gängigsten Formate von Flat Files sind CSV-Dateien (Comma-Separated Values) und TSV-Dateien (Tab-Separated Values). CSV-Dateien verwenden Kommas (,) oder Semikolons (;) als Trennzeichen zwischen den Datenfeldern, während TSV-Dateien einen Tabulator als Feldtrennzeichen nutzen. Andere, weniger verbreitete Trennzeichen wie Pipes (|) oder Leerzeichen können ebenfalls zum Einsatz kommen.

Ein großer Vorteil von Flat Files liegt in ihrer Einfachheit: Sie sind leicht zu erstellen, zu lesen, zu bearbeiten und nahezu universell kompatibel. Flat Files ermöglichen somit eine unkomplizierte Datenübertragung zwischen unterschiedlichen Anwendungen und Systemen. Sie werden besonders häufig zum Exportieren und Importieren von Daten verwendet, etwa für die Verarbeitung in Tabellenkalkulationsprogrammen wie Microsoft Excel oder für die schnelle Datenanalyse mit Python- oder R-Skripten.

Dennoch weisen Flat Files auch einige Nachteile auf: Sie eignen sich nicht optimal zur Speicherung großer Datenmengen mit komplexen Beziehungen, da keine explizite Unterstützung von Relationen oder Datenintegrität vorhanden ist. Komplexe Abfragen, effiziente Indizierung oder fortgeschrittene Operationen auf den Daten sind ebenfalls nicht oder nur eingeschränkt möglich. Sobald Daten stark relational strukturiert oder sehr umfangreich werden, sind relationale Datenbanken oder andere fortgeschrittene Speichersysteme die bessere Wahl.

Zusammenfassend sind Flat Files eine praktische, unkomplizierte Lösung für die Speicherung und Übertragung einfacher, strukturierter Daten. Aufgrund ihrer Einfachheit und Flexibilität finden sie trotz ihrer Grenzen vielfältige Anwendungsmöglichkeiten in IT, Softwareentwicklung, Datenanalyse und Datenintegration.
Ein Problem von Flat Dateien ist dass die daten nicht clean sind und manuell eingegeben wurden. Das kann zur Folgende Probleme führen

- in einem Spalte sind verschidene Datentypen Zahlen Datum oder Texte
- Power BI problem bei automatischen Datentyperkennung hat 
- Fehlerhaften Datenanalyse
# Datentypen in Power BI

Die korrekte Auswahl und Definition von Datentypen in Power BI spielt eine entscheidende Rolle bei der Datenvorbereitung und der nachfolgenden Analyse. Falsch oder ungenau definierte Datentypen können zu Fehlern oder ungenauen Ergebnissen in Berichten und Visualisierungen führen. Daher ist es wichtig, ein gutes Verständnis über die verfügbaren Datentypen und deren Einsatzbereiche in Power BI zu entwickeln.

## Warum sind Datentypen in Power BI wichtig?

Datentypen bestimmen, wie Power BI mit den Daten umgeht, wie sie gespeichert werden und welche Operationen darauf durchgeführt werden können. Beispielsweise müssen Zahlen korrekt erkannt werden, um mathematische Berechnungen wie Summen, Durchschnittswerte oder andere statistische Operationen durchführen zu können. Wenn eine Zahl versehentlich als Text importiert wird, können Berechnungen nicht durchgeführt werden, was zu Fehlern oder unerwarteten Ergebnissen führt. Besonders häufig tritt dieses Problem bei Flat Files (wie CSV-Dateien) auf, da diese standardmäßig keine klar definierten Datentypen enthalten. Daher muss man diese Datentypen im Power Query Editor zunächst richtig festlegen.

## Die wichtigsten Datentypen in Power BI und ihre Anwendungsfälle

### Zahlen-Datentypen

Zahlen werden in Power BI in unterschiedlichen Formaten gespeichert. Diese Datentypen werden für numerische Berechnungen, Aggregationen und mathematische Operationen verwendet:

- **Ganze Zahl (Integer)**:  
  Zahlen ohne Dezimalstellen, z. B. Mengenangaben, Artikelnummern.
- **Dezimalzahl (Decimal)**:  
  Zahlen mit Dezimalstellen, ideal für Finanzdaten, Preise oder genaue Messungen.
- **Festkommazahl (Fixed Decimal Number)**:  
  Wird verwendet, wenn eine feste Anzahl an Nachkommastellen erforderlich ist, besonders häufig im Finanzbereich.

### Datums- und Zeit-Datentypen

Diese Datentypen dienen zur Verarbeitung zeitbezogener Informationen:

- **Datum/Uhrzeit (Date/Time)**:  
  Kombination aus Datum und Uhrzeit, häufig für Ereignisprotokolle oder Zeiterfassungen verwendet.
- **Datum (Date)**:  
  Nur das Datum, ohne Uhrzeit. Verwendbar für Kalenderdaten.
- **Uhrzeit (Time)**:  
  Lediglich Zeitangaben ohne Datum.

Die korrekte Wahl dieser Datentypen ist entscheidend, um zeitbasierte Analysen und Visualisierungen korrekt durchzuführen.

### Textdatentypen

Text wird in Power BI verwendet, um beschreibende, nicht numerische Informationen darzustellen:

- **Text**:  
  Häufig genutzt für Kategorien, Namen, Adressen oder andere beschreibende Felder.

Textfelder sind wichtig, um Daten übersichtlich und interpretierbar zu halten, werden jedoch nicht für mathematische Operationen genutzt.

### Boolesche Datentypen (True/False)

- **Wahrheitswerte (True/False)**:  
  Typischerweise verwendet, um logische Zustände anzuzeigen, wie beispielsweise Statusindikatoren (aktiv/inaktiv).

### Datentyp „Dauer“ (Duration)

Ein besonderer Datentyp ist die „Dauer“, der verwendet wird, um Zeitintervalle darzustellen, beispielsweise wie lange ein Vorgang gedauert hat.

## Datentypänderung im Power Query Editor

Da Flat Files oft keine klar definierten Datentypen enthalten, bietet Power BI die Möglichkeit, diese Datentypen über den Power Query Editor nachträglich zu setzen oder anzupassen. Power BI unterstützt hierbei sowohl eine automatische Erkennung von Datentypen als auch die manuelle Anpassung. Im Power Query Editor können Benutzer gezielt Datentypen für jede Spalte festlegen und somit sicherstellen, dass Daten anschließend korrekt verarbeitet und analysiert werden.

## Fazit

Die korrekte Zuordnung und Bearbeitung der Datentypen in Power BI stellt eine zentrale Voraussetzung für präzise und zuverlässige Analysen dar. Der gezielte Umgang mit Datentypen verbessert nicht nur die Qualität der Analysen, sondern reduziert auch Fehlerpotenziale und erleichtert nachfolgende Prozesse in der Datenmodellierung und Visualisierung.




- Text
- Zahl
- Datum


# Aufgaben
- Datentyp von Spalte Sales und Price umwandlen 
- Datentyp von Datum umwandeln 
- Fehlermeldung bei Umwandeln erklären
- Automatische Datentyperkennung von Power BI vorstellen 
