# 📚 Glossar: Alle Begriffe & Abkürzungen erklärt
 
> 🚀 **Motivation:**
> 
> Dieses Glossar ist dein persönlicher Spickzettel für den gesamten Kurs! Egal ob im Unterricht, bei Übungen oder im Projekt – hier findest du schnell und verständlich alle wichtigen Begriffe, Abkürzungen und Tools erklärt.
 
**Dein Nachschlagewerk für den gesamten Kurs**
 
Nutze dieses Glossar, um jederzeit schnell Begriffe, Abkürzungen und Tools nachzuschlagen. Du findest hier kompakte Erklärungen, Beispiele und praktische Tipps – egal ob im Unterricht, bei Übungen oder in Projekten.

> 💡 **Tipp:** Mit `Strg+F` (Windows) oder `Cmd+F` (Mac) kannst du gezielt nach Begriffen suchen!

> 📚 **Extra:** Du vermisst einen Begriff? Sag im Kurs oder im Forum Bescheid – das Glossar wächst mit deinen Fragen!
 
---

## 🐍 Python Grundlagen

| Begriff | Abkürzung | Erklärung | Beispiel |
|---------|-----------|-----------|----------|
| **Python** | - | Programmiersprache für Data Science | `print("Hello World")` |
| **IPython** | - | Interaktive Python-Shell | Jupyter Notebooks verwenden IPython |
| **Anaconda** | - | Python-Distribution mit vielen Paketen | Enthält Jupyter, pandas, etc. |
| **pip** | - | Python Package Installer | `pip install streamlit` |
| **venv** | - | Virtual Environment (isolierte Python-Umgebung) | `python -m venv myenv` |
| **IDE** | - | Integrated Development Environment | VS Code, PyCharm |
| **Jupyter** | - | Interaktive Notebook-Umgebung | Für Datenanalyse und Prototyping |

## 📊 Data Science Pakete

| Paket | Zweck | Wichtigste Funktionen | Import |
|-------|-------|----------------------|--------|
| **pandas** | Datenmanipulation | DataFrames, CSV lesen/schreiben | `import pandas as pd` |
| **numpy** | Numerische Berechnungen | Arrays, mathematische Funktionen | `import numpy as np` |
| **matplotlib** | Basis-Plotting | Diagramme erstellen | `import matplotlib.pyplot as plt` |
| **seaborn** | Statistische Plots | Schöne Datenvisualisierung | `import seaborn as sns` |
| **plotly** | Interaktive Plots | Web-taugliche Diagramme | `import plotly.express as px` |
| **scipy** | Wissenschaftliches Rechnen | Statistik, Optimierung | `import scipy.stats as stats` |

## 🤖 Machine Learning

### Algorithmen & Begriffe

| Begriff | Abkürzung | Erklärung | Anwendung |
|---------|-----------|-----------|----------|
| **Machine Learning** | ML | Computer lernen aus Daten | Vorhersagen treffen |
| **Artificial Intelligence** | AI/KI | Computersysteme mit menschenähnlicher Intelligenz | Spracherkennung, Bildanalyse |
| **Deep Learning** | DL | ML mit künstlichen neuronalen Netzen | Bilderkennung, NLP |
| **Neural Network** | NN | Gehirn-inspiriertes Rechenmodell | Muster in komplexen Daten |
| **Natural Language Processing** | NLP | Verarbeitung menschlicher Sprache | Textanalyse, Übersetzung |
| **Computer Vision** | CV | Bildanalyse und -verständnis | Objekterkennung |

### Algorithmus-Typen

| Algorithmus | Typ | Zweck | Beispiel |
|-------------|-----|-------|----------|
| **Linear Regression** | Supervised | Zahlen vorhersagen | Hauspreis schätzen |
| **Logistic Regression** | Supervised | Kategorien vorhersagen | E-Mail: Spam oder nicht? |
| **Decision Tree** | Supervised | Entscheidungen modellieren | Kredit genehmigen? |
| **Random Forest** | Supervised | Viele Entscheidungsbäume | Robuste Vorhersagen |
| **K-Means** | Unsupervised | Gruppen finden | Kundensegmentierung |
| **K-Nearest Neighbors** | KNN | Ähnlichkeit nutzen | Empfehlungssysteme |

## 📦 ML-Bibliotheken

| Bibliothek | Zweck | Stärken | Import |
|------------|-------|---------|--------|
| **scikit-learn** | Klassisches ML | Einfach zu verwenden, gut dokumentiert | `from sklearn import ...` |
| **TensorFlow** | Deep Learning | Google-entwickelt, sehr mächtig | `import tensorflow as tf` |
| **PyTorch** | Deep Learning | Facebook-entwickelt, flexibel | `import torch` |
| **Keras** | Deep Learning | High-Level API für TensorFlow | `from tensorflow import keras` |
| **XGBoost** | Gradient Boosting | Sehr gute Performance bei tabellarischen Daten | `import xgboost as xgb` |
| **LightGBM** | Gradient Boosting | Schnell und speichereffizient | `import lightgbm as lgb` |

## 🌐 Web-Entwicklung

| Begriff | Zweck | Rolle in unserem Kurs |
|---------|-------|----------------------|
| **Streamlit** | Python Web-Apps | Haupttool für unsere ML-Apps |
| **Flask** | Web-Framework | Alternative zu Streamlit |
| **FastAPI** | API-Framework | Für REST APIs |
| **HTML** | Markup-Sprache | Grundlage jeder Webseite |
| **CSS** | Styling | Design und Layout |
| **JavaScript** | Frontend-Programmierung | Interaktivität im Browser |
| **REST API** | Schnittstelle | Daten zwischen Systemen austauschen |
| **JSON** | Datenformat | Leichtgewichtiger Datenaustausch |

## ☁️ Cloud & Deployment

| Service | Anbieter | Zweck | Kosten |
|---------|----------|-------|--------|
| **Streamlit Cloud** | Streamlit | Streamlit-Apps hosten | Kostenlos für öffentliche Apps |
| **Heroku** | Salesforce | Allgemeine App-Plattform | Begrenzte kostenlose Stufe |
| **AWS** | Amazon | Vollständige Cloud-Plattform | Pay-per-use |
| **Google Cloud** | Google | Cloud-Services | Kostenlose Stufe verfügbar |
| **Azure** | Microsoft | Microsoft Cloud | Student-Rabatte |
| **GitHub Pages** | GitHub | Statische Websites | Kostenlos |
| **Colab** | Google | Kostenlose Jupyter Notebooks | Kostenlos mit GPU! |

## 🐳 DevOps & Tools

| Tool | Zweck | Warum wichtig? |
|------|-------|---------------|
| **Docker** | Containerisierung | Einheitliche Umgebungen |
| **Git** | Versionskontrolle | Code-Änderungen verfolgen |
| **GitHub** | Code-Hosting | Zusammenarbeit und Backup |
| **GitLab** | DevOps-Plattform | Alternative zu GitHub |
| **VS Code** | Code-Editor | Bester Editor für Python |
| **Conda** | Paket-Manager | Alternative zu pip |
| **MLflow** | ML-Lifecycle | Experimente verfolgen |
| **DVC** | Data Version Control | Datensätze versionieren |

## 📊 Datenformate & Datenbanken

| Format | Erweiterung | Zweck | Pandas-Befehl |
|--------|-------------|-------|---------------|
| **CSV** | .csv | Einfache Tabellen | `pd.read_csv()` |
| **Excel** | .xlsx | Spreadsheets | `pd.read_excel()` |
| **JSON** | .json | Strukturierte Daten | `pd.read_json()` |
| **Parquet** | .parquet | Komprimierte Spalten | `pd.read_parquet()` |
| **SQL** | .sql | Datenbankabfragen | `pd.read_sql()` |
| **HDF5** | .h5 | Große Datensätze | `pd.read_hdf()` |

### Datenbanken

| Typ | Beispiele | Verwendung |
|-----|-----------|------------|
| **SQL** | PostgreSQL, MySQL | Strukturierte Daten |
| **NoSQL** | MongoDB | Dokumente und JSON |
| **Big Data** | Hadoop, Spark | Riesige Datensätze |

## 🔄 ML-Workflow Begriffe

| Begriff | Erklärung | Beispiel |
|---------|-----------|----------|
| **EDA** | Exploratory Data Analysis | Daten verstehen und visualisieren |
| **Feature Engineering** | Merkmals-Erstellung | Neue Spalten aus bestehenden Daten |
| **Training** | Modell lernen lassen | `model.fit(X_train, y_train)` |
| **Validation** | Modell testen | `model.score(X_test, y_test)` |
| **Cross-Validation** | Mehrfach-Validierung | Robuste Modell-Bewertung |
| **Hyperparameter** | Modell-Einstellungen | Learning Rate, Anzahl Bäume |
| **Overfitting** | Modell lernt Trainingsdaten auswendig | Schlechte Performance auf neuen Daten |
| **Underfitting** | Modell ist zu einfach | Kann auch Trainingsdaten nicht gut vorhersagen |

## 📈 Evaluation Metriken

### Klassifikation (Kategorien vorhersagen)

| Metrik | Formel | Wann verwenden? |
|--------|--------|----------------|
| **Accuracy** | (TP+TN)/(TP+TN+FP+FN) | Ausgewogene Datensätze |
| **Precision** | TP/(TP+FP) | Falsch-Positive vermeiden |
| **Recall** | TP/(TP+FN) | Alle Positive finden |
| **F1-Score** | 2×(Precision×Recall)/(Precision+Recall) | Balance zwischen Precision und Recall |
| **AUC-ROC** | Area Under Curve | Ranking-Qualität |

**Legende**: TP=True Positive, TN=True Negative, FP=False Positive, FN=False Negative

### Regression (Zahlen vorhersagen)

| Metrik | Bedeutung | Einheit |
|--------|-----------|--------|
| **MAE** | Mean Absolute Error | Durchschnittlicher absoluter Fehler |
| **MSE** | Mean Squared Error | Durchschnittlicher quadratischer Fehler |
| **RMSE** | Root Mean Squared Error | Wurzel aus MSE |
| **R²** | Coefficient of Determination | Anteil erklärter Varianz (0-1) |

## 🎯 Streamlit-spezifische Begriffe

| Begriff | Funktion | Beispiel |
|---------|----------|----------|
| **Widget** | Interaktives Element | `st.slider()`, `st.button()` |
| **Sidebar** | Seitliche Navigation | `st.sidebar.selectbox()` |
| **Cache** | Daten zwischenspeichern | `@st.cache_data` |
| **Session State** | Zustand zwischen Reruns | `st.session_state.counter` |
| **Columns** | Layout in Spalten | `col1, col2 = st.columns(2)` |
| **Tabs** | Registerkarten | `tab1, tab2 = st.tabs(['A', 'B'])` |
| **Rerun** | App neu ausführen | Passiert bei jedem Widget-Input |

## 🔍 Häufige Fehler & Lösungen

| Fehlermeldung | Problem | Lösung |
|---------------|---------|--------|
| `ModuleNotFoundError` | Paket nicht installiert | `pip install paketname` |
| `KeyError` | Spalte existiert nicht | DataFrame-Spalten prüfen |
| `IndexError` | Index außerhalb des Bereichs | List/Array-Länge prüfen |
| `ValueError` | Falscher Datentyp | Datentyp konvertieren |
| `FileNotFoundError` | Datei nicht gefunden | Pfad korrigieren |
| `MemoryError` | Zu wenig RAM | Kleinere Datensätze verwenden |
| `StreamlitAPIException` | Streamlit-Problem | `streamlit run` neu starten |

## 🚀 Nützliche Abkürzungen & Tastenkürzel

### Jupyter Notebooks
- **Shift + Enter**: Zelle ausführen und zur nächsten
- **Ctrl + Enter**: Zelle ausführen (bleiben)
- **A**: Neue Zelle oberhalb
- **B**: Neue Zelle unterhalb
- **M**: Zu Markdown ändern
- **Y**: Zu Code ändern
- **DD**: Zelle löschen

### Pandas Abkürzungen
- **df**: DataFrame (Standard-Name)
- **s**: Series (Standard-Name)
- **head()**: Erste 5 Zeilen
- **tail()**: Letzte 5 Zeilen
- **info()**: DataFrame-Informationen
- **describe()**: Statistische Zusammenfassung

## 📚 Weiterführende Ressourcen

### Offizielle Dokumentationen
- [Python](https://docs.python.org/3/)
- [Pandas](https://pandas.pydata.org/docs/)
- [Streamlit](https://docs.streamlit.io/)
- [Scikit-learn](https://scikit-learn.org/stable/)
- [Docker](https://docs.docker.com/)

### Tutorials & Kurse
- [Kaggle Learn](https://www.kaggle.com/learn) - Kostenlose ML-Kurse
- [Streamlit Gallery](https://streamlit.io/gallery) - Inspiration für Apps
- [Python for Data Science Handbook](https://jakevdp.github.io/PythonDataScienceHandbook/) - Kostenloses Buch

### Communities
- [Stack Overflow](https://stackoverflow.com/) - Für alle Programming-Fragen
- [Reddit r/MachineLearning](https://www.reddit.com/r/MachineLearning/)
- [Streamlit Community](https://discuss.streamlit.io/)

---
