# Einen Großteil dieses Skripts könnte man noch auf andere Skripte aufteilen, um Dopplungen zu vermeiden.

Zurück zum:
- [Inhaltsverzeichnis](../../_Inhaltsverzeichnis_Data_Analyses_.ipynb)
- [Syllabus](../../_Syllabus_PCED_.ipynb)

Siehe auch:
- [Umfragen](Umfragen.ipynb)
- [Interviews](Interview.ipynb)
- [API's](API.ipynb)
- [Web-Scraping](./Web_Scraping/Web_Scraping.ipynb)
- [Einlesen von Daten](einlesen.ipynb)
- [Stichproben](Stichproben.ipynb)
- [Recht und Ethik](recht_ethik.ipynb)
- [Anonymisierung](Anonymisierung.ipynb)
- [Einfluss des Data-Analysten auf die Geschäftsprozesse](Einfluss.ipynb)

# Data Collection / Data Aquisition / Datenerhebung

# Was ist der Prozess der Datenerhebung?

Der Datenerhebungsprozess umfasst alle Schritte, die erforderlich sind, um relevante Daten für die Analyse zu sammeln. Dies umfasst 
- die Planung,
- die Durchführung und die
- Qualitätssicherung der Datensammlung.

<br>

**Schritte**: 
1. Identifizierung des Ziels
2. Auswahl der Erhebungsmethode
3. Durchführung der Sammlung
4. Datenaufbereitung

---

# Warum ist er so wichtig?

Der Datenerhebungsprozess ist entscheidend für die Genauigkeit und Zuverlässigkeit der Analyse, weil die Qualität der Daten einen direkten Einfluss auf die Ergebnisse hat. Fehler oder Ungenauigkeiten bei der Erhebung führen dazu, dass selbst die besten Analysemodelle ungenaue oder irrelevante Ergebnisse liefern.

Eine hohe Datenqualität sorgt u.a. für:

1. Vermeidung von Verzerrungen
2. Sicherstellung der Repräsentativität
3. Vermeidung von Datenlücken und fehlenden Werten
4. Genauigkeit der Messungen
5. Datenerhebung im richtigen Kontext
6. Einhaltung ethischer und rechtlicher Standards
7. Datenkonsistenz und Vergleichbarkeit
8. Minimierung von Kosten und Ressourcen
9. Grundlage für Modellierung und Entscheidungsfindung

---

# Welche Fehler können auftreten?

Bei der Datenerhebung können verschiedene Fehler auftreten, die die Qualität der Daten und damit die Zuverlässigkeit der Analyse beeinträchtigen. Diese Fehler lassen sich in **methodische** und **technische Fehler** unterteilen. Hier sind einige der häufigsten Fehler und Vorschläge, wie sie vermieden werden können:

 1. **Auswahlverzerrung (Selection Bias)**
Tritt auf, wenn die Stichprobe nicht repräsentativ für die Gesamtpopulation ist, z.B. können nur bestimmte Gruppen (z. B. Personen einer bestimmten Altersgruppe oder Region) in die Stichprobe aufgenommen werden.
   
   **Vermeidung:**
   - Eine **zufällige Stichprobenauswahl** sicherstellen, um Repräsentativität zu gewährleisten.
   - **Stratifizierte Stichproben** verwenden, um sicherzustellen, dass alle relevanten Untergruppen der Population vertreten sind.
   - Sicherstellen, dass keine systematischen Faktoren bestimmte Gruppen ausschließen (z. B. Erhebung nur tagsüber könnte arbeitende Personen ausschließen).

<br>

 2. **Messfehler**
Messfehler entstehen, wenn die eingesetzten Messinstrumente ungenau sind oder nicht richtig angewendet werden.

   **Vermeidung:**
   - **Kalibrierung der Messinstrumente** vor der Datenerhebung.
   - **Klare Anweisungen** und Schulung des Personals, das die Messungen durchführt.
   - **Regelmäßige Überprüfung** der Messgeräte und Methoden während der Datenerhebung.

<br>

 3. **Fehler durch unklare Fragestellungen**
Wenn in einer Umfrage unklare oder missverständliche Fragen gestellt werden, können die Antworten verzerrt sein oder der tatsächlichen Meinung der Befragten nicht entsprechen.
   
   **Vermeidung:**
   - Fragen in der Umfrage **präzise und eindeutig** formulieren.
   - **Vortests (Pretests)** mit einer kleinen Stichprobe durchführen, um sicherzustellen, dass die Fragen verständlich sind.
   - Fragen so gestalten, dass sie **keine voreingenommenen Antworten** provozieren.

<br>

 4. **Antwortverzerrung (Response Bias)**
Tritt auf, wenn Befragte ihre Antworten aufgrund von sozialen Erwartungen anpassen oder bewusst falsche Angaben machen.
   
   **Vermeidung:**
   - **Anonymität** der Befragten gewährleisten, um ehrliche Antworten zu fördern.
   - **Neutrale Formulierungen** verwenden, um keine bestimmte Antwort zu beeinflussen.
   - Eine **ausgewogene Anzahl von Antwortmöglichkeiten** bieten, um extremen Antworten vorzubeugen.

<br>

 5. **Non-Response Bias (Verzerrung durch fehlende Antworten)**
Wenn bestimmte Personen nicht an der Datenerhebung teilnehmen z. B. weil sie die Umfrage ignorieren oder keine Lust haben zu antworten
   
   **Vermeidung:**
   - Anreize für die Teilnahme schaffen, um die **Rücklaufquote** zu erhöhen.
   - **Mehrere Kontaktversuche** unternehmen, um schwer erreichbare Gruppen einzubeziehen.
   - **Untersuchung der Non-Responder**, um festzustellen, ob diese systematisch von den Respondern abweichen, und falls notwendig, entsprechende Gewichtungen in die Analyse einführen.

<br>

 6. **Interviewereinfluss**
Der persönliche Einfluss eines Interviewers kann die Antworten der Befragten verfälschen. Dies ist besonders in face-to-face- oder telefonischen Interviews ein Risiko.
   
   **Vermeidung:**
   - **Standardisierte Interviewtechniken** und -leitfäden verwenden.
   - Interviewer regelmäßig **schulen**, um sicherzustellen, dass sie neutral und unvoreingenommen agieren.
   - **Selbst-administerte Erhebungsmethoden** (z. B. Online-Umfragen) verwenden, wo möglich.

<br>

 7. **Technische Fehler**
Fehler bei der Datenaufzeichnung, -speicherung oder -übertragung können zu Datenverlust oder -verzerrungen führen. Dies betrifft vor allem digitale Erhebungsmethoden.
   
   **Vermeidung:**
   - **Regelmäßige Backups** der erhobenen Daten erstellen.
   - **Datenvalidierungsprozesse** integrieren, um sicherzustellen, dass die Daten korrekt erfasst und gespeichert werden.
   - **Überprüfungen und Tests** der verwendeten Software und Technologien vor dem Einsatz durchführen.

<br>

 8. **Zeitliche Verzerrung (Time Bias)**
Wenn Daten zu einer bestimmten Zeit erhoben werden, die für das Phänomen nicht repräsentativ ist (z. B. saisonale Effekte oder Tageszeiten), kann dies zu verzerrten Ergebnissen führen.
   
   **Vermeidung:**
   - Die **Daten über einen längeren Zeitraum** erheben, um zeitliche Schwankungen auszugleichen.
   - Wenn möglich, den Datenerhebungszeitraum so gestalten, dass er repräsentativ für den gesamten Betrachtungszeitraum ist.

<br>

 9. **Erfassungsfehler**
Entstehen, wenn nicht alle relevanten Informationen oder Variablen während der Datenerhebung erfasst werden. Wichtige Faktoren können dann übersehen werden.
   
   **Vermeidung:**
   - **Sorgfältige Planung** der Erhebung, um alle relevanten Variablen zu identifizieren und zu messen.
   - **Pilotstudien** oder Vorstudien durchführen, um sicherzustellen, dass keine wichtigen Datenpunkte ausgelassen werden.

<br>

 10. **Fehlende Werte (Missing Data)**
Datenlücken treten auf, wenn nicht alle erforderlichen Datenpunkte erfasst werden. Fehlende Werte können die Analysen erheblich beeinträchtigen.
   
   **Vermeidung:**
   - **Sorgfältige Datenerfassung** mit klaren Anweisungen, um das Risiko von Lücken zu minimieren.
   - **Automatisierte Validierung** während der Datenerfassung, um sicherzustellen, dass alle Pflichtfelder ausgefüllt werden.
   - Strategien wie **Imputation** oder **Listwise Deletion** zur Behandlung fehlender Werte in der Analyse.

---

# Primär- und Sekundärdaten

**Primärdaten**: 
- Daten, die direkt vom Forscher durch eigene Untersuchungen gesammelt werden.
- kann durch Umfragen, Interviews, Beobachtungen oder Experimente erfolgen.
- Vorteile: Hohe Relevanz, aktuelle Daten
- Nachteile: Zeitaufwendig, teuer

**Sekundärdaten**:
- wurden bereits von anderen gesammelt und können von Forschern weiterverwendet werden.
- stammen aus bereits existierenden Quellen wie Büchern, Zeitschriften, Berichten, Datenbanken...
- Vorteile: Schnelle Verfügbarkeit, kostengünstig
- Nachteile: Nicht immer aktuell oder spezifisch

<br>

## Die Primärdatensammlung

Primäre Datensammlungsmethoden beziehen sich auf das direkte Sammeln von Daten aus der Quelle, ohne auf bereits existierende Daten zurückzugreifen. 

Während primäre Datensammlungsmethoden wertvolle, maßgeschneiderte und aktuelle Daten liefern können, sind sie oft mit erheblichen Kosten und Zeitaufwand verbunden. Eine sorgfältige Planung ist notwendig, um zuverlässige und ethisch vertretbare Ergebnisse zu gewährleisten.

<br>

### Vorteile

1. **Aktualität und Relevanz**: <br>
   - oft aktueller und genauer, da speziell für die Fragestellung gesammelt
   - maßgeschneiderte und genau auf Forschungsziele abgestimmte Informationen

2. **Kontrolle über den Prozess**: <br>
   - volle Kontrolle über den Datensammlungsprozess
   - ermöglicht es, die Methodik an die spezifischen Anforderungen und Ziele der Untersuchung anzupassen

3. **Exklusivität der Daten**: <br>
   - stehen in der Regel nur dem Forscher bzw. der Organisation zur Verfügung
   - kann einen Wettbewerbsvorteil bieten

4. **Anpassbarkeit an die Zielgruppe**: <br>
   - Datensammlung kann auf spezifische Zielgruppen zugeschnitten werden
   - erhöht damit die Relevanz und Aussagekraft der Ergebnisse

5. **Datengenauigkeit und -validität**: <br>
   - da Forscher direkt beteiligt -> Qualitätsstandards und Fehlerquellen können besser kontrolliert und minimiert werden

<br>

### Herausforderungen

1. **Kostenintensiv**: <br>
   - oft teuer, da sie die Planung, Durchführung und Analyse erfordert.
   - v.a. bei groß angelegten Studien können Kosten für Personal, Ausrüstung, Zeit erheblich sein

2. **Zeitaufwendig**: <br>
   - Prozess sehr zeitaufwendig
   - von Entwicklung der Methodik bis zur Datenerfassung und -analyse
   - besonders problematisch, wenn schnelle Entscheidungen erforderlich sind

3. **Methodische Herausforderungen**: <br>
Die Planung und Durchführung einer zuverlässigen Datenerhebung erfordert Fachwissen, um sicherzustellen, dass die Daten gültig, reliabel und verzerrungsfrei sind. Eine schlechte Methodik kann die Ergebnisse unbrauchbar machen.

4. **Zugänglichkeit der Zielgruppen**: <br>
Es kann schwierig sein, Zugang zu bestimmten Bevölkerungsgruppen oder individuellen Befragten zu erhalten, was zu Stichprobenverzerrungen oder unvollständigen Datensätzen führen kann.

5. **Ethische Überlegungen**: <br>
Primäre Datensammlung erfordert oft die Zustimmung und Mitwirkung der Teilnehmer, was ethische Fragen aufwirft, insbesondere bei sensiblen Themen oder schutzbedürftigen Bevölkerungsgruppen.


---

# Datensammelmethoden

https://www.appinio.com/de/blog/marktforschung/datenerhebung

Datensammelmethoden sind Techniken und Verfahren, mit denen Informationen und Daten systematisch erfasst und gesammelt werden. Sie sind ein wesentlicher Bestandteil jedes Forschungsprozesses, da die Qualität der erhobenen Daten die Genauigkeit und Zuverlässigkeit der Ergebnisse stark beeinflusst. 

Je nach Art der Forschung oder Analyse gibt es verschiedene Methoden zur Datensammlung, die auf quantitative oder qualitative Daten abzielen.

<br>

## Umfragen (Surveys)

- Strukturierte Fragebögen, die an eine ausgewählte Gruppe von Personen verteilt werden.
- Quantitative Umfragen sammeln numerische Daten, z.B. über Multiple-Choice-Fragen.
- Qualitative Umfragen können offene Fragen enthalten, um detaillierte Meinungen und Erfahrungen zu erfassen.
- Wichtig ist das Design: klare Fragen, geeignete Antwortmöglichkeiten (geschlossene oder offene Fragen), Skalierung (z.B. 1-5 Likert-Skalen).
- Beispiel für Umfragedesign:
    - Frage: "Wie zufrieden sind Sie mit unserem Produkt?"
        - Antwortskala: 1 (sehr unzufrieden) bis 5 (sehr zufrieden).
    - Frage: "Welches Feature gefällt Ihnen am meisten?"
        - Antwortmöglichkeiten: Multiple Choice.


## Interviews

- Strukturierte Interviews: Vorgegebene Fragen, die in einer festen Reihenfolge gestellt werden.
- Unstrukturierte Interviews: Offene Gespräche, in denen der Interviewer flexibel auf den Gesprächsverlauf reagieren kann.
- Halbstrukturierte Interviews: Eine Kombination aus festen und flexiblen Fragen.
- Eignet sich besonders für qualitative Forschung.




## Beobachtungen

- Direkte Erfassung von Verhaltensweisen und Ereignissen durch den Forscher.
- Kann teilnehmend (der Forscher ist aktiv beteiligt) oder nicht-teilnehmend (der Forscher ist nur Beobachter) sein.
- Verwendet, um Daten über Verhalten in natürlichen Umgebungen zu sammeln.
- Vorteile: Daten in natürlicher Umgebung erfasst.
- Nachteile: Subjektive Interpretation des Forschers kann die Ergebnisse beeinflussen.

## Experimente

- Kontrollierte Tests, um Hypothesen zu überprüfen.
- Forscher manipulieren bestimmte Variablen und beobachten deren Einfluss auf andere Variablen.
- Häufig in den Naturwissenschaften, aber auch in den Sozialwissenschaften verwendet.
- Vorteile: Kontrolle über Variablen und präzise Messungen.
- Nachteile: Hoher Aufwand und möglicherweise nicht auf reale Situationen übertragbar.

## Dokumentenanalyse

- Untersuchung von bereits vorhandenen Dokumenten wie Berichten, Artikeln, Büchern oder Regierungsdokumenten.
- Nützlich, um historische Daten oder Kontextinformationen zu analysieren.
- Kann sowohl qualitative als auch quantitative Daten liefern.

## Online-Datensammlung

- Web Scraping: Automatisiertes Extrahieren von Daten von Websites.
- Tracking-Daten: Verfolgung von Nutzerverhalten auf Websites oder Apps, z.B. durch Cookies.
- Soziale Netzwerke: Analyse von Beiträgen und Interaktionen auf Plattformen wie Twitter oder Facebook.

## Sensoren und IoT

- Verwendung von Sensoren, die in Geräten oder Umgebungen installiert sind, um physikalische Messungen wie Temperatur, Luftfeuchtigkeit oder Bewegungen zu erfassen.
- wird oft in der Industrie, Medizin oder Smart City-Technologie eingesetzt

<br>

## Beispiele für die Anwendung

- Marktforschung: Umfragen und Interviews werden genutzt, um Kundenpräferenzen zu verstehen.
- Medizinische Forschung: Experimente und Beobachtungen werden verwendet, um den Einfluss neuer Behandlungsmethoden zu analysieren.
- Sozialwissenschaften: Interviews und Umfragen sammeln qualitative Daten, um gesellschaftliche Trends zu untersuchen.

---

# Zielgruppenauswahl

Eine sorgfältige Zielgruppenauswahl sichert präzise und verallgemeinerbare Ergebnisse. Wenn die Zielgruppe nicht repräsentativ ist, kann das zu Verzerrungen und ungenauen Schlussfolgerungen führen.
Wichtige Faktoren sind z.B. Demografie, Interessen, Verfügbarkeit der Zielgruppe.

- **Interne Validität:** <br>
Eine verzerrte Auswahl kann falsche Ursache-Wirkungs-Beziehungen innerhalb der Stichprobe erzeugen. Beispielsweise könnte eine nicht zufällige Stichprobe zu voreingenommenen Ergebnissen führen.
  
- **Externe Validität:** <br>
Wenn die Zielgruppe nicht die Gesamtpopulation widerspiegelt, sind die Ergebnisse nicht auf andere Gruppen übertragbar. Eine zu spezifische Auswahl schränkt die Generalisierbarkeit der Analyse ein.

- **Vermeidung:** <br>
Zufällige und repräsentative Stichproben, breite Zielgruppen, die alle relevanten Subgruppen abdecken, sowie angepasste Stichprobenverfahren (z. B. stratifizierte Stichproben) erhöhen die Validität.

<br><br>

Eine **falsche Auswahl der Zielgruppe** kann verschiedene Probleme verursachen, die die Genauigkeit und Verlässlichkeit der Analyse beeinträchtigen:

1. **Selektionsbias:** <br>
Die Ergebnisse sind verzerrt, weil bestimmte Gruppen über- oder unterrepräsentiert sind. Das führt zu falschen Schlussfolgerungen, da die Stichprobe nicht die Gesamtpopulation widerspiegelt.
   
2. **Eingeschränkte Generalisierbarkeit:** <br>
Wenn die Zielgruppe nicht repräsentativ ist, lassen sich die Ergebnisse nicht auf die gesamte Population oder andere Gruppen übertragen, was die **externe Validität** einschränkt.
   
3. **Verzerrte Ergebnisse:** <br>
Eine unrepräsentative Zielgruppe kann falsche Korrelationen oder Ursache-Wirkungs-Beziehungen suggerieren, was die **interne Validität** der Analyse beeinträchtigt.
   
4. **Overfitting:** <br>
Die Analyse könnte zu stark an die spezifischen Merkmale der falschen Zielgruppe angepasst sein, wodurch das Modell bei anderen Datensätzen schlecht funktioniert.
   
5. **Übersehene wichtige Variablen:** <br>
Bestimmte relevante Gruppen oder Variablen werden möglicherweise gar nicht berücksichtigt, was zu unvollständigen oder fehlerhaften Ergebnissen führt.

---

# eine effektive Umfrage gestalten

1. **Klares Ziel festlegen**
- klare Definition des Ziels, das mit der Umfrage erreicht werden soll
- Welche Informationen benötigt man, um Entscheidungen zu treffen?
Beispiel: Will man die Kundenzufriedenheit messen oder herausfinden, wie oft Kunden ein bestimmtes Produkt nutzen?

<br>

2. **Zielgruppe definieren**
- wer soll an der Umfrage teilnehmen?
- Auswahl einer repräsentativen Gruppe, die zum Thema passt
Beispiel: Wenn man die Meinung von Jugendlichen zu einer neuen App erfahren will, sollten die Teilnehmer auch diese Altersgruppe widerspiegeln.

<br>

3. **Fragetypen wählen**
- Geschlossene Fragen liefern leicht quantifizierbare Antworten (z.B. Multiple-Choice-Fragen, Ja/Nein-Fragen).
- Offene Fragen bieten tiefere Einblicke und qualitative Daten, erfordern aber mehr Analysearbeit.
Beispiel: Eine geschlossene Frage könnte lauten: "Wie zufrieden sind Sie mit unserem Service? (Skala 1-5)", eine offene Frage wäre: "Was könnten wir verbessern?"

<br>

4. **Einfache und präzise Sprache**
- Verwendung präziser und leicht verständlicher Formulierungen
Beispiel: Anstatt "Wie beurteilen Sie die Effizienz der Produktdistribution?", besser: "Wie zufrieden sind Sie mit der schnellen Lieferung unserer Produkte?"

<br>

5. **Fragen logisch und übersichtlich anordnen**
- allgemeine Fragen zuerst, dann spezifischere Fragen
- ähnliche Fragen gruppieren, um den Fluss der Umfrage zu verbessern und Verwirrung zu vermeiden

<br>

6. **Skalen und Antwortmöglichkeiten sorgfältig auswählen**
- für geschlossene Fragen sollten die Antwortmöglichkeiten alle relevanten Optionen abdecken.
- bei Skalenfragen sollte die Skala balanciert und verständlich sein (z.B. 1 für "sehr unzufrieden" und 5 für "sehr zufrieden").

<br>

7. **Länge der Umfrage begrenzen**
- die Umfrage so kurz wie möglich halten
- lange Umfragen führen häufig zu Abbrüchen oder ungenauen Antworten

<br>

8. **Pilotstudie durchführen**
- Test der Umfrage in einer kleinen Gruppe zur Sammlung von Feedback

<br>

9. **Anonymität und Vertraulichkeit garantieren** 
- Gewährleistung der Anonymität und Vertraulichkeit der Antworten
- kann die Ehrlichkeit der Antworten fördern.

<br>

10. **Verteilungsstrategie planen** 
- Auswahl der geeigneten Methode zur Verteilung der Umfrage
-  online, per E-Mail, persönlich durchgeführt?
-  je nach Zielgruppe können unterschiedliche Methoden effektiv sein.

---

# Strukturierte Interviews


- Form der Datenerhebung, bei der allen Befragten dieselben standardisierten Fragen in derselben Reihenfolge gestellt werden
- Vorteile: Tieferes Verständnis, persönliche Ansichten, gute Vergleichbarkeit
- Nachteile: Zeitaufwendig, teurer.
- Beispiel: Ein Unternehmen interviewt eine Gruppe von Kunden, um qualitative Daten über die Zufriedenheit mit einem neuen Produkt zu erhalten.

<br>

**Merkmale**:
- Feste Reihenfolge der Fragen
- Geschlossene Fragen (oft mit vorgegebenen Antwortmöglichkeiten)
- Ziel: Vergleichbarkeit der Antworten

<br>

**Strukturierte Interviews** sind besser als Umfragen, wenn:

1. **Tiefe Antworten** benötigt werden, z. B. bei komplexen oder persönlichen Themen.
2. **Flexibilität** für Nachfragen wichtig ist, um mehr Klarheit zu gewinnen.
3. **Neues Wissen** erforscht wird, wo qualitative Daten wertvoller sind.
4. **Sensible Themen** behandelt werden, bei denen persönliches Vertrauen nötig ist.
5. **Kleine Stichproben** untersucht werden, bei denen Detailtiefe entscheidend ist.
6. **Nonverbale Signale** wie Körpersprache berücksichtigt werden sollen.

Sie sind ideal, wenn qualitative Einsichten über reine Zahlen wichtiger sind.

## Herausforderungen bei der Datenerhebung 
     
1. **Bias (Verzerrung):** 
    - eine der größten Herausforderungen bei der Erhebung von Daten und der Auswahl von Stichproben 
    - Verzerrungen können auf verschiedene Weise auftreten: 
       - durch Auswahl der Stichprobe (z.B. wenn bestimmte Gruppen der Bevölkerung unterrepräsentiert sind) 
       - durch die Art und Weise, wie Fragen gestellt werden 
       - durch die Reaktionen der Befragten 
     
<br> 
     
2. **Zugang zur Population:** 
    - meist ist es schwierig, Zugang zur gesamten Population zu erhalten 
    - kann geografische, rechtliche oder finanzielle Gründe haben 
     
<br> 
     
3. **Non-Response Bias:** <br> 
    - bedeutet, dass bestimmte Personen nicht an einer Umfrage oder Datenerhebung teilnehmen, 
    - kann dazu führen, dass die Stichprobe nicht mehr repräsentativ ist 
    - z.B. könnten besonders beschäftigte oder uninteressierte Personen nicht teilnehmen, was die Ergebnisse verzerrt 
     
<br> 
     
4. **Datenqualität:** <br> 
    - Genauigkeit und Zuverlässigkeit der erhobenen Daten sind entscheidend für die Analyse 
    - schlechte Datenqualität kann durch Missverständnisse bei der Befragung, fehlerhafte Messungen oder ungenaue Aufzeichnungen entstehen 
    - die Daten müssen gründlich überprüft und bereinigt werden, um zuverlässige Ergebnisse zu gewährleisten

# Unterschiede zwischen qualitativer und quantitativer Forschung 
     
     
     
| **Eigenschaft**           | **Quantitative Daten** | **Qualitative Daten**       | 
|---------------------------|------------------------|-----------------------------| 
| **Art der Information**    | Messbar, numerisch     | Beschreibend, textuell       | 
| **Analyse**                | Statistische Methoden  | Inhaltliche Analyse, Themen  | 
| **Beispiele**              | Größe, Gewicht, Anzahl | Meinungen, Erfahrungen       | 
| **Erhebungsmethode**       | Umfragen, Messungen    | Interviews, Beobachtungen    | 
    
<br> 
     
1. **Ziel und Ansatz:** 
   - **Quantitative Forschung** <br> 
     - zielt darauf ab, numerische Daten zu sammeln und statistisch auszuwerten 
     - geht oft darum, Muster oder Korrelationen in großen Datensätzen zu finden, Hypothesen zu testen und generalisierbare Aussagen zu machen 
     - basiert auf objektiven Messungen und mathematischen Modellen 
   - **Qualitative Forschung** <br> 
     - befasst sich mit nicht-numerischen Daten(z.B. Texte, Interviews, Beobachtungen, Videos) 
     - konzentriert sich auf die tiefe Analyse individueller Erfahrungen, Meinungen oder sozialer Phänomene 
     - Ziel ist oft, komplexe menschliche Verhaltensweisen oder Einstellungen zu verstehen 
     
<br> 
     
2. **Datenquellen:** 
   - **Quantitative Daten** 
     - stammen häufig aus Umfragen, Tests, Experimenten oder offiziellen Statistiken 
     - oft standardisiert und lassen sich gut in Zahlen ausdrücken (z.B. Prozentsätze, Mittelwerte, Verteilungen...) 
   - **Qualitative Daten** 
     - stammen aus Interviews, Fokusgruppen, Beobachtungen oder Dokumentenanalysen 
     - oft detaillierter und kontextbezogener und konzentrieren sich auf individuelle Erfahrungen oder tiefe Einblicke in bestimmte Themen 
     
<br> 
     
3. **Analyse:** 
   - **Quantitative Analysen** <br> 
     - verwenden statistische Methoden, um Beziehungen zwischen Variablen zu untersuchen 
     - Beispiele: Regressionsanalysen, Varianzanalysen, Hypothesentests 
     - Ergebnisse werden oft in Form von Zahlen, Diagrammen und Tabellen präsentiert 
   - **Qualitative Analysen** <br> 
     - verwenden Methoden wie die Inhaltsanalyse, die narrative Analyse oder die Grounded Theory 
     - Daten werden auf Muster, Themen oder Bedeutungen untersucht 
     - Interpretation erfolgt oft in Form von Texten, in denen die Ergebnisse beschrieben und erklärt werden 
     
<br> 
     
4. **Generalisation:** 
   - **Quantitative Forschung** <br> 
     - ermöglicht durch große Stichproben und statistische Analysen die Generalisierung der Ergebnisse auf eine größere Population 
   - **Qualitative Forschung** <br> 
     - zielt weniger auf Generalisierung ab 
     - eher auf tieferes Verständnis spezifischer Fälle oder Phänomene 
     - Ergebnisse sind oft nicht auf die gesamte Population übertragbar, liefern aber wertvolle Einblicke in individuelle Perspektiven 
     

Man kann sagen, dass sowohl qualitative als auch quantitative Methoden ihre eigenen Stärken und Schwächen haben. Quantitative Forschung ist ideal, wenn es um die Untersuchung großer Datenmengen und das Testen von Hypothesen geht. Qualitative Forschung hingegen ist besser geeignet, um tiefe Einblicke in spezifische Themen zu gewinnen und die Komplexität menschlicher Erfahrungen zu verstehen.