# UMR QB1 - Seminar zur Genexpressionsanalyse

---

## Medizinisches Problem & Forschungsfrage

**"_Was sind die molekularen Unterschiede zwischen Krebszellen und normalem menschlichem Gewebe, und wie k√∂nnen wir diese Unterschiede nutzen, um neue therapeutische Ziele und deren Medikamente f√ºr die Krebsbehandlung zu identifizieren?_"**

### **Warum dies f√ºr die Medizin wichtig ist:**
- **Krebs-Heterogenit√§t:** Verschiedene Krebsarten haben unterschiedliche molekulare Signaturen
- **Personalisierte Medizin:** Behandlungen m√ºssen auf spezifische Krebsarten zugeschnitten sein
- **Medikamentenresistenz:** Krebszellen entwickeln sich weiter, um der Behandlung zu entgehen
- **Therapeutische Ziele:** Neue Medikamente werden dringend f√ºr bessere Patientenergebnisse ben√∂tigt

### **Was wir entdecken werden:**
1. **Molekulare Krebs-Signaturen:** Gene, die in Krebs vs. normalem Gewebe konsistent ver√§ndert sind
2. **Therapeutische Schwachstellen:** Signalwege, die mit Medikamenten gezielt behandelt werden k√∂nnten
3. **Drug Repurposing-M√∂glichkeiten:** Bestehende Medikamente, die Krebs behandeln k√∂nnten
4. **Biomarker-Identifikation:** Gene, die das Therapieansprechen vorhersagen k√∂nnten

---


## Datensatz: Eine echte Krebs vs. Normal Gewebe Studie

**Klinischer Kontext:** Universal Human Reference (UHR) vs Human Brain Reference (HBR)  
**Medizinische Relevanz:** Krebs-Zelllinien vs. normales menschliches Hirngewebe<br>
**Stichprobengr√∂√üe:** 6 Proben (3 Krebs-Replikate vs. 3 Normal-Hirngewebe-Replikate)  
**Datentyp:** Paired-end RNA-Sequenzierung (Chromosom 22 Teilmenge)  
**Referenz:** Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL (2015) Informatics for RNA Sequencing: A Web Resource for Analysis on the Cloud. *PLoS Comput Biol* 11(8): e1004393. https://doi.org/10.1371/journal.pcbi.1004393



### **Medizinische Proben**

#### **UHR (Universal Human Reference) = KREBS-PROBEN**
- **Zusammensetzung:** Gesamt-RNA aus 10 verschiedenen menschlichen Krebs-Zelllinien
- **Enthaltene Krebsarten:** Brust-, Leber-, Geb√§rmutterhals-, Hoden-, Hirn-, Hautkrebs plus Immunzellen (T-Zelle, B-Zelle, Makrophage, Histiozyt)
- **Warum dies wichtig ist:** Repr√§sentiert die gemeinsamen molekularen Merkmale verschiedener Krebsarten
- **Klinische Relevanz:** Hilft bei der Identifizierung von pan-Krebs therapeutischen Zielen

#### **HBR (Human Brain Reference) = NORMALE GEWEBE-KONTROLLEN**
- **Zusammensetzung:** Gesamt-RNA aus Gehirnen von 23 gesunden Kaukasiern, meist 60-80 Jahre alt
- **Warum Hirngewebe:** Bietet eine normale Gewebe-Baseline zum Vergleich
- **Klinische Relevanz:** Zeigt, wie "gesunde" Genexpression aussieht

### **Die biologische Hypothese:**
**Krebszellen werden systematische Ver√§nderungen in der Genexpression im Vergleich zu normalem Gewebe zeigen, die offenbaren:**
1. **Onkogene** (krebsf√∂rdernde Gene), die √ºberexprimiert sind
2. **Tumorsuppressoren** (krebsverhindernde Gene), die unterdr√ºckt sind
3. **Stoffwechselwege**, die ver√§ndert sind, um Krebswachstum zu unterst√ºtzen
4. **Medikamenten-Ziele**, die Krebszellen selektiv abt√∂ten k√∂nnten

---

## Lernziele


**Technische F√§higkeiten:**
1. Durchf√ºhrung einer differentiellen Expressionsanalyse zur Identifikation von Krebs-Biomarkern
2. Durchf√ºhrung einer Pathway-Anreicherung zum Verst√§ndnis der Krebsbiologie
3. Anwendung von computationalem Drug Repurposing zur therapeutischen Entdeckung

**Medizinisches Verst√§ndnis:**
1. **Interpretation von Krebs-Gensignaturen** im klinischen Kontext
2. **Identifikation potenzieller Biomarker** f√ºr Krebsdiagnose/-prognose
3. **Verst√§ndnis des Drug Repurposing** als Strategie f√ºr schnellere therapeutische Entwicklung
4. **Verkn√ºpfung computationaler Befunde** mit realen Krebsbehandlungsentscheidungen

**Klinische Translation:**
1. **Bewertung therapeutischer Ziele**, die durch RNA-Seq identifiziert wurden
2. **Beurteilung von Medikamentenkandidaten** f√ºr Krebsbehandlungspotenzial
3. **Verst√§ndnis von Personalisierter Medizin**-Ans√§tzen in der Krebsversorgung

---

## Setup und Einf√ºhrung

#### Installation von Conda

Nach Ausf√ºhrung dieser Zelle wird die Laufzeitumgebung automatisch neu gestartet. Warten Sie, bis dieser Vorgang abgeschlossen ist, bevor Sie fortfahren. Ignorieren Sie Fehlermeldungen und Warnungen

In [1]:
!pip install -q condacolab
import condacolab
condacolab.install()

‚è¨ Downloading https://github.com/jaimergp/miniforge/releases/download/24.11.2-1_colab/Miniforge3-colab-24.11.2-1_colab-Linux-x86_64.sh...
üì¶ Installing...
üìå Adjusting configuration...
ü©π Patching environment...
‚è≤ Done in 0:00:12
üîÅ Restarting kernel...


#### √úberpr√ºfung der Conda-Installation

In [1]:
import condacolab
condacolab.check()

‚ú®üç∞‚ú® Everything looks OK!


#### Installation aller erforderlichen Software und Pakete

ca. 5 min

In [2]:
%%bash
conda install -c bioconda -c conda-forge bioconductor-deseq2 r-optparse r-ggplot2 r-gprofiler2 r-dplyr r-tidyr -y -q 2>&1

Channels:
 - bioconda
 - conda-forge
Platform: linux-64
Collecting package metadata (repodata.json): ...working... done
Solving environment: ...working... done

## Package Plan ##

  environment location: /usr/local

  added / updated specs:
    - bioconductor-deseq2
    - r-dplyr
    - r-ggplot2
    - r-gprofiler2
    - r-optparse
    - r-tidyr


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    _r-mutex-1.0.1             |      anacondar_1           3 KB  conda-forge
    argcomplete-3.6.3          |     pyhd8ed1ab_0          41 KB  conda-forge
    binutils_impl_linux-64-2.43|       h4bf12b8_2         5.4 MB  conda-forge
    bioconductor-biobase-2.66.0|    r44h3df3fcb_0         2.6 MB  bioconda
    bioconductor-biocgenerics-0.52.0|    r44hdfd78af_3         678 KB  bioconda
    bioconductor-biocparallel-1.40.0|    r44he5774e6_1         1.6 MB  bioconda
    bioconductor-data-packages-202506

#### Daten- und Skript-Repository

- Expressionsdaten: Vorverarbeitete RNA-Seq Datendateien und Count-Matrix
- Analyseskripte f√ºr jeden Schritt
- Referenzgenom-Dateien und Annotationen

In [3]:
%%bash
git clone https://gitlab.uni-rostock.de/wb283/qb1rnaseq.git

Cloning into 'qb1rnaseq'...


In [4]:
%%bash
ls

condacolab_install.log
qb1rnaseq
sample_data


In [6]:
%%bash
ls qb1rnaseq

counts.tsv
drug_repositioning.py
expression_technology_comparison_ed2.jpg
griffith-data.tar.gz
load_data.R
mapping.sh
pathway_analysis.R
README.md
rnaseq_experiments.png
rnaseq_expression_table_ed2.jpg
rnaseq_mapping_example_ed2.jpg
run_deseq2.R
samples.tsv
V57


---

## 1 Datenexploration

### Laden der Genexpressionsdaten

Dieser Schritt l√§dt die vorverarbeiteten RNA-Seq Expressionsdaten und bereitet sie f√ºr die statistische Analyse vor.

**Was geschieht hier:**
- Einlesen der Count-Matrix (Zeilen = Gene, Spalten = Proben)
- Laden der Proben-Metadaten (Krebs vs. Normal)
- Grundlegende Qualit√§tskontrollpr√ºfungen
- Vorbereitung der Daten f√ºr DESeq2-Analyse

**Medizinische Bedeutung:**
Diese Count-Matrix repr√§sentiert, wie aktiv jedes Gen in Krebs vs. normalem Gewebe ist. H√∂here Werte = h√∂here Genexpression.

In [14]:
%cd qb1rnaseq

[Errno 2] No such file or directory: 'qb1rnaseq'
/content/qb1rnaseq


In [15]:
%%bash
ls

counts.tsv
degs.tsv
deseq2_results.RData
drug_repositioning.py
expression_technology_comparison_ed2.jpg
griffith-data.tar.gz
heatmap.png
load_data.R
mapping.sh
pathway_analysis.R
pca_plot.png
README.md
rnaseq_experiments.png
rnaseq_expression_table_ed2.jpg
rnaseq_mapping_example_ed2.jpg
run_deseq2.R
samples.tsv
V57
volcano_plot.png


In [None]:
%%bash
head samples.tsv

In [None]:
%%bash
head counts.tsv

---

## 2 Differentielle Expressionsanalyse

### Differentielle Expressionsanalyse mit DESeq2

**Was ist differentielle Expression?**
Differentielle Expressionsanalyse identifiziert Gene, die zwischen Krebs und normalem Gewebe unterschiedlich exprimiert sind. Dies offenbart:
- **Onkogene**: Gene mit h√∂herer Expression in Krebs (f√∂rdern Krebswachstum)
- **Tumorsuppressoren**: Gene mit niedrigerer Expression in Krebs (verhindern normalerweise Krebs)

**Wie funktioniert DESeq2?**
DESeq2 ist eine statistische Methode, die:
1. Normalisiert Count-Daten √ºber Proben hinweg
2. Modelliert biologische Variabilit√§t zwischen Replikaten
3. Testet auf signifikante Expressionsunterschiede
4. Korrigiert f√ºr multiple Testprobleme

**Wichtige Ausgabemetriken:**
- **Log2FoldChange**: Wie stark sich die Expression ver√§ndert hat (positiv = h√∂her in Krebs)
- **Adjusted p-value (padj)**: Statistische Signifikanz (< 0.05 = signifikant)
- **Base mean**: Durchschnittliche Expressionsst√§rke √ºber alle Proben

**Medizinische Interpretation:**
- Gene mit **hohem positivem log2FC** sind potenzielle Medikamenten-Ziele (zu unterdr√ºcken)
- Gene mit **hohem negativem log2FC** sind potenzielle Biomarker f√ºr Krebssuppression
- **Signifikante Gene** (padj < 0.05) k√∂nnten als diagnostische oder prognostische Marker dienen

In [12]:
%%bash
ls

counts.tsv
drug_repositioning.py
expression_technology_comparison_ed2.jpg
griffith-data.tar.gz
load_data.R
mapping.sh
pathway_analysis.R
README.md
rnaseq_experiments.png
rnaseq_expression_table_ed2.jpg
rnaseq_mapping_example_ed2.jpg
run_deseq2.R
samples.tsv
V57


In [13]:
%%bash
Rscript run_deseq2.R --metadata samples.tsv --expression counts.tsv

Reading input files...
Retained 1567 genes for analysis
Running DESeq2 analysis...
GTF file not found, using transcript IDs as gene symbols
Differentially expressed genes written to: degs.tsv 
Generating plots...
null device 
          1 
Checking genes for heatmap...
Genes in res_df: 1466 
Genes in vsd: 1567 
Overlapping genes: 0 
No overlap found, using top genes from vsd directly...
Selected 20 genes for heatmap
Heatmap saved to: heatmap.png 
null device 
          1 
Analysis complete. Plots saved as: pca_plot.png, heatmap.png, volcano_plot.png 
R workspace saved as: deseq2_results.RData 


1: package ‚ÄòDESeq2‚Äô was built under R version 4.4.3 
2: package ‚ÄòmatrixStats‚Äô was built under R version 4.4.3 
3: package ‚Äòoptparse‚Äô was built under R version 4.4.3 
using ntop=500 top features by variance


In [None]:
%%bash
cd qb1rnaseq
head degs.tsv

### Interpretation der DESeq2-Ergebnisse

**Verst√§ndnis der Ausgabetabelle:**

Jede Zeile repr√§sentiert ein Gen mit den folgenden Spalten:

**gene_id**
- Eindeutige Kennung f√ºr jedes Gen oder Transkript
- Format: Ensembl-Transkript-ID (z.B. ENST00000...)

**baseMean**
- Durchschnittliche normalisierte Count-Anzahl √ºber alle Proben
- H√∂here Werte = st√§rkere Gesamt-Genexpression
- Wichtig f√ºr die Priorisierung biologisch relevanter Gene

**log2FoldChange**
- Expressions√§nderung zwischen Krebs und normalem Gewebe (auf log2-Skala)
- **Positive Werte**: Gene h√∂her exprimiert in Krebs (potenzielle Onkogene)
- **Negative Werte**: Gene niedriger exprimiert in Krebs (potenzielle Tumorsuppressoren)
- **Magnitude**: |log2FC| > 1 bedeutet eine mindestens 2-fache Ver√§nderung

**lfcSE (log fold change standard error)**
- Unsicherheitsma√ü f√ºr die log2FoldChange-Sch√§tzung
- Kleinere Werte = pr√§zisere Sch√§tzungen

**stat**
- Wald-Teststatistik (verwendet f√ºr die Hypothesentestung)
- Gr√∂√üere absolute Werte deuten auf st√§rkere Evidenz f√ºr differentielle Expression hin

**pvalue**
- Roher p-Wert aus dem statistischen Test
- Wahrscheinlichkeit, diesen Effekt zuf√§llig zu beobachten

**padj (adjusted p-value)**
- P-Wert korrigiert f√ºr multiples Testen (Benjamini-Hochberg-Methode)
- **< 0.05**: Statistisch signifikante differentielle Expression
- **< 0.01**: Hochsignifikante differentielle Expression
- Dies ist die wichtigste Metrik f√ºr die Identifikation echter Krebs-assoziierter Gene

---

### Priorisierung von Krebs-assoziierten Genen

**F√ºr therapeutische Ziele (Onkogene):**
```
Suchen nach:
- padj < 0.05 (statistisch signifikant)
- log2FoldChange > 1 (mindestens 2-fach erh√∂ht in Krebs)
- baseMean > 50 (angemessen exprimiert)
```

**F√ºr Krebs-Biomarker (Tumorsuppressoren):**
```
Suchen nach:
- padj < 0.05 (statistisch signifikant)
- log2FoldChange < -1 (mindestens 2-fach verringert in Krebs)
- baseMean > 50 (angemessen exprimiert)
```

**Klinische Bedeutung:**
- **Hochregulierte Gene** (positiver log2FC) k√∂nnten mit Inhibitor-Medikamenten gezielt behandelt werden
- **Herunterregulierte Gene** (negativer log2FC) k√∂nnten Wege offenbaren, die wiederhergestellt werden m√ºssen
- **Signifikante Gene** sind Kandidaten f√ºr diagnostische Tests oder therapeutische Interventionen

### Visualisierung differentiell exprimierter Gene

**Volcano Plot:**
Visualisiert sowohl die Gr√∂√üe der Ver√§nderung (log2 fold change) als auch die statistische Signifikanz (p-Wert) f√ºr alle Gene gleichzeitig.

**Interpretation:**
- **X-Achse**: Expressionsver√§nderung (negativ = herunterreguliert in Krebs, positiv = hochreguliert)
- **Y-Achse**: Statistische Signifikanz (-log10 p-Wert; h√∂her = signifikanter)
- **Rote Punkte**: Potenzielle Onkogene (hochreguliert in Krebs)
- **Blaue Punkte**: Potenzielle Tumorsuppressoren (herunterreguliert in Krebs)
- **Graue Punkte**: Nicht signifikante Ver√§nderungen

**Klinische Bedeutung:**
- Die am weitesten rechts liegenden roten Punkte sind die st√§rksten Onkogen-Kandidaten
- Die am weitesten links liegenden blauen Punkte sind die st√§rksten Tumorsuppressor-Kandidaten
- H√∂he auf der Y-Achse best√§tigt statistische Robustheit

In [None]:
%%bash
cd qb1rnaseq
Rscript create_plots.R

In [None]:
from IPython.display import Image, display
display(Image('qb1rnaseq/volcano_plot.png'))

**PCA Plot (Principal Component Analysis):**
Reduziert Tausende von Genmessungen auf zwei Dimensionen und zeigt, wie √§hnlich oder unterschiedlich Proben basierend auf ihren gesamten Genexpressionsprofilen sind.

**Interpretation:**
- **Jeder Punkt** = eine Probe (rot = Krebs, blau = normal)
- **Abstand zwischen Punkten** = molekulare √Ñhnlichkeit
- **Klare Trennung** = deutliche molekulare Unterschiede zwischen Krebs und Normal
- **PC1 & PC2** = Hauptkomponenten, die die gr√∂√üte Variation erfassen

**Klinische Bedeutung:**
- Klare Trennung best√§tigt robuste Krebs vs. Normal-Unterschiede
- Clustering innerhalb von Gruppen zeigt konsistente Replikation
- Dies validiert, dass unsere Genexpressionsunterschiede real sind

In [None]:
display(Image('qb1rnaseq/pca_plot.png'))

**Heatmap (W√§rmekarte):**
Zeigt Expressionsmuster der 20 signifikantesten Gene √ºber alle Proben hinweg, wobei Farbe die Expressionsst√§rke repr√§sentiert.

**Interpretation:**
- **Zeilen** = Gene (Top 20 signifikanteste)
- **Spalten** = Proben (Krebs links, Normal rechts)
- **Farbe** = Expressionsst√§rke (rot = hoch, blau = niedrig)
- **Muster** = Konsistente Unterschiede zwischen Krebs und Normal

**Klinische Bedeutung:**
- Gene mit roter/Krebs- und blau/Normal-Spalten = potenzielle Onkogene
- Gene mit blau/Krebs- und roter/Normal-Spalten = potenzielle Tumorsuppressoren
- Konsistente Muster √ºber Replikate hinweg best√§tigen zuverl√§ssige Biomarker

In [None]:
display(Image('qb1rnaseq/heatmap.png'))

---

## 3 Pathway-Analyse

### Pathway-Analyse mit g:Profiler

**Was ist Pathway-Analyse?**
Pathway-Analyse gruppiert differentiell exprimierte Gene in biologische Funktionen, Stoffwechsel- und Signalwege. Statt einzelner Gene untersuchen wir ganze zellul√§re Prozesse.

**Warum dies wichtig ist:**
- Einzelne Gene sind schwer zu interpretieren
- Pathway-Ver√§nderungen offenbaren, **wie** Krebs funktioniert
- Identifiziert Prozesse, die gezielt mit Medikamenten behandelt werden k√∂nnen
- Verbindet molekulare Daten mit bekannter Krebsbiologie

**Was g:Profiler macht:**
1. Nimmt unsere Liste differentiell exprimierter Gene entgegen
2. Testet auf √úberrepr√§sentation in biologischen Datenbanken:
   - **GO:BP** (Gene Ontology: Biological Process) - zellul√§re Funktionen
   - **KEGG** - metabolische und Signalwege
   - **REAC** (Reactome) - molekulare Interaktionsnetzwerke
3. Gibt angereicherte Pathways mit statistischer Signifikanz zur√ºck

**Erwartete Krebs-Pathways:**

**Hochreguliert in Krebs (Onkogene):**
- Zellzyklus-Progression (unkontrollierte Zellteilung)
- DNA-Replikation (schnelle Zellvermehrung)
- Metabolische Umprogrammierung (Energieerzeugung f√ºr Wachstum)
- Angiogenese (Blutgef√§√übildung zur Tumorversorgung)

**Herunterreguliert in Krebs (Tumorsuppressoren):**
- Apoptose (programmierter Zelltod)
- DNA-Reparatur (Aufrechterhaltung der genomischen Stabilit√§t)
- Zellzyklus-Checkpoints (Stopp gesch√§digter Zellen)
- Immun√ºberwachung (Erkennung abnormaler Zellen)

**Klinische Anwendung:**
- Angereicherte Pathways offenbaren **therapeutische Schwachstellen**
- Beispiel: Wenn DNA-Reparatur herunterreguliert ist ‚Üí DNA-sch√§digende Chemotherapie k√∂nnte effektiver sein
- Pathway-Wissen leitet die Auswahl von Kombinationstherapien

In [None]:
%%bash
cd qb1rnaseq
Rscript pathway_analysis.R --input degs.tsv --output pathway_results.tsv

In [None]:
%%bash
cd qb1rnaseq
head pathway_results.tsv

---

## 4 Drug Repurposing

### Drug Repurposing in der Krebsforschung

**Was ist Drug Repurposing?**
Drug Repurposing (auch Wirkstoffumnutzung genannt) bedeutet, neue therapeutische Anwendungen f√ºr bestehende Medikamente zu finden. Dieser Ansatz bietet mehrere Vorteile:

1. **Schnellere Entwicklung**: 5-10 Jahre vs. 15-20 Jahre f√ºr neue Medikamente
2. **Bekannte Sicherheitsprofile**: Bestehende Medikamente haben etablierte Sicherheitsdaten
3. **Niedrigere Kosten**: Reduziert das Risiko und die Kosten der Medikamentenentwicklung
4. **Sofortige klinische Anwendung**: Kann in einigen F√§llen off-label verschrieben werden

**Wie funktioniert computationales Drug Repurposing?**
Unser Ansatz verwendet Genexpressions-Signaturen:
1. **Krebs-Signatur**: Listen von Onkogenen (hochreguliert) und Tumorsuppressoren (herunterreguliert)
2. **Medikamenten-Effekt-Datenbank**: Wie Tausende von Medikamenten die Genexpression beeinflussen
3. **Signatur-Matching**: Finde Medikamente, die Krebs-Genexpressionsmuster umkehren

**Erfolgsgeschichten:**
- **Metformin**: Diabetes-Medikament ‚Üí Krebspr√§vention (200+ klinische Studien)
- **Aspirin**: Schmerzlinderung ‚Üí Krebspr√§vention (FDA-zugelassen)
- **Rapamycin**: Immunsuppressivum ‚Üí Krebs- und Alterungsforschung

**Unsere Skript-Vorbereitung:**
Konvertiert unsere DESeq2-Ergebnisse in ein Format, das mit L1000CDS2, einer gro√üen Drug Repurposing-Datenbank, kompatibel ist.

### Abfrage der L1000CDS2-Medikamenten-Datenbank

**Was ist L1000CDS2?**
L1000CDS2 (L1000 Characteristic Direction Signature) ist ein von dem Ma'ayan-Labor entwickeltes computationales Tool, das:

1. **Datenbankumfang**: Enth√§lt Genexpressions-Signaturen f√ºr >20.000 Medikamente, die an menschlichen Zelllinien getestet wurden
2. **Signatur-Matching**: Verwendet mathematische Algorithmen, um Medikamente zu finden, die Krankheits-Signaturen umkehren
3. **LINCS-Programm**: Teil der NIH Library of Integrated Network-based Cellular Signatures Initiative

**Wie funktioniert der Algorithmus?**
1. **Eingabe-Signatur**: Unsere Krebs-Gen-Signatur (Onkogene + Tumorsuppressoren)
2. **Datenbanksuche**: Vergleicht mit medikamenten-induzierten Expressionsver√§nderungen
3. **Bewertungssystem**: Berechnet, wie gut jedes Medikament die Krebs-Signatur umkehrt
4. **Ranking**: Gibt Medikamente nach ihrem Potenzial, Krebs entgegenzuwirken, sortiert zur√ºck

**Interpretation der Ergebnisse:**
- **Negative Scores**: Medikamente, die Krebs-Signaturen umkehren (hohes therapeutisches Potenzial)
- **Positive Scores**: Medikamente, die Krebs-Signaturen nachahmen (diese vermeiden)
- **Score-Magnitude**: Gr√∂√üere absolute Werte deuten auf st√§rkere Effekte hin

**Klinische Validierung:**
Das System hat erfolgreich identifiziert:
- Bekannte Krebs-Medikamente (validiert den Ansatz)
- Repositionierte Medikamente, die bereits in Krebs-Studien sind
- Neue Repurposing-M√∂glichkeiten f√ºr weitere Untersuchungen


In [None]:
%%bash
cd qb1rnaseq
python drug_repositioning.py --input degs.tsv --output drug_candidates.txt

In [None]:
%%bash
cd qb1rnaseq
cat drug_candidates.txt

### Interpretation der Drug Repurposing-Ergebnisse

**Verst√§ndnis der L1000CDS2-Scores:**

Die Drug Repurposing-Analyse produziert eine geordnete Liste von Verbindungen basierend auf ihrer F√§higkeit, Krebs-Gen-Signaturen umzukehren. So interpretieren Sie die Ergebnisse:

**Score-Interpretation:**
- **Negative Scores**: Hohes therapeutisches Potenzial (Medikamente, die Krebs-Signaturen umkehren)
- **Positive Scores**: Diese Medikamente vermeiden (sie ahmen Krebs-Signaturen nach oder verschlechtern sie)
- **Score-Magnitude**: Gr√∂√üere absolute Werte deuten auf st√§rkere vorhergesagte Effekte hin

**Validierungskategorien:**

**Bekannte Krebs-Medikamente (Positive Kontrollen):**
- **Beispiele**: Doxorubicin, Paclitaxel, Cisplatin, Tamoxifen, Imatinib
- **Bedeutung**: Validiert unseren computationalen Ansatz
- **Klinische Bedeutung**: Best√§tigt, dass die Krebs-Signatur biologisch relevant ist
- **Forschungswert**: Zeigt, dass die Methode etablierte Krebs-Therapeutika identifizieren kann

**Erfolgreich repositionierte Medikamente:**
- **Metformin**: Urspr√ºnglich f√ºr Diabetes ‚Üí Jetzt in 200+ Krebs-Klinischen Studien
- **Aspirin**: Urspr√ºnglich f√ºr Schmerz/Entz√ºndung ‚Üí FDA-zugelassen f√ºr Krebspr√§vention
- **Klinischer Erfolg**: Diese Medikamente beweisen, dass Repurposing in der Praxis funktioniert
- **Patientennutzen**: Bereits f√ºr off-label Anwendung in einigen F√§llen verf√ºgbar

**Vielversprechende Repurposing-Kandidaten:**
- **Statine** (Cholesterin-Medikamente): Anti-Krebs-Eigenschaften in Studien entdeckt
- **Rapamycin** (Immunsuppressivum): Aktive Krebs- und Alterungsforschung
- **Chloroquin** (Antimalariamittel): Wird f√ºr Krebs-Anwendungen untersucht
- **Forschungsm√∂glichkeit**: Neue Anwendungen, die weitere Validierung ben√∂tigen

---

### Warum Drug Repurposing funktioniert

**Wissenschaftliche Vorteile:**
- **Schnellerer Entwicklungszeitplan**: 5-10 Jahre vs. 15-20 Jahre f√ºr neue Medikamente
- **Bekannte Sicherheitsprofile**: Bestehende Medikamente haben etablierte Sicherheits- und Nebenwirkungsdaten
- **Niedrigere Entwicklungskosten**: Reduziert das finanzielle Risiko f√ºr pharmazeutische Unternehmen
- **Regulatorische Vorteile**: Schnellerer Zulassungsprozess f√ºr neue Indikationen

**Biologische Begr√ºndung:**
- **Pathway-Targeting**: Viele Krankheiten teilen gemeinsame molekulare Signalwege
- **Polypharmakologie**: Einzelne Medikamente beeinflussen oft mehrere biologische Ziele
- **Netzwerk-Effekte**: Medikamente k√∂nnen miteinander verbundene zellul√§re Systeme beeinflussen
- **Serendipit√∂se Entdeckungen**: Unerwartete vorteilhafte Effekte bei verschiedenen Krankheiten




---

## Kontakt

Dr. rer. nat. Israel Barrantes<br>
Research Group Translational Bioinformatics (head)<br>
Institute for Biostatistics and Informatics in Medicine and Ageing Research, Office 3017<br>
Rostock University Medical Center<br>
Ernst-Heydemann-Str. 8<br>
18057 Rostock, Germany<br>

Email: israel.barrantes[bei]uni-rostock.de<br>

---
Update: 29.10.2025
