# Sekvensanalyse af et Hypotetisk Bispecifikt Antistof

I denne notebook vil vi udføre en sekvensanalyse af et hypotetisk bispecifikt antistof, der binder til både CD20 og CD3. Bispecifikke antistoffer er konstruerede proteiner, der kan binde to forskellige mål samtidig.

## Trin 1: Installation af Biopython

Vi skal bruge Biopython-pakken til vores analyse. Hvis du ikke har Biopython installeret, kan du installere det ved at køre nedenstående kommando.

In [1]:
!pip install biopython



## Trin 2: Import af Nødvendige Biblioteker

Vi importerer de nødvendige biblioteker til vores analyse. Vi bruger `ProteinAnalysis` fra Biopython til at analysere aminosyresekvensen.

In [2]:
from Bio.SeqUtils.ProtParam import ProteinAnalysis

## Trin 3: Definition af Hypotetiske Sekvenser

Vi definerer to sekvenser, en der binder til CD20 og en der binder til CD3. Disse sekvenser er hypotetiske og bruges kun til demonstration.

In [3]:
# Hypotetisk sekvens af et bispecifikt antistof, der binder til CD20 og CD3
sequence_str_cd20 = "EVQLVESGGGLVQPGGSLRLSCAASGFTFSSYAMSWVRQAPGKGLEWVSAISYDGSTYYADSVKGRFTISRDNAKNTLYLQMNSLRAEDTAVYYCARGGGGMDVWGQGTTVTVSS"
sequence_str_cd3 = "QVQLVQSGAEVKKPGSSVKVSCKASGDTFAYWMNWVRQAPGQGLEWIGYINPSRGYTNYNQKFKGKATLTADKSSSTAYMQLSSLKTSEDTAVYYCARERDGWGQGTTVTVSS"

# Kombiner sekvenserne til et bispecifikt antistof (for enkelheds skyld)
sequence_str = sequence_str_cd20 + sequence_str_cd3
print(f"Aminosyresekvens: {sequence_str}")

Aminosyresekvens: EVQLVESGGGLVQPGGSLRLSCAASGFTFSSYAMSWVRQAPGKGLEWVSAISYDGSTYYADSVKGRFTISRDNAKNTLYLQMNSLRAEDTAVYYCARGGGGMDVWGQGTTVTVSSQVQLVQSGAEVKKPGSSVKVSCKASGDTFAYWMNWVRQAPGQGLEWIGYINPSRGYTNYNQKFKGKATLTADKSSSTAYMQLSSLKTSEDTAVYYCARERDGWGQGTTVTVSS


## Trin 4: Sekvensanalyse

Vi bruger `ProteinAnalysis` til at analysere sekvensen og beregne dens basiske egenskaber som molekylvægt, aromatisk indeks, instabilitetsindeks, isoelectric punkt og andel af sekundær struktur.

In [4]:
# Analyser sekvensen
protein_analysis = ProteinAnalysis(sequence_str)

# Beregn basiske egenskaber
molecular_weight = protein_analysis.molecular_weight()
aromaticity = protein_analysis.aromaticity()
instability_index = protein_analysis.instability_index()
isoelectric_point = protein_analysis.isoelectric_point()
secondary_structure_fraction = protein_analysis.secondary_structure_fraction()

# Udskriv resultater
print(f"Molekylvægt: {molecular_weight}")
print(f"Aromatisk indeks: {aromaticity}")
print(f"Instabilitetsindeks: {instability_index}")
print(f"Isoelectric punkt: {isoelectric_point}")
print(f"Andel af sekundær struktur (helix, turn, sheet): {secondary_structure_fraction}")

Molekylvægt: 24572.072300000003
Aromatisk indeks: 0.11403508771929824
Instabilitetsindeks: 32.24517543859649
Isoelectric punkt: 8.95461025238037
Andel af sekundær struktur (helix, turn, sheet): (0.25, 0.33771929824561403, 0.3508771929824561)


### Forklaring af Resultater

1. **Molekylvægt**: Vægten af molekylet i Dalton (Da).
2. **Aromatisk Indeks**: Forholdet af aromatiske aminosyrer i sekvensen. Aromatiske aminosyrer er vigtige for proteinets struktur.
3. **Instabilitetsindeks**: Forudsiger stabiliteten af proteinet i en testtube. En værdi under 40 betyder, at proteinet sandsynligvis er stabilt.
4. **Isoelectric Punkt**: Den pH-værdi, hvor proteinet har en neutral ladning.
5. **Sekundær Struktur**: Andelen af helix, turn, og sheet i proteinets sekundære struktur.