Jetzt wollen wir Moleküle "bauen". Ein relativ wichtiges Hilfsmittel auch der Chemoinformatik ist die "**S**implified **M**olecular **I**nput **L**ine **E**ntry **S**pecification" (SMILES). 

In [None]:
# Wieder ein paar Definitionen.
import stk, stko
from backend.interaction import show_molecule_from_smiles

Hier sind unsere ersten SMILES:

In [None]:
smiles = ['CCCCCC','C1CCCCC1','C1COCCC1','c1ccccc1', 'O=C(O)c1ccccc1O']

Schauen wir uns mal an, was wir gebaut haben (die SMILES können über das Dropdown-Menü angewählt werden, wer erkennt die Regeln?). Das Programm stellt die Molekülstruktur nach einfachen empirischen Regeln zusammen. Mit dem *Optimize* Button kann noch eine Kraftfeld-Optimierung aufgerufen werden, welche eine noch etwas verbesserte Struktur liefert.

In [None]:
show_molecule_from_smiles(smiles, show_structure_formula=True)

Hier eine kleine Übersicht, wie SMILES aufgebaut sind. Weiter unten könnt Ihr ein weiteres Interaktionsfenster laden und alles mal ausprobieren.

## Atome und Ladungen
SMILES Strukturformeln werden ohne Wasserstoffatome ($H$) eingegeben, wobei gängige SMILES Software die Anzahl der möglichen Bindungen, die Atome haben können, versteht und leere Bindungsstellen entsprechend mit Wasserstoffatomen aufgefüllt werden.
Durch das Hinzufügen von eckigen Klammern können Wasserstoffatome auch explizit angegeben werden.
So kann Wasser in verschiedenen Schreibweisen dargestellt werden: `O`, `[OH2]` oder `[H]O[H]` (ausprobieren!).
Atome welche nicht im Teilsatz der wichtigen Atome für die organische Chemie sind ($B$, $C$, $N$, $O$, $P$, $S$, $F$, $Cl$, $Br$ und $I$) können ebenfalls nur durch die Verwendung von eckigen Klammern zu einem SMILES hinzugefügt werden.
Zum Beispiel: `[Au]` (Gold), `[Ti]` (Titan), oder `[Co]` (Kobalt).
Zusätzlich können mit Hilfe der eckigen Klammern Ladungen auf Atomen explizit angegeben werden.
Die Ladungszahl kann dabei durch wiederholte Eingabe des Ladungssymbols (`+` oder `-`) oder eine nachfolgende Zahl eingegeben werden.
Beispiele für Atome und Ladungen:
- `[Co+++]` oder `[Co+3]` für $Co^{3+}$
- `CCC(=O)[O-]` für eine ionisierte Form der Propionsäure


## Bindungen
Standardmäßig werden zwischen den eingegebenen Atomtypen einfache Bindungen angenommen.
Wie in der folgenden Liste zu sehen ist, können diese aber auch explizit definiert werden.
Hier die Liste der möglichen Bindungstypen:
- \- Einfachbindung
- = Doppelbindung
- \# Dreifachbindung

Beispiele für diese Bindungstypen wären:
- `CC` oder `C-C` für Ethan ($CH_3CH_3$)
- `C=C` für Ethen ($CH_2CH_2$)
- `N#N` für molekularen Stickstoff ($N_2$)

Zusätzlich können Strukturen durch hinzufügen eines Punktes (.) unterbrochen werden. Ein einfaches Beispiel wäre `CCCCC.CCCCC` für zwei unabhängige Kohlenstoffketten.

## Verweigungen
Eine Abzweigung einer Kette kann angegeben werden, indem die Atome des Zweiges in (runde) Klammern gesetzt werden.
Der Zweig wird an das Atom vor der Klammer angefügt.
Spezielle Bindungstypen können auch als erstes Symbol in der Klammer gesetzt werden.
Beispiele für Verzweigungen wären:
- `CC(O)C` für Isopropanol
- `CC(=O)C` für Aceton

## Ringe
Durch das Hinzufügen von Zahlen kann der Start und das Ende eines Ringes beschrieben werden.
Dabei werden die Zahlen hinter das betroffene Atom angefügt.
Beispiele für Ringstrukturen wären:
- `C1CCCCC1` für Cyclohexan
- `C1OC1CC` für 1,2-Epoxybutan

Eine aromatische Bindung, welche immer mindestens einen Ring aufweist, kann durch Verwendung von kleinen Buchstaben codiert werden.
Beispiele für aromatische Ringstrukturen:
- `c1ccccc1` für Benzol
- `c1cc2ccccc2cc1` für Naphthalin





Nun können wir mit selbst erstellten SMILES experimentieren.
Falls eine Fehlermeldung angezeigt wird ist der SIMLES ungültig und ihr habt etwas falsch gemacht.
Versucht für jeden zuvor erwähnten Typen ein SMILES zu generieren.

In [None]:
show_molecule_from_smiles(smiles = "", show_structure_formula=True)

Auch sehr komplexe Moleküle können so definiert werden, probiert doch mal das hier:

`OCCc1c(C)[n+](cs1)Cc2cnc(C)nc2N`

Weitere Beispiele und die vollständigen Regeln für SMILES findet Ihr im Internet.

Jetzt schreiben wir eines der Moleküle als Datei. Es gibt im Internet diverse weitere Software, mit der Moleküle visualisiert (und ggf. auch weiter bearbeitet) werden können, aber auch, um damit quantenchemische Rechnungen durchzuführen. Sprecht uns gerne an für weitere Hinweise.

In [None]:
stk_mol = stk.BuildingBlock( smiles[-1] )
stk_molo = stko.MMFF().optimize(stk_mol)

writer = stk.MolWriter()
writer.write(stk_molo,"sac.mol")