Jetzt wollen wir Moleküle "bauen". Ein relativ wichtiges Hilfsmittel auch der Chemoinformatik ist die "**S**implified **M**olecular **I**nput **L**ine **E**ntry **S**pecification" (SMILES). 

In [1]:
# Wieder ein paar Definitionen.
import stk, stko
from backend.interaction import show_molecule_from_smiles

Hier sind unseer erstern SMILES

In [2]:
smiles = ['CCCCCC','C1CCCCC1','C1COCCC1','c1ccccc1', 'O=C(O)c1ccccc1O']

Schauen wir uns mal an, was wir gebaut haben:

In [3]:
show_molecule_from_smiles(smiles, show_structure_formula=True)

GridspecLayout(children=(Dropdown(description='SMILES', layout=Layout(grid_area='widget001', width='auto'), op…

Nun schauen wir uns genauer an wie diese SMILES aufgebaut sind.

## Atome und Ladungen
SMILES Strukturformeln werden ohne Wasserstoffatome ($H$) eingegeben, wobei gängige SMILES Software die Anzahl der möglichen Bindungen die Atome haben können versteht und leere Bindungsstellen entsprechend mit Wasserstoffatomen aufgefüllt werden.
Durch hinzufügen von eckigen Klammern können allerdings Wasserstoffatome explizit angegeben werden.
So kann Wasser in verschiedenen Schreibweisen dargestellt werden `O`, `[OH2]` oder `[H]O[H]`.
Atome welche nicht im Teilsatz der wichtigen Atome für die organische Chemie sind ($B$, $C$, $N$, $O$, $P$, $S$, $F$, $Cl$, $Br$ und $I$) können ebenfalls nur durch hinzufügen von eckigen Klammern verwendet werden.
Zum Beispiel: `[Au]` (Gold), `[Ti]` (Titan) oder `[Co]` (Kobalt)


## Bindungen
Standardmäßig werden zwischen den eingegebenen Atomtypen einfache Bindungen angenommen.
Wie in der folgenden Liste zu sehen ist, können diese aber auch explizit definiert werden.
Hier die Liste der möglichen Bindungstypen:
- \- Einfachbindung
- = Doppelbindung
- \# Dreifachbindung

Beispiele für diese Bindungstypen wären:
- `CC` oder `C-C` für Ethan ($CH_3CH_3$)
- `C=C` für Ethen ($CH_2CH_2$)
- `N#N` für Molekularen Stickstoff ($N_2$)

Zusätzlich können Strukturen durch hinzufügen eines Punktes (.) unterbrochen werden. Ein einfaches Beispiel wäre `CCCCC.CCCCC`.

## Verweigungen
Eine Abzweigung einer Kette kann angegeben werden indem die Atome des Zweiges in Klammern gesetzt werden.
Der Zweig wird an das Atom vor der Klammer angefügt.
Spezielle Bindungstypen können auch als erstes Symbol in der Klammer gesetzt werden.
Beispiele hierfür wären:
- `CC(O)C` für Isopropanol
- `CC(=O)C` für Aceton

## Ringe
Durch das Hinzufügen von Zahlen, kann der Start und das Ende eines Ringes beschrieben werden.
Dabei werden die Zahlen hinter das betroffene Atom angefügt.
Beispiele für Ringstrukturen wären:
- `C1CCCCC1` für Cyclohexan
- `C1OC1CC` für 1,2-Epoxybutan

Eine aromatische Bindung, welche immer mindestens einen Ring aufweist kann durch verwendung von kleinen Buchstaben gebildet werden.
Beispiele für aromatische Ringstrukturen:
- `c1ccccc1` für Benzol
- `c1cc2ccccc2cc1` für Naphthalin





Hier können wir nun eigene SMILES testen.

In [4]:
show_molecule_from_smiles(smiles = "", show_structure_formula=True)

GridspecLayout(children=(Text(value='CCCC', description='SMILES', layout=Layout(grid_area='widget001', width='…

Jetzt schreiben wir eines der Moleküle als Datei.

In [5]:
stk_mol = stk.BuildingBlock( smiles[-1] )
stk_molo = stko.MMFF().optimize(stk_mol)

writer = stk.MolWriter()
writer.write(stk_molo,"sac.mol")