**Autor:** Matea Turalija Reščić

**Literatura:** https://group.miletic.net/hr/nastava/materijali/python-modul-rdkit/

# Uvod u RDKit

U programskom jeziku Python, napisat ćemo programsku skriptu za crtanje spojeva koristeći njihov zapis u [formatu SMILES](https://group.miletic.net/hr/nastava/materijali/smiles-format/). U nastavku je isječak programskog koda koji koristi module `Chem` i `Draw` za crtanje molekule butana:

In [None]:
from rdkit import Chem
from rdkit.Chem import Draw

# Definira molekulu iz SMILES zapisa
molekula = Chem.MolFromSmiles('CCCC')

# Crta molekulu
Draw.MolToImage(molekula)

**Napomena:**
U Jupyter bilježnicama, jednom izvršeni `import` ostaje aktivan tijekom cijele sesije. To znači da, ako ste u prethodnoj ćeliji već izvršili `import Chem` i `import Draw`, oni će biti dostupni i u svim narednim ćelijama. Nema potrebe ponavljati `import` naredbe u svakoj ćeliji, osim ako ponovno pokrenete kernel ili započnete novu sesiju.

**ZADATAK**

U Python programskom jeziku nacrtajte sljedeće kemijske spojeve: [aceton](https://en.wikipedia.org/wiki/Acetone), [benzen](https://en.wikipedia.org/wiki/Benzene) i [aspirin](https://en.wikipedia.org/wiki/Aspirin).

In [None]:
# aceton
aceton = Chem.MolFromSmiles('CC(=O)C')
Draw.MolToImage(aceton)

In [None]:
# benzen
benzen = Chem.MolFromSmiles('c1ccccc1')
Draw.MolToImage(benzen)

In [None]:
# aspirin
aspirin = Chem.MolFromSmiles('O=C(C)Oc1ccccc1C(=O)O')
Draw.MolToImage(aspirin)

## Više slika molekula

Želimo li nacrtati dvije molekule jednu do druge, morat ćemo kreirati SMILES listu u kojoj ćemo pohraniti SMILES zapis molekula. Zatim ćemo pomoću petlje `for` kreirati slike molekula. To možemo postići na sljedeći način:

In [None]:
smiles_list = ['CC(=O)C', 'C1=CC=CC=C1']
molekula_list = []

for smiles in smiles_list:
  molekule = Chem.MolFromSmiles(smiles)
  molekula_list.append(molekule)

Draw.MolsToGridImage(molekula_list, molsPerRow=2)

**ZADATAK**

1. Nacrtajte četiri aminokiseline [glicin](https://en.wikipedia.org/wiki/Glycine), [fenilalanin](https://en.wikipedia.org/wiki/Phenylalanine), [histidin](https://en.wikipedia.org/wiki/Histidine) i [cistein](https://en.wikipedia.org/wiki/Cysteine) tako da se nalaze na istoj slici poredane jedna ispod druge.

2. Prilagodite prethodni zadatak tako da imate dva retka, svaki s dvije slike molekula.

In [None]:
lista = ['C(C(=O)O)N', 'c1ccc(cc1)C[C@@H](C(=O)O)N', 'O=C([C@H](CC1=CNC=N1)N)O', 'C([C@@H](C(=O)O)N)S']
m_list = []

for x in lista:
  m = Chem.MolFromSmiles(x)
  m_list.append(m)

Draw.MolsToGridImage(m_list, molsPerRow=1) # u drugom zadatku promijeniti molsPerRow=2

## Ispis SMILES zapisa

Prvo provjerimo kakvog je tipa objekt pohranjenog u varijabli `molekula`. To možemo provjeriti funkcijom `type()`:

In [None]:
molekula = Chem.MolFromSmiles('CCCC')
type(molekula)

`rdkit.Chem.rdchem.Mol` je klasa koja predstavlja molekulu u RDKitu. Ova klasa ima različite metode i atribute koji omogućuju pristup raznim informacijama o molekuli, uključujući atomske podatke, veze između atoma i druge relevantne podatke o molekularnoj strukturi.

Želimo li pretvoriti objekt molekula u znakovni niz u formatu SMILES, napisat ćemo sljedeće:

In [None]:
smiles = Chem.MolToSmiles(molekula)

print('Tip varijable smiles:', type(smiles))
print('Smiles zapis', smiles)

## Molekulski opisnici

Molekulski opisnici su kvantitativne reprezentacije određenih karakteristika molekula. Omogućavaju konverziju kompleksnih molekularnih struktura u numeričke podatke, čime se olakšava analiza i modeliranje.

Iz modula `Chem` ćemo uvesti pripadni modul `Descriptors` za pristup molekulskim opisnicima. Primjer ispod koristi nekoliko različitih opisnika:
* `MolWt` izračunava molarnu masu (engl. *molecular weight*),
* `HeavyAtomCount` broji atome (oni koji nisu vodik) u molekuli,
* `NumValenceElectrons` računa ukupan broj valentnih elektrona u molekuli.

In [None]:
from rdkit.Chem import Descriptors

# Definira molekulu iz SMILES zapisa
molekula = Chem.MolFromSmiles('CCCC')

# Izračun i ispis opisnika
molarna_masa = Descriptors.MolWt(molekula)
broj_atoma_u_molekuli = Descriptors.HeavyAtomCount(molekula)
valentni_elektroni = Descriptors.NumValenceElectrons(molekula)

print("Molarna masa:", molarna_masa, "g/mol")
print("Broj atoma u molekuli:", broj_atoma_u_molekuli)
print("Broj valentnih elektrona:", valentni_elektroni)

**ZADATAK**

Nacrtajte [mravlju kiselinu](https://en.wikipedia.org/wiki/Formic_acid) (metanska kiselina). Zatim ispišite na ekran molarnu masu, broj atoma u molekuli i broj valentnih elektrona.

In [None]:
mravlja_kiselina = Chem.MolFromSmiles('O=CO')

display(Draw.MolToImage(mravlja_kiselina))

molarna_masa = Descriptors.MolWt(mravlja_kiselina)
broj_atoma = Descriptors.HeavyAtomCount(mravlja_kiselina)
val_el = Descriptors.NumValenceElectrons(mravlja_kiselina)

print("Molarna masa:", molarna_masa, "g/mol")
print("Broj atoma u molekuli:", broj_atoma)
print("Broj valentnih elektrona:", val_el)

**Napomena:** Jupyter bilježnice prikazuju posljednji evaluirani rezultat u ćeliji. Ako imate više naredbi unutar iste ćelije, Jupyter će prikazati samo posljednji rezultat, osim ako eksplicitno ne pozovete funkcije poput `display()` za prikazivanje slika ili rezultata.

Ponekad će biti korisno zaokružiti numeričke rezultate na određeni broj decimala. To možemo postići korištenjem funkcije `round()` na sljedeći način:

In [None]:
import numpy as np

zaokruzena_molarna_masa = np.round(molarna_masa, decimals = 1)

print("Molarna masa mravlje kiseline:", molarna_masa, "g/mol")
print("Zaokružena molarna masa mravlje kiseline:", zaokruzena_molarna_masa, "g/mol")

## Pohrana slikovne datoteke

Slike generiranih molekula mogu se pohraniti na dva načina:

In [None]:
Draw.MolToFile(mravlja_kiselina, "slika1.png", size=(500,500))

In [None]:
slika = Draw.MolToImage(mravlja_kiselina)
slika.save("slika2.png", size=(500,500))

**ZADATAK:**

Nacrtajte molekulu djelatne tvari lijeka naziva [diklofenak](https://en.wikipedia.org/wiki/Diclofenac). Pronađite o kojoj je djelatnoj tvari riječ i njezin popularni naziv. Sliku molekule, veličine 600x400 točaka, pohranite tako da se na samoj slici ispod nacrtane molekule nalazi i naziv lijeka. Koristite argument `legend` za ispis naziva lijeka ispod slike.

In [None]:
voltaren = Chem.MolFromSmiles('O=C(O)Cc1ccccc1Nc2c(Cl)cccc2Cl')
Draw.MolToFile(voltaren, "voltaren.png", size=(600,400), legend = "VOLTAREN")