Pracujeme s ligandy z protein-ligand komplexů z PL-REX datasetu. 3D struktury molekul ve formátu SDF jsou k dispozici v adresáři ligands.
V datasetu jsou samostatné série ligandů pro deset cílových proteinů. První část jména souboru je číslo série a zkratka názvu cílového proteinu, např. "001-CA2". Druhá část je označení samotného ligandu (např. 5NXG, což je PDB kód struktury ze které byl ligand získán).
Jako měřítko konformační energie molekuly se často používá počet volně rotovatelných vazeb. Použijte Python a knihovnu rdkit ke spočítání rotovatelných vazeb ve všech ligandech.
Výstupem by měla být tabulka výsledků a histogram distribuce počtu rotovatelných vazeb v celém datasetu.
Vyberete jednu sérii ligandů ve které jsou největší rozdíly počtu rotovatelných vazeb. Na těchto ligandech proveďte hledání konformerů programem crest. Program je pro linux, na windows jde použít WSL2 nebo virtuální stroj s linuxem.
Příklad k hledání konformerů je zde. Až zprovozníte program a vyzkoušíte tento příklad, konzultujte nastavení programu pro další výpočty.
K tomu je třeba přidat i výpočet konformační entropie
Srovnejte a korelujte počty rotovatelných vazeb a vypočítané konformační entropie.