In [2]:
import selfies as sf

# Обычная формула бензола (SMILES)
smiles = "c1ccccc1"

# Переводим в SELFIES
encoded_selfies = sf.encoder(smiles)
print(encoded_selfies) 
# Выведет что-то вроде: [C][=C][C][=C][C][=C][Ring1][=Branch1]

# Переводим обратно
decoded_smiles = sf.decoder(encoded_selfies)

[C][=C][C][=C][C][=C][Ring1][=Branch1]


In [3]:
import selfies as sf
from rdkit import Chem
from rdkit.Chem import AllChem

# 1. Твоя формула в формате SELFIES (например, Бензол)
selfies_str = "[C][=C][C][=C][C][=C][Ring1][=Branch1]"

# 2. Декодируем SELFIES в SMILES (язык, который понимает RDKit)
smiles = sf.decoder(selfies_str)
print(f"SMILES: {smiles}")

# 3. Создаем объект молекулы в RDKit
mol = Chem.MolFromSmiles(smiles)

# 4. ВАЖНО: Добавляем атомы водорода (AddHs)
# В формулах они обычно скрыты, но для 3D они нужны, чтобы рассчитать углы.
mol_3d = Chem.AddHs(mol)

# 5. Генерируем 3D координаты (EmbedMolecule)
# RDKit пытается подобрать реалистичную форму молекулы в пространстве
res = AllChem.EmbedMolecule(mol_3d)

if res == 0:
    print("3D модель успешно построена!")
    # 6. Сохраняем в файл .sdf (его можно открыть в любой программе просмотра)
    w = Chem.SDWriter('my_molecule.sdf')
    w.write(mol_3d)
    w.close()
    print("Сохранено в файл 'my_molecule.sdf'")
else:
    print("Не удалось построить 3D модель (слишком сложная структура?)")

SMILES: C1=CC=CC=C1
3D модель успешно построена!
Сохранено в файл 'my_molecule.sdf'
