In [4]:
from rdkit import Chem
from rdkit.Chem import Crippen

# SMILES 표기법을 분자로 변환
smiles = "COCCCNC(=O)C1CCC(CN(Cc2c(Cl)cccc2Cl)S(=O)(=O)c2ccc(Br)cc2)CC1"
mol = Chem.MolFromSmiles(smiles)

# ALogP 계산
ALogP = Crippen.MolLogP(mol)

print("ALogP 값:", ALogP)
print('실제 값: 5.491')

ALogP 값: 5.905900000000006
실제 값: 5.491


In [2]:
from rdkit import Chem
from rdkit.Chem import Draw

# SMILES 표기법으로 화학 분자 정의
smiles = "Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1"  # 이 부분에 원하는 SMILES 문자열을 입력합니다.

# SMILES 문자열을 화학 분자로 변환
mol = Chem.MolFromSmiles(smiles)

# 화학 분자를 이미지로 그리기
img = Draw.MolToImage(mol)

# 이미지를 화면에 표시
img.show()


In [4]:
from rdkit import Chem
from rdkit.Chem import Descriptors

# SMILES 표기법으로 화학 분자 정의
smiles = "Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1"

# SMILES 문자열을 화학 분자로 변환
mol = Chem.MolFromSmiles(smiles)

# 분자 기술자 계산
molecular_weight = Descriptors.MolWt(mol)
num_atoms = Descriptors.HeavyAtomCount(mol)

print("Molecular Weight:", molecular_weight)
print("Number of Heavy Atoms:", num_atoms)

## 이거는 의미 없다고함 (Hong)

Molecular Weight: 289.31300000000005
Number of Heavy Atoms: 19


In [None]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

# Pretrained 모델과 토크나이저 로드 (예: ChemBERTa)
model_name = "seyonec/ChemBERTa-ZINC-v1"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# SMILES 문자열을 토큰화 및 모델 입력 형식으로 변환
smiles = "Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1"
inputs = tokenizer(smiles, return_tensors="pt")

# 모델에 입력 데이터 전달
outputs = model(**inputs)

# 모델 출력에서 예측 결과 얻기
logits = outputs.logits
predicted_class = torch.argmax(logits)

print("Predicted Class:", predicted_class)


In [None]:
from rdkit import Chem
from rdkit.Chem import AllChem
from torch_geometric.data import Data

# SMILES 표기법으로 화학 분자 정의
smiles = "Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1"

# SMILES 문자열을 RDKit 분자 객체로 변환
mol = Chem.MolFromSmiles(smiles)

# RDKit을 사용하여 분자 그래프 생성
mol = Chem.AddHs(mol)  # 수소 원자 추가
mol_graph = Chem.RWMol(mol)  # 수정 가능한 분자 그래프 생성

# 분자 그래프의 노드 및 엣지 정보 추출
num_atoms = mol_graph.GetNumAtoms()  # 노드 수
atom_features = [atom.GetAtomicNum() for atom in mol_graph.GetAtoms()]  # 노드 특성 (원자 번호)
bond_indices = []
for bond in mol_graph.GetBonds():
    start, end = bond.GetBeginAtomIdx(), bond.GetEndAtomIdx()
    bond_indices.extend([(start, end), (end, start)])  # 양방향 엣지로 추가

# 분자 그래프 데이터로 변환 (PyTorch Geometric)
x = torch.tensor(atom_features, dtype=torch.float)
edge_index = torch.tensor(bond_indices, dtype=torch.long).t().contiguous()

data = Data(x=x, edge_index=edge_index)

print(data)



In [10]:
from rdkit import Chem

# SMILES 표기법으로 화학 분자 정의
smiles = "Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1"

# SMILES 문자열을 RDKit 분자 객체로 변환
mol = Chem.MolFromSmiles(smiles)

# 분자 내에서 모든 작용기 식별
functional_groups = Chem.GetMolFrags(mol, asMols=True)

# 각 작용기의 SMILES 문자열 및 원자 인덱스 출력
for group in functional_groups:
    group_smiles = Chem.MolToSmiles(group)
    atom_indices = [atom.GetIdx() for atom in group.GetAtoms()]
    print(f"Functional Group: {group_smiles}, Atom Indices: {atom_indices}")


Functional Group: Cc1[nH]c(=O)[nH]c(=O)c1S(=O)(=O)NCC1CCCO1, Atom Indices: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18]
