In [1]:
import yaml
import pandas as pd

with open("../configs/default.yaml", 'r', encoding="utf-8") as f:
    config = yaml.safe_load(f)
    train_path = config["data"]["train_path"]
    df = pd.read_csv(train_path)

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10343 entries, 0 to 10342
Data columns (total 7 columns):
 #   Column   Non-Null Count  Dtype  
---  ------   --------------  -----  
 0   SMILES   10343 non-null  object 
 1   id       7973 non-null   float64
 2   Tg       557 non-null    float64
 3   FFV      7892 non-null   float64
 4   Tc       866 non-null    float64
 5   Density  613 non-null    float64
 6   Rg       614 non-null    float64
dtypes: float64(6), object(1)
memory usage: 565.8+ KB


In [2]:
import rdkit
from rdkit import Chem

smiles = df["SMILES"][0]

mol = Chem.MolFromSmiles(smiles)

print("--- ⚛️ 아스피린의 원자(Node) 피처 ---")
for atom in mol.GetAtoms():
    print(f"[{atom.GetIdx()}] 원자: {atom.GetSymbol()},",
          f"차수: {atom.GetDegree()},",
          f"형식전하: {atom.GetFormalCharge()},",
          f"혼성: {atom.GetHybridization()},",
          f"방향족 여부: {atom.GetIsAromatic()},",
          f"수소 수: {atom.GetTotalNumHs()}")

print("\n--- 🔗 아스피린의 결합(Edge) 피처 ---")
for bond in mol.GetBonds():
    print(f"[{bond.GetBeginAtomIdx()}-{bond.GetEndAtomIdx()}] 결합:",
          f"종류: {bond.GetBondType()},",
          f"컨쥬게이션: {bond.GetIsConjugated()},",
          f"고리 여부: {bond.IsInRing()}")

--- ⚛️ 아스피린의 원자(Node) 피처 ---
[0] 원자: *, 차수: 1, 형식전하: 0, 혼성: UNSPECIFIED, 방향족 여부: False, 수소 수: 0
[1] 원자: C, 차수: 3, 형식전하: 0, 혼성: SP2, 방향족 여부: False, 수소 수: 0
[2] 원자: C, 차수: 3, 형식전하: 0, 혼성: SP2, 방향족 여부: False, 수소 수: 0
[3] 원자: *, 차수: 1, 형식전하: 0, 혼성: UNSPECIFIED, 방향족 여부: False, 수소 수: 0
[4] 원자: C, 차수: 3, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 0
[5] 원자: C, 차수: 2, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 1
[6] 원자: C, 차수: 2, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 1
[7] 원자: C, 차수: 3, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 0
[8] 원자: C, 차수: 4, 형식전하: 0, 혼성: SP3, 방향족 여부: False, 수소 수: 0
[9] 원자: C, 차수: 1, 형식전하: 0, 혼성: SP3, 방향족 여부: False, 수소 수: 3
[10] 원자: C, 차수: 1, 형식전하: 0, 혼성: SP3, 방향족 여부: False, 수소 수: 3
[11] 원자: C, 차수: 1, 형식전하: 0, 혼성: SP3, 방향족 여부: False, 수소 수: 3
[12] 원자: C, 차수: 2, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 1
[13] 원자: C, 차수: 2, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 1
[14] 원자: C, 차수: 3, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 0
[15] 원자: C, 차수: 2, 형식전하: 0, 혼성: SP2, 방향족 여부: True, 수소 수: 1
[16] 원자: C, 차