In [9]:
import pandas as pd
import os

def extract_smiles_to_smi_files_from_csv(csv_file, smiles_column, output_dir):
    # CSV 파일 읽기
    df = pd.read_csv(csv_file)
    
    # 출력 디렉토리가 없으면 생성
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    # SMILES 열에서 데이터를 추출하여 .smi 파일로 저장
    for index, row in df.iterrows():
        smiles = row[smiles_column]
        name = f"molecule_{index+1}"  # 각 파일의 이름 지정
        output_file = os.path.join(output_dir, f"{name}.smi")
        
        with open(output_file, 'w') as f:
            f.write(smiles)
        
        print(f"{output_file} 파일이 생성되었습니다.")

# CSV 파일 경로와 SMILES 열 이름 및 출력 디렉토리 설정
csv_file = "C:/Users/USER/Downloads/open/train.csv"  # CSV 파일 경로
smiles_column = "Smiles"  # SMILES 문자열이 있는 열 이름
output_dir = "C:/Users/USER/Downloads/open/output_smi_files"  # SMILES 파일을 저장할 디렉토리 경로

# SMILES 문자열을 .smi 파일로 추출
extract_smiles_to_smi_files_from_csv(csv_file, smiles_column, output_dir)


C:/Users/USER/Downloads/open/output_smi_files\molecule_1.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_2.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_3.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_4.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_5.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_6.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_7.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_8.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_9.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_10.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_11.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_12.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/output_smi_files\molecule_13.smi 파일이 생성되었습니다.
C:/Users/USER/Downloads/open/outpu

In [12]:
from rdkit import Chem
from rdkit.Chem import AllChem
import os

def convert_smiles_files_to_pdb(input_dir, output_dir):
    # 입력 디렉토리에서 모든 .smi 파일을 가져오기
    for smi_file in os.listdir(input_dir):
        if smi_file.endswith(".smi"):
            with open(os.path.join(input_dir, smi_file), 'r') as file:
                smiles = file.readline().strip()
                name = os.path.splitext(smi_file)[0]  # 파일 이름에서 확장자를 제거하여 분자 이름으로 사용
                
                # SMILES로부터 분자 생성
                mol = Chem.MolFromSmiles(smiles)
                
                if mol is None:
                    print(f"SMILES '{smiles}'을(를) 처리할 수 없습니다.")
                    continue
                
                # 수소 추가
                mol = Chem.AddHs(mol)
                
                # 3D 좌표 생성
                AllChem.EmbedMolecule(mol)
                AllChem.UFFOptimizeMolecule(mol)
                
                # PDB 파일로 저장
                output_file = os.path.join(output_dir, f"{name}.pdb")
                with open(output_file, 'w') as f:
                    f.write(Chem.MolToPDBBlock(mol))
                print(f"{output_file} 파일이 저장되었습니다.")

# 입력 디렉토리와 출력 디렉토리 설정
input_dir = "C:/Users/USER/Downloads/open/output_smi_files"  # .smi 파일들이 있는 디렉토리 경로
output_dir = "C:/Users/USER/Downloads/open/output_pdb_files"  # 생성된 PDB 파일을 저장할 디렉토리 경로

# 출력 디렉토리가 없으면 생성
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# 변환 실행
convert_smiles_files_to_pdb(input_dir, output_dir)


C:/Users/USER/Downloads/open/output_pdb_files\molecule_1.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_10.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_100.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1000.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1001.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1002.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1003.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1004.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1005.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1006.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1007.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1008.pdb 파일이 저장되었습니다.
C:/Users/USER/Downloads/open/output_pdb_files\molecule_1009.pdb 파일이 저장되었습니다.
C:/Us