# 1. 환경 준비

In [None]:

!pip install biopython
!pip install transformers accelerate
!pip install -q git+https://github.com/RosettaCommons/RFdiffusion.git@main


# 2. 펩타이드 서열 생성 (ProtGPT2)

In [None]:

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("nferruz/ProtGPT2")
model = AutoModelForCausalLM.from_pretrained("nferruz/ProtGPT2")

inputs = tokenizer("Generate peptide: ", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=20, do_sample=True, top_k=50)
print(tokenizer.decode(outputs[0]))


# 3. 펩타이드 구조 예측 (RFdiffusion)

In [None]:

# 사용자 환경에 따라 실행 환경 준비 필요
# RFdiffusion은 생성된 서열을 구조로 변환
# 현재는 실행 구조만 기술
print("RFdiffusion 구조 예측은 GPU와 고사양 환경 필요")


# 4. 도킹 수행 (ZDOCK)

In [None]:

# ZDOCK은 웹 기반 도구이므로 결과 파일(.pdb, .out)을 Google Drive에서 업로드 후 분석
from google.colab import drive
drive.mount('/content/drive')


# 5. 도킹 점수 파싱

In [None]:

zdock_out_path = '/content/drive/MyDrive/path_to_zdock/job.XXXXX.out'

with open(zdock_out_path, 'r') as file:
    lines = file.readlines()
    scores = [(i+1, float(line.split()[-1])) for i, line in enumerate(lines)]

# 상위 10개 출력
top_scores = sorted(scores, key=lambda x: x[1], reverse=True)[:10]
for rank, score in top_scores:
    print(f"Rank {rank}: Score {score}")


# 6. 구조 시각화 (ChimeraX는 로컬에서 사용)

In [None]:

print("ChimeraX를 통해 target.pdb 및 model_xx.pdb 파일을 시각화할 수 있습니다.")
print("명령어 예시: open target.pdb; open model_01.pdb; matchmaker model_01 target")


# ✅ 파이프라인 요약

In [None]:

print("1) ProtGPT2로 서열 생성 → 2) RFdiffusion 구조 예측 → 3) ZDOCK 도킹 수행 → 4) 상위 후보 선정")
