<a href="https://colab.research.google.com/github/JisungJang-AI-BIO/LAIDD_Developability/blob/main/1_Boltz_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 소개 및 설정

**실습: Boltz-2를 활용한 항체-항원 구조 예측**

**목표**: 이 노트북에서는 Boltz-2를 사용하여 유방암 치료 항체인 트라스투주맙(Trastuzumab)과 그 표적 항원인 HER2 단백질의 결합 구조를 예측합니다. 아미노산 서열 정보만을 이용하여 복잡한 단백질 복합체의 3차원 구조를 생성하고 시각화하는 과정을 경험할 것입니다.

In [None]:
# 1단계: Boltz 예측을 위한 패키지 설치
# 충돌을 피하기 위해 PyTorch와 Boltz를 나누어 설치합니다.

print("호환되는 PyTorch 버전을 설치합니다...")
!pip install torch torchvision torchaudio

print("\nBoltz 패키지를 설치합니다...")
!pip install boltz -U

print("\n설치가 완료되었습니다.")

호환되는 PyTorch 버전을 설치합니다...
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m166.0/166.0 MB[0m [31m6.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m99.1/99.1 kB[0m [31m6.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m167.9/167.9 MB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[0m

## 생물학적 문제 정의

**표적 항원 (Antigen)**: 인간 상피세포 성장인자 수용체 2(HER2)는 세포 성장을 조절하는 단백질입니다.

**항체 (Antibody)**: 트라스투주맙(Trastuzumab)은 HER2에 특이적으로 결합하여 그 기능을 억제하는 항체입니다.

**우리의 목표**: Boltz-2를 사용하여 두 단백질의 3차원 결합 구조를 예측합니다.

In [None]:
# 2단계: 항체와 항원의 아미노산 서열을 정의합니다.

heavy_chain_sequence = "EVQLVESGGGLVQPGGSLRLSCAASGFNIKDTYIHWVRQAPGKGLEWVARIYPTNGYTRYADSVKGRFTISADTSKNTAYLQMNSLRAEDTAVYYCSRWGGDGFYAMDYWGQGTLVTVSS"
light_chain_sequence = "DIQMTQSPSSLSASVGDRVTITCRASQDVNTAVAWYQQKPGKAPKLLIYSASFLYSGVPSRFSGSRSGTDFTLTISSLQPEDFATYYCQQHYTTPPTFGQGTKVEIK"
antigen_sequence = "TQVCTGTDMKLRLPASPETHLDMLRHLYQGCQVVQGNLELTYLPTNASLSFLQDIQEVQGYVLIAHNQVRQVPLQRLRIVRGTQLFEDNYALAVLDNGDPLNNTTPVTGASPGGLRELQLRSLTEILKGGVLIQRNPQLCYQDTILWKDIFHKNNQLALTLIDTNRSRACHPCSPMCKGSRCWGESSEDCQSLTRTVCAGGCARCKGPLPTDCCHEQCAAGCTGPKHSDCLACLHFNHSGICELHCPALVTYNTDTFESMPNPEGRYTFGASCVTACPYNYLSTDVGSCTLVCPLHNQEVTAEDGTQRCEKCSKPCARVCYGLGMEHLREVRAVTSANIQEFAGCKKIFGSLAFLPESFDGDPASNTAPLQPEQLQVFETLEEITGYLYISAWPDSLPDLSVFQNLQVIRGRILHNGAYSLTLQGLGISWLGLRSLRELGSGLALIHHNTHLCFVHTVPWDQLFRNPHQALLHTANRPEDECVGEGLACHQLCARGHCWGPGPTQCVNCSQFLRGQECVEECRVLQGLPREYVNARHCLPCHPECQPQNGSVTCFGPEADQCVACAHYKDPPFCVARCPSGVKPDLSYMPIWKFPDEEGACQPCPINCTHSCVDLDDKGCPAEQRASPLT"
output_name = "Trastuzumab_HER2_prediction"

print("입력이 정의되었습니다.")

In [None]:
# 3단계: Boltz 예측 설정을 위해 YAML 파일을 생성합니다.
import yaml

input_data = {
    'sequences': {
        'H': heavy_chain_sequence,
        'L': light_chain_sequence,
        'A': antigen_sequence
    },
    'name': output_name
}

yaml_path = f"{output_name}.yaml"
with open(yaml_path, 'w') as f:
    yaml.dump(input_data, f)

print(f"YAML 입력 파일이 생성되었습니다: {yaml_path}")

In [None]:
# 4단계: Boltz 예측을 실행합니다.
# GPU 런타임에서 실행해야 하며, 몇 분 정도 소요될 수 있습니다.
print("\nBoltz-2 예측을 시작합니다... 잠시만 기다려 주세요.")
!boltz predict {yaml_path}
print("예측이 완료되었습니다!")

## 분석: 3D 구조 시각화

이제 Boltz가 생성한 PDB 파일을 `py3Dmol`을 사용하여 시각화합니다. 이 단계에서는 `boltz`가 더 이상 필요 없으므로, 시각화에 필요한 패키지만 새로 설치하여 진행합니다.

In [None]:
# 5단계: 시각화 라이브러리 설치
# 예측 단계와 분리하여 시각화에 필요한 py3Dmol을 설치합니다.
print("시각화를 위해 py3Dmol을 설치합니다...")
!pip install py3Dmol -q

시각화를 위해 py3Dmol을 설치합니다...
Traceback (most recent call last):
  File "/usr/local/bin/pip3", line 4, in <module>
    from pip._internal.cli.main import main
  File "/usr/local/lib/python3.11/dist-packages/pip/_internal/cli/main.py", line 11, in <module>
    from pip._internal.cli.autocompletion import autocomplete
  File "/usr/local/lib/python3.11/dist-packages/pip/_internal/cli/autocompletion.py", line 10, in <module>
^C


In [None]:
# 6단계: 예측된 구조를 시각화합니다.
import py3Dmol
import os

try:
    pdb_file_path = os.path.join(output_name, 'unrelaxed_model_1.pdb')

    if not os.path.exists(pdb_file_path):
        raise FileNotFoundError

    with open(pdb_file_path, 'r') as f:
        pdb_data = f.read()

    view = py3Dmol.view(width=800, height=600)
    view.addModel(pdb_data, "pdb")

    # 각 체인을 다른 색상으로 시각화
    view.setStyle({'chain':'A'}, {'cartoon': {'color':'red'}})
    view.setStyle({'chain':'H'}, {'cartoon': {'color':'blue'}})
    view.setStyle({'chain':'L'}, {'cartoon': {'color':'green'}})

    view.zoomTo()
    view.show()
except FileNotFoundError:
    print(f"오류: 예측된 PDB 파일({pdb_file_path})을 찾을 수 없습니다. 4단계가 성공적으로 실행되었는지 확인하세요.")
except Exception as e:
    print(f"시각화 중 오류가 발생했습니다: {e}")