### Step 1: Install CANYA

Google Colab 환경에서 Conda 없이 바로 CANYA를 설치합니다. 필요한 종속성(`tensorflow`, `numpy`, `pandas`)은 Colab에 이미 설치되어 있으므로 별도 설치가 필요하지 않습니다.

In [15]:
# --- 1단계: Conda 설치 ---
# Colab에 Conda 환경을 관리할 Miniforge를 설치합니다.
!wget -q "https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-Linux-x86_64.sh"
!bash Miniforge3-Linux-x86_64.sh -bfp /usr/local
!conda config --set auto_update_conda false

# --- 2단계: CANYA 전용 가상 환경 생성 및 모든 의존성 설치 ---
# python 3.8을 기반으로 numpy, pandas, tensorflow 등 모든 요구사항을 한 번에 설치합니다.
!conda create -n canya_env python=3.8 numpy=1.19.5 pandas=1.3.3 tensorflow=2.6.0 keras=2.6.0 "protobuf<=3.20" matplotlib seaborn -c conda-forge -y

# --- 3단계: 가상 환경 내에 CANYA 설치 ---
# 위에서 만든 canya_env 환경 안에서 pip를 사용해 canya를 설치합니다.
!conda run -n canya_env pip install --no-cache-dir https://github.com/lehner-lab/canya/tarball/master

print("\n\n✅ 모든 설치가 성공적으로 완료되었습니다!")
print("CANYA는 'canya_env'라는 가상 환경에 설치되었습니다.")
print("아래 '가상 환경에서 CANYA 실행하기' 설명을 참고하여 다음 단계를 진행하세요.")

bash: Mambaforge-Linux-x86_64.sh: No such file or directory
/bin/bash: line 1: mamba: command not found
/bin/bash: line 1: mamba: command not found
/bin/bash: line 1: mamba: command not found


✅ 모든 설치가 성공적으로 완료되었습니다!
CANYA는 'canya_env'라는 가상 환경에 설치되었습니다.
아래 '가상 환경에서 CANYA 실행하기' 설명을 참고하여 다음 단계를 진행하세요.


### Step 2: Prepare Input File

`canya_input.txt`라는 입력 파일을 생성합니다. 형식은 CANYA에서 요구하는 형식에 맞게 구성해야 합니다 (예: 탭 구분 서열 리스트).

In [16]:
with open("canya_input.txt", "w") as f:
    f.write("ID\tSequence\n")
    f.write("Seq1\tCASSIRSSYEQYF\n")
    f.write("Seq2\tCASSLGQGAETLYF\n")

### Step 3: Run CANYA (Basic Mode)

In [17]:
# !mamba run -n canya_env 를 앞에 붙여서 실행합니다.
!mamba run -n canya_env canya --input canya_input.txt --output basic_out.txt
!mamba run -n canya_env canya --input canya_input.txt --output summarized_out.txt --summarize mean
!mamba run -n canya_env canya --input canya_input.txt --output ensemble_out.txt --summarize mean --mode ensemble

/bin/bash: line 1: mamba: command not found
/bin/bash: line 1: mamba: command not found
/bin/bash: line 1: mamba: command not found


### Step 4: Run CANYA with Summary Mode (`--summarize mean`)

In [12]:
!canya --input canya_input.txt --output summarized_out.txt --summarize mean

/bin/bash: line 1: canya: command not found


### Step 5: Run CANYA in Ensemble Mode (Robust Prediction)

In [13]:
!canya --input canya_input.txt --output ensemble_out.txt --summarize mean --mode ensemble

/bin/bash: line 1: canya: command not found


### Step 6: Visualize Results

In [14]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

try:
    df = pd.read_csv("ensemble_out.txt", sep='\t')
    df_sorted = df.sort_values('Mean_Score', ascending=False).reset_index(drop=True)

    plt.figure(figsize=(10, 6))
    sns.barplot(x='ID', y='Mean_Score', data=df_sorted, palette='viridis', edgecolor='black')
    plt.errorbar(x=df_sorted.index, y=df_sorted['Mean_Score'], yerr=df_sorted['Std_Dev_Score'], fmt='none', c='black', capsize=5)
    plt.title('CANYA Nucleation Score (Ensemble Mode)', fontsize=16)
    plt.xlabel('Sequence ID')
    plt.ylabel('Mean ± Std Dev')
    plt.ylim(0, 1)
    plt.tight_layout()
    plt.show()
except Exception as e:
    print("Error reading results:", e)

Error reading results: [Errno 2] No such file or directory: 'ensemble_out.txt'
