# Analysis tutorial
- ## Created : 2020/12/10
- ## Created by Yoyo, Jeff
- ### Last edit : 2020/12/31

MYT*Lab* website: https://mytsai.cc

參考資料：
- [NAMD tutorial ver.2017](https://www.ks.uiuc.edu/Training/Tutorials/namd-index.html)

此教程僅供教學用途

All rights reserved.



### 縮寫:
### VMD TkCon   =  Tk Console

# `(必讀) 解壓縮確認注意事項 : `
##  >  課程下載  : 檔名為 : `NAMD_Tutorial_2022.zip`  的壓縮檔。
##  >  點開壓縮檔( `NAMD_Tutorial_2022.zip` )將裡頭的 `NAMD_Tutorial_2022 ` 資料夾用滑鼠將其移至`桌面`上。
##  0. 在桌面上點擊檔名為 `NAMD_Tutorial_2022 ` 的資料夾，並進入。
##  1. 點擊 vmd 的安裝檔( `vmd193win32nocuda`) ，以程式預設的路徑直接安裝 VMD 即可。
##  2.  分子動力學模擬程式( NAMD )的執行檔在資料夾中(`NAMD_Tutorial_2022`)的子資料夾(`NAMD_exe`)裡頭，'檔名為 `namd2` 之檔案。 
　
##  > 執行 `JupyterLab` → 在左方視窗中移動路徑到 Desktop/NAMD_Tutorial_2022/ 
## 中 → 點選檔案 `Analysis_tutorial.ipynb`

# `(重要)專題實作注意事項 : `
## 　　(1.)若使用本教學文件裡面的分析方法製作  `專題實作`時，請根據自己的需求跟改 `檔案名稱` 與 `資料夾路徑`。
## 　　(２.)並依照自己的需求更改、增加模擬。

# A. Specific Heat 
### 簡介:
### 如果我們在 NAMD_tutorial.ipynb 的章節 (C.) 中，將模擬的時間步長增加，
### (也就是在檔案 `ubq_wb_eq.conf` 中的 參數 `run` 的值改更大)，
### 將得到足夠的能量資訊及模擬的動態結構用以計算蛋白質比熱。
### 考量到計算時間的花費，已先將模擬完成。


## 0. 打開 VMD ( 預設路徑應為: C:\Program Files (x86)\University of Illinois\VMD )
## 1. 點VMD Main的【`Extensions`】→【`Tk Console`】→鍵入
### 　cd   ~/Desktop/NAMD_Tutorial/Analysis_dir/
## 2. 再鍵入或(複製貼上下列指令)
### 　mol  new Specific-Heat/300K/ubq_wb_eq.dcd
### 　mol  addfile Specific-Heat/300K/ubq_wb.psf
## 3. 在VMD Main 中點【`Extensions`】→ 【`Analysis`】→【`NAMD Energy`】
### 依照下列指示輸入或選取:
###   `Selection 1`　　: 　　　protein
###   `Energy Type` 　:　　　ALL
###   `Output File`　　:　　　ubq_wb_energy-300K.dat
###  `Parameter Files(opt)`:　點選`Find` 找到 par_all27_prot_lipid.inp  (檔案在桌面上的NAMD_Tutorial/Working_dir 路徑中)　　
### 完成後點擊  `Run NAMDEnergy`
　　
### 如果顯示出 : `Cluld not locate 'namd2'`
### 請點 `是(Y)` → 從路徑: 桌面上的 NAMD_Tutorial_2022/NAMD_exe/namd2.exe  選擇後→  `開啟`
## 4. 此時你會看到檔案 `ubq_wb_energy-300K.dat` 出現在資料夾 `Analysis_dir` 中。
## 並有 `ubq_wb_energy-350K.dat`  及 `ubq_wb_energy-400K.dat` 檔案也再當下目錄。
　
　
#### 備註: `ubq_wb_energy-350K.dat`  及 `ubq_wb_energy-400K.dat` 是當你從重複步驟 A.(2.)~ A.(3.) ，但只是將相
#### 關檔案改成分別位在 `Specific-Heat/350K` 及 `Specific-Heat/400K` 資料夾中的相對應 `ubq_wb.psf` 及 `ubq_wb_eq.dcd` 檔案並將 .dat
#### 檔案輸出檔名改成相對應的模擬溫度而已。 
#### 此流程已經簡化，同學們不必執行。
　
　
## 5. 得到系統中的蛋白質質量
### 　在`Tk Console` 中鍵入或(複製貼上下列指令)：
### 　　source   get_mass.tcl
### 　　get_total_mass
#### 此時畫面給出的值應為 `8564.866839528084` $amu$ 左右

## 6. 確認 `JupyterLab` 左方視窗中路徑為 `Desktop/NAMD_Tutorial_2022/Analysis_dir/` 中 
## 7. 比熱計算:
## 　(a.)載入模組

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns 
import math

## 　(b.)定義計算比熱的函數

In [None]:
def Calculate_Cv(energy_arr, T, mass):
    cv_kcal = energy_arr.var() / (0.00198657*T**2) # kcal/mol/K 
    cv_J = cv_kcal / (mass * 2.388620656092e-07) # J/(kg degree(Celsius))
    print("Cv = " + str(cv_kcal)+ " k cal 　K/mol ")
    print("Cv = " + str(cv_J)  +  " J/(kg 度C)" )
    return cv_kcal, cv_J

## 　(c.)讀取能量的資料並做前處裡 (以300K 溫度系統為例)

In [None]:
#input_data_file = "My_Project_dir/ENERGY.dat"  
#energy_data = np.loadtxt(input_data_file, dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 

In [None]:
energy_data_300 = np.loadtxt("Analysis_dir/ubq_wb_energy-300K.dat", dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 

## 　(d.)將下列函數相對應參數位子改成(以300K 溫度系統為例)
### 　`Calculate_Cv(energy_data , 300, 8564.8668)`
### 　你的`energy_arr` 即為 `energy_data`  
### 　因為你讀取的.dat 檔案為系統溫度為 300K 的環境條件。
### 　所以　`Calculate_Cv(energy_arr, T, mass)` 中的 `T` 改成 300
### 　，`mass` 改成剛剛在 A.(5.)中所計算的蛋白質質量，並取小數點後4位:所以得　`8564.8668`
#### 　300K:

In [None]:
#Calculate_Cv(energy_arr, T, mass)

In [None]:
Calculate_Cv(energy_data_300, 300, 8564.8668)

## 　(e.)計算不同溫度下之比熱
### 　請同學將A.(7.(C.))程式碼區塊中 `input_data_file` 的 `ubq_wb_energy-300K.dat` 
### 　輪流改成 `ubq_wb_energy-350K.dat` 及`ubq_wb_energy-400K.dat` 並執行，
### 　再將 `Calculate_Cv(energy_arr, T, mass)` 的 T 改成相對應的值後計算
### 　系統分別在 350K及 400K的比熱!
## 執行區塊:(練習)

In [None]:
# 自訂名稱 = np.loadtxt("目標檔案路徑", dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 

In [None]:
# Calculate_Cv(自訂名稱, 溫度, 8564.8668)

#### (練習一.)350K:

In [None]:
NEW_VAR1 = np.loadtxt("NEW_FILE_PATH1", dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 

In [None]:
Calculate_Cv(NEW_VAR1, 350, 8564.8668)

#### 　(練習二.)400K:

#### 得到的值應該分別為
#### 300K :
##### 　14.975　k cal  K/mol  、   7320.187  J/(kg 度C)
#### 350K :
##### 　23.989　k cal  K/mol  、 11726.321  J/(kg 度C)
#### 400K :
##### 　17.526　k cal  K/mol  、   8566.905  J/(kg 度C)

## 8. 將上述各 .dat 檔案作圖
## 　(a.)載入模組

In [None]:
import matplotlib.pyplot as plt

## 　(b.)資料處理

In [None]:
for i in ["300","350","400"]:
    input_data_file = "Analysis_dir/ubq_wb_energy-%sK.dat" %(i)
    if i == "300":
        energy_data = np.loadtxt(input_data_file, dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 
        TF = np.arange(len(energy_data))
        energy_data = np.c_[TF,energy_data]
    if i != "300":
        energy_data_temp = np.loadtxt(input_data_file, dtype=float, usecols=(10), skiprows=1)  ##只要total energy項 
        energy_data = np.c_[energy_data,energy_data_temp]

## 　(b-2.)資料預覽

In [None]:
energy_data_300

## 　(c.)畫能量隨時間之變化關係圖

In [None]:
#plt.style.use('seaborn-whitegrid')
plt.figure(figsize=(15,8))
plt.title('Total Energy fluctuation in different temperature',fontsize=25)
##300K##
plt.plot(energy_data[:,0], energy_data[:,1], '-', linewidth = 1, label = '300K' ,color = "b" )
##350K##
plt.plot(energy_data[:,0], energy_data[:,2], '-', linewidth = 1, label = '350K' ,color = "y")
##400K##
plt.plot(energy_data[:,0], energy_data[:,3], '-', linewidth = 1, label = '400K' ,color = "r")

plt.xlabel("Time frame", fontsize=20)
plt.ylabel("k $cal/mol$", fontsize=20)

plt.rc('xtick',labelsize=14)
plt.rc('ytick',labelsize=14)
leg = plt.legend()
leg_lines = leg.get_lines()
leg_texts = leg.get_texts()
plt.setp(leg_lines, linewidth=4)
#15
plt.setp(leg_texts, fontsize=20)

## (d.)畫在不同溫度下的能量分布關係圖

In [None]:
#import seaborn as sns

In [None]:
#plt.style.use('seaborn-whitegrid')
plt.figure(figsize=(12,8))
plt.title('Total Energy distribution in different temperature',fontsize=25)
# sns.distplot(energy_data[:,1], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="b",linewidth=4,label="300K"))
# sns.distplot(energy_data[:,2], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="y",linewidth=4,label="350K"))
# sns.distplot(energy_data[:,3], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="r",linewidth=4,label="400K"))
plt.hist(energy_data[:,1], bins=50, label="300K", color = "b")
plt.hist(energy_data[:,2], bins=50, label="350K", color = "y")
plt.hist(energy_data[:,3], bins=50, label="400K", color = "r")
plt.xlabel("k $cal/mol$", fontsize=20)
plt.ylabel('Frequency',fontsize=20) 
leg = plt.legend()
leg_lines = leg.get_lines()
leg_texts = leg.get_texts()
plt.setp(leg_lines, linewidth=4)
plt.setp(leg_texts, fontsize=15)

In [None]:
plt.figure(figsize=(12,8))
plt.title('Total Energy distribution in different temperature',fontsize=25)
sns.distplot(energy_data[:,1], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="b",linewidth=4,label="300K"))
sns.distplot(energy_data[:,2], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="y",linewidth=4,label="350K"))
sns.distplot(energy_data[:,3], hist=True , norm_hist=True, bins=30 ,kde=True, kde_kws=dict(color="r",linewidth=4,label="400K"))
plt.xlabel("k $cal/mol$", fontsize=20)
plt.ylabel('Relative Frequency',fontsize=20) 
leg = plt.legend()
leg_lines = leg.get_lines()
leg_texts = leg.get_texts()
plt.setp(leg_lines, linewidth=4)
plt.setp(leg_texts, fontsize=15)