## **From PDB Secondary Structure to PSI-PRED**
PDB의 7-letter 2차구조 lable을 PSI-PRED의 3-letter로 변환하고 보기 좋게 출력합니다.

### **사용법**
1. **PDB에서 2차구조 string 긁어오기**
    - 10글자마다 있는 공백은 수작업으로 제외해야 됩니다.
    - 귀찮으면 맨 밑에 만들어둔 걸로 써도 됩니다.
    
    
2. **함수 호출하여 결과물 생성**
    - <code>ss</code>: 2차구조 string 객체입니다.
    - <code>sep="-"</code>: 2차구조 string의 공백을 대신할 문자입니다. 기본값은 "-".
    - <code>charPerCol=10</code>: 각 열마다 표시할 문자의 개수입니다. 기본값은 10.  
    (가능한 값: 4~26)
    - <code>maxCol=5</code>: 각 줄마다 표시할 열의 개수입니다. 기본값은 5.  
    (가능한 값: 1~)
    - 아래와 같이 호출하면 됩니다.
    
> ~~~python3
> reformatter(ss, sep="-", charPerCol=10, maxCol=5)
> ~~~
------
[결과물 바로보기](#출력-결과)

In [32]:
def print_seq(string1, string2, sep="-", charPerCol=10, maxCol=5):
    cells = int(len(string1)/charPerCol)
    
    def opr(string, cells, sep, charPerCol):
        chars = list(string.replace(" ", sep))
        res = []
        
        for i in range(cells):
            res.append("".join(chars[:charPerCol]))
            del chars[:charPerCol]
            
        res.append("".join(chars[0:]))
        
        return res

    res_s1 = opr(string1, cells, sep, charPerCol)
    res_s2 = opr(string2, cells, sep, charPerCol)
    
    # [res_s1, res_s2, current_cols]
    cursor = [0, 0, 0]
    
    while cursor[1] < (cells - 3):
        print("\n\n7-letter >>\t", end="")
        while (cursor[-1] < (maxCol)):
            print(res_s1[cursor[0]], end="\t")
            cursor[0] += 1
            cursor[-1] += 1
        
        print("\n3-letter >>\t", end="")
        for col in range(cursor[-1]):
            print(res_s2[cursor[1]], end="\t")
            cursor[1] += 1
        cursor[-1] = 0
        
    print("\n\n7-letter >>\t", end="")
    print(*res_s1[cursor[0]:], sep="\t")
    print("3-letter >>\t", end="")
    print(*res_s2[cursor[1]:], sep="\t")
        
    return

In [4]:
def reformatter(ss, sep="-", charPerCol=10, maxCol=5):
    res = ""
    
    for c in ss:
        if c in ["G", "H", "I"]:
            res += "H"
        
        elif c == "E":
            res += "E"
            
        else:
            res += "C"
            
    
    if len(ss) == len(res):
        print("Jobs done.", end="")
        
    else:
        print("Jobs canceled because of errors.")
        return 0
    
    print_seq(ss, res, sep, charPerCol, maxCol)
    return res

### 출력 결과
------
[맨 위로 이동](#From-PDB-Secondary-Structure-to-PSI-PRED)

In [4]:
# 공백이 이상하게 섞여 있는 거니까 쓰지 마세요
ss_1o8v_debug = "  GGG EEEEEEEEESHHHHHHHHT  HHHHHHHHH   EEEEEEEETTEEEEEEE SS  EEEEEEETT   EEEE TT   EEEEEEEEET TEEEEEEE SS EEEEEEEE ETTEEEEEEE ETTEEEEEEE EE  "
ss_1ag2_debug = "  TTTSEE S          SS HHHHHHHHHH TTTS S  EE    SSS  HHHHHHHHHHHH HHHHHHHHHT TT    HHHH HHHHHHHHHH HHHHHHHHHTTT "

In [5]:
ss_1o8v = "  GGG EEEEEEEEESHHHHHHHHT  HHHHHHHHH   EEEEEEEETTEEEEEEE SS EEEEEEETT  EEEE TT  EEEEEEEEETTEEEEEEE SS EEEEEEEEETTEEEEEEEETTEEEEEEEEE  "
ss_1ag2 = " TTTSEE S         SSHHHHHHHHHHTTTS S  EE   SSS  HHHHHHHHHHHHHHHHHHHHHTTT    HHHHHHHHHHHHHHHHHHHHHHHTTT "

In [56]:
res = reformatter(ss_1o8v, sep="_", charPerCol=10, maxCol=5)

Jobs done.

7-letter >>	__GGG_EEEE	EEEEESHHHH	HHHHT__HHH	HHHHHH___E	EEEEEEETTE	
3-letter >>	CCHHHCEEEE	EEEEECHHHH	HHHHCCCHHH	HHHHHHCCCE	EEEEEEECCE	

7-letter >>	EEEEEE_SS_	EEEEEEETT_	_EEEE_TT__	EEEEEEEEET	TEEEEEEE_S	
3-letter >>	EEEEEECCCC	EEEEEEECCC	CEEEECCCCC	EEEEEEEEEC	CEEEEEEECC	

7-letter >>	S_EEEEEEEE	ETTEEEEEEE	ETTEEEEEEE	EE__
3-letter >>	CCEEEEEEEE	ECCEEEEEEE	ECCEEEEEEE	EECC


In [34]:
res = reformatter(ss_1ag2)

Jobs done.

7-letter >>	-TTTSEE-S-	--------SS	HHHHHHHHHH	TTTS-S--EE	---SSS--HH	
3-letter >>	CCCCCEECCC	CCCCCCCCCC	HHHHHHHHHH	CCCCCCCCEE	CCCCCCCCHH	

7-letter >>	HHHHHHHHHH	HHHHHHHHHT	TT----HHHH	HHHHHHHHHH	HHHHHHHHHT	
3-letter >>	HHHHHHHHHH	HHHHHHHHHC	CCCCCCHHHH	HHHHHHHHHH	HHHHHHHHHC	

7-letter >>	TT-
3-letter >>	CCC
