# 問題文

## 問題

正の整数 `a` と `n` に対して、`a mod n`（略記: `a mod n`）とは、`a` を `n` で割った余りのことを指します。  
たとえば、`29 mod 11 = 7` となるのは、`29 = 11 × 2 + 7` であるためです。

**剰余算術**（モジュラー算術）は、加算、減算、乗算、除算を mod 演算に基づいて行う数学的手法です。  
もし `a mod n = b mod n` であるとき、`a` と `b` は `n` を法として**合同**であるといい、次のように記述します：  
`a ≡ b mod n`

剰余算術における有用な事実として、以下の性質があります：

- もし `a ≡ b mod n` かつ `c ≡ d mod n` ならば  
  `a + c ≡ b + d mod n`  
  `a × c ≡ b × d mod n`

この規則を理解しているか確認するために、次の値を使って実際に確かめてみるとよいでしょう：  
`a = 29`, `b = 73`, `c = 10`, `d = 32`, `n = 11`

この演習でわかるように、一部の Rosalind の問題では、非常に大きな整数を扱う必要がありますが、  
計算上の問題（メモリや処理速度）を回避するために、答えをより小さな数で割った余り（mod）として求めます。

---

## 与えられるもの

長さ最大 1000 アミノ酸からなるタンパク質文字列（Protein String）

## 求めるもの

そのタンパク質が翻訳された可能性のある **異なる RNA 文字列の総数（mod 1,000,000）** を返してください。  
（**ストップコドンの重要性**を無視しないでください）

---

In [1]:
codon_dict = {
    "UUU": "F", "UUC": "F", "UUA": "L", "UUG": "L",
    "CUU": "L", "CUC": "L", "CUA": "L", "CUG": "L",
    "AUU": "I", "AUC": "I", "AUA": "I", "AUG": "M",
    "GUU": "V", "GUC": "V", "GUA": "V", "GUG": "V",
    "UCU": "S", "UCC": "S", "UCA": "S", "UCG": "S",
    "CCU": "P", "CCC": "P", "CCA": "P", "CCG": "P",
    "ACU": "T", "ACC": "T", "ACA": "T", "ACG": "T",
    "GCU": "A", "GCC": "A", "GCA": "A", "GCG": "A",
    "UAU": "Y", "UAC": "Y", "UAA": "Stop", "UAG": "Stop",
    "CAU": "H", "CAC": "H", "CAA": "Q", "CAG": "Q",
    "AAU": "N", "AAC": "N", "AAA": "K", "AAG": "K",
    "GAU": "D", "GAC": "D", "GAA": "E", "GAG": "E",
    "UGU": "C", "UGC": "C", "UGA": "Stop", "UGG": "W",
    "CGU": "R", "CGC": "R", "CGA": "R", "CGG": "R",
    "AGU": "S", "AGC": "S", "AGA": "R", "AGG": "R",
    "GGU": "G", "GGC": "G", "GGA": "G", "GGG": "G"
}

In [2]:
count_codon = {}
for _, value in codon_dict.items():
    if value not in count_codon:
        count_codon[value] = 0
    count_codon[value] += 1
count_codon

{'F': 2,
 'L': 6,
 'I': 3,
 'M': 1,
 'V': 4,
 'S': 6,
 'P': 4,
 'T': 4,
 'A': 4,
 'Y': 2,
 'Stop': 3,
 'H': 2,
 'Q': 2,
 'N': 2,
 'K': 2,
 'D': 2,
 'E': 2,
 'C': 2,
 'W': 1,
 'R': 6,
 'G': 4}

In [3]:
def main(aa_sequence: str,mod = 1000000) -> int:
    result = 1
    for aa in aa_sequence:
        result = (result * count_codon[aa]) % mod
    result = (result * count_codon["Stop"]) % mod
    return result

In [4]:
seq = "MA"

In [5]:
main(seq)

12