In [None]:
import tensorcircuit as tc
import numpy as np

def mult(c: tc.Circuit, x_reg, y_reg, res_reg, p):
    """
    模乘法 |x⟩|y⟩|0⟩ → |x⟩|y⟩|x*y mod p⟩
    参数:
        c: 量子电路
        x_reg, y_reg: 输入寄存器（量子比特位置索引）
        x_reg = [0, 1, ..., n-1]
        y_reg = [n, n+1, ..., 2n-1]
        结果寄存器 res_reg = [2n, 2n+1, ..., 3n-1]
        其中 n 是每个寄存器的量子比特数, 电路c包括3n个量子比特
        例如 n=3 时，x_reg = [0,1,2], y_reg = [3,4,5], res_reg = [6,7,8]
        p: 模数
    """
    n = len(x_reg)  # 假设 x_reg 和 y_reg 长度相同
    # 1. 通过连加计算 x*y=Σ (y*2^i) * x_i
    for i in range(n):
        # 对 x 的每一位 x_i，若为1，则|x⟩|y⟩|psi>->|x⟩|y⟩|psi+y*2^i mod p>
        # 当x的第n-i位(也即整体电路的第n-i位, 从最高位向最低位不需要辅助比特)为1时，受控模加法
        controll_qubit_add(c, y_reg, res_reg, p, control=n-i)
        double(c,res_reg, p)
    
    # 2. 结果已在 res_reg 中（x*y mod p）
    return c

def sqr(c: tc.Circuit, x_reg, res_reg, p, n):
    """
    模平方 |x⟩|0⟩ → |x⟩|x² mod p⟩
    """
    for i in range(n):
        # 对 x 的每一位 x_i，若为1，则|x⟩|y⟩|psi>->|x⟩|y⟩|psi+y*2^i mod p>
        # 当x的第n-i位(也即整体电路的第n-i位, 从最高位向最低位不需要辅助比特)为1时，受控模加法
        controll_qubit_add(c, x_reg, res_reg, p, control=n-i)
        double(c,res_reg, p)
        
    return c

