# El algoritmo de factorización Factor Base

In [1]:
from sympy import *
from TANJCC import *
from itertools import combinations

## Elección de la base. Voy a tener suerte

La primera elección de la base es poco profesional, por ejemplo elegimos la base con el -1 y los primeros 30 primos.

** Ejercicio 0.-** Define la base
$$B=[-1,2,3,...,113],$$ 
que tiene al $-1$ y los primeros 30 primos

In [2]:
base = [-1]+[prime(i) for i in range(1,31)]
print(base)
n=32056356

[-1, 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113]



Lista de funciones auxiliares que vamos a definir:
   - <span style="color:red">abmod(x,n)</span>,
   - <span style="color:red">mayorpot(b,p)</span>,
   - <span style="color:red">bnumer(b,base,n)</span>,
   - <span style="color:red">vec_alfa(b,base,n)</span>,
   - <span style="color:red">parp(lista)</span>,
   - <span style="color:red">ssuma(lista1,lista2)</span>,
   - <span style="color:red">aux(k,r)</span>,
   - <span style="color:red">suma(lista,k)</span>,

Paso a comentar cada función:

  - La función <span style="color:red">abmod(x,n)</span> tiene como salida $x\%n$ si este es menor o igual que $\frac{n}{2}$ y $x\%n -n$ en caso contrario.  
  
  - La función <span style="color:red">mayorpot(x,p)</span>
     - Si $p=-1$ tiene como salida $1$ si $x<0$ y $0$ en caso contrario.
     - Para cualquier otro $p$ (normalmente primo) tiene como salida el exponente de la mayor potencia de $p$ que divide a $x$. Para definir esta función no puedes factorizar x.
     
  - La función <span style="color:red">bnumer(b,base,n)</span> tiene como salida true si $b$ es un base-número relativo a $n$ y false en caso contrario.
  
  - La función <span style="color:red">vec_alfa(b,base,n)</span> comprueba que $b$ es un base-número y en este caso tiene como salida el vector alfa asociado a $b$. 
Este será una lista de longitud <span style="color:green">len(base)</span> cuyas coordenadas son los exponentes de los elementos de "base" en la descomposición en primos de abmod($b^2,n$) (ver teoría).

  - La función <span style="color:red">parp(lista)</span> vale true si todos los elementos en la lista son pares y false en otro caso.
  
  - La función <span style="color:red">ssuma(lista1,lista2)</span> comprueba que las listas tienen la misma longitud y en ese caso tiene como salida una nueva lista con la misma longitud de las dos listas y que en lugar $i$ tiene a lista1[i]+lista2[i].

Nuestro siguiente objetivo es calcular todas las <span style="color:red">ssumas</span> de k elementos de una lista de listas, de la misma longitud, con $k$ menor o igual que la longitud de cualquier lista de la lista.

   - Para ello vamos a definir una función auxiliar <span style="color:red">aux(k,r)</span> cuya salida sea una lista con todas las listas posibles de la forma $[l_0,l_2,\ldots,l_{k-1}]$ con
$0\leq l_0 < l_2 <\ldots< l_{k-1} \leq r.$
   
   - La función  <span style="color:red">suma(lista,k)</span>: La variable "lista" tiene que ser una lista de listas, todas ellas de la misma longitud, primero comprueba que $k\leq $<span style="color:green">len(lista)</span> y luego da una lista con todas las 
<span style="color:red">ssumas</span> posibles de $k$ elementos de la "lista"
   

## Elección de la lista de $B$ números. Voy a seguir teniendo suerte

Vamos a elegir una lista de $B$-números con la esperanza de que sean suficientes para resolver la ecuación #eq. El proceso será el siguiente:

 - Fijamos $k_{max}$ y también $i_{max}$. 
 - Construimos la lista 
 $$L_1=[n_k=\mbox{ floor(sqrt($k*n$)), para } k=1,2,3,4,\ldots,k_{max}].$$ 
 - Construimos la lista $$L_2=[ b_{ki}=n_k + i, \mbox{ para } n_k \in L_1 \mbox{ e } i=0,2,3,\ldots,i_{max}-1]$$
 
 - Seleccionamos de $L_2$ aquellos $b_{ki}$ que son B-números y formamos la lista BN con ellos.
 
Define una función <span style="color:red">bi(n,k,i,base)</span> que realice el proceso de selección anterior.

## Algoritmo de resolución de la ecuación $x^2=y^2 \mod n$

- Imput n
- output (t,s) con $t^2=s^2\mod n$

    - **paso 1.-** Elegimos una base $B$ y esperamos tener suerte.
    - **paso 2.-** Elegimos índices $k_{max}$ e $i_{max}$ y construimos la lista de $B$-números <span style="color:green">BN</span>= <span style="color:red">bi(n,$k_{max}$,$i_{max}$,base)</span> y volvemos a esperar tener suerte.
    - **paso 3.-** Construimos la lista <span style="color:green">alfavec</span> de alfa vectores correspondientes a los $B$-números en $BN$.
    - **paso 4.-** Inicializamos el índice $j=1$, construimos la lista <span style="color:green">sumaj</span>=<span style="color:red">suma(alfavec,j)</span> y nos quedamos con las sublista <span style="color:green">sumajpar</span>  de sumaj cuyos elementos satisfagan la condición <span style="color:red">parp</span>. Si <span style="color:green">sumajpar</span> es vacía tomamos $j=j+1$ y repetimos el proceso anterior.
    - **paso 5.-** Inicializamos $\alpha$ como el primer elemento de <span style="color:green">sumajpar</span>, tomamos $in_\alpha$ como el lugar que ocupa $\alpha$ en <span style="color:green">sumaj</span>. Esto nos permite calcular la lista de eles para $\alpha$,
<center> <span style="color:green">eles$\alpha$</span> = <span style="color:red">aux(len(B),j)[in_$\alpha$]</span> = $[l_0,l_2,\ldots,l_{j-1}]$</center>
además tenemos que $$\alpha=\alpha_{l_0}+\ldots +\alpha_{l_{j-1}}.$$
Si ponemos $\alpha_{l_i}=(e_{l_i}^0,\ldots,e_{l_i}^h)$ y $\alpha=(e_0,\ldots,e_h)$ entonces:
$$ e_r=\sum_{i=0}^{j-1} e_{l_i}^r$$
    - **paso 6.-** Calculamos:
    $$ t=\prod_{i=0}^{j-1} b_{l_i} \quad\mbox{y}\quad s=\prod_{r=0}^h p_r^{\frac{e_r}{2}}$$
    - **paso 7.-** Si $(t,s)$ es una solución no trivial return $(t,s)$. En caso contrario volvemos al paso 5 tomando $\alpha=$ siguiente de $\alpha$.
    - **Fin.-** Si todas las soluciones que hemos obtenido son triviales no hemos tenido suerte y cambiamos primero los índices $k_{max}$ e $i_{max}$ y si aún así no tenemos suerte cambiamos la base $B$.

** Ejercicio 1.-** Elije un entero $n$ positivo que empiece por los dígitos de tu DNI, asegúrate de que el $n$ que has elegido no es primo, y realiza el algoritmo anterior paso a paso.

A partir de la solución que has obtenido, da una factorización de $n$.

***Comprueba el resultado.***

**Paso 1.-** Elegimos una base $B$ y esperamos tener suerte. Realizado en el ejercicio 0  
**Paso 2:** Elegimos índices $k_{max}$ e $i_{max}$ y construimos la lista de $B$-números <span style="color:green">BN</span>= <span style="color:red">bi(n,$k_{max}$,$i_{max}$,base)</span> y volvemos a esperar tener suerte.

In [3]:
k_max = 10
i_max = 10
BN = bi(n, k_max, i_max, base)
print base
print len(BN)

[-1, 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113]
21


**Paso 3:** Construimos la lista <span style="color:green">alfavec</span> de alfa vectores correspondientes a los $B$-números en $BN$.

In [4]:
alfavec = [vec_alfa(b,base,n) for b in BN]

**Paso 4** - Inicializamos el índice $j=1$ , construimos la lista $\texttt{sumaj=suma(alfavec,j)}$ y nos quedamos con las sublista $\texttt{sumajpar}$ de $\texttt{sumaj}$ cuyos elementos satisfagan la condición $\texttt{parp}$. Si $\texttt{sumajpar}$ es vacía tomamos $j=j+1$  y repetimos el proceso anterior.

In [5]:
sumajpar_info = getSumajPar(alfavec,1,len(base))

**Paso 5.-** Inicializamos $\alpha$ como el primer elemento de <span style="color:green">sumajpar</span>, tomamos $in_\alpha$ como el lugar que ocupa $\alpha$ en <span style="color:green">sumaj</span>. Esto nos permite calcular la lista de eles para $\alpha$,
<center> <span style="color:green">eles$\alpha$</span> = <span style="color:red">aux(len(B),j)[in_$\alpha$]</span> = $[l_0,l_2,\ldots,l_{j-1}]$</center>
además tenemos que $$\alpha=\alpha_{l_0}+\ldots +\alpha_{l_{j-1}}.$$
Si ponemos $\alpha_{l_i}=(e_{l_i}^0,\ldots,e_{l_i}^h)$ y $\alpha=(e_0,\ldots,e_h)$ entonces:
$$ e_r=\sum_{i=0}^{j-1} e_{l_i}^r$$

In [6]:
alpha = sumajpar_info[1][0]
found_j = sumajpar_info[2]
suma_j = sumajpar_info[3]
eles_alpha = aux(len(BN),found_j)[suma_j.index(alpha)]

print alpha
print eles_alpha

[0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
(6,)


**Paso 6.-** Calculamos:
    $$ t=\prod_{i=0}^{j-1} b_{l_i} \quad\mbox{y}\quad s=\prod_{r=0}^h p_r^{\frac{e_r}{2}}$$

In [7]:
t_factors = [BN[i] for i in eles_alpha]
t = prod(t_factors)
print t

s_factors = [base[i]**(alpha[i]/2) for i in range(len(base))]
s = prod(s_factors)
print s

13869
105


In [8]:
d_1 = gcd(n, t-s)
n_1 = n/d_1
print([n_1,d_1])

[2329, 13764]


Tenemos por tanto que $n = d_1 n_1$. Ahora debemos continuar descomponiendo $d_1$ y $n_1$. Para no repetir el proceso sin integrarlo todo en una única función, se realiza la unión o suma de las factorizaciones de $d_1$ y $n_1$

In [9]:
factors_d_1 = factorint(d_1)
factors_n_1 = factorint(n_1)
print { k: factors_d_1.get(k, 0) + factors_n_1.get(k, 0) 
       for k in set(factors_d_1) | set(factors_n_1) }

{2: 2, 3: 1, 37: 1, 137: 1, 17: 1, 31: 1}


**Fin.-** Si todas las soluciones que hemos obtenido son triviales no hemos tenido suerte y cambiamos primero los índices $k_{max}$ e $i_{max}$ y si aún así no tenemos suerte cambiamos la base $B$.

** Ejercicio (Avanzado) 2.-** Define una función 
<center><span style="color:red">soleq(n,h,k,i)</span></center>
que haga lo siguiente:
- Tome como Base Factor a la lista formada por $-1$ seguido de los $h$-primeros primos.
- Tome $k$ e $i$ como los índices $k_{max}$ e $i_{max}$ en el algoritmo anterior
- Tenga como salida:
   - print todas las soluciones son triviales, o bien
   - $(t,s)$,  una solución no trivial de la ecuación $x^2\equiv y^2 \mod n$.

Comprueba que tu función "funciona" utilizando el $n$ del ejercicio anterior y viendo que obtienes los mismos resultados.

Aplica la función <span style="color:red">soleq</span> a varios ejemplos y comprueba los resultados.

In [10]:
sol = soleq(n, 30, 10, 10)

1
13869 y 105 es una solución no trivial de la ecuación


In [11]:
print sol
sol[0]*sol[1]

[2329, 13764]


32056356

** Ejercicio (Avanzado) 3.-** Define una función 
<center><span style="color:red">fac(n,h)</span></center>
para factorizar $n$ que utilice la función soleq. El parámetro $h$ indica el número de primos que van a formar parte de la base factor. He omitido los índices $k$ e $i$ pero puedes añadirlos si los necesitas.

In [12]:
#fac(n, 30, 10, 10)

## Elección de la base. Fracciones continuas

La función <span style="color:green">continued_fraction_periodic(a,b,d)</span> calcula la fracción continua asociada a $\frac{a+\sqrt d}{b}$

In [13]:
F=continued_fraction_periodic(0,1,9073) # (0+sqrt(9073))/1
print F

[95, [3, 1, 26, 2, 6, 1, 1, 3, 2, 1, 5, 3, 1, 7, 5, 1, 1, 1, 4, 4, 4, 1, 1, 1, 5, 7, 1, 3, 5, 1, 2, 3, 1, 1, 6, 2, 26, 1, 3, 190]]


la función <span style="color:green">continued_fraction_convergents(lista)</span> calcula los convergentes

In [14]:
L1=[F[0]]+F[1][:5]
print L1

[95, 3, 1, 26, 2, 6]


In [15]:
L2=continued_fraction_convergents(L1)

In [16]:
L3=list(L2)
print L3

[95, 286/3, 381/4, 10192/107, 20765/218, 134782/1415]


In [17]:
L3[1]

286/3

In [18]:
fraction(L3[1])

(286, 3)

### Algoritmo de elección de la Base factor y de los B-números

- **Paso 1.-** Calculamos la fracción continua asociada a $\sqrt n$
<center> F = <span style="color:green">continued_fraction_periodic(0,1,n).</span></center>
- **Paso 2.-** Formamos la lista
<center> $L_1 =$ <span style="color:green">F[0]+F[1].</span></center>
- **Paso 3.-** Elegimos $s\leq len(L_1)$, calculamos los convergentes 
<center> $L_2 = $<span style="color:green">continued_fraction_convergents($L_1$[:s]).</span></center>
- **Paso 4.-** Formamos la lista Pbs cuyos elementos son los numeradores de los elementos en $L_2$.
- **Paso 5.-** Para cada $b\in Pbs$ factorizamos <span style="color:green">abmod $(b^2,n)$.</span>
- **Paso 6.-** La base factor $B$ estará formada por $-1$ junto con los primos que:
   - aparecen en la factorización de <span style="color:green">abmod $(b^2,n)$</span> para al menos dos b's en Pbs, o bien
   - aparece con un exponente par en la factorización de <span style="color:green">abmod $(b^2,n)$</span> para exactamente un b.
-  **Paso 7.-** La lista de B-números estará formada por aquellos b's en Pbs que sean B-números para la base obtenida en el paso anterior.

** Ejercicio 4.-** Elije un entero $n$ positivo que empiece por los dígitos de tu DNI, asegúrate de que el $n$ que has elegido no es primo y que es distinto del que elegiste en el ejercicio 1, y realiza el algoritmo anterior paso a paso obteniendo una base $B$ y una lista de $B$-números $BN$.


In [19]:
n = 32056356783
isprime(n)

False

*Pasos 1 y 2*

In [20]:
F = continued_fraction_periodic(0,1,n)
print len(F[1])

10622


*Paso 3.-* Elegimos $s\leq len(L_1)$, calculamos los convergentes 
<center> $L_2 = $<span style="color:green">continued_fraction_convergents($L_1$[:s]).</span></center>

In [21]:
s = 1000
L1 = [F[0]]+ F[1][:s]
L2=continued_fraction_convergents(L1)
L2=list(L2)

- *Paso 4.-* Formamos la lista Pbs cuyos elementos son los numeradores de los elementos en $L_2$.

In [22]:
Pbs = [fraction(i)[0] for i in L2]

*Paso 5.-* Para cada $b\in Pbs$ factorizamos <span style="color:green">abmod $(b^2,n)$.</span>

In [23]:
factorized_pbs = [ factorint(abmod(b**2,n)) for b in Pbs]

*Paso 6.-* La base factor $B$ estará formada por $-1$ junto con los primos que:
   - aparecen en la factorización de <span style="color:green">abmod $(b^2,n)$</span> para al menos dos b's en Pbs, o bien
   - aparece con un exponente par en la factorización de <span style="color:green">abmod $(b^2,n)$</span> para exactamente un b.

In [24]:
base = getFactorsBase(factorized_pbs)

 *Paso 7.-* La lista de B-números estará formada por aquellos b's en Pbs que sean B-números para la base obtenida en el paso anterior

In [25]:
BN = bi(n, 20, 20, base)
print BN

[537143, 716172, 716180, 716182, 537129, 537130, 537135, 537137, 537139, 537140, 693431, 537144, 620223, 358086, 358090, 358091, 800716, 620238, 358096, 179042, 179043, 179045, 400358, 473703, 179048, 310119]



** Ejercicio 5.-** Completa el ejercicio 3 resolviendo la ecuación $x^2\equiv y^2\mod n$ utilizando como base factor y lista de B-números los obtenidos en el ejercicio 3. 



In [26]:
soleqFC(n)

NameError: global name 'h' is not defined

** Ejercicio 6.-** Completa el ejercicio 4 factorizando el $n$ que has elegido.



** Ejercicio (Avanzado) 6.-** Automatiza los procesos de elección de base factor y resolución de la ecuación, para ello define una función  <span style="color:red">soleqfc(n,s)</span>.



** Ejercicio (Avanzado) 7.-** Define una función <span style="color:red">facfc(n)</span> que factorice $n$ utilizando la función soleqfc.
