# Algoritam F4

Algoritam $F4$ je otkrio Žan-Šarl Fožer (Jean-Charles Faugère) i objavio u radu [A new efficient algorithm for computing Gröbner bases (F4)](https://www.sciencedirect.com/science/article/pii/S0022404999000055) 1999. godine.

Fožer primećuje nekoliko mana Buhbergerovog algoritma za računanje Grebnerovih baza:
- algoritam troši dosta vremena na nepotrebna računanja koja dolaze iz $S$-polinoma koji se redukuju u $0$;
- algoritam je dosta sekvencijalan, što znači da ne koristi efikasno mogućnosti paralelizacije koje trenutni hardver nudi;
- neke optimizacije koje pokušavaju da smanje broj nepotrebnih računanja su previše računski skupe.

Osnovna Buhbergerovog algoritma je bila izbor odgovarajućeg para polinoma $(f, g)$, formiranje $S$-polinoma $S(f, g)$ od $f$ i $g$ i redukcija $S(f, g)$ u odnosu na trenutni skup $G$. Fožer je našao način da to ubrza tako što redukuje više polinoma u istoj iteraciji petlje. Sada ćemo prikazati glavne ideje ovog pristupa.

## Svođenje na problem nalaženja Gaus-Džordanove forme matrice polinoma

Neka je dat skup polinoma $F = f_1, f_2, \ldots f_k$. Možemo od svakog polinoma izdvojiti skup monoma $M(f_i)$ koji se nalaze u tom polinomu. Možemo onda proširiti definiciju skupa monoma na skup polinoma, odnosno $M(F) = \bigcup_{i = 1}^{n} M(f_i)$. Monome u $M(F)$ možemo sortirati u obrnutom poretku u odnosu na neku relaciju $\prec$, čime dobijamo niz monoma $m_1, m_2, \ldots, m_t$. Sada svaki polinom iz $F$ možemo zapisati kao linearnu kombinaciju monoma $m_i$, odnosno:
\begin{align*}
    f_i = \alpha_1 m_1 + \ldots + \alpha_t m_t,
\end{align*} za sve $1 \leq i \leq k$.

Ovo nam nameće preslikavanje $\phi(f)_F = (\alpha_1(f), \ldots, \alpha_t(f))$, koje polinomu daje vektorski zapis. To znači da možemo sve polinome iz skupa $F$ predstaviti kao matricu čije vrste su vektori koji odgovaraju polinomima $f_i$. Dakle, vrste matrice su koeficijenti polinoma, a kolone predstavljaju monome uz te koeficijente.

Ako bi monomi $m_i$ bile nezavisne promenljive $Y_i$, onda bismo lako mogli da nađemo redukovanu Grebnerovu bazu od $F$ u odnosu na leksikografski poredak $Y_t < \ldots < Y_0$ tako što bismo matricu sveli na Gaus-Džordanovu formu. Na vrstama te matrice bi se nalazili polinomi te Grebnerove baze i posao bi bio završen.

Bez obzira na to što monomi $m_i$ nisu, u opštem slučaju, nezavisne promenljive, Fožer svejedno nalazi način da se algoritam svođenja matrice na Gaus-Džordanovu formu iskoristi da se nađe Grebnerova baza. Dakle, Fožer nalazi Gaus-Džordanovu formu matrice, nakon čega posmatra skup $LM(F) = \bigcup_{i = 1}^{n} LM(f_i)$. Od vrsta redukovane matrice, izdvaja skup polinoma:
\begin{align*}
    F^{+} = \{g \mid g \text{ je vrsta redukovane matrice} \land LM(g) \notin LM(F)\}
\end{align*}

Takođe definiše i skup $F^{-}$ koji se sastoji od polinoma koji odgovaraju vrstama redukovane matrice, ali nisu u $F^{+}$.

Prva stvar koja se može dokazati je sledeće. Neka je $F'$ skup polinoma čija je veličina jednaka veličini $LM(F)$ i $LM(F') = LM(F)$: proširivanjem skupa $F^{+}$, dobijamo bazu vektorskog prostora generisanog vektorima koji odgovaraju polinomima iz $F$. Dodatno, ta baza je trougaona, odnosno mogu se elementi baze urediti u niz $g_1, \ldots, g_m$ tako da je $LM(g_i) > LM(g_{i + 1})$.

## S-polinomi i matrica

Koja je sad ideja i kakve veze ima ovo što smo u prethodnoj sekciji ispričali sa bilo čim? Pratite pažljivo, jer nije baš intuitivno na prvi pogled. Kao što smo rekli iznad, jedan od glavnih problema Buhbergerovog algoritma je što ima dosta parova $S$-polinoma koji se svode na $0$. Ako smo $S$-polinom $S(f, g)$ videli u jednoj iteraciji algoritma i on se sveo na $0$, videćemo ga i u svim narednim iteracijama i u njima će da se svede na $0$, zbog činjenice da se skup koji odgovara trenutnom stanju Grebnerove baze povećava u svakoj iteraciji. Ako na pametan način uspemo $S$-polinome, ili bar neke njihove delove, da smestimo u matricu, i pritom izbegnemo one koji se svode na $0$, neke nepotrebne račune smo izbegli.

Taj pametan način da se izbegnu nepotrebni računi je suština Fožerovog podalgoritma koji je nazvao *simboličko procesiranje*. Zamislimo da smo izdvojili skup parova $(f, g)$. $S$-polinomi tih parova su $\frac{LCM(LM(f), LM(g))}{LM(f)} f - \frac{LCM(LM(f), LM(g))}{LM(g)} g$ (možemo svesti polinome $f$ i $g$ na monične, pa je $LT(f) = LM(f)$). Ovo se može lepše zapisati u obliku $t_f f - t_g g$. Umesto $S$-polinoma, Fožer rešava da stavlja $t_f f$ polinome u vrste matrice. Simboličko procesiranje u odnosu na trenutno stanje Grebnerove baze $G$ ovde služi da se iz skupa $F^{+}$ odstrane polinomi koji pripadaju idealu generisanom sa $G$.

Sad ide glavna poenta cele ove priče: kada matricu koju smo dobili svedemo na Gaus-Džordanovu formu i izdvojimo skup $F^{+}$, onda $G$ proširujemo sa skupom $F^{+}$. To radimo dok nismo obradili sve moguće parove polinoma. Fožer pokazuje da je ovaj postupak validan, jer se polinomi iz modula generisanog sa $t_f f$ redukuju u $0$ u odnosu na skup polinoma $G \cup F^{+}$. Dakle, kada se ovaj korak završi, $S$-polinomi parova $(f, g)$ sa kojima smo počeli će biti uključeni u Grebnerovu bazu, čije je trenutno stanje $G \cup F^{+}$.

## Algoritam

Opisali smo glavne ideje, ali sada ostaje ceo algoritam da opišemo. Algoritam čine naredne stavke:
- ulaz: skup $F$ za čiji ideal tražimo Grebnerovu bazu, funkcija $S$ koja od datog skupa parova $(f, g)$ bira skup parova koje ćemo obraditi
- izlaz: Grebnerova baza od $\langle F \rangle$
- koraci.

Koraci algoritma su:
1. $G = F$, $d = 0$
2. $P = \{(f, g) \mid f, g \in F \land f \neq g\}$
3. dokle god je $P \neq \emptyset$, radi sledeće:
   1. $d = d + 1$
   2. $P_d = S(P)$
   3. $P = P - P_d$
   4. $L_d$ postaje skup elemenata $(t_f, f)$ takvi da je $f$ u nekom od parova iz $P_d$
   5. $F_d^{+} = Reduction(L_d, G)$
   6. za sve $h$ iz $F_d^{+}$, radi sledeće:
      1. $P = P \cup \{(h, g) \mid g \in G \}$
      2. $G = G \cup \{h\}$
4. vrati $G$

Dakle, prvo konstruišemo skup parova i inicijalizujemo Grebnerovu bazu na $F$. Naredni korak je prolaženje kroz neke od parova, njihovo obrađivanje i proširivanje baze. Kada uvodimo nove elemente u bazu, u skup parova dodajemo i parove koji odgovaraju $S$-polinomima vezanim za taj element.

Sada opišimo kako radi funkcija $Reduction$. Algoritam za $Reduction$ čine:
- ulaz: skup $L$ parova oblika $(t_f, f)$, skup $G$ koji predstavlja trenutno stanje Grebnerove baze
- izlaz: skup polinoma $F^{+}$
- koraci.
Koraci algoritma su:
1. $F = SymbolicPreprocessing(L, G)$
2. svedi matricu na Gaus-Džordanovu formu
3. izdvoji i vrati skup polinoma $F^{+}$ iz matrice

Konačno, opisujemo algoritam $SymbolicPreprocessing$. Njega čine:
- ulaz: skup $L$ parova oblika $(t_f, f)$, skup $G$ koji predstavlja trenutno stanje Grebnerove baze
- izlaz: skup polinoma $F$
- koraci.
Koraci algoritma su:
1. $F = \{t_f f \mid (t_f, f) \in L\}$
2. $Done = LM(F)$
3. dokle god je $M(F) \neq Done$, gde je $M(F)$ skup monoma svih polinoma iz $F$, radi sledeće:
   1. nađi element $m$ koji se nalazi u $M(F)$, ali ne u $Done$
   2. $Done = Done \cup \{m\}$
   3. ako postoje polinom $f$ iz $G$ i monom $m'$ iz $M(F)$ takvi da važi $m = m' LM(f)$, uradi sledeće:
      1. $F = F \cup \{m' f\}$
4. vrati $F$

Elementi $m' f$ koje dodaje u ovom algoritmu u skup $F$ će pomoći prilikom redukcije matrice. Oduzimanjem vrste koja odgovara polinomu $m' f$ od vrste koja odgovara polinomu $m$, dobijamo vrstu čiji je vodeći monom manji od prethodnog. Na taj način konstruisana matrica kao da skladišti elemente koji će se koristiti prilikom uzajamne redukcije polinoma iz $F$.

## Implementacija

Krenućemo implementaciju sa dna ka vrhu: prvo implementiramo $SymbolicPreprocessing$, pa $Reduction$ i onda tek na kraju glavnu funkciju.

In [1]:
from sympy import poly, degree, LM, reduced, lcm, degree_list
from sympy.polys.orderings import lex, grlex, grevlex
from sympy.polys.orderings import monomial_key
from sympy.abc import x, y, z

def degtuple_to_expr(degtuple, varorder):
    if len(varorder) == 0:
        return ""
        
    s = str(varorder[0]) + "**" + str(degtuple[0])
    
    for i in range(1, len(varorder)):
        s = s + "*" + str(varorder[i]) + "**" + str(degtuple[i])
    
    return s

def symbolic_preprocessing(L, G, varorder, domain):
    
    if len(L) == 0 or len(G) == 0:
            return None
    
    F = {poly(p[0] * p[1], *varorder, domain = domain) for p in L}
    M = set()

    for f in F:
        for monom in f.monoms():
            M.add(poly(degtuple_to_expr(monom, varorder), *varorder, domain = domain))
        
    # alternativno, možemo da nađemo skup elemenata koji je u M, ali nije u Done
    # onda samo izbacujemo elemente iz njega kad ih obrađujemo u petlji
    LMF = {LM(f) for f in F}
    to_be_checked = M.difference(LMF)
    
    while len(to_be_checked) != 0:
        m = to_be_checked.pop()
        # prolazimo kroz polinome iz F i proveravamo da li važi jednakost m = m' LM(f) za neko m'
        for f in G:
            lmf = poly(LM(f), *varorder, domain = domain)
            m_deg, lmf_deg = m.monoms()[0], lmf.monoms()[0]
            
            flag = True
            
            for i in range(len(varorder)):
                if m_deg[i] < lmf_deg[i]:
                    flag = False
                    break
            
            if flag:
                m1 = poly(m / lmf, *varorder, domain = domain)
                F.add(m1 * f)
                break
                
    return F

In [2]:
varorder = [x, y, z]
domain = 'ZZ'
g1 = poly('x**2 - y', *varorder, domain = domain)
g2 = poly('x**3 - z', *varorder, domain = domain)
G = [g1, g2]

lm_g1, lm_g2 = LM(g1), LM(g2)
lcm_g1_g2 = lcm(lm_g1, lm_g2)

L = [(lcm_g1_g2 / lm_g1, g1), (lcm_g1_g2 / lm_g2, g2)]

F = symbolic_preprocessing(L, G, varorder, domain)

print(F)

{Poly(x**3 - x*y, x, y, z, domain='ZZ'), Poly(x**3 - z, x, y, z, domain='ZZ')}


Sada implementiramo *Reduction*.

In [3]:
from sympy import Matrix

def build_matrix(polys, monoms, varorder, domain):
    cols = [x for x in monoms]
    cols.sort(key = monomial_key('lex', varorder), reverse = True)
    # pravimo mapu koja svakom monomu dodeljuje indeks
    cols_map = {}
    for i in range(len(cols)):
        cols_map[cols[i]] = i

    matrix = []
    for f in polys:
        row = [0 for i in range(len(cols))]
        for monomial, coeff in f.as_dict().items():
            row[cols_map[poly(degtuple_to_expr(monomial, varorder), *varorder, domain = domain)]] += coeff
        matrix.append(row)

    return (Matrix(matrix), cols)

def reduction(L, G, varorder, domain):
    F = symbolic_preprocessing(L, G, varorder, domain)
    
    M = set()
    
    for f in F:
        for monom in f.monoms():
            M.add(poly(degtuple_to_expr(monom, varorder), *varorder, domain = domain))
            
    matrix, cols = build_matrix(F, M, varorder, domain)
    
    rref_matrix, _ = matrix.rref()
    
    F1 = set()
    
    LMF = {LM(f) for f in F}
    
    for i in range(rref_matrix.rows):
        p = poly("0", *varorder, domain = domain)
    
        for j in range(rref_matrix.cols):
            p += rref_matrix[i, j] * cols[j]
        
        if p != 0 and LM(p) not in LMF:
            F1.add(p)

    return F1

In [4]:
F1 = reduction(L, G, varorder, domain)
print(F1)

{Poly(x*y - z, x, y, z, domain='ZZ')}


Sada možemo implementirati algoritam $F4$ do kraja. Ono na šta treba da obratimo pažnju je funkcija koja bira parove koje ćemo obraditi. Stavićemo za početak funkciju koja uzima sve parove i obrađuje ih odjednom. Posle ćemo prikazati kakvu je funkciju koristio Fožer u svom radu.

In [5]:
def select_all(pairs, *args):
    return pairs.copy()

def F4(F, select, varorder, domain):
    G, d = {f for f in F}, 0
    P = set()
    for i in range(len(F)):
        for j in range(len(F)):
            if i != j:
                P.add((F[i], F[j]))
    while len(P) != 0:
        d += 1
        Pd = select(P, varorder, domain)
        for p in Pd:
            P.discard(p)
        Ld = set()
        for f, g in Pd:
            lmf, lmg = LM(f), LM(g)
            lcmfg = lcm(lmf, lmg)
            tf, tg = poly(lcmfg / lmf, *varorder, domain = domain), poly(lcmfg / lmg, *varorder, domain = domain)
            Ld.add((tf, f))
            Ld.add((tg, g))
        F1 = reduction(Ld, G, varorder, domain)
        for h in F1:
            for g in G:
                P.add((h, g))
            G.add(h)
    
    return G

In [6]:
basis = F4(G, select_all, varorder, domain)

for g in basis:
    print(g)

Poly(x**3 - z, x, y, z, domain='ZZ')
Poly(x*y**2*z - y*z**2, x, y, z, domain='ZZ')
Poly(x*y - z, x, y, z, domain='ZZ')
Poly(y**3 - z**2, x, y, z, domain='ZZ')
Poly(x*z - y**2, x, y, z, domain='ZZ')
Poly(x**2 - y, x, y, z, domain='ZZ')


In [7]:
B = [poly(x**3 - z, x, y, z, domain='ZZ'),
     poly(x**2 - y, x, y, z, domain='ZZ'),
     poly(x*y - z, x, y, z, domain='ZZ'),
     poly(y**3 - z**2, x, y, z, domain='ZZ'),
     poly(x*z - y**2, x, y, z, domain='ZZ')]

basis = [x for x in basis]

for b in basis:
    _, r = reduced(b, B)
    print(r)

Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')


Rezultat koji smo dobili je malo drugačiji od onog koji se dobija Buhbergerovim algoritmom. Ipak, lako proveravamo elementi ove baze pripadaju idealu generisanom Grebnerovom bazom iz Buhbergerovog algoritma.

Sada ćemo prikazati strategiju izbora koju je Fožer koristio. On navodi da se ta funkcija najbolje pokazala u praksi (verovatno misli na vreme izvršavanja), a njeno izračunavanje čine dva koraka:

1. nađi najmanji totalni stepen $d$ od $LCM(LM(f), LM(g))$ za sve parove iz $P$
2. $P_d$ postavi da bude skup parova čiji $LCM(LM(f), LM(g))$ ima stepen $d$.

In [8]:
def faugere_select(pairs, varorder, domain):
    d = 9999

    for p in pairs:
        f, g = p
        lmf, lmg = LM(f), LM(g)
        lcmfg = poly(lcm(lmf, lmg), *varorder, domain = domain)

        d1 = sum(lcmfg.monoms()[0])

        if d1 < d:
            d = d1

    Pd = set()
    for p in pairs:
        f, g = p
        lmf, lmg = LM(f), LM(g)
        lcmfg = poly(lcm(lmf, lmg), *varorder, domain = domain)

        if d == sum(lcmfg.monoms()[0]):
            Pd.add(p)

    return Pd

In [9]:
basis = F4(G, faugere_select, varorder, domain)

for g in basis:
    print(g)

Poly(y**3*z**10 - z**12, x, y, z, domain='ZZ')
Poly(x**2*y**2*z - z**3, x, y, z, domain='ZZ')
Poly(x*y**2*z**5 - y*z**6, x, y, z, domain='ZZ')
Poly(x*y**3*z - y**2*z**2, x, y, z, domain='ZZ')
Poly(x*y**3*z**3 - y**2*z**4, x, y, z, domain='ZZ')
Poly(x*y*z**9 - z**10, x, y, z, domain='ZZ')
Poly(x*y**2*z**10 - y*z**11, x, y, z, domain='ZZ')
Poly(x**3 - z, x, y, z, domain='ZZ')
Poly(x**2*z**17 - y*z**17, x, y, z, domain='ZZ')
Poly(x*y**2*z - y*z**2, x, y, z, domain='ZZ')
Poly(x*y*z**4 - z**5, x, y, z, domain='ZZ')
Poly(y**5*z**2 - y**2*z**4, x, y, z, domain='ZZ')
Poly(x*z**10 - y**2*z**9, x, y, z, domain='ZZ')
Poly(x*z**13 - y**2*z**12, x, y, z, domain='ZZ')
Poly(x*y**2*z**8 - y*z**9, x, y, z, domain='ZZ')
Poly(x*y*z**10 - z**11, x, y, z, domain='ZZ')
Poly(x*y*z**3 - z**4, x, y, z, domain='ZZ')
Poly(x*z - y**2, x, y, z, domain='ZZ')
Poly(x*y*z**18 - z**19, x, y, z, domain='ZZ')
Poly(y**3*z**2 - z**4, x, y, z, domain='ZZ')
Poly(x*y*z**11 - z**12, x, y, z, domain='ZZ')
Poly(x*z**9 - y**2*z**

In [10]:
basis = [x for x in basis]

for g in basis:
    _, r = reduced(g, B)
    print(r)

Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x, y, z, domain='ZZ')
Poly(0, x,

Kao što vidimo, svih pet elemenata koje smo dobili Buhbergerovim algoritmom se nalaze i u ovoj bazi. Ostali elementi se takođe redukuju u $0$, pa pripadaju istom idealu. Razlog zašto se dobijaju ovako velike Grebnerove baze je što je korišćen poredak **lex**, koji je poznat po tome što generiše velike Grebnerove baze. Probao sam da koristim i druge poretke, ali iz nekog razloga je izvršavanje bilo jako sporo. Pretpostavljam da Sympy nema najbolju organizaciju biblioteke, i da se dosta vremena troši na neke sporedne operacije, kao što je generisanje **Poly** objekata. Česti pozivi **poly** funkcije su iz razloga što, kada dođe do toga da neka promenljiva bude isključena iz polinoma, Sympy u pozadini napravi polinom bez te promenljive umesto da zadrži promenljivu i dodeli joj stepen $0$.

Ova funkcija trenutno radi samo za redosled $x > y > z$. Drugi redosledi se mogu postići preimenovanjem promenljivih. Pokazaćemo kako se mogu efikasno polinomi čuvati u memoriji i kako se efikasno implementiraju elementarne operacije nad polinomima.