# Instala√ß√£o do Z3/Pandas

In [None]:
!pip install z3-solver pandas

Collecting z3-solver
  Downloading z3_solver-4.15.1.0-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (602 bytes)
Downloading z3_solver-4.15.1.0-py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (29.5 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m29.5/29.5 MB[0m [31m26.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: z3-solver
Successfully installed z3-solver-4.15.1.0


## Iniciando o projeto
### Importa√ß√£o das bibliotecas e recursos necess√°rios


*   Importando um dataframe por meio de uma url
*   Iniciando o solver do Z3



In [None]:
import pandas as pd
from z3 import *

CSV_URL = 'https://raw.githubusercontent.com/thiagoalvesifce/logicomp/master/vertebral_column_features_binarized_abnormal_no.csv'
solver = Solver()

df = pd.read_csv(CSV_URL)

num_colunas = df.shape[1]
# k representa o numero de colunas/features, que vai representar a quantidade de vari√°veis (x1, x2, ..., xk)
k = num_colunas - 1

### Fazendo um map no df para padronizar tudo em 0 ou 1
#### A ultima coluna class P (indica que o paciente tem patologia) e NO (indica que o paciente n√£o tem patologia)

*   p -> 1
*   NO -> 0



In [None]:
df['class'] = (df['class'].replace({'P': 1, 'NO': 0})).astype(int)

  df['class'] = (df['class'].replace({'P': 1, 'NO': 0})).astype(int)


**Divis√£o dos dados**
* Selecionar aleatoriamente 90% dos pacientes com patologia e
90% dos pacientes sem patologia para compor o conjunto de
treinamento;
* Os 10% restantes de cada grupo formar√£o o conjunto de teste.

In [None]:
df_with_pathologies = df[ df['class'] == 1 ]
df_without_pathologies = df[ df['class'] == 0 ]

train_with_pathologies =  df_with_pathologies.sample(frac=0.9, random_state=42)
train_without_pathologies = df_without_pathologies.sample(frac=0.9, random_state=42)

test_with_pathologies = df_with_pathologies.drop( train_with_pathologies.index )
test_without_pathologies = df_without_pathologies.drop( train_without_pathologies.index )

train = pd.concat([train_with_pathologies, train_without_pathologies]).sample(frac=1, random_state=42)
test  = pd.concat([test_with_pathologies,  test_without_pathologies ]).sample(frac=1, random_state=42)

labels = train['class']
labels_test = test['class']

Cria√ß√£o de Vari√°veis para indicar o n√∫mero m√°ximo de regras (M) e o n√∫mero de literais (L)

In [None]:
M = int(input('Enter the number of rules: '))
L = int(input('Enter the number of literals: '))

Enter the number of rules: 7
Enter the number of literals: 4


## Cria√ß√£o das vari√°veis (p, n, s)
Cada coluna do dataframe se tornar√° uma vari√°vel e ter√£o suas respectivas representa√ß√µes de (p, n, s) no solver do z3.

*   As vari√°veis p: representam a positividade da vari√°vel na regra
*   As vari√°veis n: representam a negatividade da vari√°vel na regra
*   As vari√°veis s: representam a "invisibilidade/(don's care)" da vari√°vel na regra

Al√©m da indica√ß√£o de qual coluna √© a vari√°vel, √© necess√°rio saber tamb√©m a qual regra aquela vari√°vel pertence. No caso, temos M regras.

A representa√ß√£o (exemplo):

1. p_1_1: "A vari√°vel x1 tem valor positivo na regra 1"
2. n_1_1: "A vari√°vel x1 tem valor negativo na regra 1"
3. s_1_1: "A vari√°vel x1 n√£o aparece/n√£o tem import√¢ncia na regra 1"

In [None]:
p = {(i, j): Bool(f"p_{i}_{j}") for i in range(1, k+1) for j in range(1,M+1)}
n = {(i, j): Bool(f"n_{i}_{j}") for i in range(1, k+1) for j in range(1, M+1)}
s = {(i, j): Bool(f"s_{i}_{j}") for i in range(1, k+1) for j in range(1, M+1)}

print(M)

7


## ‚úÖ Restri√ß√µes: Representa√ß√£o Exclusiva das Vari√°veis

Para cada **vari√°vel** em **cada regra**, ela deve aparecer **exatamente** em uma das seguintes formas:

- **Positiva** ‚Äî `p_{i,j}`  
- **Negativa** ‚Äî `n_{i,j}`  
- **N√£o aparece** (*don‚Äôt care*) ‚Äî `s_{i,j}`  

---

### üî∏ Condi√ß√µes a serem impostas

1. **Pelo menos uma** deve ser verdadeira:
   ```z3
   p_{i,j} ‚à® n_{i,j} ‚à® s_{i,j}
   ```
2. **No m√°ximo uma** deve ser verdadeira:
   ```z3
   ¬¨(p_{i,j} ‚àß n_{i,j}) ‚àß ¬¨(p_{i,j} ‚àß s_{i,j}) ‚àß ¬¨(n_{i,j} ‚àß s_{i,j})
   ```

In [None]:
for i in range(1, k+1):
    for j in range(1, M+1):
        solver.add( Or(p[(i,j)], n[(i,j)], s[(i,j)]) )
        solver.add( Not(And(p[(i,j)], n[(i,j)])) )
        solver.add( Not(And(p[(i,j)], s[(i,j)])) )
        solver.add( Not(And(n[(i,j)], s[(i,j)])) )

## ‚úÖ Restri√ß√£o: M√°ximo de Literais por Regra

Cada **regra** (ou termo) da DNF pode usar no m√°ximo **L** literais (positivas ou negativas).

---

### üî∏ Objetivo

Assegurar que nenhuma cl√°usula individual fique muito complexa, limitando o n√∫mero de literais em cada termo a **L**.


In [None]:
# Como n√£o h√° como somar valores booleanos do z3, fazemos uma fun√ß√£o auxiliar que retorna 1 ou 0 (inteiros) para executar a soma:

def Bool2Int(b):
    return If(b, 1, 0)

for j in range(1, M+1):
    literais_na_regra = []
    for i in range(1, k+1):
        # Se a regra j usa a feature i (positiva ou negativa), 0 caso contr√°rio
        literais_na_regra.append(
            Bool2Int( Or(p[(i,j)], n[(i,j)]) )
        )
    # Impor: soma de literais na regra j ‚â§ L
    solver.add( Sum(literais_na_regra) <= L )
print(L)

4


## ‚úÖ Restri√ß√µes: Proibir Regra Completamente ‚ÄúVazia‚Äù
Para cada **regra** `j` √© preciso garantir que **pelo menos uma literal** apare√ßa (ou seja, n√£o seja `s_{i,j}` para todo `i`).

* Se `s_{i,j} = True` significa ‚Äúfeature i n√£o aparece‚Äù.
* Impomos: para cada j, existe algum i tal que `¬¨(s_{i,j})` seja True ‚Üí ou seja, p ou n

In [None]:
for j in range(1, M+1):
    claus = []
    for i in range(1, k+1):
        claus.append( Not(s[(i,j)]) )
    solver.add( Or(*claus) )

## üéØ Objetivo Geral  
Para cada linha do conjunto de dados, queremos garantir que a solu√ß√£o **rejeite** os exemplos negativos (classe 0) e **aceite** os exemplos positivos (classe 1), usando vari√°veis booleanas que representam literais positivas (`p`), negativas (`n`) ou ‚Äúdon‚Äôt-care‚Äù (`s`).

---

## üî¥ Exemplos Negativos (classe 0)  

**Aplica√ß√£o**:  
   - Para cada termo (regra) _j_:  
     - Deve haver **ao menos um literal** que ‚Äúquebre‚Äù a regra para esta linha.  
     - Se uma feature vale **1**, ent√£o for√ßamos o literal negativo nessa regra.  
     - Se a feature vale **0**, for√ßamos o literal positivo.  


---

## üü¢ Exemplos Positivos (classe 1)

**Aplica√ß√£o**:  
   - Para cada termo _j_:  
     - Constru√≠mos uma lista de **implica√ß√µes**:  
       - Se o literal positivo estiver ativo (`p_{i,j}`), ent√£o a feature deve valer 1.  
       - Se o literal negativo estiver ativo (`n_{i,j}`), ent√£o a feature deve valer 0.  
       - Literais ‚Äúdon‚Äôt-care‚Äù (`s_{i,j}`) n√£o imp√µem nenhuma condi√ß√£o.

In [None]:
for idx, linha in train.iloc[:, :-1].iterrows():
    valor = int(labels[idx])  # 0 ou 1
    if valor == 0:
        for j in range(1, M+1):
            falha_disj = []
            for i in range(0, k):
                if int(linha.values[i]) == 1:
                    falha_disj.append( n[(i+1, j)] )
                else:
                    falha_disj.append( p[(i+1, j)] )
            solver.add( Or(*falha_disj) )
    else:
        regras_aceitam = []
        for j in range(1, M+1):
            conds = []
            for i in range(0, k):
                # feature equivale a cada coluna daquela linha especifica
                valor_feat = int(linha.values[i])
                conds.append( Implies(p[(i+1, j)], valor_feat == 1) )
                conds.append( Implies(n[(i+1, j)], valor_feat == 0) )
            regras_aceitam.append( And(*conds) )
        solver.add( Or(*regras_aceitam) )

## 1. Verifica√ß√£o de Satisfatibilidade
- **Objetivo:** Checar se existe um modelo (atribui√ß√£o de vari√°veis booleanas) que satisfa√ßa todas as restri√ß√µes impostas ao solver.
---
## 2. Extra√ß√£o do Modelo e Montagem das Regras
- **Objetivo:** Traduzir o modelo retornado pelo solver em um conjunto de regras l√≥gicas.
---
## 3. Fun√ß√£o de Predi√ß√£o (`predict`)
- **Objetivo:** Classificar uma nova amostra com base no conjunto de regras extra√≠das.
---
## 4. C√°lculo da Acur√°cia no Conjunto de Teste
- **Objetivo:** Medir a qualidade do modelo comparando predi√ß√µes com r√≥tulos reais.

In [None]:
sat_result = solver.check()
print(solver)
if sat_result == sat:
    print(f"\n==> SOLU√á√ÉO ENCONTRADA: R = {M} regras, L = {L} literais")
    modelo = solver.model()

    rules = []
    for j in range(1, M+1):
        rule = []
        for i in range(1, k+1):
            if is_true(modelo.evaluate(p[(i, j)])):
                rule.append((i, 1))
            elif is_true(modelo.evaluate(n[(i, j)])):
                rule.append((i, 0))
        rules.append(rule)

    for j, rule in enumerate(rules, start=1):
        if rule:
            lits = [f"(x{i} == {val})" for i, val in rule]
            print(f"Regra {j}: {' ‚àß '.join(lits)}")
        else:
            print(f"Regra {j}: (nenhuma feature ‚Üí termo vazio)")

    # 4) Definir fun√ß√£o de predi√ß√£o
    def predict(x, rules):
        for rule in rules:
            ok = True
            for i, val in rule:
                # checa cada literal
                if val == 1 and x[i-1] != 1:
                    ok = False
                    break
                if val == 0 and x[i-1] != 0:
                    ok = False
                    break
            if ok:
                return 1
        return 0

    correct = 0
    total = len(test)
    for idx, row in test.iloc[:, :-1].iterrows():
        x = row.values.astype(int)
        y_true = int(labels_test[idx])
        y_pred = predict(x, rules)
        if y_pred == y_true:
            correct += 1

    acuracia = correct / total
    print(f"\nAcur√°cia no teste: {acuracia:.2%}")
else:
    print("N√£o existe classifica√ß√£o perfeita dentro dos limites testados.")


[Or(p_1_1, n_1_1, s_1_1),
 Not(And(p_1_1, n_1_1)),
 Not(And(p_1_1, s_1_1)),
 Not(And(n_1_1, s_1_1)),
 Or(p_1_2, n_1_2, s_1_2),
 Not(And(p_1_2, n_1_2)),
 Not(And(p_1_2, s_1_2)),
 Not(And(n_1_2, s_1_2)),
 Or(p_1_3, n_1_3, s_1_3),
 Not(And(p_1_3, n_1_3)),
 Not(And(p_1_3, s_1_3)),
 Not(And(n_1_3, s_1_3)),
 Or(p_1_4, n_1_4, s_1_4),
 Not(And(p_1_4, n_1_4)),
 Not(And(p_1_4, s_1_4)),
 Not(And(n_1_4, s_1_4)),
 Or(p_1_5, n_1_5, s_1_5),
 Not(And(p_1_5, n_1_5)),
 Not(And(p_1_5, s_1_5)),
 Not(And(n_1_5, s_1_5)),
 Or(p_1_6, n_1_6, s_1_6),
 Not(And(p_1_6, n_1_6)),
 Not(And(p_1_6, s_1_6)),
 Not(And(n_1_6, s_1_6)),
 Or(p_1_7, n_1_7, s_1_7),
 Not(And(p_1_7, n_1_7)),
 Not(And(p_1_7, s_1_7)),
 Not(And(n_1_7, s_1_7)),
 Or(p_2_1, n_2_1, s_2_1),
 Not(And(p_2_1, n_2_1)),
 Not(And(p_2_1, s_2_1)),
 Not(And(n_2_1, s_2_1)),
 Or(p_2_2, n_2_2, s_2_2),
 Not(And(p_2_2, n_2_2)),
 Not(And(p_2_2, s_2_2)),
 Not(And(n_2_2, s_2_2)),
 Or(p_2_3, n_2_3, s_2_3),
 Not(And(p_2_3, n_2_3)),
 Not(And(p_2_3, s_2_3)),
 Not(And(n_2_3,