# ATIVIDADE 3.1 - Decomposição LU

In [1]:
import numpy as np
import scipy.linalg as sla
import timeit

### 1. Implemente uma função que encontre o vetor solução de um sistema de equações lineares usando decomposição LU.

Implementa a decomposição PA = LU usando o algoritmo de Doolittle com pivoteamento parcial, conforme descrito no notebook.

    def lu_doolittle(A):
    
    n = A.shape[0]
    
Passo 1: Inicialize L = P = I e U = A

    U = A.astype(float).copy()
    L = np.eye(n)
    P = np.eye(n)
    
Passo 2: Para j = 1, ..., n-1

    for j in range(n - 1):

Encontrar o pivô (maior valor em módulo na coluna j)

        p = np.argmax(np.abs(U[j:, j])) + j
        
        if p != j:

Permutar linha U_j com linha U_p

            U[[j, p], :] = U[[p, j], :]

Permutar linha P_j com linha P_p

            P[[j, p], :] = P[[p, j], :]

Permutar também a parte já calculada de L

            L[[j, p], :j] = L[[p, j], :j]
            
Passo 3: Para i = j+1, ..., n

        for i in range(j + 1, n):

l_ij = u_ij / u_jj

            L[i, j] = U[i, j] / U[j, j]

U_i = U_i - l_ij * U_j

            U[i, :] = U[i, :] - L[i, j] * U[j, :]
            
    return P, L, U

Resolve um sistema triangular inferior Ly = b.

    def substituicao_progressiva(L, b):
    
    n = L.shape[0]
    y = np.zeros(n)
    
    for i in range(n):
        soma = np.dot(L[i, :i], y[:i])
        y[i] = (b[i] - soma) / L[i, i]
        
    return y


Resolve um sistema triangular superior Ux = y.

    def substituicao_regressiva(U, y):
    
    n = U.shape[0]
    x = np.zeros(n)
    
    for i in range(n - 1, -1, -1):
        soma = np.dot(U[i, i+1:], x[i+1:])
        x[i] = (y[i] - soma) / U[i, i]
        
    return x

Função principal que resolve Ax = b usando decomposição LU

    def resolver_sistema_lu(A, b):
    
1. Decomposição (Etapa 1)

        P, L, U = lu_doolittle(A)
    
2. Solução do sistema intermediário Ly = Pb (Etapa 2)

        Pb = P @ b
        y = substituicao_progressiva(L, Pb)
    
3. Solução do sistema final Ux = y (Etapa 3)

        x = substituicao_regressiva(U, y)
    
    return x

Teste da Questão 1 

    print("### Testes da Questão 1 ###\n")

Teste (a)

    A_a = np.array([[2., 1.], 
                    [1., 2.]])
    b_a = np.array([1., 2.])
    solucao_a = resolver_sistema_lu(A_a, b_a)
    print(f"Solução esperada (a): [0. 1.]")
    print(f"Solução calculada (a): {solucao_a}\n")

Teste (b)

    A_b = np.array([[4., 1.],
                    [1., 5.]])
    b_b = np.array([2., 10.])
    solucao_b = resolver_sistema_lu(A_b, b_b)
    print(f"Solução esperada (b): [0. 2.]")
    print(f"Solução calculada (b): {solucao_b}")

In [3]:
def lu_doolittle(A):
    
    n = A.shape[0]
    
    U = A.astype(float).copy()
    L = np.eye(n)
    P = np.eye(n)
    
    for j in range(n - 1):
        
        p = np.argmax(np.abs(U[j:, j])) + j
        
        if p != j:
            
            U[[j, p], :] = U[[p, j], :]
            
            P[[j, p], :] = P[[p, j], :]
            
            L[[j, p], :j] = L[[p, j], :j]
            
        
        for i in range(j + 1, n):
            
            L[i, j] = U[i, j] / U[j, j]
            
            U[i, :] = U[i, :] - L[i, j] * U[j, :]
            
    return P, L, U

def substituicao_progressiva(L, b):
    
    n = L.shape[0]
    y = np.zeros(n)
    
    for i in range(n):
        soma = np.dot(L[i, :i], y[:i])
        y[i] = (b[i] - soma) / L[i, i]
        
    return y

def substituicao_regressiva(U, y):
    
    n = U.shape[0]
    x = np.zeros(n)
    
    for i in range(n - 1, -1, -1):
        soma = np.dot(U[i, i+1:], x[i+1:])
        x[i] = (y[i] - soma) / U[i, i]
        
    return x

def resolver_sistema_lu(A, b):

    P, L, U = lu_doolittle(A)
    
    Pb = P @ b
    y = substituicao_progressiva(L, Pb)
    
    x = substituicao_regressiva(U, y)
    
    return x

print("### Testes da Questão 1 ###\n")

A_a = np.array([[2., 1.], 
                [1., 2.]])
b_a = np.array([1., 2.])
solucao_a = resolver_sistema_lu(A_a, b_a)
print(f"Solução esperada (a): [0. 1.]")
print(f"Solução calculada (a): {solucao_a}\n")

A_b = np.array([[4., 1.],
                [1., 5.]])
b_b = np.array([2., 10.])
solucao_b = resolver_sistema_lu(A_b, b_b)
print(f"Solução esperada (b): [0. 2.]")
print(f"Solução calculada (b): {solucao_b}")

### Testes da Questão 1 ###

Solução esperada (a): [0. 1.]
Solução calculada (a): [0. 1.]

Solução esperada (b): [0. 2.]
Solução calculada (b): [0. 2.]


### 2. Compare o tempo de cálculo da implementação de solução por eliminação Gaussiana e da decomposição LU, para a solução dos seguintes sistemas, e discuta os resultados:

(a)

*x1 + x2 + x3 = 1*

*4x1 + 4x2 + 2x3 = 2*

*2x1 + x2 − x3 = 0*

(b)

*7x1 − 7x2 + x3 = 1*

*−3x1 + 3x2 + 2x3 = 2*

*7x1 + 7x2 − 72x3 = 7*

(c)

*x1 + 2x2 + 3x3 + 4x4 = 20*

*2x1 + 2x2 + 3x3 + 4x4 = 22*

*3x1 + 3x2 + 3x3 + 4x4 = 22*

*4x1 + 4x2 + 4x3 + 4x4 = 24*

Definição dos Sistemas

Sistema (a)

    A_a = np.array([[1., 1., 1.],
                    [4., 4., 2.],
                    [2., 1., -1.]])
    b_a = np.array([1., 2., 0.])

Sistema (b)

    A_b = np.array([[7., -7., 1.],
                    [-3., 3., 2.],
                    [7., 7., -72.]])
    b_b = np.array([1., 2., 7.])

Sistema (c)

    A_c = np.array([[1., 2., 3., 4.],
                    [2., 2., 3., 4.],
                    [3., 3., 3., 4.],
                    [4., 4., 4., 4.]])
    b_c = np.array([20., 22., 22., 24.])


Testes de Tempo (%%timeit)

Sistema (a)
    
    print("--- Sistema (a) ---")
    %timeit np.linalg.solve(A_a, b_a)
    %timeit LU_piv_a = sla.lu_factor(A_a); sla.lu_solve(LU_piv_a, b_a)

Sistema (b)

    print("\n--- Sistema (b) ---")
    %timeit np.linalg.solve(A_b, b_b)
    %timeit LU_piv_b = sla.lu_factor(A_b); sla.lu_solve(LU_piv_b, b_b)

Sistema (c)

    print("\n--- Sistema (c) ---")
    %timeit np.linalg.solve(A_c, b_c)
    %timeit LU_piv_c = sla.lu_factor(A_c); sla.lu_solve(LU_piv_c, b_c)

In [None]:
A_a = np.array([[1., 1., 1.],
                [4., 4., 2.],
                [2., 1., -1.]])
b_a = np.array([1., 2., 0.])

A_b = np.array([[7., -7., 1.],
                [-3., 3., 2.],
                [7., 7., -72.]])
b_b = np.array([1., 2., 7.])

A_c = np.array([[1., 2., 3., 4.],
                [2., 2., 3., 4.],
                [3., 3., 3., 4.],
                [4., 4., 4., 4.]])
b_c = np.array([20., 22., 22., 24.])


In [4]:
print("--- Sistema (a) ---")
%timeit np.linalg.solve(A_a, b_a)
%timeit LU_piv_a = sla.lu_factor(A_a); sla.lu_solve(LU_piv_a, b_a)

--- Sistema (a) ---
6.37 μs ± 424 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
14.9 μs ± 1.79 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [5]:
print("\n--- Sistema (b) ---")
%timeit np.linalg.solve(A_b, b_b)
%timeit LU_piv_b = sla.lu_factor(A_b); sla.lu_solve(LU_piv_b, b_b)


--- Sistema (b) ---
5.68 μs ± 435 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
15 μs ± 2.11 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [6]:
print("\n--- Sistema (c) ---")
%timeit np.linalg.solve(A_c, b_c)
%timeit LU_piv_c = sla.lu_factor(A_c); sla.lu_solve(LU_piv_c, b_c)


--- Sistema (c) ---
6.26 μs ± 297 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
18.1 μs ± 1.06 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


#### Resposta:

O método de Eliminação Gaussiana (EG) possui duas limitações principais:

1. Alto Custo Computacional: A etapa de escalonamento da EG requer $\mathcal{O}(n^3/3)$ operações. Em contrapartida, resolver um sistema triangular (como na decomposição LU) requer apenas $\mathcal{O}(2n^2)$ operações. A imagem flops.png ilustra que a etapa de eliminação é a que domina o custo (chegando a 99,85% do total para $n=1000$).

2. Ineficiência para Múltiplos $b$: Se quisermos resolver vários sistemas que têm a mesma matriz $\mathbf{A}$ mas diferentes vetores $\mathbf{b}$, a EG exige que todo o custoso processo de escalonamento seja refeito para cada novo $\mathbf{b}$.

Ao executar os testes, para resolver um único sistema, o tempo de np.linalg.solve (EG) é muito competitivo, e por vezes até mais rápido, do que a soma das etapas sla.lu_factor + sla.lu_solve (LU).

Bloco de Demonstração

1 Fatoração (O Custo $\mathcal{O}(n^3/3)$ - Feito UMA VEZ)

    print("Tempo para FATORAR (Custo alto, feito 1 vez):")
    %timeit LU_piv_c = sla.lu_factor(A_c)

Fatoramos uma vez

    LU_piv_c = sla.lu_factor(A_c)
    b_c_novo = np.array([10., 12., 14., 16.]) # Um novo vetor b

2 Solução (O Custo $\mathcal{O}(n^2)$ - Feito VÁRIAS VEZES)

    print("\nTempo para RESOLVER com LU (Custo baixo, feito várias vezes):")
    %timeit sla.lu_solve(LU_piv_c, b_c_novo)

    print("\nTempo da 'Eliminação Gaussiana' (Custo alto, refeito sempre):")
    %timeit np.linalg.solve(A_c, b_c_novo)

In [7]:
print("Tempo para FATORAR (Custo alto, feito 1 vez):")
%timeit LU_piv_c = sla.lu_factor(A_c)

LU_piv_c = sla.lu_factor(A_c)
b_c_novo = np.array([10., 12., 14., 16.]) # Um novo vetor b

print("\nTempo para RESOLVER com LU (Custo baixo, feito várias vezes):")
%timeit sla.lu_solve(LU_piv_c, b_c_novo)

print("\nTempo da 'Eliminação Gaussiana' (Custo alto, refeito sempre):")
%timeit np.linalg.solve(A_c, b_c_novo)

Tempo para FATORAR (Custo alto, feito 1 vez):
6.8 μs ± 455 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)

Tempo para RESOLVER com LU (Custo baixo, feito várias vezes):
8.74 μs ± 945 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)

Tempo da 'Eliminação Gaussiana' (Custo alto, refeito sempre):
4.99 μs ± 243 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


Dessa forma, O tempo de sla.lu_solve (Etapa 2) será ordens de magnitude mais rápido do que np.linalg.solve. Isso prova que, embora a Eliminação Gaussiana (EG) seja rápida para um único problema, a Decomposição LU é drasticamente mais eficiente em cenários onde a matriz $\mathbf{A}$ é constante e apenas o vetor $\mathbf{b}$ varia, pois o custo computacional principal ($\mathcal{O}(n^3/3)$) é pago apenas uma vez.