$ \newcommand{\mbf}{\mathbf} $
$ \newcommand{\norm}[1]{\left\Vert#1\right\Vert} $
$ \newcommand{\abs}[1]{\left\vert#1\right\vert} $

# O método de Jacobi

## $ \S 1 $ Introdução

Considere um sistema linear de $ n $ equações em $ n $ variáveis $ x_1, \dots, x_n $:
\begin{equation*}
\begin{cases}
& a_{11} x_1 &+& a_{12}x_2 &+& \cdots &+& a_{1n}x_n &=& b_1 \\
& a_{21} x_1 &+& a_{22}x_2 &+& \cdots &+& a_{2n}x_n &=& b_2 \\
& \vdots &+& \vdots &+& \cdots &+& \vdots &=&\vdots \\
& a_{n1} x_1 &+& a_{n2}x_2 &+& \cdots &+& a_{nn}x_n &=& b_n
\end{cases}
\end{equation*}

Equivalentemente, usando notação matricial:
\begin{equation*}
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{bmatrix}
\begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix} =
\begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix}
\end{equation*}
ou simplesmente $ \mbf{A}\mbf{x} = \mbf{b} $.

Neste caderno consideraremos um procedimento iterativo para resolução deste sistema chamado de *método de Jacobi* (C. G. J. Jacobi, 1804—1851). As hipóteses necessárias para sequer considerar este método (ainda que não sejam suficientes para garantir que ele convergirá, veja a $ \S 4 $) são que:
* $ \mbf A $ é invertível;
* As entradas diagonais de $ \mbf A $ são todas não-nulas.

Daremos duas descrições equivalentes e as respectivas implementações do método, uma na forma escalar e outra na forma matricial. A primeira é levemente mais eficiente do ponto de vista computacional, enquanto a segunda é um pouco mais simples do ponto de vista conceitual, por isto começaremos com esta.

## $ \S 2 $ Descrição matricial do método de Jacobi

### 2.1 O método de Jacobi como método de ponto fixo

Sob o ponto de vista matricial, a idéia é muito parecida com a do método do ponto fixo. Como acima, suponha que $ \mbf A $ seja invertível com entradas diagonais não-nulas. Sejam $ \mbf D $ a parte diagonal de $ \mbf A $, $ \mbf L $ a parte abaixo da diagonal e $ \mbf U $ a parte acima da diagonal, de modo que:

\begin{equation*}
\mbf D = 
\begin{bmatrix}
a_{11} & 0 & \cdots & 0 & 0 \\
0 & a_{22} & \cdots & 0 & 0 \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
0 & 0 & \cdots & a_{(n-1)(n-1)} & 0 \\
0 & 0 & \cdots & 0 & a_{nn}
\end{bmatrix}\quad \text{e} \quad
\mbf L + \mbf U = \begin{bmatrix}
0 & a_{12} & \cdots & a_{1(n-1)} & a_{1n} \\
a_{21} & 0 & \cdots & a_{2(n-1)} & a_{2n} \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
a_{(n-1)1} & a_{(n-1)2} & \cdots & 0 & a_{(n-1)n} \\
a_{n1} & a_{n2} & \cdots & a_{(n-1)n} & 0
\end{bmatrix}
\end{equation*}

ou seja, $ \mbf L + \mbf U $ é a parte *não-diagonal* de $ \mbf A $.

Temos $ \newcommand{\Dar}{\Longleftrightarrow} $
\begin{alignat}{9}
\mbf{A}\mbf{x} = \mbf{b} & \Dar \big[ \mbf D + (\mbf L + \mbf U)\big] \mbf x = \mbf b \\
&\Dar \mbf D \mbf x = -(\mbf L + \mbf U)\mbf x + \mbf b \\
&\Dar \mbf x = -\mbf D^{-1}\big(\mbf L + \mbf U\big) \mbf x + \mbf D^{-1}\mbf b
\end{alignat}
Logo, definindo
$$ \mbf T = -\mbf D^{-1}\big(\mbf L + \mbf U\big) \qquad \text{e} \qquad \mbf c = \mbf D^{-1}\mbf b\ ,$$
concluímos que
$$
\mbf{A}\mbf{x} = \mbf{b} \Dar \mbf x = \mbf T \mbf x + \mbf c.
$$
Ou seja, $ \mbf x $ é solução do sistema original se e somente se é ponto fixo da transformação $ \mbf x \mapsto \mbf T \mbf x + \mbf c $.

Usando a mesma estratégia do método do ponto fixo, a partir de uma aproximação inicial $ \mbf{x}^{(0)} $ escolhida, construímos uma seqüência $ \big (\mbf{x}^{(k)} \big) $ definida por 
$$ \mbf{x}^{(k)} = \mbf{T} \mbf{x}^{(k-1)} + \mbf c .$$
Assim:
* $ \mbf{x}^{(1)} = \mbf{T} \mbf{x}^{(0)} + \mbf c $;
* $ \mbf{x}^{(2)} = \mbf{T} \mbf{x}^{(1)} + \mbf c $;
* $ \mbf{x}^{(3)} = \mbf{T} \mbf{x}^{(2)} + \mbf c $;
* $ \vdots $
* $ \mbf{x}^{(k)} = \mbf{T} \mbf{x}^{(k-1)} + \mbf c $;
* $ \vdots $

Como vimos no caderno anterior (Lema 4.1), *se* esta seqüência tem um limite, ele obrigatoriamente é ponto fixo da transformação $ \mbf x \mapsto \mbf T \mbf x + \mbf c $, e portanto também é solução do sistema original.

📝 A escolha da aproximação inicial $ \mbf x^{(0)} $ é irrelevante para a convergência da seqüência $ \mbf x^{(k)} $ resultante, significando que  se o procedimento fornece uma seqüência convergente para uma determinada escolha inicial, qualquer outra escolha também resultaria numa seqüência convergente.

📝 Entretanto, geralmente quanto mais próxima for a aproximação inicial $ \mbf x^{(0)} $ da solução exata, mais rápida será a convergência da seqüência $ \big (\mbf{x}^{(k)} \big) $ produzida pelo método a esta solução exata. Na ausência de um palpite adequado, podemos tomar $ \mbf x^{(0)} $ como a origem de $ \mathbb R^n $ ou escolhê-lo aleatoriamente.

### 2.2 Implementação da forma matricial do método de Gauss-Jacobi

Resumindo, a forma matricial do método de Gauss-Jacobi consiste na escolha de uma aproximação inicial $ \mbf x^{(0)} $ e da iteração do cálculo
$$ \boxed{\mbf{x}^{(k)} = \mbf{T} \mbf{x}^{(k-1)} + \mbf c} $$
onde
$$ \boxed{\mbf T = -\mbf D^{-1}\big(\mbf L + \mbf U\big)} \qquad \text{e} \qquad
\boxed{\mbf c = \mbf D^{-1}\mbf b}$$
até que
$$ \norm{\mbf{x}^{(k)} - \mbf{x}^{(k - 1)}} $$
seja menor que um certo $ \varepsilon > 0 $ escolhido. Na prática também é recomendável estipular um número máximo de iterações após o qual o procedimento termina mesmo que a tolerância desejada ainda não tenha sido atingida.

In [41]:
import numpy as np


def gauss_jacobi_matricial(A, b, x_0, eps, max_iter):
    """Dada uma matriz quadrada 'A' com entradas diagonais não-nulas e um vetor
    coluna 'b' de dimensão compatível, fornece uma aproximação para a solução
    do sistema linear Ax = b usando o método de Gauss-Jacobi, começando com
    a aproximação inicial 'x_0' fornecida. O procedimento pára assim que a
    diferença entre duas aproximações consecutivas tenha norma menor que 'eps'
    ou que o número 'max_iter' máximo de iterações tenha sido excedido."""
    n = np.shape(A)[0]
    assert np.shape(A) == (n, n)
    assert np.shape(b) == (n,) or np.shape(b) == (n, 1)
    assert np.shape(x_0) == (n,) or np.shape(x_0) == (n, 1)
    b = np.reshape(b, (n, 1))
    x_0 = np.reshape(x_0, (n, 1))
    D = np.diag(A)        # D é a parte diagonal de A
    assert np.all(D)
    D_inversa = np.diag(np.reciprocal(D))
    F = np.copy(A)        # F é a parte de A fora da diagonal
    np.fill_diagonal(F, np.zeros(n))
    
    c = np.matmul(D_inversa, b)
    T = np.matmul((-1) * D_inversa, F)
    
    erro = 100
    x = x_0
    iteracoes = 0
    
    while iteracoes < max_iter and eps < erro:
        x_novo = np.matmul(T, x) + c
        # Computamos a norma do máximo da diferença x_novo - x:
        erro = np.linalg.norm(x_novo - x, np.inf)
        x = np.copy(x_novo)
        iteracoes += 1
    
    print(f"Foram necessárias {iteracoes} iterações.")
    return x

**Problema 1:** Use o método de Gauss-Jacobi para aproximar a solução do sistema linear $ \mbf{A} \mbf{x} = \mbf{b} $ com um erro menor que $ \varepsilon = 10^{-3} $ em cada entrada, onde:
$$
\mbf A =
\begin{bmatrix}
2 & 1 \\
5 & 7
\end{bmatrix}
\quad \text{e} \quad
b =
\begin{bmatrix}
11 \\
13
\end{bmatrix}.
$$
(a) Tomando como aproximação inicial 
$$ \mbf x^{(0)} =
\begin{bmatrix}
7 \\
-3
\end{bmatrix}.$$

(b) Tomando como aproximação inicial 
$$ \mbf x^{(0)} =
\begin{bmatrix}
0 \\
0
\end{bmatrix}.$$ 

(c) Tomando como aproximação inicial 
$$ \mbf x^{(0)} =
\begin{bmatrix}
2000 \\
-5000
\end{bmatrix}.$$ 

(d) Compare o número de iterações necessárias em cada caso.

A solução exata é:
$$ \mbf x =
\begin{bmatrix}
\phantom{-}7.11\bar 1 \\
-3.22\bar 2
\end{bmatrix}.
$$


In [42]:
A = np.array([[2., 1.], [5., 7.]])
b = np.array([11., 13.])

x_0 = np.array([7., -3.])
x_1 = np.array([0., 0.])
x_2 = np.array([2000., -3000.])
eps = 1e-3
max_iter = 100

print(gauss_jacobi_matricial(A, b, x_0, eps, max_iter))
print(gauss_jacobi_matricial(A, b, x_1, eps, max_iter))
print(gauss_jacobi_matricial(A, b, x_2, eps, max_iter))

Foram necessárias 11 iterações.
[[ 7.11046551]
 [-3.22176108]]
Foram necessárias 19 iterações.
[[ 7.11095881]
 [-3.22174206]]
Foram necessárias 29 iterações.
[[ 7.11193413]
 [-3.22300411]]


## $ \S 3 $ Descrição escalar do método de Gauss-Jacobi

### 3.1 O método de Gauss-Jacobi como isolamento dos termos diagonais

Voltando à forma original, considere o sistema de $ n $ equações e $ n $ variáveis
\begin{equation*}
\begin{cases}
& a_{11} x_1 &+& a_{12}x_2 &+& \cdots &+& a_{1n}x_n &=& b_1 \\
& a_{21} x_1 &+& a_{22}x_2 &+& \cdots &+& a_{2n}x_n &=& b_2 \\
& \vdots &+& \vdots &+& \cdots &+& \vdots &=&\vdots \\
& a_{n1} x_1 &+& a_{n2}x_2 &+& \cdots &+& a_{nn}x_n &=& b_n
\end{cases}
\end{equation*}
Como antes, precisaremos supor que ele tem solução única e que todos os coeficientes $ a_{ii} $ são não-nulos ($ i = 1, \dots, n $). Podemos reescrever a $ i $-ésima equação isolando a variável $ x_i $:
\begin{equation*}
    x_i = \frac{1}{a_{ii}}\bigg(b_i - \sum_{\substack{j=1 \\ j \ne i}}^n a_{ij} x_j\bigg) = \frac{1}{a_{ii}}\bigg(b_i - a_{i1}x_1 - a_{i2}x_2 - \cdots - 
    \widehat{a_{ii}x_i} - \cdots - a_{in}x_n \bigg)
\end{equation*}
onde a notação $ \widehat{\phantom{ab}} $ significa que a expressão sob este sinal deve ser omitida.

Sob este ponto de vista, o método de Gauss-Jacobi consiste simplesmente em dissociar os valores das variáveis que aparecem do lado direito daqueles que aparecem do lado esquerdo, para cada $ i = 1, 2, \dots, n $. Mais precisamente, assumindo que já tenhamos calculado uma aproximação
$$
\mbf x^{(k - 1)} = \big(x_1^{(k - 1)}\,,\ x_2^{(k - 1)}\,,\ \dots\,,\ x_n^{(k - 1)}\big)
$$
para a solução exata, definimos
\begin{equation*}
    \boxed{x_i^{(k)} = \frac{1}{a_{ii}}\bigg(b_i - \sum_{\substack{j=1 \\ j \ne i}}^n a_{ij} x_j^{(k - 1)}\bigg)} \qquad (i = 1, 2, \dots, n).
\end{equation*}
para cada $ k \ge 1 $. Como antes, os valores iniciais
$$
\mbf x^{(0)} = \big(x_1^{(0)}\,,\ x_2^{(0)}\,,\ \dots\,,\ x_n^{(0)}\big)
$$
devem ser fornecidos, advinhados ou escolhidos aleatoriamente.

### 3.2 Implementação da forma escalar do método de Gauss-Jacobi

In [43]:
import numpy as np


def gauss_jacobi_escalar(A, b, x_0, eps, max_iter):
    """Dada uma matriz quadrada 'A' com entradas diagonais não-nulas e um vetor
    coluna 'b' de dimensão compatível, fornece uma aproximação para a solução
    do sistema linear Ax = b usando o método de Gauss-Jacobi, começando com
    a aproximação inicial 'x_0' fornecida. O procedimento pára assim que a
    diferença entre duas aproximações consecutivas tenha norma menor que 'eps'
    ou que o número 'max_iter' máximo de iterações tenha sido excedido."""
    n = np.shape(A)[0]
    assert np.shape(A) == (n, n)
    assert np.shape(b) == (n,)
    assert np.shape(x_0) == (n,)
    D = np.diag(A)        # D é a parte diagonal de A
    assert np.all(D)
    
    erro = 100
    x = x_0
    iteracoes = 0
    x_novo = np.zeros(n)
    
    while iteracoes < max_iter and eps < erro:
        for i in range(n):
            x_novo[i] = b[i]
            for j in range(n):
                if j != i:
                    x_novo[i] -= A[i, j] * x[j]
            x_novo[i] /= D[i]
        # Computamos a norma do máximo da diferença x_novo - x:
        erro = np.linalg.norm(x_novo - x, np.inf)
        x = np.copy(x_novo)
        iteracoes += 1
    
    print(f"Foram necessárias {iteracoes} iterações.")
    return x

In [44]:
A = np.array([[2., 1.], [5., 7.]])
b = np.array([11., 13.])

x_0 = np.array([7., -3.])
x_1 = np.array([0., 0.])
x_2 = np.array([2000., -3000.])
eps = 1e-3
max_iter = 100

print(gauss_jacobi_escalar(A, b, x_1, eps, max_iter))
print(gauss_jacobi_escalar(A, b, x_2, eps, max_iter))

Foram necessárias 19 iterações.
[ 7.11095881 -3.22174206]
Foram necessárias 29 iterações.
[ 7.11193413 -3.22300411]


**Problema 2:** Considere o sistema:
\begin{equation*}
\begin{cases}
& 4 x &+& -y &+& z &=& 12 \\
& -x &+& 4y &+& -2z &=& -1 \\
& x &+& -2y &+& 4z  &=& 5 
\end{cases}
\end{equation*}
cuja solução exata é $ x = 3 $, $ y = 1 $ e $ z = 1 $.

(a) Encontre a solução a uma precisão de cinco casas decimais usando o método de Gauss-Jacobi.

(b) Quantas iterações são necessárias tomando os valores iniciais $ x^{(0)} = y^{(0)} = z^{(0)} = 0 $?

## $ \S 3 $ Critério de convergência

Vimos no caderno passado (Teorema 6.1) que um critério suficiente, mas não necessário, para a convergência da seqüência $ \big( \mbf x^{(k)} \big) $ produzida por um método iterativo é que
$$
\norm{\mbf T} = \underset{1 \le i \le n}{\max}\ \sum_{j=1}^n \abs{t_{ij}} < 1,
$$
onde, no caso do método de Jacobi,
$$
\mbf T = -\mbf D^{-1}\big(\mbf L + \mbf U\big).
$$

Dizemos que a matriz $ \mbf A $ é (estritamente) **diagonalmente dominante** se
$$
\sum_{\substack{j=1 \\ j \ne i}}^n \abs{a_{ij}} < \abs{a_{ii}} \qquad \text{para todo $ i = 1, 2, \dots, n $}\,.
$$
Em palavras, $ A $ é diagonalmente dominante se em cada linha, a entrada diagonal tem valor absoluto maior que a soma dos valores absolutos das outras entradas.

**Problema 3:** Verifique que as matrizes $ \mbf A $ dos coeficientes dos sistemas dos Problemas 1 e 2 são diagonalmente dominantes.

**Problema 4:** Sejam $ \mbf A $ uma matriz quadrada e 
$$
\mbf T = -\mbf D^{-1}\big(\mbf L + \mbf U\big)
$$
como no método de Jacobi. Mostre que $ \mbf A $ é diagonalmente dominante se e somente se $ \norm{\mbf T} < 1 $.

**Corolário (critério das linhas):** *Se $ \mbf A $ é diagonalmente dominante, então o método de Jacobi produz uma seqüência $ \big(\mbf x^{(k)} \big) $ que converge à solução exata do sistema $ \mbf A \mbf x = \mbf b $, não importa quem sejam $ \mbf x^{(0)} $ e $ \mbf b $.*

⚠️ Não vale a recíproca: pode ser que o método de Jacobi funcione mesmo quando $ \mbf A $ não seja diagonalmente dominante.

📝 Alternativamente, poderíamos ter definido uma matriz como "diagonalmente dominante por colunas" se em cada coluna, a entrada diagonal tem módulo maior que a soma dos módulos das outras entradas. Esta hipótese também é suficiente para garantir a convergência da seqüência produzida pelo método de Jacobi à solução exata.

📝 Muitas vezes, apesar da matriz original $ \mbf A $ não ser diagonalmente dominante, podemos transformar o sistema $ \mbf A \mbf x = \mbf b $ num sistema equivalente $ \mbf A' \mbf x = \mbf b' $ (por exemplo, efetuando algumas trocas de linhas) em que a matriz $ \mbf A' $ é diagonalmente dominante. Podemos então aplicar o método de Jacobi a este último sistema.

**Problema 5:** Considere o sistema 
\begin{equation*}
\begin{cases}
& x_1 &+& 3x_2 &+& x_3 &=& -2 \\
& 5x_1 &+& 2x_2 &+& 2x_3 &=& 3 \\
&  &+& 6x_2 &+& 8x_3  &=& -6 
\end{cases}
\end{equation*}

(a) Verifique que a matriz $ \mbf A $ dos coeficientes *não* é diagonalmente dominante.

(b) Mostre que efetuando uma troca de linhas, podemos transformá-lo num sistema equivalente em que a matriz dos coeficientes é diagonalmente dominante.

(c) Aplicando o método de Jacobi a este última, encontre uma aproximação à solução exata do sistema original com erro menor que $ 10^{-4} $.