O método numérico para resolução de sistemas lineares que aqui será exposto é o método do **Gradiente Conjugado**.

# Discussão inicial:
Ele utiliza de uma ideia de aproximação de valores do vetor de variáveis do sistema, que podem ser entendidos como uma matriz coluna, que, ao ser multiplicado pela matriz de constantes do sistema linear, resultará em outro vetor, o vetor das constantes do outro lado da igualdade.

# **Conceito chave**:

  Este método usa o conceito de combinação linear do vetor de incógnitas 'x' para gerar o vetor de resultados 'b', portanto, o foco deste método é resolver A . x = b, encontrando valores para x através de iterações sucessivas, se necessário, dessa forma, é necessário um chute inicial para valores de x.

# Resumo Teórico
O método do Gradiente Conjugado é uma técnica iterativa usada para resolver sistemas lineares Ax = b, onde A é simétrica e definida positiva.

Ele se baseia em minimizar a função f(x) = 1/2 x^t Ax - b^t x, cuja derivada (gradiente) é Ax - b.

O gradiente fornece a direção de maior crescimento da função, eo método usa essa informação - mas, em vez de seguir o gradiente diretamente, ele segue direções chamadas conjugadas para tornar o processo mais eficiente.

A solução de Ax = b é encontrada quando o gradiente se anula, ou seja, quando Ax = b.

Cada iteração melhora a aproximação de x, até que o erro seja suficientemente pequeno.

In [None]:
import numpy as np

# Definindo a matriz A (simétrica e definida positiva)
A = np.array([[1, 2],
              [3, 4]])

# Definindo o vetor b
b = np.array([5, 9])

# Definindo um chute inicial (pode ser um vetor de zeros)
x_init = np.array([0, 0])

# Definindo o número máximo de iterações
max_iter = 100

# Definindo a tolerância
tolerancia = 1e-6

# Chamando a função gradiente_conjugado com os valores de teste
solucao = gradiente_conjugado(A, b, x_init, max_iter, tolerancia)

# Exibindo a solução encontrada
print("A solução encontrada é:", solucao)

# Para verificar, podemos calcular A @ solucao e ver se é próximo de b
print("Verificação (A @ solucao):", A @ solucao)
print("Vetor b original:", b)

A solução encontrada é: [-1.00162307  3.00123436]
Verificação (A @ solucao): [5.00084565 9.00006823]
Vetor b original: [5 9]


In [None]:
# Definição das entradas necessárias
# A: a matriz do problema
# b: o vetor do lado direito da equação
# x_init: uma estimativa inicial, tipo um chute. 'x' pode ser um vetor de zeros
# max_iter: número máximo de passos para evitar loops infinitos
# tolerancia: o quão "próximo" de zero o resíduo tem que ser para pararmos

def gradiente_conjugado(A, b, x_init, max_iter, tolerancia):
    # Começa com nosso "chute" inicial
    x = x_init

    # Calcula o "resíduo", que é o quanto nossa solução atual está errada
    # (b - A*x)
    r = b - A @ x

    # A primeira direção de busca é o próprio resíduo
    p = r

    # Calcula o produto interno do resíduo, pra ver o "tamanho" dele
    r_k = r.T @ r

    # Entra no loop principal, que vai rodar até a solução convergir
    for i in range(max_iter):
        # Se o resíduo for bem pequeno, significa que a solução está boa.
        # Aí a gente pode parar.
        if r_k < tolerancia:
            break

        # Calcula o "passo", a distância que a gente vai andar na direção 'p'
        # A @ p é a multiplicação da matriz A pela nossa direção de busca
        Ap = A @ p

        # O tamanho do passo é calculado para ser o ideal
        alpha = r_k / (p.T @ Ap)

        # Atualiza a nossa solução, dando o passo
        x = x + alpha * p

        # Calcula o novo resíduo com a nova solução
        r_novo = r - alpha * Ap
        r_k_novo = r_novo.T @ r_novo

        # Calcula o "beta", que é um fator pra definir a nova direção de busca
        beta = r_k_novo / r_k

        # A nova direção de busca é uma combinação do novo resíduo com a direção anterior.
        # É isso que faz o método não "ziguezaguear".
        p = r_novo + beta * p

        # Atualiza o resíduo e seu produto interno para a próxima iteração
        r = r_novo
        r_k = r_k_novo

    # Retorna a solução final, ou a melhor que ele encontrou
    return x

# Descrição:

**1. Descrição geral:** \
Este método é iterativo e precisa, por definição, de que a matriz seja simétrica, isto é, A^t = A (matriz dos coeficientes igual a sua transposta) e que seja definida positiva: x^t Ax > 0.

**2. Descrição das entradas e saída:** \
As entradas:
- Uma matriz de constantes;
- Uma matriz coluna de constantes dos resultados do sistema;
- O máximo de interações permitidas;
- A tolerância.

A saída é uma matriz coluna de valores das incógnitas.

**3. Descrição da experiência de funcioamento:** \
Este método não funciona bem, ou pode falhar completamente, em duas situações principais:

*A matriz não é simétrica e definida positiva*: Se a matriz não for simétrica (ou seja, se A ≠ A^t ) ou se ela não for definida positiva, a teoria por trás do método não se aplica.

O outro fator problemático neste método são os *problemas de precisão numérica:* Como o método é iterativo e lida com operações de ponto flutuante, ele pode sofrer com erros de arredondamento. Em problemas muito grandes ou com matrizes "mal-condicionadas" (onde pequenas mudanças na entrada causam grandes mudanças na saída), a precisão dos cálculos pode se deteriorar, afetando a convergência.

*O Gradiente Conjugado é Considerado Eficiente?* \
Sim, ele é considerado eficiente, especialmente para resolver sistemas lineares de grande porte, porém é mais usado para resolver sistemas não-lineares.

A eficiência do Gradiente Conjugado vem de duas características principais:

**Convergência Rápida:** Para as matrizes que atendem às condições ideais (simétricas e definidas positivas), o método garante que a solução exata será encontrada em, no máximo, n passos, onde n é o número de variáveis. Na prática, a solução é geralmente encontrada em um número muito menor de iterações. Além disso, este método evita o desperdícil de tentativas de aproximação, através do uso da noção de conjugado do gradiente.

**Baixo Custo de Memória:** O algoritmo não precisa armazenar a matriz inteira. Ele só precisa calcular a multiplicação da matriz A por um vetor, o que é extremamente vantajoso para matrizes esparsas (aquelas com muitos zeros), comuns em problemas de engenharia e ciência de dados. Isso o torna superior a métodos diretos como a Eliminação de Gauss, que exigem muito mais memória e tempo de processamento para matrizes grandes.\
Em síntese, este método é uma escolha interessante quando se trata dos chamados *sistemas lineares esparços*, quando há uma quantidade qgrande de zeros no mesmo ou a resolução de outros tipos de sistemas, os não lineares.

Referências:

- A inteligência artificial Chatgpt para o entendimento dos conceitos e tradução da ideia do método.
- Aulas do professor da plataforma Youtube, Prof. Thadeu Penna, do Canal Thadeu Penna.