# **4101553 Métodos Numéricos aplicados a la Ingenieria Civil**

Departamento de Ingeniería Civil

Universidad Nacional de Colombia

Sede Manizales

**Docente:** Juan Nicolás Ramírez Giraldo ([jnramirezg@unal.edu.co](mailto:jnramirezg@unal.edu.co))


"*Cum cogitaveris quot te antecedant, respice quot sequantur*"

**Séneca**


[Repositorio de la asignatura](https://github.com/jnramirezg/metodos_numericos_ingenieria_civil/)


# **Unidad 1: Sistemas de ecuaciones lineales**
## **Métodos Iterativos**
1. Método de Jacobi
2. Método de Gauss-Seidel

### **Método de Jacobi**

#### **Construcción del método**

Para la construcción del método se usa inicialmente un sistema de 3x3 simbólico:

Dado la matriz de coeficientes constantes:
$\underline{\underline{A}}=\displaystyle \left[\begin{matrix}i_{0} & i_{1} & i_{2}\\j_{0} & j_{1} & j_{2}\\k_{0} & k_{1} & k_{2}\end{matrix}\right]$

Y el vector de constantes:
$\underline{B}=\displaystyle \left[\begin{matrix}b_0\\b_1\\b_2\end{matrix}\right]$

Se busca hallar el vector de soluciones $\underline{X}$ de la expresión: $\underline{\underline{A}}.\underline{X}=\underline{B}$

En este caso, se define para efectos de programación en Python:
$\underline{X}=\displaystyle \left[\begin{matrix}x_0\\x_1\\x_2\end{matrix}\right]$



La propuesta del método de Jacobi busca despejar de cada ecuación una de las incógnitas, de tal manera que, se puedan evaluar iterativamente las demás. Más adelante se discutirán los cuidados numéricos que se deben considerar para garantizar la convergencia.


In [6]:
# Importación de liberías.
import sympy as sp

# Incógnitas simbólicas.
x0, x1, x2 = sp.symbols('x_0 x_1 x_2')

# Constantes simbólicas.
b0, b1, b2 = sp.symbols('b_0 b_1 b_2')

# Coeficientes constantes simbólicos.
i0, i1, i2 = sp.symbols('i_0 i_1 i_2')  # Se asocian a la primera ec.
j0, j1, j2 = sp.symbols('j_0 j_1 j_2')  # Se asocian a la segunda ec.
k0, k1, k2 = sp.symbols('k_0 k_1 k_2')  # Se asocian a la tercera ec.


In [7]:
# Definición de la matriz de coeficientes constantes.
A = sp.Matrix([
                [i0, i1, i2],
                [j0, j1, j2],
                [k0, k1, k2],
                            ])


In [8]:
A


Matrix([
[i_0, i_1, i_2],
[j_0, j_1, j_2],
[k_0, k_1, k_2]])

In [9]:
X = sp.Matrix([x0, x1, x2])


In [10]:
X


Matrix([
[x_0],
[x_1],
[x_2]])

In [11]:
B = sp.Matrix([b0, b1, b2])


In [12]:
B

Matrix([
[b_0],
[b_1],
[b_2]])

In [13]:
P = A*X - B  # Esto es igual a 0.


In [14]:
P


Matrix([
[-b_0 + i_0*x_0 + i_1*x_1 + i_2*x_2],
[-b_1 + j_0*x_0 + j_1*x_1 + j_2*x_2],
[-b_2 + k_0*x_0 + k_1*x_1 + k_2*x_2]])

Por lo que, el sistema queda de la siguiente manera:

$\displaystyle \left[\begin{matrix}- b_{0} + i_{0} x_{0} + i_{1} x_{1} + i_{2} x_{2}\\- b_{1} + j_{0} x_{0} + j_{1} x_{1} + j_{2} x_{2}\\- b_{2} + k_{0} x_{0} + k_{1} x_{1} + k_{2} x_{2}\end{matrix}\right] = \displaystyle \left[\begin{matrix}0\\0\\0\end{matrix}\right]$

Se despeja $x_0$, $x_1$ y $x_2$ de la primera, segunda y tercera ecuación, respectivamente. 

In [15]:
# Este código por el momento NO es necesario estudiarlo.
e0 = sp.solve(P[0],x0)[0]
e1 = sp.solve(P[1],x1)[0]
e2 = sp.solve(P[2],x2)[0]

In [16]:
# De la ecuación 1, se despeja x0
e0


(b_0 - i_1*x_1 - i_2*x_2)/i_0

In [17]:
# De la ecuación 2, se despeja x1
e1


(b_1 - j_0*x_0 - j_2*x_2)/j_1

In [18]:
# De la ecuación 3, se despeja x2
e2


(b_2 - k_0*x_0 - k_1*x_1)/k_2

Es decir,

$x_0 =\displaystyle \frac{b_{0} - i_{1} x_{1} - i_{2} x_{2}}{i_{0}}$

$x_1 =\displaystyle \frac{b_{1} - j_{0} x_{0} - j_{2} x_{2}}{j_{1}}$

$x_2 =\displaystyle \frac{b_{2} - k_{0} x_{0} - k_{1} x_{1}}{k_{2}}$

Luego, se asume para la iteración 0 que:

$\displaystyle \left[\begin{matrix}x_{0}^{(m)}\\x_{1}^{(m)}\\x_{2}^{(m)}\end{matrix}\right]$ = $\displaystyle \left[\begin{matrix}0\\0\\0\end{matrix}\right]$



Con las ecuaciones organizadas así:

$\displaystyle \left[\begin{matrix}x_{0}^{(m+1)}\\x_{1}^{(m+1)}\\x_{2}^{(m+1)}\end{matrix}\right]$ = 
$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1}^{(m)} - i_{2} x_{2}^{(m)}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0}^{(m)} - j_{2} x_{2}^{(m)}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0}^{(m)} - k_{1} x_{1}^{(m)}}{k_{2}}\end{matrix}\right]$


Se obtienen después de la primera iteración que $x_{0}$, $x_{1}$ y $x_{2}$ toman nuevos valores, es decir, los valores que se usarán en la iteración 1. Así, sucesivamente ¿hasta qué iteración?

Es allí, donde se definen unos criterios de error, los cuales se mostrarán más adelante.

**Sistematización del método**

Resulta altamente costoso realizar despejes particulares para cada sistema de ecuaciones, por lo que, se busca una estructura matricial simple que llegue a la forma general:

$\displaystyle \left[\begin{matrix}x_{0}^{(m+1)}\\x_{1}^{(m+1)}\\x_{2}^{(m+1)}\end{matrix}\right]$ = 
$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1}^{(m)} - i_{2} x_{2}^{(m)}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0}^{(m)} - j_{2} x_{2}^{(m)}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0}^{(m)} - k_{1} x_{1}^{(m)}}{k_{2}}\end{matrix}\right]$

In [19]:
# Se construye un vector con los resultados a los que queremos llegar.
ec = sp.Matrix([e0, e1, e2])
ec1 = sp.Matrix([e0, e1, e2]) # Se crea una copia


In [20]:
# Se comprueba que efectivamente corresponda
# a parte de derecha de la igualdad
ec


Matrix([
[(b_0 - i_1*x_1 - i_2*x_2)/i_0],
[(b_1 - j_0*x_0 - j_2*x_2)/j_1],
[(b_2 - k_0*x_0 - k_1*x_1)/k_2]])

¿Cómo se organiza?

$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1} - i_{2} x_{2}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0} - j_{2} x_{2}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0} - k_{1} x_{1}}{k_{2}}\end{matrix}\right]$  ec(0)

En este paso, se multiplica la fila 0 por $i_0$, la fila 1 por $j_1$ y la fila 2 por $k_2$. Luego, estas cada fila deberá multiplicarse por $1/i_0$, $1/j_1$ y $1/k_2$, correpondientemente, con el fin de conservar las ecuaciones originales.

In [21]:
ec1[0] = ec1[0]*(i0)
ec1[1] = ec1[1]*(j1)
ec1[2] = ec1[2]*(k2)

In [22]:
ec1 # Ecuación 1


Matrix([
[b_0 - i_1*x_1 - i_2*x_2],
[b_1 - j_0*x_0 - j_2*x_2],
[b_2 - k_0*x_0 - k_1*x_1]])

Recordando que:

La matriz de coeficientes constantes está definida por:
$\underline{\underline{A}}=\displaystyle \left[\begin{matrix}i_{0} & i_{1} & i_{2}\\j_{0} & j_{1} & j_{2}\\k_{0} & k_{1} & k_{2}\end{matrix}\right]$

El vector de constantes por:
$\underline{B}=\displaystyle \left[\begin{matrix}b_0\\b_1\\b_2\end{matrix}\right]$

Y el vector de incógnitas por:
$\underline{X}=\displaystyle \left[\begin{matrix}x_0\\x_1\\x_2\end{matrix}\right]$

¿Qué pasa si se realiza esta operación?

$\underline{B} - \underline{\underline{A}}.\underline{X}$

In [23]:
ec2 = B - A*X  # Ecuación 2


¿Qué similitudes tienen la ecuación 1 y $\underline{B} - \underline{\underline{A}}.\underline{X}$?

$\displaystyle \left[\begin{matrix}b_{0} - i_{1} x_{1} - i_{2} x_{2}\\b_{1} - j_{0} x_{0} - j_{2} x_{2}\\b_{2} - k_{0} x_{0} - k_{1} x_{1}\end{matrix}\right]$ ec(1)

$\displaystyle \left[\begin{matrix}b_{0} - i_{0} x_{0} - i_{1} x_{1} - i_{2} x_{2}\\b_{1} - j_{0} x_{0} - j_{1} x_{1} - j_{2} x_{2}\\b_{2} - k_{0} x_{0} - k_{1} x_{1} - k_{2} x_{2}\end{matrix}\right]$ ec(2)


In [24]:
ec2-ec1


Matrix([
[-i_0*x_0],
[-j_1*x_1],
[-k_2*x_2]])

¿Qué elementos no son comunes?

$\displaystyle \left[\begin{matrix}
b_{0} - \underline{i_{0} x_{0}} - i_{1} x_{1} - i_{2} x_{2}\\
b_{1} - j_{0} x_{0} - \underline{j_{1} x_{1}} - j_{2} x_{2}\\
b_{2} - k_{0} x_{0} - k_{1} x_{1} - \underline{k_{2} x_{2}}
\end{matrix}\right]$

Claramente, corresponden a los elementos de la diagonal de la matriz de coeficientes constantes.

In [25]:
# Se crea una matriz T con los mismos coeficientes constantes,
# pero sin la diagonal.
T = sp.Matrix([
               [ 0, i1, i2],
               [j0,  0, j2],
               [k0, k1,  0],
                           ])


In [26]:
T


Matrix([
[  0, i_1, i_2],
[j_0,   0, j_2],
[k_0, k_1,   0]])

Ahora, en vez de usar:

$\underline{B} - \underline{\underline{A}}.\underline{X}$  ec(2)

Se usa:
$\underline{B} - \underline{\underline{T}}.\underline{X}$  ec(3)

In [27]:
ec3 = B - T*X


In [28]:
ec3


Matrix([
[b_0 - i_1*x_1 - i_2*x_2],
[b_1 - j_0*x_0 - j_2*x_2],
[b_2 - k_0*x_0 - k_1*x_1]])

In [29]:
# Se verifica que ec3=ec1
ec3-ec1


Matrix([
[0],
[0],
[0]])

In [30]:
ec1


Matrix([
[b_0 - i_1*x_1 - i_2*x_2],
[b_1 - j_0*x_0 - j_2*x_2],
[b_2 - k_0*x_0 - k_1*x_1]])

Ahora sí son iguales. Solo falta multiplicar cada fila por $1/i_0$, $1/j_1$ y $1/k_2$, correpondientemente, para llegar a la ec(0).

¿Cómo se hace esto a partir de una operación matricial simple?

In [31]:
# Se crea una matriz D con la diagonal de A.
D = sp.Matrix([
               [i0,  0,  0],
               [ 0, j1,  0],
               [ 0,  0, k2],
                           ])


In [32]:
D


Matrix([
[i_0,   0,   0],
[  0, j_1,   0],
[  0,   0, k_2]])

Nótese que $\underline{\underline{A}}=\underline{\underline{D}}+\underline{\underline{T}}$, es decir, una forma de descomponer la matriz.

In [33]:
# Se comprueba lo anterior.
A-(D+T)


Matrix([
[0, 0, 0],
[0, 0, 0],
[0, 0, 0]])

Luego, $\underline{\underline{D}}^{-1}$ es:


In [34]:
D**-1


Matrix([
[1/i_0,     0,     0],
[    0, 1/j_1,     0],
[    0,     0, 1/k_2]])

Que tiene un muy bajo costo computacional, e incluso no es necesario realizar la operación con el concepto de inversa, sino con una rutina particular.

Recordando que, se busca llegar a la ec(0):



$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1} - i_{2} x_{2}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0} - j_{2} x_{2}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0} - k_{1} x_{1}}{k_{2}}\end{matrix}\right]$

Se verifica si con esta expresión se llega a lo mismo:

$\underline{\underline{D}}^{-1}(\underline{\underline{B}}-\underline{\underline{T}}.\underline{\underline{X}})$

In [35]:
# Se verifica lo anterior.
ec4 = D**-1*(B - T*X)


In [36]:
ec4


Matrix([
[(b_0 - i_1*x_1 - i_2*x_2)/i_0],
[(b_1 - j_0*x_0 - j_2*x_2)/j_1],
[(b_2 - k_0*x_0 - k_1*x_1)/k_2]])

$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1} - i_{2} x_{2}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0} - j_{2} x_{2}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0} - k_{1} x_{1}}{k_{2}}\end{matrix}\right]$ ec(4)

In [37]:
# Se verifica si ec(4)=ec(0)
ec4-ec


Matrix([
[0],
[0],
[0]])

Por lo tanto,

$\displaystyle \left[\begin{matrix}x_{0}^{(m+1)}\\x_{1}^{(m+1)}\\x_{2}^{(m+1)}\end{matrix}\right]=\underline{\underline{D}}^{-1}(\underline{\underline{B}}-\underline{\underline{T}}.\underline{\underline{X}})
= 
\displaystyle \left[\begin{matrix}\frac{1}{i_{0}} & 0 & 0\\0 & \frac{1}{j_{1}} & 0\\0 & 0 & \frac{1}{k_{2}}\end{matrix}\right]\left(\displaystyle \left[\begin{matrix}b_{0}\\b_{1}\\b_{2}\end{matrix}\right] - \displaystyle \left[\begin{matrix}0 & i_{1} & i_{2}\\j_{0} & 0 & j_{2}\\k_{0} & k_{1} & 0\end{matrix}\right]\displaystyle \left[\begin{matrix}x_0^{(m)}\\x_1^{(m)}\\x_2^{(m)}\end{matrix}\right]\right)$ 

Con lo que se llega a la expresión buscada:

$\displaystyle \left[\begin{matrix}x_{0}^{(m+1)}\\x_{1}^{(m+1)}\\x_{2}^{(m+1)}\end{matrix}\right]$ = 
$\displaystyle \left[\begin{matrix}\frac{b_{0} - i_{1} x_{1}^{(m)} - i_{2} x_{2}^{(m)}}{i_{0}}\\\frac{b_{1} - j_{0} x_{0}^{(m)} - j_{2} x_{2}^{(m)}}{j_{1}}\\\frac{b_{2} - k_{0} x_{0}^{(m)} - k_{1} x_{1}^{(m)}}{k_{2}}\end{matrix}\right]$

#### Contrucción numérica en Python

Para efectos de aprendizaje profundo de los procesos, se desarrollará su aplicación a partir de lista de listas y sin usar ningún módulo de Python.

Inicialmente se desarrollará para un sistema de 3x3, y luego se ampliará a cualquier sistema.

In [38]:
# Se define la matriz coeficientes constantes A como una lista de listas.
A = [
     [ 3, -1, -1],
     [-1,  3,  1],
     [ 2,  1,  4],
                 ]


In [39]:
A


[[3, -1, -1], [-1, 3, 1], [2, 1, 4]]

In [40]:
# Se define el vector B como una lista.
B = [1, 3, 7]


In [41]:
B


[1, 3, 7]

De acuerdo, con la formulación general, se debe descomponer la matriz $\underline{\underline{A}}$ en $\underline{\underline{D}}$ y $\underline{\underline{T}}$.


**Matriz $\underline{\underline{D}}$**

In [42]:
# Matriz D, con los elementos de la diagonal.

# Se define el espacio de memoria.
D = [[0, 0, 0], [0, 0, 0], [0, 0, 0],]  # Para una matriz de 3x3.
# De forma específica se deben asignar los valores así:
# Fila 0
D[0][0] = A[0][0]
D[0][1] = 0
D[0][2] = 0
# Fila 1
D[1][0] = 0
D[1][1] = A[1][1]
D[1][2] = 0
# Fila 2
D[2][0] = 0
D[2][1] = 0
D[2][2] = A[2][2]


In [43]:
D


[[3, 0, 0], [0, 3, 0], [0, 0, 4]]

Luego, este proceso no es tan eficiente. Por lo que es adecuado ponerlo dentro de un ciclo.

Se observa que, cuando en $\underline{\underline{D}}$ ocurre que $i=j$, entonces se llama el corresponiente en $\underline{\underline{A}}$, y de lo contrario, si $i\neq j$, se pone 0.

Si $i=j$:

$d_{ij} = a_{ij}$

de lo contrario, si $i\neq j$:

$d_{ij} = 0$




In [44]:
# Se define nuevamente el espacio de memoria.
D = [[0, 0, 0], [0, 0, 0], [0, 0, 0],]  # Para una matriz de 3x3.


In [45]:
for i in range(3):      # Recorre 3 filas.
    for j in range(3):  # Recorre 3 columnas.
        if i==j:        # Condición 1.
            D[i][j] = A[i][j]
        else:           # Condición 2.
            D[i][j] = 0
            

In [46]:
D


[[3, 0, 0], [0, 3, 0], [0, 0, 4]]

De forma más general, si se tiene la matriz A de orden n (cuadrada), se podría crear automáticamente la matriz diagonal correspondiente:

In [47]:
n = len(A)     # El número de filas de A.
m = len(A[0])  # El número de columnas de A.

# Se crea una matriz de ceros de tamaño n.
# Se supone que m=n, pero para evitar controlar errores en este paso
# se crea de manera general.
D = []
for i in range(n):
    D += [[]]
    for j in range(m):
        D[i] += [0]
        


In [48]:
D


[[0, 0, 0], [0, 0, 0], [0, 0, 0]]

In [49]:
for i in range(n):      # Recorre n filas.
    for j in range(m):  # Recorre m columnas.
        if i==j:        # Condición 1.
            D[i][j] = A[i][j]
        else:           # Condición 2.
            D[i][j] = 0


In [50]:
D


[[3, 0, 0], [0, 3, 0], [0, 0, 4]]

In [51]:
# Ya generalizado y sistematizado el proceso, se genera una función.
def matriz_D(A):
    '''
        Función a la que se le ingresa una matriz definida como una lista
        de listas, y devuelve una matriz del mismo tamaño, pero únicamente
        con los elementos de la diagonal.
    '''
    n = len(A)     # El número de filas de A.
    m = len(A[0])  # El número de columnas de A.

    # Se crea una matriz de ceros de tamaño n.
    # Se supone que m=n, pero para evitar controlar errores en este paso
    # se crea de manera general.
    D = []
    for i in range(n):
        D += [[]]
        for j in range(m):
            D[i] += [0]

    for i in range(n):      # Recorre n filas.
        for j in range(m):  # Recorre m columnas.
            if i==j:        # Condición 1.
                D[i][j] = A[i][j]
            #else:           # Condición 2.
            #    D[i][j] = 0
    return D


In [52]:
# Se prueba su funcionamiento.
matriz_D(A)


[[3, 0, 0], [0, 3, 0], [0, 0, 4]]

In [53]:
# Se define una matriz J de tamaño 3x2.
J = [
     [1, 2],
     [3, 4],
     [5, 6],
           ]


In [54]:
matriz_D(J)


[[1, 0], [0, 4], [0, 0]]

In [55]:
# Se define una matriz K de tamaño 2x3.
K = [
     [1, 2, 3],
     [4, 5, 6],
              ]


In [56]:
matriz_D(K)


[[1, 0, 0], [0, 5, 0]]

**Matriz $\underline{\underline{T}}$**

Matriz $\underline{\underline{T}}$, con los elementos que no son de la diagonal.

#### Síntesis del método
De forma análoga a $\underline{\underline{D}}$, se observa que, cuando en $\underline{\underline{T}}$ ocurre que $i\neq j$, entonces se llama el corresponiente en $\underline{\underline{A}}$, y de lo contrario, si $i=j$, se pone 0.

Si $i\neq j$:

$d_{ij} = a_{ij}$

de lo contrario, si $i=j$:

$d_{ij} = 0$

In [57]:
# Ya generalizado y sistematizado el proceso, se genera una función.
def matriz_T(A):
    '''
        Función a la que se le ingresa una matriz definida como una lista
        de listas, y devuelve una matriz del mismo tamaño y con los mismos
        elementos, pero sin los elementos de la diagonal.
    '''
    n = len(A)     # El número de filas de A.
    m = len(A[0])  # El número de columnas de A.

    # Se crea una matriz de ceros de tamaño n.
    # Se supone que m=n, pero para evitar controlar errores en este paso
    # se crea de manera general.
    T = []
    for i in range(n):
        T += [[]]
        for j in range(m):
            T[i] += [0]

    for i in range(n):      # Recorre n filas.
        for j in range(m):  # Recorre m columnas.
            if i!=j:        # Condición 1, ÚNICO CAMBIO: en vez de ==, !=.
                T[i][j] = A[i][j]
            #else:           # Condición 2.
            #    T[i][j] = 0
    return T


Se prueba con las matrices $\underline{\underline{A}}$, $\underline{\underline{J}}$ y $\underline{\underline{K}}$; previamente definidas.


In [58]:
matriz_T(A)


[[0, -1, -1], [-1, 0, 1], [2, 1, 0]]

In [59]:
matriz_T(J)
    

[[0, 2], [3, 0], [5, 6]]

In [60]:
matriz_T(K)


[[0, 2, 3], [4, 0, 6]]

In [61]:
# Luego, la creación de la matriz de ceros se puede automatizar en una función.
def matriz_ceros(m, n):
    '''
        Se crea una matriz de ceros de tamaño mxn definida como una lista de listas.
    '''
    C = []
    for i in range(n):
        C += [[]]
        for j in range(m):
            C[i] += [0]
    return C


In [62]:
matriz_ceros(4, 4)


[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]

Adicionalmente, se requiere la inversa de la matriz diagonal $\underline{\underline{D}}$, la cual se puede obtener con una rutina sencilla, así:


In [63]:
def matriz_Dinv(D):
    '''
        Función que se le ingresa una matriz definida como una lista de litas, y retorna
        la matriz inversa de la matriz diagonal correspondiente.
    '''
    n = len(D)     # El número de filas de D.
    m = len(D[0])  # El número de columnas de D.
    
    # Se crea el espacio de memoria adecuado con ceros.
    Dinv = matriz_ceros(m, n) # Esta función debe estar en el mismo programa que la función prin.

    for i in range(n):      # Recorre n filas.
        for j in range(m):  # Recorre m columnas.
            if i==j:        # Condición ÚNICA.
                Dinv[i][j] = 1/D[i][j]
    return Dinv


In [64]:
matriz_Dinv(D)


[[0.3333333333333333, 0, 0], [0, 0.3333333333333333, 0], [0, 0, 0.25]]

Insistiendo en el uso de listas y no de módulos, se debe definir la multiplicación de una matriz de orden $nxn$ por un vector $nx1$, tal como se evidencia a continuación:

$\displaystyle \left[\begin{matrix}x_{0}^{(m+1)}\\x_{1}^{(m+1)}\\x_{2}^{(m+1)}\end{matrix}\right]$=
$\displaystyle \left[\begin{matrix}\frac{1}{i_{0}} & 0 & 0\\0 & \frac{1}{j_{1}} & 0\\0 & 0 & \frac{1}{k_{2}}\end{matrix}\right]\left(\displaystyle \left[\begin{matrix}b_{0}\\b_{1}\\b_{2}\end{matrix}\right] - \displaystyle \left[\begin{matrix}0 & i_{1} & i_{2}\\j_{0} & 0 & j_{2}\\k_{0} & k_{1} & 0\end{matrix}\right]\displaystyle \left[\begin{matrix}x_0^{(m)}\\x_1^{(m)}\\x_2^{(m)}\end{matrix}\right]\right)$ 

$\underline{\underline{X}}^{m+1}=\underline{\underline{D}}^{-1}(\underline{\underline{B}}-\underline{\underline{T}}.\underline{\underline{X}}^{m})$

In [65]:
# Creación del producto de una matriz por un vector conforme.

# Si se tiene la matriz A
A


[[3, -1, -1], [-1, 3, 1], [2, 1, 4]]

In [66]:
# Y el vector B
B


[1, 3, 7]

In [67]:
# A*B en el contexto matricial debe arrojar un vector del mismo tamaño que B.
# Se crea un vector del mismo tamaño que B, lleno de ceros.
Mmul = matriz_ceros(len(B), 1)[0]  
# Se le agrega el indexado cero para que sea una lista, y no una lista de listas.


In [68]:
Mmul


[0, 0, 0]

In [69]:
# Note la diferencia
matriz_ceros(len(B), 1)


[[0, 0, 0]]

In [70]:
# Calculando de forma muy específica.
Mmul[0] = B[0]*A[0][0] + B[1]*A[0][1] + B[2]*A[0][2]
Mmul[1] = B[0]*A[1][0] + B[1]*A[1][1] + B[2]*A[1][2]
Mmul[2] = B[0]*A[2][0] + B[1]*A[2][1] + B[2]*A[2][2]


In [71]:
Mmul


[-7, 15, 33]

In [72]:
# Esto último se puede sistematizar, así:
# Se reserva nuevamente el espacio de memoria.
Mmul = matriz_ceros(len(B), 1)[0]  

for i in range(3):
    for j in range(3):
        Mmul[i] += B[j]*A[i][j]


In [73]:
Mmul


[-7, 15, 33]

In [74]:
# Y ahora, definido como una función general.
# Esta función no prevee errores de tamaño, pues estos serán controlados en el programa principal.
def Mmul_vector(A, B):
    '''
        Función que realiza la multiplicación de una matriz A cuadrada de orden n
        definida como una lista de listas con un vector B de tamaño n definido como una lista.
        Devuelve Mmul, del mismo tamaño que B.
    '''
    n = len(B)                    # Tamaño
    Mmul = matriz_ceros(n, 1)[0]  # Vector de ceros de tamaño n.
    
    for i in range(n):
        for j in range(n):
            Mmul[i] += B[j]*A[i][j]
            
    return Mmul


In [75]:
Mmul_vector(A, B)


[-7, 15, 33]

In [76]:
# Antes de organizar el método, falta definir la resta de vectores definidos como listas.

# Para construirlo se crean los vectores M y N.
M = [1, 2, 3]
N = [4, 5, 6]


In [77]:
# Se crea un vector del mismo tamaño que los vectores, lleno de ceros.
Mres = matriz_ceros(len(M), 1)[0]


In [78]:
Mres


[0, 0, 0]

In [79]:
Mres[0] = M[0]-N[0]
Mres[1] = M[1]-N[1]
Mres[2] = M[2]-N[2]


In [80]:
Mres


[-3, -3, -3]

In [81]:
# Sistematizado en una función.
# Esta función no prevee errores de tamaño, pues estos serán controlados en el programa principal.
def Mres_vector(M, N):
    '''
        Función que suma dos vectores M y N definidos como listas, devulve un vector del mismo
        tamaño con la suma.
    '''
    n = len(M)                    # Tamaño
    Mres = matriz_ceros(n, 1)[0]  # Vector de ceros de tamaño n.
    
    for i in range(n):
        Mres[i] = M[i]-N[i]

    return Mres
    

In [82]:
Mres_vector(M, N)


[-3, -3, -3]

Finalmente, se compilan y organizan todas las funciones anteriormente definidas y se soluciona el problema. Hasta el momento se ha definido:
- matriz_ceros(m, n)
- matriz_D(A)
- matriz_T(A)
- matriz_Dinv(D)
- Mmul_vector(A, B)
- Mres_vector(M, N)

Con estas funciones es suficiente para aplicar el método.


In [83]:
# Se cuenta con la matriz de coeficientes constantes.
A


[[3, -1, -1], [-1, 3, 1], [2, 1, 4]]

In [84]:
# Y con el vector de constantes
B


[1, 3, 7]

La forma general del método es:
$\underline{\underline{X}}^{m+1}=\underline{\underline{D}}^{-1}(\underline{\underline{B}}-\underline{\underline{T}}.\underline{\underline{X}}^{m})$

In [85]:
# Se definen las matrices constantes del método.
Dinv = matriz_Dinv(A)
T = matriz_T(A)

# Se define X0, para la primera iteración.
X0 = [0, 0, 0]


In [86]:
TX0 = Mmul_vector(T, X0)
B_TX0 = Mres_vector(B, TX0)
X1 = Mmul_vector(Dinv, B_TX0)


In [87]:
X1


[0.3333333333333333, 1.0, 1.75]

In [88]:
TX1 = Mmul_vector(T, X1)
B_TX1 = Mres_vector(B, TX1)
X2 = Mmul_vector(Dinv, B_TX1)


In [89]:
X2


[1.25, 0.5277777777777777, 1.3333333333333335]

In [90]:
TX2 = Mmul_vector(T, X2)

B_TX2 = Mres_vector(B, TX2)

X3 = Mmul_vector(Dinv, B_TX2)


In [91]:
X3


[0.9537037037037037, 0.9722222222222221, 0.9930555555555556]

En este caso sabemos que la solución es \[1, 1, 1\], y realmente se empieza a acercar con la tercera iteración.

Una propuesta es crear un ciclo en n pasos, donde n puede ser un número como 10 o 100, y así, se garantiza muchos recálculos. ¿serán suficientes?


In [92]:
X0 = [0, 0, 0]

for i in range(100):
    TX0 = Mmul_vector(T, X0)
    B_TX0 = Mres_vector(B, TX0)
    X1 = Mmul_vector(Dinv, B_TX0)
    X0 = X1

X = X0


In [93]:
X


[1.0, 1.0, 1.0]

En este caso, claramente fue suficiente y la respuesta convergió muy bien. Pero se hace necesario un concepto más general para definir la cantidad de pasos de iteración a realizar.

En un **Khoury R., Harder, D. W. (2016)** se propone comparar el valor la distancia entre dos puntos soluciones en pasos sucesivos, de tal manera que, cuando se llegue a un valor de tolerancia definido, paren las iteraciones. Este criterio, tiene sentido en la medida de que cada vez más la solución de una iteración a otra se va a parecer más.



In [94]:
# Previamenye a la implementación del criterio, se define una función que arroje la norma de un vector definido
# como una lista.

def dis_punto(M, N):
    '''
        Función que devuelve la distancia entre dos puntos definidos como listas. Devuelve un escalar.
    '''
    n = len(M)  # Tamaño del vector.
    dist_2 = 0  # Espacio de memoria.
    for i in range(n):
        dist_2 += (M[i]-N[i])**2
    dist = (dist_2)**0.5

    return dist
    

In [95]:
# Por ejemplo, para M y N previamente definidos.
dis_punto(M, N)


5.196152422706632

In [96]:
# Se plantea el método con este criterio.
X0 = [0, 0, 0]

toler = 0.0000000001
paso = 0

while True:
    TX0 = Mmul_vector(T, X0)
    B_TX0 = Mres_vector(B, TX0)
    X1 = Mmul_vector(Dinv, B_TX0)
    paso += 1
    if dis_punto(X1, X0) < toler:
        print(paso)
        break
    X0 = X1

X = X0

23


In [97]:
X


[0.9999999999983317, 0.9999999999379355, 1.0000000000552478]

**Pregunta de clase**

A partir de cuántos ceros en los decimales de la tolerancia ¿se empieza a obtener el mismo resultado? ¿por qué?


In [98]:
# Se organiza la función del método.
def metodo_jacobi(A, B):
    n = len(A)
    # Se definen las matrices constantes del método.
    Dinv = matriz_Dinv(A)
    T = matriz_T(A)

    # Se define X0, para la primera iteración.
    X0 = matriz_ceros(n, 1)[0]

    toler = 0.0000000000000001
    paso = 0

    while True:
        TX0 = Mmul_vector(T, X0)
        B_TX0 = Mres_vector(B, TX0)
        X1 = Mmul_vector(Dinv, B_TX0)
        paso += 1
        if dis_punto(X1, X0) < toler:
            print(f"Se hicieron {paso} iteraciones")
            break
        X0 = X1

    X = X0
    return X


In [99]:
metodo_jacobi(A, B)


Se hicieron 36 iteraciones


[1.0, 1.0, 1.0]

In [100]:
A1 = [[11, -9],[11, 13]]
B1 = [99, 286]


In [101]:
metodo_jacobi(A1, B1)


Se hicieron 198 iteraciones


[15.954545454545455, 8.5]

In [102]:
A2 = [[11, 13],[11, -9]]
B2 = [286,99]


In [103]:
metodo_jacobi(A2, B2)


OverflowError: (34, 'Result too large')

¿Qué ocurrió?

In [148]:
# Se plantea una mejora
def metodo_jacobi(A, B):
    n = len(A)
    # Se definen las matrices constantes del método.
    Dinv = matriz_Dinv(A)
    T = matriz_T(A)

    # Se define X0, para la primera iteración.
    X0 = matriz_ceros(n, 1)[0]

    toler = 0.0000000000000001
    paso = 0

    while True:
        TX0 = Mmul_vector(T, X0)
        B_TX0 = Mres_vector(B, TX0)
        X1 = Mmul_vector(Dinv, B_TX0)
        paso += 1
        if dis_punto(X1, X0) < toler:
            print(f"Se hicieron {paso} iteraciones")
            break
        X0 = X1
        # Criterio de divergencia
        if paso==100:
            X0 = 'No converge'
            break
        

    X = X0
    return X

In [149]:
A2 = [[11, 13],[11, -9]]
B2 = [286,99]
pivote_parcial(A2, B2)

metodo_jacobi(A2, B2)

'No converge'

In [150]:
A2

[[11, 13], [11, -9]]

In [153]:
A3 =[[ 10, -7, 0],[-3,  2, 6],[5, -1, 5]]

B3 = [7, 4, 6]

pivote_parcial(A3, B3)

In [154]:
metodo_jacobi(A3, B3)


'No converge'

Obsérvese que, el problema $\underline{\underline{A}}_1.\underline{X}=\underline{B}_1$ tiene la misma solución que $\underline{\underline{A}}_2.\underline{X}=\underline{B}_2$, pero en un caso el método converge a una respuesta y en el otro no. ¿Qué hacer?

En **Chapra (2015)** se expone que una condición **suficiente** pero **no necesaria** para garantizar la convergencia es que el elemento de la diagonal de la matriz de coeficientes constantes debe ser mayor que todo elemento fuera de la diagonal de cada fila. Esto, generalizado es: para un sistema de $n$ ecuaciones:

$|a_{ii}|>\displaystyle\sum_{j=1\\
i\neq j}^{n}|a_{ij}|$

De donde surge el concepto de [matriz dominante](https://es.wikipedia.org/wiki/Matriz_de_diagonal_estrictamente_dominante).

#### Implementación con numpy

In [1]:
import numpy as np
A = np.array([
              [ 3, -1, -1],
              [-1,  3,  1],
              [ 2,  1,  4],
                          ])
B = np.array([1, 3, 7])


In [2]:
A

array([[ 3, -1, -1],
       [-1,  3,  1],
       [ 2,  1,  4]])

In [162]:
D = np.diag(np.diag(A))


In [163]:
D


array([[3, 0, 0],
       [0, 3, 0],
       [0, 0, 4]])

In [164]:
T = A-D


In [165]:
T


array([[ 0, -1, -1],
       [-1,  0,  1],
       [ 2,  1,  0]])

In [167]:
Dinv = np.diag(1/np.diag(A))  # Esto no es lo mismo que la inversa.


Dinv


In [173]:
np.zeros(3)

array([0., 0., 0.])

In [174]:
# Se plantea una mejora
def metodo_jacobi_np(A, B):
    n = len(A)
    # Se definen las matrices constantes del método.
    D = np.diag(np.diag(A))
    Dinv = np.diag(1/np.diag(A))
    T = A-D
    # Se define X0, para la primera iteración.
    X0 = np.zeros(n)

    toler = 0.0000000000000001
    paso = 0

    while True:
        TX0 = T@X0
        B_TX0 = B-TX0
        X1 = Dinv@B_TX0
        paso += 1
        if dis_punto(X1, X0) < toler:
            print(f"Se hicieron {paso} iteraciones")
            break
        X0 = X1
        # Criterio de divergencia
        if paso==100:
            X0 = 'No converge'
            break
        

    X = X0
    return X

In [175]:
metodo_jacobi_np(A, B)

Se hicieron 36 iteraciones


array([1., 1., 1.])

### Método de Gauss-Seidel

#### Construcción del método

#### Síntesis del método