$\Huge{\text{Física Computacional}}$

# Tema 5: Soluciones de ecuaciones.

## 5.1 Soluciones de ecuaciones lineales.

- Queremos resolver numericamente un sistema de $n$ ecuaciones lineales con $n$ incóngnitas de la forma:

\begin{align}
a_{11}\,x_1+a_{12}\,x_2+\cdots+a_{1n}\,x_n &= b_1,\nonumber\\
a_{21}\,x_1+a_{22}\,x_2+\cdots+a_{2n}\,x_n &= b_2,\nonumber\\
\vdots\quad\qquad\vdots\qquad\qquad\vdots\quad&\quad\vdots\nonumber\\
a_{n1}\,x_1+a_{n2}\,x_2+\cdots+a_{nn}\,x_n &=b_n,\nonumber\\
\end{align}

$\quad$ o en formulación matricial:

$$A\cdot X =B,$$

$\quad$ con

$$A=\left(
\begin{array}{cccc}
a_{11}&a_{12}&\cdots&a_{1n}\nonumber\\
a_{21}&a_{22}&\cdots&a_{2n}\nonumber\\
\vdots&\vdots&\ddots&\vdots\nonumber\\
a_{n1}&a_{n2}&\cdots&a_{nn}\nonumber\\
\end{array}\right),\quad
X=\left(
\begin{array}{c}
x_1\nonumber\\
x_2\nonumber\\
\vdots\nonumber\\
x_n\nonumber\\
\end{array}
\right)\quad\text{y}\quad B=\left(
\begin{array}{c}
b_1\nonumber\\
b_2\nonumber\\
\vdots\nonumber\\
b_n\nonumber\\
\end{array}
\right).
$$
<br/>


**¿ Cuál es el método más efectivo para resolver este sistema numéricamente?**

- A primera vista puede parecer que el método más sencillo es calcular la inversa de $A$, es decir:

$$X= A^{-1}\cdot B,$$

$\quad$ sin embargo no es el caso. 

- Calcular la inversa de una matriz es en general más complicado que resolver el sistema inicial de ecuaciones.
- Además, la inversa involucra cocientes de diferencias de números que aumenta el error de redondeo. 
- Hay métodos más fáciles y rápidos.

### 5.1.1 Eliminación gaussiana. 

- La idea del método es utilizar operaciones elementales de matrices que permitan transformar nuestro sistema de ecuaciones inicial en uno donde la matriz $A$ sea triangular.

- Para ello construimos en primer lugar la matriz ampliada:

$$\left(A\vert B\right)=\left(
\begin{array}{cccccc}
a_{11}&a_{12}&\cdots&a_{1n}&\vert& b_1\nonumber\\
a_{21}&a_{22}&\cdots&a_{2n}&\vert& b_2\nonumber\\
\vdots&\vdots&\ddots&\vdots&\vert &\vdots\nonumber\\
a_{n1}&a_{n2}&\cdots&a_{nn}&\vert& b_n\nonumber\\
\end{array}\right)$$

- Operaciones elementales sobre la matriz extendida:

    1. Multiplicar una fila por un escalar (no nulo).
    2. Sumar a una fila el múltiplo de otra. 
    3. Intercambiar las posición de dos filas.
    
    
- El método de Gauss combina las operaciones 1 y 2 para transformar:

$$\left(A\vert B\right)=\left(
\begin{array}{ccccccc}
a_{11}&a_{12}&a_{31}&\cdots&a_{1n}&\vert& b_1\nonumber\\
a_{21}&a_{22}&a_{32}&\cdots&a_{2n}&\vert& b_2\nonumber\\
a_{31}&a_{32}&a_{33}&\cdots&a_{3n}&\vert& b_3\nonumber\\
\vdots&\vdots&\vdots&\ddots&\vdots&\vert &\vdots\nonumber\\
a_{n1}&a_{n2}&a_{n3}&\cdots&a_{nn}&\vert& b_n\nonumber\\
\end{array}\right)\quad\Rightarrow\quad 
\left(
\begin{array}{ccccccc}
 1 &\bar a_{12}&\bar a_{31}&\cdots&\bar a_{1n}&\vert&\bar b_1\nonumber\\
0& 1&\bar a_{32}&\cdots&\bar a_{2n}&\vert&\bar b_2\nonumber\\
0&0& 1 &\cdots&\bar a_{3n}&\vert&\bar b_3\nonumber\\
\vdots&\vdots&\vdots&\ddots&\vdots&\vert &\vdots\nonumber\\
0&0&0&\cdots& 1 &\vert&\bar b_n\nonumber\\
\end{array}\right)$$

$\quad$ donde el segundo sistema de ecuaciones se puede resolver por sustitución inversa.

**¿Como podemos obtener la matriz triangular?** 

- Dividimos la **primera** fila por el **primer** elemento $a_{11}$.
- Le restamos a la fila $j>1$ la primera fila multiplicada por su primer elmento $a_{j1}$. 
- Dividimos la **segunda** fila por su **segundo** elemento $a_{22}$. 
- Le restamos a la fila $j>2$ la segunda fila multiplicada por su primer elmento $a_{j2}$. 
- Continuamos de la misma fórmula hasta llegar al último elemento.

**¿Como realizar la sustitución hacía atrás?** 
- El valor de $x_n=\bar b_n$
- El valor de $x_{n-1}=\bar b_{n-1} -\bar a_{n-1,n} x_n$
- Continuamos restandole a las filas anteriores el valor de todas las incognitas que acabamos de resolver multiplicadas por su correspondiente coeficiente en la fila.

**Algoritmo para obtener la eliminación gaussiana:**

1. Dividimos la fila $m$ por su elemento $m$-esimo.
2. A cada fila $i>m$ le restamos la fila $m$ multiplicada por su elemento $a_{mi}$. 
3. El valor de la variable $x_m=b_m-\sum_{i=m+1}^N a_{m,i}\,x_i$ 


**Ejercicio 5.1:** Usar el método de la eliminación de Gauss para transformar el sistema de ecuaciones:

\begin{align}
2\,w +   x+4\,y+   z=&-4,\nonumber\\
3\,w +4\,x-   y-   z=& 3,\nonumber\\
   w -4\,x+   y+5\,z=& 9,\nonumber\\
2\,w -2\,x+   y+3\,z=& 7.\nonumber\\
\end{align}

In [3]:
from numpy import array,zeros,column_stack

def gaussian_elim(A,B):
    # Calculamos el número de filas
    N=len(B)

    # Creamos nuestra matriz ampliada
        
    AB=column_stack((A,B))        
        
    # Eliminación gaussiana

    for m in range(N):
    
        # 1. dividimos por el elemento 
        div=AB[m,m]
        AB[m,:]/=div
    
        # 2. Sustraemos las filas siguientes
        for i in range(m+1,N):
            mult=AB[i,m]
            AB[i,:]-=mult*AB[m,:]
        
    # 3. Sustitución inversa        
    x=zeros(N,float)

    for m in range(N-1,-1,-1):
        x[m]=AB[m,N]
        for i in range(m+1,N):
            x[m]-=AB[m,i]*x[i]
    return x,AB

In [4]:
# Definimos nuestra matriz ampliada
A=array([[2,1,4,1],[3,4,-1,-1],[1,-4,1,5],[2,-2,1,3]],float)
B=array([-4,3,9,7],float)

AB=column_stack((A,B))    
print("Nuestra matriz extendida inicial")
print(AB)
print("")

x,AB2=gaussian_elim(A,B)

print("Nuestra matriz extendida triangular")
print(AB2)        
print("")

print("La solución del sistema de ecuaciones es:")
print(x)

Nuestra matriz extendida inicial
[[ 2.  1.  4.  1. -4.]
 [ 3.  4. -1. -1.  3.]
 [ 1. -4.  1.  5.  9.]
 [ 2. -2.  1.  3.  7.]]

Nuestra matriz extendida triangular
[[ 1.   0.5  2.   0.5 -2. ]
 [ 0.   1.  -2.8 -1.   3.6]
 [-0.  -0.   1.  -0.  -2. ]
 [-0.  -0.  -0.   1.   1. ]]

La solución del sistema de ecuaciones es:
[ 2. -1. -2.  1.]


### 5.1.2 Método del pivote. 

- La eliminación gaussiana requiere dividir en cada paso por el elemento $a_{ii}$, lo cual sólo es posible si el elemento es diferente de cero.

- El método del pivote combina la eliminación gaussiana con la operación elemental 3 de las matrices:   
  el intercambio de una fila por otro. 

- Esto garantiza que en ningún paso un elemento de la diagonal sea 0.

- No hay una única forma de hacerlo. 
- La regla general es intercambiar en cada paso la fila $m$ por la fila $j>m$ tal que $\vert a_{jm}\vert$ tenga el valor máximo de todos los $a_{km}$  con $m\le k\le n$.

**Ejercicio 5.2:** Modificar el algoritmo de la eliminación de gauss para incluir el método del pivote. 

1. Comprobar que el resultado del ejercicio 5.1 no cambia. 
2. Aplicarlo al sistema:

\begin{align}
   x+4\,y+   z=&-4,\nonumber\\
3\,w +4\,x-   y-   z=& 3,\nonumber\\
   w -4\,x+   y+5\,z=& 9,\nonumber\\
2\,w -2\,x+   y+3\,z=& 7.\nonumber\\
\end{align}

$\quad$ y comprobar que el sistema funciona.

In [5]:
from numpy import array,zeros

def gaussian_pivot(A,B):

    # Calculamos el número de filas
    N=len(B)

    # Creamos nuestra matriz ampliada
        
    AB=column_stack((A,B))     
    
    # Eliminación gaussiana con método del pivote. 

    for m in range(N):

        #1. Escogemos la fila i>=m cuyo elemento a_{im} este más alejado de 0. 
        pivot= m
        largest= abs(AB[m,m])
    
        for i in range(m+1,N):
            if abs(AB[i,m]>largest):
                largest=AB[i,m]
                pivot=i

        # 2. Intercambiamos la fila pivot por la fila m.     
        for i in range(N+1):
            AB[m,i],AB[pivot,i]=AB[pivot,i],AB[m,i]
    
        # 3. dividimos por el elemento 
        div=AB[m,m]
        AB[m,:]/=div
    
        # 4. Sustraemos las filas siguientes
        for i in range(m+1,N):
            mult=AB[i,m]
            AB[i,:]-=mult*AB[m,:]
        
    # 5. Sustitución inversa        
    x=zeros(N,float)

    for m in range(N-1,-1,-1):
        x[m]=AB[m,N]
        for i in range(m+1,N):
            x[m]-=AB[m,i]*x[i]

    return x,AB

In [6]:
print("Nuestra matriz extendida inicial")
print(AB)
print("")

x,AB2 = gaussian_pivot(A,B)

print("Nuestra matriz extendida triangular")
print(AB)        
print("")

print("La solución del sistema de ecuaciones es:")
print(x)

Nuestra matriz extendida inicial
[[ 2.  1.  4.  1. -4.]
 [ 3.  4. -1. -1.  3.]
 [ 1. -4.  1.  5.  9.]
 [ 2. -2.  1.  3.  7.]]

Nuestra matriz extendida triangular
[[ 2.  1.  4.  1. -4.]
 [ 3.  4. -1. -1.  3.]
 [ 1. -4.  1.  5.  9.]
 [ 2. -2.  1.  3.  7.]]

La solución del sistema de ecuaciones es:
[ 2. -1. -2.  1.]


In [7]:
# Definimos nuestra matriz ampliada
A=array([[0,1,4,1],[3,4,-1,-1],[1,-4,1,5],[2,-2,1,3]],float)
B=array([-4,3,9,7],float)

AB=column_stack((A,B))

print("Nuestra matriz extendida inicial")
print(AB)
print("")

x,AB2 = gaussian_pivot(A,B)

print("Nuestra matriz extendida triangular")
print(AB)        
print("")

print("La solución del sistema de ecuaciones es:")
print(x)

Nuestra matriz extendida inicial
[[ 0.  1.  4.  1. -4.]
 [ 3.  4. -1. -1.  3.]
 [ 1. -4.  1.  5.  9.]
 [ 2. -2.  1.  3.  7.]]

Nuestra matriz extendida triangular
[[ 0.  1.  4.  1. -4.]
 [ 3.  4. -1. -1.  3.]
 [ 1. -4.  1.  5.  9.]
 [ 2. -2.  1.  3.  7.]]

La solución del sistema de ecuaciones es:
[ 1.61904762 -0.42857143 -1.23809524  1.38095238]


### 5.1.3 Factorización LU.

- La eliminación gaussiana con pivote es un método efectivo y rápido.
- Sin embargo, en muchas ocasiones en física queremos resolver el sitema:

$$A\cdot X =V,$$

$\quad$ para distintos valores de $V$. 

- Cómo el efecto de la eliminación gussiana sobre $A$ siembre es el mismo, la pregunta es si uno puede almacenar de alguna forma las operaciones necesarias para convertir $A$ en una matriz triangular.  

#### Forma matricial de las operaciones elementales sobre matrices.

- El punto de partida es la matriz identidad $I(n)$. 
- Toda operación elemental se puede expresar como una operacion sobre $I(n)$ que luego actuará en $A$. 

    1. Multiplicar una fila $m$ por un escalar $\alpha$.   
       Por ejemplo, multiplicar la fila segunda por un $\alpha$.
    
    $$I_{1}(n,2)=\left(
    \begin{array}{ccccc}
          1&0&\cdots&0\\
          0&\alpha&\cdots&0\\
          \vdots&\vdots&\ddots&0\\
          0&0&\cdots&1\\
    \end{array}\right).
    $$
<br/>

    2. Sumar a una fila $k$ la fila $m$ multiplicada por un escalar.  
       Por ejemplo, restar a la segunda fila la primera multiplicada por $\alpha$.
    
    $$I_{2}(n,2,1)=\left(
    \begin{array}{ccccc}
          1&0&\cdots&0\\
          \alpha&1&\cdots&0\\
          \vdots&\vdots&\ddots&0\\
          0&0&\cdots&1\\
    \end{array}\right).
    $$
<br/>

    3. Intercambiar la fila $k$ por la fila $m$.   
       Por ejemplo, intercambiar la fila 2 por la fila 1.  
    
    $$I_{3}(n,1,2)=\left(
    \begin{array}{ccccc}
          0&1&\cdots&0\\
          1&0&\cdots&0\\
          \vdots&\vdots&\ddots&0\\
          0&0&\cdots&1\\
    \end{array}\right).
    $$
<br/>

- Definidas esas operaciones. Se puede construir para cada uno de los pasos de la eliminación gaussiana la matriz que nos permite transforma $A$ en una matriz diagonal.

**Ejercicio 5.3:** Para una matriz $A$ de dimensión $4x4$ 

$$A=\left(
\begin{array}{cccc}
a_{11}&a_{12}&a_{13}&a_{14}\nonumber\\
a_{21}&a_{22}&a_{23}&a_{24}\nonumber\\
a_{31}&a_{32}&a_{33}&a_{34}\nonumber\\
a_{41}&a_{42}&a_{43}&a_{44}\nonumber\\
\end{array}\right)$$
<br/>

definir las matrices asociadas a las 4 operaciones necesarias para convertirla en una matriz triangular superior.


1. Dividir la primera fila por su primer elemento y restarsela al resto de filas al multipicarla por $\alpha_{j1}$ con j>1. 
<br/>

$$L_1=\frac{1}{a_{11}}\left(
\begin{array}{cccc}
1&0&0&0\nonumber\\
-a_{21}&a_{11}&0&0\nonumber\\
-a_{31}&0&a_{11}&0\nonumber\\
-a_{41}&0&0&a_{11}\nonumber\\
\end{array}\right),$$
<br/>

que permite

$$L_1\cdot A =\left(
\begin{array}{cccc}
1&b_{12}&b_{13}&b_{14}\nonumber\\
0&b_{22}&b_{23}&b_{24}\nonumber\\
0&b_{32}&b_{33}&b_{34}\nonumber\\
0&b_{42}&b_{43}&b_{44}\nonumber\\
\end{array}\right)=B$$
<br/>

2. Dividir la segunda fila por su segundo elemento y restarsela al resto de filas al multipicarla por $\beta_{j2}$ con j>2. 
<br/>
<br/>

$$L_2=\frac{1}{b_{22}}\left(
\begin{array}{cccc}
b_{22}&0&0&0\nonumber\\
0&1&0&0\nonumber\\
0&-b_{32}&b_{22}&0\nonumber\\
0&-b_{42}&0&b_{22}\nonumber\\
\end{array}\right),$$
<br/>

que permite
<br/>

$$L_2\cdot B =\left(
\begin{array}{cccc}
1&c_{12}&c_{13}&c_{14}\nonumber\\
0&1&c_{23}&c_{24}\nonumber\\
0&0&c_{33}&c_{34}\nonumber\\
0&0&c_{43}&c_{44}\nonumber\\
\end{array}\right)=C$$
<br/>

3. Dividir la tercera fila por su tercer elemento y restarsela al la cuarta fila multiplicada por $c_{43}$. 
<br/>
<br/>

$$L_3=\frac{1}{c_{33}}\left(
\begin{array}{cccc}
c_{33}&0&0&0\nonumber\\
0&c_{33}&0&0\nonumber\\
0&0&1&0\nonumber\\
0&0&-c_{43}&c_{33}\nonumber\\
\end{array}\right),$$
<br/>

que permite

$$L_3\cdot C =\left(
\begin{array}{cccc}
1&d_{12}&d_{13}&d_{14}\nonumber\\
0&1&d_{23}&d_{24}\nonumber\\
0&0&1&d_{34}\nonumber\\
0&0&0&d_{44}\nonumber\\
\end{array}\right)=D$$
<br/>

4. Dividir la cuarta fila por su cuarto elemento. 
<br/>
<br/>

$$L_4=\frac{1}{d_{44}}\left(
\begin{array}{cccc}
d_{44}&0&0&0\nonumber\\
0&d_{44}&0&0\nonumber\\
0&0&d_{44}&0\nonumber\\
0&0&0&1\nonumber\\
\end{array}\right),$$
<br/>

que nos permite convertir la matriz D en una matriz triangular superior.

- Por tanto, para una matriz con $n$ filas, necesitamos definir $n$ matrices $L_i$ con $i=1,\cdots,n$.
- Una vez obtenidas el problema reside en operar con ellas sobre la matriz extendida y realizar la sustitución hacía atrás:

$$L_n\cdots L_2\cdot L_1\cdot A=L_n\cdots L_2\cdot L_1\cdot V,$$

- Puesto que el producto $L_n\cdots L_2\cdot L_1\cdot A$ siempre es el mismo,   
  no hace falta volverlo a calcular si se cambia el valor de V. 
  
  
#### Matrices L y U.  
  
- En la práctica sin embargo se intenta minimizar las operaciones sobre V,  
  de forma que sus valores sólo se utilizan para la sustitución hacía atrás. 
  
- Ello se consigue definiendo la matrices:

$$L=L_1^{-1}L_2^{-1}\cdots L_n^{-1}\quad\text{y}\quad U=L_n\cdots L_2\cdot L_1\cdot A,$$

$\quad$ que satisfacen que:

$$ L\cdot U =A,\quad\Rightarrow\quad L\cdot U\cdot X =V$$

- $U$, tal y como hemos visto, es una matriz triangular superior.  

- En principio el cálculo de $L$ requiere calcular la inversa de cada una de las matrices elementales y operar con ellas.  

**Ejercicio 5.4:** Calcular el valor de L para la matriz del ejercicio 5.3.

1. Calculamos la inversa de cada una de las matrices elementales.
<br/>
<br/>

$$L_1^{-1}=\left(
\begin{array}{cccc}
a_{11}&0&0&0\nonumber\\
a_{21}&1&0&0\nonumber\\
a_{31}&0&1&0\nonumber\\
a_{41}&0&0&1\nonumber\\
\end{array}\right),\; L_2^{-1}=\left(
\begin{array}{cccc}
1&0&0&0\nonumber\\
0&b_{22}&0&0\nonumber\\
0&b_{32}&1&0\nonumber\\
0&b_{42}&0&1\nonumber\\
\end{array}\right),\; L_3^{-1}=\left(
\begin{array}{cccc}
1&0&0&0\nonumber\\
0&1&0&0\nonumber\\
0&0&c_{33}&0\nonumber\\
0&0&c_{43}&1\nonumber\\
\end{array}\right),\; L_4^{-1}=\left(
\begin{array}{cccc}
1&0&0&0\nonumber\\
0&1&0&0\nonumber\\
0&0&1&0\nonumber\\
0&0&0&d_{44}\nonumber\\
\end{array}\right).$$
<br/>
<br/>

2. Operamos con todas ellas:

$$L=L_1^{-1}L_2^{-2}L_3^{-1}L_4^{-2}=\left(
\begin{array}{cccc}
a_{11}&0&0&0\nonumber\\
a_{21}&b_{22}&0&0\nonumber\\
a_{31}&b_{32}&c_{33}&0\nonumber\\
a_{41}&b_{42}&c_{43}&d_{44}\nonumber\\
\end{array}\right).$$
<br/>
<br/>

* Pero no es el caso: 
    - la matriz L es la matriz triangular cuyas columnas se generan en cada paso al convertir la matriz A en una matriz triangular superior, es decir, cuando se calcula U. 



* La matriz L es una matriz diagonal inferior miesntras que la matriz U es una matriz diagonal superior.
* Por tanto, cada una de ellas puede resolverse por medio de la sustitución, hacía atrás para U y hacía adelante para L.

* Especificamente, queremos resolver:

$$L\cdot U\cdot X = V,$$

$\quad$ que se puede descomponer en:

$$U\cdot X = Y$$

$\quad$ y el problema:

$$L\cdot Y =V.$$

**Ejercicio 5.5:** Aplicar la descomposición LU a la matriz del ejercicio 5.1.

In [8]:
def LU(A):

    from numpy import zeros,copy
    
    N=len(A)
    
# Inicialiazmos nuestras dos matrices. 
    L=zeros([N,N],float)     # L tiene que ser una matriz triangular inferior.
    U=copy(A)                # U será la matriz A convertida en triangular superior.

# Creamos la matrix L
    for m in range(N):
        L[m:N,m] = U[m:N,m] # para cada iteracción (para cada fila), 
                            # la columna m de L queda fijada por el valor que tiene U.                  
            
        # Convetimos ahora U en una matrix triangular superior.
        # Para ello usamos la eliminación guassiana.    
        
        # 1. Dividimos la fila m por el elemento m,m
        div=U[m,m]
        U[m,:]/=div
        
        # 2. Sustraemos la fila m a las filas i>m multiplicadas por el elemento i,m
        for i in range(m+1,N):
            mult=U[i,m]
            U[i,:]-= mult*U[m,:]
            
    return L,U

In [9]:
# Definimos nuestra matriz
from numpy import dot

A=array([[2,1,4,1],[3,4,-1,-1],[1,-4,1,5],[2,-2,1,3]],float)

# Generamos las matrices L y U y comprobamos que son como deberían ser.
L,U=LU(A)
print(L)
print()
print(U)
print()

# Comprabamos que L U es efectivamente A.
print(dot(L,U))
print()
print(A)

[[  2.    0.    0.    0. ]
 [  3.    2.5   0.    0. ]
 [  1.   -4.5 -13.6   0. ]
 [  2.   -3.  -11.4  -1. ]]

[[ 1.   0.5  2.   0.5]
 [ 0.   1.  -2.8 -1. ]
 [-0.  -0.   1.  -0. ]
 [-0.  -0.  -0.   1. ]]

[[ 2.  1.  4.  1.]
 [ 3.  4. -1. -1.]
 [ 1. -4.  1.  5.]
 [ 2. -2.  1.  3.]]

[[ 2.  1.  4.  1.]
 [ 3.  4. -1. -1.]
 [ 1. -4.  1.  5.]
 [ 2. -2.  1.  3.]]


In [10]:
# programa que usa las matrices LU
# para resolver un sistema de ecuaciones

def LU_sol(L,U,V):

    from numpy import empty
    N=len(V)

    # 1. Sustitución hacía adelante. Operando con L.
    y=empty(N,float)
    
    for m in range(N):
        y[m]=V[m]
        for i in range(m):
            y[m]-= L[m,i]*y[i]
        y[m]/=L[m,m]
    
    # 2. Sustitución hacía atrás. Operando con U.
    x=empty(N,float)
    
    for m in range(N-1,-1,-1):
        x[m]=y[m]
        for i in range(m+1,N):
            x[m]-=U[m,i]*x[i]
            
    return(x)

In [11]:
V=array([-4,3,9,7],float)
print(LU_sol(L,U,V))

[ 2. -1. -2.  1.]


**Final de la clase del 25/10/21**