Lo siguiente está basado en el capítulo 2 y apéndice del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3 y el libro de Matrix Analysis and Applied Linear Algebra de Carl D. Meyer.

**Se sugiere haber revisado la sección 1.5 del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3: uso de numpy**

# Sistemas de ecuaciones lineales

En general son de la forma: $$\begin{array}{ccc} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n  &= & b_1 \\ a_{21}x_1 + a_{22}x_2 +  \cdots + a_{2n}x_n &= & b_2 \\ \vdots & & \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &=& b_m \end{array}$$

donde: las $x_i$'s son las incógnitas y las $a_i$'s y $b_i$'s son constantes conocidas.

Las entradas $a_{ij}$'s son llamadas coeficientes del sistema y el conjunto de $b_i$'s se le llama lado derecho del sistema.

**3 posibilidades para solución del sistema anterior:**

* Una única solución: sólo existe uno y sólo un conjunto de valores de $x_i$'s que satisfacen todas las ecuaciones simultáneamente y el sistema se nombra **consistente** o **no singular**.

* Ninguna solución: no existe ningún conjunto de valores de $x_i$'s que satisfacen todas las ecuaciones simultáneamente (el conjunto solución es vacío) y el sistema se nombra **inconsistente** o singular.

* Infinitas soluciones: hay una infinidad de conjuntos (distintos) de valores de las $x_i$'s que satisfacen todas las ecuaciones simultáneamente. **obs:** si un sistema tiene más de una solución entonces tiene una infinidad de soluciones y el sistema se nombra **consistente** o **no singular**.



El arreglo de coeficientes: $$\begin{bmatrix} a_{11} & a_{12} & \cdots& a_{1n} \\ a_{21} & a_{22} & \cdots& a_{2n} \\ &&\vdots \\ a_{m1} & a_{m2} & \cdots& a_{mn} \end{bmatrix}$$ 

se le llama matriz de coeficientes del sistema y la matriz de coeficientes aumentada con el lado derecho se le llama matriz aumentada: $$ \left [\begin{array}{cccc|c} a_{11} & a_{12} & \cdots& a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots& a_{2n} & b_2 \\ && \vdots& & \\ a_{m1} & a_{m2} & \cdots& a_{mn} & b_m \end{array} \right ]$$

Si a la matriz de coeficientes se denota por $A$ y el lado derecho por $b$ entonces la matriz aumentada es $[A|b]$.

**Def** Formalmente un escalar es un número real o complejo y una matriz es un arreglo rectangular de escalares y se escribe $A \in \mathcal{R}^{mxn}$ o $A \in \mathcal{C}^{mxn}$ para denotar que $A$ es un arreglo de dos dimensiones de números reales o de números complejos respectivamente y $A$ tiene dimensiones $mxn$: $m$ renglones y $n$ columnas.

Una matriz se nombra cuadrada si $m=n$ y rectangular si $m \neq n$.

**Def** Una submatriz de una matriz $A$ es un arreglo que se forma al eliminar cualquier combinación de renglones y columnas de $A$. Por ejemplo, $B = \begin{bmatrix} 2 &4 \\ -3& 7\end{bmatrix}$ es una submatriz de $A = \begin{bmatrix} 2 &1& 3& 4 \\ 8& 6& 5& -9\\ -3& 8& 3& 7 \end{bmatrix}$.

El símbolo $A_{i*}$ es utilizado para denotar el $i$-ésimo renglón de $A$ y $A_{*j}$ la $j$-ésima columna de A. Por ejemplo $A_{2*} = \begin{bmatrix} 8& 6& 5& -9 \end{bmatrix}$ y $A_{*2} = \begin{bmatrix} 1 \\6\\8 \end{bmatrix}$ en la definición anterior.

## En numpy...

**En numpy creamos arrays de dos dimensiones de la siguiente forma:**

In [21]:
import numpy as np
import pprint
A = np.array([[1,2,3],[4,5,6]])
pprint.pprint(A)

array([[1, 2, 3],
       [4, 5, 6]])


**y cada array tiene atributos `ndim` (número de dimensiones), `shape` (tamaño de cada dimensión) y `size` (el tamaño total del array) y `dtype` el tipo de dato del array**

In [23]:
print('v.ndim:', A.ndim)
print('v.shape:', A.shape)
print('v.size:', A.size)
print('v.dtype', A.dtype)

v.ndim: 2
v.shape: (2, 3)
v.size: 6
v.dtype int64


**accedemos con corchetes a sus componentes**

In [27]:
print('elemento en la posición (0,0):', A[0][0])
print('elemento en la posición (1,2):', A[1][2])
#también con la siguiente notación:
print('elemento en la posición (0,0):', A[0,0])
print('elemento en la posición (1,2):', A[1,2])

elemento en la posición (0,0): 1
elemento en la posición (1,2): 6
elemento en la posición (0,0): 1
elemento en la posición (1,2): 6


In [30]:
print('primer columna:', A[:,0])
print('tercer columna:', A[:,2])
print('segundo renglón:', A[1,:])

primer columna: [1 4]
tercer columna: [3 6]
segundo renglón: [4 5 6]


**otra forma de generar arrays en numpy es con la función arange o random para un array pseudo aleatorio:**

In [39]:
pprint.pprint(np.arange(6).reshape(2,3))
pprint.pprint(np.arange(0,1.2,.2).reshape(3,2))

array([[0, 1, 2],
       [3, 4, 5]])
array([[0. , 0.2],
       [0.4, 0.6],
       [0.8, 1. ]])


In [35]:
#array pseudo aleatorio
np.random.seed(1989)
pprint.pprint(np.random.randint(5, size=(3,2))) #números enteros pseudo aleatorios del 0 al 4

array([[2, 4],
       [4, 2],
       [3, 4]])


ver: 
* [numpy.reshape](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html)
* [numpy.random.randint](https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.random.randint.html)

## Interpretación geométrica

Resolver un sistema de ecuaciones lineales equivale a encontrar la intersección entre rectas, planos o hiperplanos (2,3 o n dimensiones respectivamente). Por ejemplo para un caso de dos dimensiones se tiene:

![image](https://drive.google.com/uc?export=view&id=0B66Kmqpqr3IQdHlOQk9LOWxZQ0VINVd6SlFELWdjR0c3d2lz)

El inciso a) representa un sistema de ecuaciones lineales sin solución, el inciso b) infinitas soluciones (en el dibujo ligeramente se desplazó hacia abajo una de las rectas para mostrar ambas) y el inciso c) una única solución. 

## Algoritmos

Existen una gran cantidad de algoritmos para resolver los sistemas de ecuaciones. Típicamente se elige el algoritmo de acuerdo a las características de los coeficientes.

Los hay iterativos y directos o basados en factorizaciones matriciales. Entre los directos o basados en factorizaciones matriciales se encuentran:


* Eliminación Gaussiana o factorización LU.
* Factorización de Cholesky.
* Factorización QR.
* Descomposición en valores singulares.

y como ejemplo de los iterativos están:

* Jacobi.
* Gauss-Seidel.
* Gradiente conjugado.



### Algoritmos directos o basados en factorizaciones matriciales

Los algoritmos directos encuentran sistemas de ecuaciones equivalentes a partir de operaciones básicas del álgebra lineal. **Obs:** dos sistemas de ecuaciones lineales son equivalentes si tienen el mismo conjunto solución.

### Ejemplos de uso de los paquetes numpy y scipy para resolver ecuaciones lineales

1)Resolver: $$\begin{array}{ccc} 8x_1 -6x_2 + 2x_3  &= & 28 \\ -4x_1 + 11x_2 -7x_3 &= & -40 \\ 4x_1 -7x_2 + 6x_3 &=& 33\end{array} $$

In [1]:
import numpy as np
import pprint

In [3]:
A = np.array([[8, -6, 2], [-4, 11, -7], [4, -7, 6]])
b = np.array([28,-40,33])
print('A:')
pprint.pprint(A)
print('b:')
pprint.pprint(b)

A:
array([[ 8, -6,  2],
       [-4, 11, -7],
       [ 4, -7,  6]])
b:
array([ 28, -40,  33])


In [4]:
np.linalg.solve(A,b)

array([ 2., -1.,  3.])

2) Resolver $Ax = B$ 

$$\begin{array}{l}
\begin{array}{ccc}
6x_1-4x_2+x_3&=&\\
-4x_1+6x_2-4x_3&=&\\
x_1-4x_2+6x_3&=&
\end{array}
\left[\begin{array}{cc}
-14 & 22\\
36 & -18\\
6 & 7
\end{array}
\right] 
\end{array}
$$

In [5]:
import numpy as np
import pprint

In [6]:
A = np.array([[6,-4,1], [-4,6,-4], [1,-4,6]])
B = np.array([[-14,22],[36,-18],[6,7]])
print('A:')
pprint.pprint(A)
print('B:')
pprint.pprint(B)

A:
array([[ 6, -4,  1],
       [-4,  6, -4],
       [ 1, -4,  6]])
B:
array([[-14,  22],
       [ 36, -18],
       [  6,   7]])


In [7]:
np.linalg.solve(A,B)

array([[10.,  3.],
       [22., -1.],
       [14.,  0.]])

3) Obtener los factores $L, U$ de la matriz $A$: $$A = \begin{bmatrix} 1& 4& 1 \\ 1& 6& -1 \\2& -1&2 \end{bmatrix}$$ 

y utilizarlos para resolver $Ax = B$ con $$B=\begin{bmatrix}7 & -1\\13 & 6\\5 & 7\end{bmatrix}$$

In [8]:
import scipy
import scipy.linalg 
import numpy as np
import pprint

In [9]:
A = scipy.array([[2,-1,2], [1,6,-1], [1,4,1]])
P, L, U = scipy.linalg.lu(A)

print('A:')
pprint.pprint(A)
print('P:')
pprint.pprint(P)
print('L:')
pprint.pprint(L)
print('U:')
pprint.pprint(U)


A:
array([[ 2, -1,  2],
       [ 1,  6, -1],
       [ 1,  4,  1]])
P:
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])
L:
array([[1.        , 0.        , 0.        ],
       [0.5       , 1.        , 0.        ],
       [0.5       , 0.69230769, 1.        ]])
U:
array([[ 2.        , -1.        ,  2.        ],
       [ 0.        ,  6.5       , -2.        ],
       [ 0.        ,  0.        ,  1.38461538]])


In [10]:
print('Verificando resultado')
print('L*U:')
pprint.pprint(np.dot(L,U))
print('P*A')
pprint.pprint(np.dot(P,A))

Verificando resultado
L*U:
array([[ 2., -1.,  2.],
       [ 1.,  6., -1.],
       [ 1.,  4.,  1.]])
P*A
array([[ 2., -1.,  2.],
       [ 1.,  6., -1.],
       [ 1.,  4.,  1.]])


In [11]:
B = scipy.array([[7,-1],[13,6],[5,7]])
D = scipy.linalg.solve_triangular(L,B,lower=True)
x = scipy.linalg.solve_triangular(U,D,lower=False)
print('x:')
pprint.pprint(x)

x:
array([[ 7.33333333, -1.83333333],
       [ 0.33333333,  1.66666667],
       [-3.66666667,  2.16666667]])


In [12]:
print('Verificando resultado')
pprint.pprint(A.dot(x[:,0]))
pprint.pprint(A.dot(x[:,1]))

Verificando resultado
array([ 7., 13.,  5.])
array([-1.,  6.,  7.])


**Ejercicio: resolver el ejercicio 3) anterior con la factorización QR del paquete `numpy` de la matriz A**

In [13]:
q,r = np.linalg.qr(A)

In [14]:
pprint.pprint(q)
pprint.pprint(r)

array([[-0.81649658,  0.56354707, -0.12549116],
       [-0.40824829, -0.71724173, -0.56471022],
       [-0.40824829, -0.40985242,  0.81569255]])
array([[-2.44948974, -3.26598632, -1.63299316],
       [ 0.        , -6.5064071 ,  1.43448345],
       [ 0.        ,  0.        ,  1.12942045]])


In [18]:
x = scipy.linalg.solve_triangular(r,np.dot(q.T,B))
pprint.pprint(x)

array([[ 7.33333333, -1.83333333],
       [ 0.33333333,  1.66666667],
       [-3.66666667,  2.16666667]])


## Referencias:
* [numpy.linalg.solve](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.solve.html)
* [scipy.linalg.lu](https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.linalg.lu.html)
* [scipy.linalg.solve_triangular](https://docs.scipy.org/doc/scipy/reference/generated/scipy.linalg.solve_triangular.html)

### Algoritmos iterativos

A diferencia de los algoritmos directos que utilizan un número finito de pasos para resolver un sistema de ecuaciones lineales, esta clase de algoritmos utilizan un punto inicial y con un proceso iterativo van mejorando la solución hasta que se satisfaga un criterio de paro. Típicamente tienen un desempeño más lento que los directos pero aprovechan mejor la estructura de las matrices. Dependiendo de las características de las matrices convergen o no a la solución.

Revisar sección 2.7 del libro de texto de J. Kiusalas Numerical Methods in Engineering with Python 3:

* Gauss-Seidel.
* Gradiente conjugado.
