# FUNCIONES

In [1]:
import os
import pprint
import numpy as np
import copy
from math import sqrt
from scipy.linalg import solve_triangular

### Creación matrices

In [2]:
def crea_matriz(renglones,columnas,maximo_valor,minimo_valor,entero=False):
    """
    Función de apoyo para genear matrices aleatorias
                            
    params: renglones       no. de renglones de la matriz
            columnas        no. de renglones de la matriz
            maximo_valor    valor máximo de las entradas de la matriz
            minimo_valor    valor mínimo de las entradas de la matriz
            entero          Indica si las entradas serán enteras (True) o no
            
    return: M               Matriz con numeros al azar
    """
    M=np.zeros((renglones, columnas))
    for i in range(renglones):
        for j in range(columnas):
            if entero:
                M[i][j]=(np.random.rand(1)*(maximo_valor+1-minimo_valor)+minimo_valor)//1
            else:
                M[i][j]=np.random.rand(1)*(maximo_valor-minimo_valor)+minimo_valor
    return M

### Factorización QR

In [3]:
def house(x):
    """
    Función que calcula la proyección de householder
    
    params: x       vector al que se le hará la reflexión householder
                    
    return: Beta    constante utilizada para obtener v
            v       vector que representa la reflexión de householder
    """
    m=len(x)
    norm_2_m=x[1:m].dot(np.transpose(x[1:m]))
    v=np.concatenate((1,x[1:m]), axis=None)
    Beta=0
    if (norm_2_m==0 and x[0]>=0):
        Beta=0
    elif (norm_2_m==0 and x[0]<0):
        Beta=2
    else:
        norm_x=np.sqrt(pow(x[0],2)+norm_2_m)
        if (x[0]<=0):
            v[0]=x[0]-norm_x
        else:
            v[0]=-norm_2_m/(x[0]+norm_x)
        Beta=2*pow(v[0],2)/(norm_2_m+pow(v[0],2))
        v=v/v[0]
    return Beta, v

In [4]:
def factorizacion_QR(A):
    """
    Función que genera una matriz que contendrá información escencial de las proyecciones householder
    (vectores v's) y componentes de la matriz triangular superior R, del estilo:
    [r11      r12      r13      r14    ]
    [v_2_(1)  r22      r23      r24    ]
    [v_3_(1)  v_3_(2)  r33      r34    ]
    [v_4_(1)  v_4_(2)  v_4_(3)  r44    ]
    [v_5_(1)  v_5_(2)  v_5_(3)  v_5_(4)]
    
    params: A      Matriz (mxn) de la que se desea obtener factorización QR
            
    return: A_r_v  Matriz (mxn) con la información esencial (es igual a la matriz R, pero en lugar de tener ceros
                   en la parte inferior, contiene info de los vectores householder que serán útiles para
                   futuros cálculos, que entre otros están el calcular la matriz ortonormal Q)
    """
    m=A.shape[0]
    n=A.shape[1]
    A_r_v=copy.copy(A)
    for j in range(n):
        beta, v=house(A_r_v[j:m,j])
        A_r_v[j:m,j:n]=A_r_v[j:m,j:n]-beta*(np.outer(v,v)@A_r_v[j:m,j:n])
        A_r_v[(j+1):m,j]=v[1:(m-j)]
    return A_r_v

In [5]:
def QT_C(A_r_v,C):
    """
    Función que calcula el producto matricial de Q_transpuesta por una matriz dada C
                            
    params: A_r_v   Matriz (mxn) con la información esencial (es igual a la matriz R, pero en lugar de tener ceros
                    en la parte inferior, contiene información de los vectores householder que serán útiles para
                    futuros cálculos, que entre otros están el calcular la matriz ortonormal Q)
            C       Matriz (mxp) (si se pasa por ejemplo C=Identidad (mxm) la función devolverá Q)

    return: M       Matriz con número al azar
    """
    m=A_r_v.shape[0]
    n=A_r_v.shape[1]
    QT_por_C=np.eye(m)
    for j in range(n-1,-1,-1):
        v=np.concatenate((1,A_r_v[(j+1):m,j]), axis=None)
        beta=2/(1+A_r_v[(j+1):m,j].dot(A_r_v[(j+1):m,j]))
        QT_por_C[j:m,j:m]=C[j:m,j:m]-beta*np.outer(v,v)@C[j:m,j:m]
    return QT_por_C

In [6]:
def Q_j(A_r_v,j):
    """
    Función que calcula la matriz Qj (en el proceso de obtención de factorización QR se van obteniendo n Qj's,
    que si se multiplican todas da por resultado Q=Q1*Q2*...*Qn)
                            
    params: A_r_v   Matriz (mxn) con la información esencial (es igual a la matriz R, pero en lugar de tener ceros
                    en la parte inferior, contiene información de los vectores householder que serán útiles para
                    futuros cálculos, que entre otros están el calcular la matriz ortonormal Q)
            C       Matriz (mxp) (si se pasa por ejemplo C=Identidad (mxm) la función devolverá Q)

    return: Qj      Matriz Q de la j-esima iteración del proceso iterativo de factorización QR
    """
    m=A_r_v.shape[0]
    n=A_r_v.shape[1]
    Qj=np.eye(m)
    v=np.concatenate((1,A_r_v[(j+1):m,j]), axis=None)
    beta=2/(1+A_r_v[(j+1):m,j].dot(A_r_v[(j+1):m,j]))
    Qj[j:m,j:m]=np.eye(m-j)-beta*np.outer(v,v)
    return Qj

### Funciones para solución de Sistemas de Ecuaciones Lineales

In [7]:
def Solucion_SEL_QR_nxn(A,b):
    """
    Función que obtiene la solución de un sistema de ecuaciones lineales (SEL) con n ecuaciones y n incognitas
            
    params: A   Matriz (nxn) que representa los coeficientes de las ecuaciones
            b   vector (nx1) constantes del sistema

    return: x   vector que satisface (Ax=b)
    """
    A_r_v=factorizacion_QR(A)
    m=A_r_v.shape[0]
    #Q=np.transpose(QT_C(A_r_v,np.eye(m)))
    #R=np.transpose(Q)@A
    n=A_r_v.shape[0]
    Q=np.eye(m)
    R=copy.copy(A)
    for j in range(m):
        Qj=Q_j(A_r_v,j)
        Q=Q@Qj
        R=Q_j(A_r_v,j)@R
    b_prima=np.transpose(Q)@b
    x = solve_triangular(R, np.transpose(Q)@b)
    return x

#### Eliminación por bloques

In [8]:
def bloques(A, b=False, n1=False, n2=False):
    """
    Esta es la función para la creación de bloques usando un arreglo de numpy
    
    params: A   Matriz (nxn) que representa los coeficientas de las ecuaciones
            b   vector (nx1) constantes del sistema
            n1  Numero de renglones que tendrá el 1er bloque
            n2  Numero de renglones que tendrá el 2do bloque
    
    return: A11 Fraccion de la matriz dividida
            A12 Fraccion de la matriz dividida
            A12 Fraccion de la matriz dividida
            A12 Fraccion de la matriz dividida
            b1  Fraccion del vector dividido
            b2  Fraccion del vector dividido
    """

    # Primero definimos el n
    m,n = A.shape

    # Condiciones de A
    # Si no se dan los n deseados, se intentan hacer los bloques casi iguales
    if  not (n1&n2):
        n1 = n//2
        n2 = n - n1
    # Los bloques deben cumplir la condicion de tamaño
    elif n1+n1 != n:
        sys.exit('n1 + n2 debe ser igual a n')
    else:
        None

    # Condiciones de b
    if  b is False:
        b1 = None
        b2 = None
        print('condicion1')
    elif len(b) == m:
        b1 = b[:n1]
        b2 = b[n1:m]
    else:
        sys.exit('los renglones de A y b deben ser del mismo tamaño')

    A11 = A[:n1,:n1]
    A12 = A[:n1,n1:n]
    A21 = A[n1:m,:n1]
    A22 = A[n1:m,n1:n]

    return A11,A12,A21,A22,b1,b2

In [9]:
def eliminacion_bloques(A,b):
    """
    Función que obtiene la solución de un sistema de ecuaciones lineala (SEL) con n ecuaciones y n incognitas
            
    params: A   Matriz (nxn) que representa los coeficientas de las ecuaciones
            b   vector (nx1) constantes del sistema
    
    return: x1 Solucion al 1er sistema de ecuaciones obtenido con la división por bloques
            x2 Solucion al 2do sistema de ecuaciones obtenido con la división por bloques
    """
    if np.linalg.det(A)==0:
        sys.exit('A debe ser no singular')

    A11,A12,A21,A22,b1,b2 = bloques(A,b)

    if np.linalg.det(A11)==0:
        ys.exit('A11 debe ser no singular')

    ## 1. Calcular A11^{-1}A12 y A11^{-1}b1 teniendo cuidado en no calcular la inversa sino un sistema de ecuaciones lineales
    ## Aquí se debe usar el método QR una vez que esté desarrollado

    ## Definimos y = A11^{-1}b1, por tanto A11y=b1. Resolviendo el sistema anterior para 11y:
    y = Solucion_SEL_QR_nxn(A11,b1)
    #y = np.linalg.solve(A11,b1)

    ## Definimos Y = A11^{-1}A12
    Y = Solucion_SEL_QR_nxn(A11,A12)
    #Y = np.linalg.solve(A11,A12)

    ## 2. Calcular el complemento de Schur del bloque A11 en A. Calcular b_hat
    S = A22 - A21@Y
    b_h = b2 - A21@y

    ## 3. Resolver Sx2 = b_hat
    x2 = Solucion_SEL_QR_nxn(S,b_h)
    #x2 = np.linalg.solve(S,b_h)

    ## 4. Resolver A11x1 = b1-A12X2
    x1 = Solucion_SEL_QR_nxn(A11,b1-A12@x2)
    #x1 = np.linalg.solve(A11,b1-A12@x2)

    return np.concatenate((x1,x2), axis=0)

# Prueba Precisión - Factorización QR

## EJEMPLO 1 (Matriz de dimensión 5x3)

Verificaremos que la factorización QR de una matriz obtenida con la función de numpy, es igual a la obtenida con la función implementada por los programadores.

Empezaremos por generar una matriz aleatoria con la función crea_matriz

In [10]:
# Generamos una matriz aleatoria de tamaño definido (renglones y columnas) y valores aleatorios comprendidos en un rango, pudiendo ser sus entradas de tipo enteros o dobles
m=5
n=3
A=np.round(crea_matriz(m,n,6,-6,False),2)
A

array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])

### Implementación programadores

Utilizaremos la función factorizacion_QR para obtener la factorización de la matriz A creada anteriormente.

In [11]:
A_r_v = factorizacion_QR(A)
np.round(A_r_v,4)

array([[10.0168,  2.7615, -9.6399],
       [ 0.8531,  7.9609,  2.0952],
       [-0.9446, -0.5506,  2.1283],
       [ 0.9745,  0.8053, -0.2308],
       [-0.4126,  0.5415, -0.6653]])

Utilizamos la función QT_C para obetener Q.

In [12]:
Q=np.transpose(QT_C(A_r_v,np.eye(m)))
np.round(Q,4)

array([[ 0.4652, -0.4562,  0.5052, -0.5211,  0.2206],
       [-0.4562,  0.6108,  0.431 , -0.4446,  0.1882],
       [ 0.5052,  0.431 ,  0.5228,  0.4922, -0.2084],
       [-0.5211, -0.4446,  0.4922,  0.4922,  0.215 ],
       [ 0.2206,  0.1882, -0.2084,  0.215 ,  0.909 ]])

Ahora resolvemos y obtenemos R.

In [13]:
R=np.transpose(Q)@A
np.round(R,4)

array([[10.0168,  2.7615, -9.6399],
       [-0.    ,  0.8688, -1.5077],
       [-0.    ,  3.905 ,  1.2666],
       [-0.    , -5.7116, -2.2447],
       [-0.    , -3.8406, -0.0581]])

Calcularemos la multiplicación de las matrices Q y R para validar que obtenemos A.

In [14]:
print('Q@R:')
pprint.pprint(Q@R)
print('A:')
pprint.pprint(A)

Q@R:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])
A:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])


### Implementación Numpy

Obtenemos Q y R con la función *numpy.linalg.qr()*

In [15]:
Q_np, R_np = np.linalg.qr(A)
print('Q_np:')
pprint.pprint(Q_np)
print('R_np:')
pprint.pprint(R_np)

Q_np:
array([[-0.4652177 , -0.46543506,  0.70922985],
       [ 0.45623281, -0.50621049, -0.21080839],
       [-0.50515055, -0.05087524, -0.55773282],
       [ 0.52112369,  0.26390222,  0.34270657],
       [-0.22062899,  0.6744542 ,  0.15504567]])
R_np:
array([[-10.01681586,  -2.76152626,   9.63986973],
       [  0.        ,  -7.96091532,  -2.09524316],
       [  0.        ,   0.        ,   2.12827811]])


Calcularemos la multiplicación de las matrices Q y R para validar que obtenemos A.

In [16]:
print('Q_np@R_np:')
pprint.pprint(Q_np@R_np)
print('A:')
pprint.pprint(A)

Q_np@R_np:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])
A:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])


### Comparación

**Validación A = QR**

Valores obtenidos con la función implementada por los programadores.

In [17]:
print('Q@R:')
pprint.pprint(Q@R)
print('A:')
pprint.pprint(A)

Q@R:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])
A:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])


Valores obtenidos con la función de numpy.

In [18]:
print('Q_np@R_np:')
pprint.pprint(Q_np@R_np)
print('A:')
pprint.pprint(A)

Q_np@R_np:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])
A:
array([[ 4.66,  4.99, -2.  ],
       [-4.57,  2.77,  5.01],
       [ 5.06,  1.8 , -5.95],
       [-5.22, -3.54,  5.2 ],
       [ 2.21, -4.76, -3.21]])


Las dos funciones cumplen que A = QR.

Podemos ver que obtenemos los mismos resultados al multiplicar las matrices Q y R obtenidas por cada función respectivamente.

**Validación Q**

Valores obtenidos con la función implementada por los programadores.

In [19]:
print('Q:')
pprint.pprint(Q)

Q:
array([[ 0.4652177 , -0.45623281,  0.50515055, -0.52112369,  0.22062899],
       [-0.45623281,  0.61077924,  0.4309534 , -0.44458038,  0.18822273],
       [ 0.50515055,  0.4309534 ,  0.52283935,  0.49224874, -0.20840416],
       [-0.52112369, -0.44458038,  0.49224874,  0.49218608,  0.21499401],
       [ 0.22062899,  0.18822273, -0.20840416,  0.21499401,  0.90897763]])


Valores obtenidos con la función de numpy.

In [20]:
print('Q_np:')
pprint.pprint(Q_np)

Q_np:
array([[-0.4652177 , -0.46543506,  0.70922985],
       [ 0.45623281, -0.50621049, -0.21080839],
       [-0.50515055, -0.05087524, -0.55773282],
       [ 0.52112369,  0.26390222,  0.34270657],
       [-0.22062899,  0.6744542 ,  0.15504567]])


Por alguna razón, al comparar los valores de Q obtenidos por las dos funciones tenemos diferencias. 


**Validación R**

Valores obtenidos con la función implementada por los programadores.

In [21]:
print('R:')
pprint.pprint(R)

R:
array([[ 1.00168159e+01,  2.76152626e+00, -9.63986973e+00],
       [-3.13386125e-16,  8.68847286e-01, -1.50771604e+00],
       [-5.79071310e-16,  3.90499622e+00,  1.26655211e+00],
       [-1.30937462e-15, -5.71155737e+00, -2.24474348e+00],
       [-3.89547107e-17, -3.84062418e+00, -5.81066855e-02]])


Valores obtenidos con la función de numpy.

In [22]:
print('R_np:')
pprint.pprint(R_np)

R_np:
array([[-10.01681586,  -2.76152626,   9.63986973],
       [  0.        ,  -7.96091532,  -2.09524316],
       [  0.        ,   0.        ,   2.12827811]])


Por alguna razón, al comparar los valores de R obtenidos por las dos funciones tenemos diferencias. 


Tanto las funciones implementadas por los programadores para obtener la factorización $QR$ de una matriz, como la función *linalg.qr* de la librería numpy consideran una matriz de entrada A de dimensiones $mxn$. Como resultado se obtienen las siguientes dos matrices:

+ Función implementa por los programadores:
    + matriz ortogonal $Q$ de dimensiones $mxm$
    + matriz triangular superior $R$ de dimensiones $mxn$

+ Función linalg.qr de numpy
    + matriz con columnas ortonormales $Q$ de dimensiones $mxn$
    + matriz traingular superior $R$ con dimensiones $nxn$
    
 
En el caso de la función implementada en numpy, se obtiene lo que se conoce como "Factorización thin QR", en donde $Q$ ya no es una matriz ortogonal, si no una matriz con entradas ortonormales.

Lo anterior muestra por qué en las secciones de **Validación Q** y **Validación R** se obtienen matrices distintas; sin embargo, como se demuestra en la sección **Comparación A=QR**, al multiplicar uno u otro par de matrices $QR$, se recupera la matriz original $A$.

## EJEMPLO 2 (Matriz de dimensión 3x5)

En este caso consideramos una matriz con las dimensiones invertidas con respecto al Ejemplo 1.

In [23]:
# Generación de matriz aleatorio de tamaño 3x5
m=3
n=5
A=np.round(crea_matriz(m,n,6,-6,False),2)
A

array([[-3.72,  3.49, -1.33,  1.43, -2.1 ],
       [ 5.46, -1.65,  2.24,  2.34, -3.56],
       [ 3.51,  5.67,  0.58,  5.98, -1.2 ]])

### Implementación programadores

De igual forma que en el ejemplo anterior, utilizamos la función **factorizacion_QR** para obtener la matriz auxiliar $A$ que posteriormente será utilizada para encontrar la matriz $Q$.

In [24]:
A_r_v = factorizacion_QR(A)
np.round(A_r_v,4)

IndexError: index 0 is out of bounds for axis 0 with size 0

Como se puede observar, la función **factorización_QR(A)** despliega un error cuya interpretación no es muy clara. 

La referencia https://github.com/ITAM-DS/analisis-numerico-computo-cientifico/blob/master/temas/III.computo_matricial/3.3.c.Factorizacion_QR.ipynb, indica que este algoritmo debe recibir como entrada una matriz $A$ con dimensiones $mxn$, tal que $m \geq n$.

Es conveniente incluir en la función *factorizacion_QR* una validación sobre las dimensiones de las matriz; y en caso de que la condición no se cumpla, desplegar un mensaje indicando que la matriz $A$ deber ser de la forma $mxn$, con $m \geq n$.

## Resumen de Hallazgos

La función *factorizacion_QR* debería identificar claramente las matrices que pueden y que no pueden ser operadas. Es importante añadir una condición de validación sobre los requerimientos de la matriz de entrada ($A \in R^{mxn}$ tal que $m \geq n$); y en las situaciones en que el requerimiento no se cumpla, desplegar un mensaje indicando: "la matriz de entrada no es válida".


**TO DO:**
+ Agregar validación sobre los requerimientos de la matriz de entrada.