![logomateriaCV.png](attachment:logomateriaCV.png)

# OpenCV 

### para a materia de Visión Artificial do Grao de Robótica. EPSE de Lugo.

<hr style = "border: none; height: 4px; background-color: # D3D3D3" />

# 8.1Ferramentas matemáticas para a formación de imaxes: vectores


A formación de imaxes é o proceso de proxectar os elementos que aparecen nunha **escena 3D** (obxectos, superficies, paisaxes, etc.) nun **plano de imaxe 2D**. Este proceso ocorre, por exemplo, cando estás a capturar unha imaxe do mundo real mediante unha cámara ou cando estás xogando a un videoxogo en primeira persoa e o ambiente virtual 3D do xogo proxéctase nun plano que se che mostra como a vista do xogador.

<table>
<tr><td><img src="./images/intro.jpg" width="600"/></td>
    <td><img src="./images/videogame.png" width="400"/></td>
<tr>
</table>

O tema da *formación de imaxes* implica dúas perspectivas diferentes do problema de xerar imaxes a partir de escenas 3D:

- **O problema xeométrico:** Onde se proxecta cada punto 3D na imaxe?
- **O problema radiométrico:** Cal será a cor na imaxe de cada punto 3D? *(non abordado aquí)*

Neste caderno de introdución, veremos algunhas ferramentas matemáticas básicas que son necesarias para estudar modelos de formación de imaxes como o modelo "pinhole". Aínda que nun primeiro momento poida parecer que non están relacionados co problema que nos ocupa, a súa comprensión é de capital importancia cando se estudan elementos e transformacións entre o mundo 3D e o plano da imaxe 2D.

Estas ferramentas inclúen:

- **Transformacións euclidianas en 3D**.
   - Presentación e visualización de vectores (<a href="#111">sección 1.1.1</a>).
   - Produtos de vectores 3D (<a href="#112">sección 1.1.2</a>).
   - Transformación lineal de vectores (<a href="#113">sección 1.1.3</a>)
   - Matriz de rotación (<a href="#114">sección 1.1.4</a>).
- ***Seguinte caderno:*** **Transformacións homoxéneas (<a href="./2-Thomoxeneas.ipynb">cuaderno 2</a>)**.

## Contexto do problema - Cámara en primeira persoa nos videoxogos

Nos videoxogos, denomínase *primeira persoa* a calquera perspectiva gráfica representada dende o punto de vista do personaxe do xogador, ou desde a cabina ou o asento dianteiro dun vehículo conducido polo personaxe. Moitos xéneros incorporan perspectivas en primeira persoa, incluíndo xogos de aventura, condución, vela e simuladores de voo. Quizais os máis estendidos sexan os tiradores en primeira persoa, nos que a perspectiva gráfica é un compoñente integral do xogo.

Normalmente, cando alguén xoga nun ordenador en primeira persoa, as teclas `WASD` do noso teclado úsanse para mover a posición da cámara nos eixes $x$ e $z$ (movemento plano) e `ESPAZO` úsase para saltar ( isto move a cámara no eixe $y$, polo que permite que se mova en 3D). Despois, o rato utilízase para cambiar a orientación da cámara (isto aplícase as rotacións de *pitch* e/ou *yaw* ao sistema de coordenadas da cámara). A combinación de movementos 3D e rotacións 3D crea un control total de movementos 6D para o noso personaxe.

<img src="./images/first_person.jpg" width="500"/>$\\[3pt]$

A nosa tarefa neste caderno é **programar estes desprazamentos e rotacións da cámara para que poidan integrarse nun motor gráfico!**. Obviamente, isto implica aprender todas as matemáticas implicadas aquí, e a maioría delas están relacionadas coa manipulación de vectores e matrices. Entón, imos comezar!

In [5]:
import numpy as np
import cv2
import matplotlib.pyplot as plt
import matplotlib
import scipy.stats as stats
from ipywidgets import interact, fixed, widgets
from mpl_toolkits.mplot3d import Axes3D
from math import sin, cos, radians
%matplotlib notebook

matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)
images_path = './images/'

## Transformacións euclidianas 3D

## 1.1.1 Presentación e visualización de vectores <span id=111></span>

Dado que neste caderno (e nos seguintes imos empregar moitos vectores), en primeiro lugar cómpre saber como se definen os vectores e como transformalos.

Un vector libre $\mathbf{v}$ pódese definir como unha entidade matemática representada como un *segmento orientado* entre dous puntos $\{\mathbf{p},\mathbf{q}\}$:

$\hspace{2cm} \mathbf{p} = \begin{bmatrix} p_1 \\ p_2 \\ p_3\end{bmatrix} \in \mathbb{R}^3, \ \mathbf{q} = \begin{bmatrix} q_1 \\ q_2 \\ q_3 \end{bmatrix} \in \mathbb{R}^3 \\[5pt]$

cuxos elementos (en 3D) poden ser calculados como:

$\hspace{2cm} \mathbf{v} = \begin{bmatrix} v_1 \\ v_2 \\ v_3\end{bmatrix} = \begin{bmatrix} q_1  - p_1 \\ q_2 - p_2  \\ q_3 - p_3 \end{bmatrix} \in \mathbb{R}^3$

Observa a partir da notación en $\mathbf{p}$, por exemplo, que un vector tamén pode representar as coordenadas dun determinado punto con respecto á orixe. De feito, neste caderno, utilizaremos vectores para referirnos a varias entidades como puntos, eixes ou mesmo transformación (traslacións).

Así, é importante saber debuxalos, para ter unha referencia visual do que estamos a usar! En python, podemos trazar un conxunto de vectores 3D usando o método de matplotlib [`quiver()`](https://matplotlib.org/3.1.1/gallery/mplot3d/quiver3d.html), que toma 6 argumentos principais:

- `X,Y,Z`: tuplas que conteñen as coordenadas *X*, *Y* e *Z* do punto de orixe no conxunto de vectores.
- `U,V,W`: tuplas que conteñen as coordenadas *X*, *Y* e *Z* de todos os vectores w.r.t. tal punto de orixe.

O seguinte código ilustra como representar dous vectores libres $\mathbf{v}_1 = (2,1,1)$ e $\mathbf{v}_2 = (0,1,2)$, co punto de orixe $\mathbf{p}=(1,1,1)$

In [6]:
matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# Vector de coordenadas
v1 = np.array([2,1,1])
v2 = np.array([0,1,2])
v = np.column_stack((v1,v2))

# etiquetas dos vectores
labels = ["v1","v2"]

# Orixe de coordendas
p = np.array([1,1,1])
origin = np.column_stack((p,p))

# preparamos o vector para representalo
X,Y,Z = origin[0,:], origin[1,:], origin[2,:]
U,V,W = v[0,:], v[1,:], v[2,:]

# Creamos a figura e a preparamos para 3D
fig = plt.figure()
ax = fig.add_subplot(projection='3d')

# Establecemos limites dos eixos
ax.set_xlim3d(-1, 4)
ax.set_ylim3d(-1, 4)
ax.set_zlim3d(-1, 4)

# Etiquetas dos eixos
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')
#ax.set_aspect('equal')

# Plot vectores
ax.quiver(X, Y, Z, U, V, W, color="black")

# Aengadimos etiquetas
for i in range(len(labels)):
    ax.text(U[i]+X[i], V[i]+Y[i], W[i]+Z[i] ,labels[i], fontsize=12)

# forzamos a visualizacion!
plt.show()

<IPython.core.display.Javascript object>

## <span style="color:green"><b><i>EXERCICION 1a: Queremos ver como funcionan estas cousas</i></b></span>

Imos converter o código anterior que mostra vectores nun método que poidamos usar máis tarde. **A túa primeira tarefa é** definir o método chamado `plot_vectors()`, que devolve unha figura que representa un número de vectores libres de entrada definidos en `v` cunha `orixe` e `etiquetas` de eixes dados.

Teña en conta que:

- Esta función tamén espera como entradas unha figura e algúns eixes. Isto permítenos chamar ao método **varias veces** mentres traballamos a mesma figura.
- Para iso, a primeira vez que se chama o método, os eixes deben inicializarse previamente fóra do método. Podes usar [ax = fig.add_subplot(projection='3d')](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) para iso.
- Tamén hai que permitir introducir os límites dos eixes como argumento, seleccionar a área do plot queremos ver.

In [7]:
# Exercicio 1
def plot_vectors(fig, ax, v, origin, labels, color, axes_lim):

    """ Representa vectores 3D usando matplotlib
        
         Argumentos:
             fig, ax: figura e eixes (deben ser 3D)
             v: array que contén coordenadas vectoriales, cada columna contén un vector 3D
             origin: matriz que contén puntos de orixe vectorial para a matriz 'v'
             labels: matriz de cadeas que conteñen etiquetas para os vectores, debería ter a mesma lonxitude que as columnas en 'v'
             color: cadea que contén a cor dos vectores
             axes_lim: vector de tamaño 6 que contén os límites mínimo e máximo para cada eixe [X_min,X_max,X_min,X_max,Z_min,Z_max]
        
         Retorno:
             fig, ax: Figura e eixe dun gráfico 3D cos vectores representados
     """  
    
    
    # Escribe o teu código aqui

    # prepara o vector para representalo
    X,Y,Z = None, None, None
    U,V,W = None, None, None

    # Establece os eixes
    ax.set_xlim3d(axes_lim[None], axes_lim[None])
    ax.set_ylim3d(axes_lim[None], axes_lim[None])
    ax.set_zlim3d(axes_lim[None], axes_lim[None])
    
    # Engade as etiquetas e as escalas
    ax.set_xlabel(None)
    ax.set_ylabel(None)
    ax.set_zlabel(None)
    #ax.set_aspect('equal')
    
    # Representa ao vector
    ax.quiver(None, None, None, None, None, None,color=None)
    
    # Engadimos etiquetas
    for i in range(len(labels)):
        ax.text(U[i]+X[i], V[i]+Y[i], W[i]+Z[i], labels[i], fontsize=12, color=color)

    return fig,ax

Para **probar a túa función**, o seguinte código debería mostrar unha base ortonormal (vectores unitarios) centrada en $\mathbf{p}_0=(0,0,0)$.
<img src="./images/ortho_base.png" width="350"/>$\\[3pt]$

In [None]:
matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# Creamos a figura e preparamola para 3D
fig = plt.figure()
ax = fig.add_subplot(projection='3d')

# Coordenadas do vector
v = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Coordenadas orixe
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# Etiquetas do vector
labels = ["x","y","z"]

# chamamos a plot_vectors
fig, ax = plot_vectors(fig, ax, v, origin, labels, "red", [-1,2,-1,2,-1,2])

fig.show()

## <span style="color:green"><b><i>Exercicio 1b: Representando un vector libre</i></b></span>

Imos facer uso do método `plot_vectors()` para trazar un vector libre `v` construído a partir das coordenadas doutros dous vectores `p` e `q`. Lembra que:

$\hspace{2cm} \mathbf{v} = \begin{bmatrix} v_1 \\ v_2 \\ v_3\end{bmatrix} = \begin{bmatrix} q_1 - p_1 \\ q_2 - p_2 \\ q_3 - p_3 \end {bmatrix} \in \mathbb{R}^3$

Como resultado, as coordenadas do vector libre `v` exprésanse w.r.t. o punto final do vector `p`, é dicir, `p` é a súa orixe. Considera as seguintes definicións de vectores:

- $p = [1,1,1,5]$
- $q = [1,5,1,1]$

Este é o resultado que buscamos:

<img src="./images/example_of_free_vector.PNG"/>$\\[3pt]$

In [None]:
matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# Creamos a figura e preparamola para 3D
fig = plt.figure()
ax = fig.add_subplot(projection='3d')
   
# eixes do sistema de referencia
v_o = np.array([[1,0,0],[0,1,0],[0,0,1]])

# orixe de coordendas do sistema de referencia
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# Define aos vectores
p = np.vstack(None)
q = np.vstack(None)
v = None

# Define o orixe de cada vector
origin_p = np.vstack(None)
origin_q = np.vstack(None)
origin_v = None

# Etiquetas do vector
labels = ["x","y","z"]
labels_p = [None]
labels_q = [None]
labels_v = [None]

# chamamos a plot_vectors
fig, ax = plot_vectors(fig, ax, v_o, origin, labels, "red", [-1,2,-1,2,-1,2])
fig, ax = plot_vectors(fig, ax, p, origin_p, labels_p, "blue", [-1,2,-1,2,-1,2])
fig, ax = plot_vectors(fig, ax, q, origin_q, labels_q, "blue", [-1,2,-1,2,-1,2])
fig, ax = plot_vectors(fig, ax, v, origin_v, labels_v, "green", [-1,2,-1,2,-1,2])

fig.show()

## 1.1.2 Produto de vectores 3D <span id=112></span>

Agora que sabes como definir e trazar un conxunto de vectores, estás preparado para aprender dúas operacións básicas con eles: os produtos **escalar** e **vectorial**.

### Produto escalar de dous vectores

O produto escalar (tamén chamado produto interno) de dous vectores é a suma dos produtos entre elementos, o que resulta un **escalar**.

***Definición alxébrica:***

$$ \mathbf{a} = \begin{bmatrix} a_1 \\ a_2 \\ a_3\end{bmatrix} \;\;\;\;\;\; \mathbf{b} = \begin{bmatrix} b_1 \\ b_2 \\ b_3 \end{bmatrix}$$

$$\langle\mathbf{a},\mathbf{b}\rangle = \mathbf{a} \cdot \mathbf{b} = \mathbf{a}^\texttt{T}\mathbf{b} = \texttt{traza}(\mathbf{a} \, \mathbf{b}^\texttt{T}) = a_1b_1 + a_2b_2 + a_3b_3 \in \mathbb{R}$$

O produto escalar está implicado na definición da **norma euclidiana** dun vector, que, xeométricamente, representa a distancia entre os dous puntos que delimitan o vector:

$$\|\mathbf{a}\| = \sqrt{\mathbf{a}^\texttt{T}\mathbf{a}} = \sqrt{a_1^2 + a_2^2 + a_3^2}$$

***Definición xeométrica:*** Desde un punto de vista xeométrico, o produto escalar de dous vectores $\mathbf{a}$ e $\mathbf{b}$ defínese por:

$$ \mathbf{a}\cdot \mathbf{b} = \| \mathbf{a}\| \, \|\mathbf{b}\| \cos \theta$$

onde $\theta$ é o ángulo entre ambos os vectores. É dicir, o produto escalar representa o produto das súas normas euclidianas e o coseno do ángulo entre elas. Tal definición pódese reorganizar para calcular a proxección dun vector sobre o outro como se mostra na figura: $\\[5pt]$

<img src="./images/dot.png" width="300" align="center"/>

## **<span style="color:green"><b><i>TAREFA 2: Xogar co produto escalar</i></b></span>**

Imos traballar cos vectores $\mathbf{a}=(0,1,0.5)$ e $\mathbf{b}=(1,1.5,1)$ e o produto escalar:

1. Primeiro de todo, traza estes vectores usando `plot_vectors()`.

In [None]:
# TAREFA 2
# Escribe o código aqui!

matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# Creamos a figura e preparamola para 3D
fig = plt.figure()
ax = fig.add_subplot(projection='3d')
   
# Bases do sistema de coordendas
v_o = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Orixe
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# Matriz de vectores
v = np.array(None)
origin_v = None

# Etiquetas dos vectores
labels = ["x","y","z"]
labels_v = ["a","b"]

# chamamos plot_vectors
fig, ax = plot_vectors(fig, ax, v_o, origin, labels, "red", [-1,2,-1,2,-1,2])
fig, ax = plot_vectors(fig, ax, v, None, None, "blue", [-1,2,-1,2,-1,2])

fig.show()

2. Agora, calcula o **produto escalar** destes vectores usando o método **alxébrico** descrito. Comproba que obtén o mesmo resultado que usando [`np.dot()`](https://numpy.org/doc/stable/reference/generated/numpy.dot.html).

In [None]:
# produto escalar
dot = None
dot_np = np.dot(None, None)

print('Produto escalar     : ' + str(dot))
print('Produto escalar (np): ' + str(dot_np))

<font color='blue'>**Saída esperada:** </font>

     Produto escalar: 2.0
     Produto escalar (np): 2.0

3. Por último, vexamos a interpretación xeométrica do produto escalar. Para iso, calcula as normas de ámbolos vectores e acha a proxección do primeiro vector `a` sobre o segundo `b`, é dicir:
$$ \frac{\mathbf{a}\cdot \mathbf{b}}{\|\mathbf{b}\|}$$

Comproba que obteñas a mesma norma que usando [`np.linalg.norm()`](https://numpy.org/doc/stable/reference/generated/numpy.linalg.norm.html).

In [None]:
# Normas
norm_a = None # norma do primeiro vector
norm_b = None # norma do segundo vector
norm_a_np = np.linalg.norm(None)
norm_b_np = np.linalg.norm(None)

# proxeccion do vector a sobre o segundo b
projection = None

print("a norm     : " + str(round(norm_a,2)))
print("b norm     : " + str(round(norm_b,2)))
print("a norm (np): " + str(round(norm_a_np,2)))
print("b norm (np): " + str(round(norm_b_np,2)))
print("\nProxeccion de a sobre b: " + str(round(projection,2)))

<font color='blue'>**Saída esperada:**  </font>

    a norm     : 1.12
    b norm     : 2.06
    a norm (np): 1.12
    b norm (np): 2.06

    Proxeccion de a sobre b: 0.97

### Produto vectorial de dous vectores

O produto vectorial de dous vectores linealmente independentes $\mathbf{a}$ e $\mathbf{b}$ é unha transformación lineal que dá lugar a **outro vector** $\mathbf{c}$ perpendicular a ambos, e así ao plano que os contén. Dados dous vectores:$\\[5pt]$

$$ \mathbf{a} = \begin{bmatrix} a_1 \\ a_2 \\ a_3\end{bmatrix} \hspace{1cm} \mathbf{b} = \begin{bmatrix} b_1 \\ b_2 \\ b_3 \end {bmatrix} \\[5pt]$$

O seu produto vectorial defínese como: $\\[10pt]$
$$ \mathbf{c} = \mathbf{a} \times \mathbf{b} = \begin{vmatrix}
i & j & k \\
a_1 & a_2 & a_3 \\
b_1 & b_2 & b_3
\end{vmatrix}
= 
(a_2 b_3 \mathbf{i} + a_3 b_1 \mathbf{j} + a_1 b_2 \mathbf{k}) - (a_3 b_2 \mathbf{i} + a_1 b_3 \mathbf{j} + a_2 b_1 \mathbf{k})
= 
(a_2 b_3 - a_3 b_2)\mathbf{i} + (a_3 b_1 - a_1 b_3)\mathbf{j} + (a_1 b_2 - a_2 b_1)\mathbf{k}
$$

Aínda que é máis conveniente expresalo como unha transformación lineal mediante a multiplicación matricial:

$$ \mathbf{c} = \mathbf{a} \times \mathbf{b}
= [\mathbf{a}]_\times\mathbf{b} \hspace{1,5cm} / \hspace{1,5cm} [\mathbf{a}]_\times = \begin{bmatrix} 0 & -a_3 & a_2 \\ a_3 & 0 & -a_1 \\ -a_2 & a_1 & 0\end{bmatrix} \in \mathbb{R}^3$$

onde $[\mathbf{a}]_\times$ chámase matriz *skew-symmetric* de $\mathbf{a}$.

A norma do vector resultante calcúlase como:

$$ \|\mathbf{c}\| = \|\mathbf{a}\| \, \|\mathbf{b}\| \sin \theta$$

Isto ten un **significado xeométrico** interesante: a norma do produto vectorial de dous vectores $\mathbf{a}$ e $\mathbf{b}$ pódese interpretar como a área do paralelogramo que ten aos vectores como lados. Ademais, como se mencionou antes, o vector resultante é ortogonal aos dous vectores $\mathbf{a}$ e $\mathbf{b}$:

<img src="./images/cross.png" width="200" align="center"/>

## **<span style="color:green"><b><i>TAREFA 3: tempo do produto vectorial</i></b></span>**

Imos xogar co produto vectorial! Para iso **tedes a tarefa de**:

1. Calcular o produto vectorial de dous vectores $\mathbf{a}=[1,1,4]$ e $\mathbf{b}=[2,3,1]$ **utilizando a multiplicación matricial** e comproba que obtén o mesmo resultado que usar `np.cross()`.
2. Calcula a norma do vector resultante $\mathbf{c}$ que, como se comentou, representa a área do paralelogramo que ten $\mathbf{a}$ e $\mathbf{b}$ como lados.
3. Despois debuxa $\mathbf{a}$ e $\mathbf{b}$ como vectores negros e o seu produto vectorial $\mathbf{c}$ en vermello usando o método anterior `plot_vectors()`.

*Consello: en numPy, a multiplicación matricial defínese co operador `@` (`A @ B`) en lugar do operador* `*` *, que realiza a multiplicación matricial por elementos. Para transformar un vector horizontal (fila) nun vector vertical (columna) pode usar [`np.vstack()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.vstack.html).*

In [None]:
matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# TAREFA 3
# Escribe o teu codigo aqui!

# Coordenadas dos vectores
v = np.array(None)

# Puntos orixe dos vectores
origin = np.array([[0,0],[0,0],[0,0]])

# vectores independentes
a = v[:,0]
b = v[:,1]

# acha â
hat_a = np.array(None)

# calcula o produto vectorial
cross = None
cross_np = np.cross(None,None)

print('a x b     : ' + str(cross))
print('a x b (np): ' + str(cross_np))

# acha o modulo de c = a x b 
norm_c = np.linalg.norm(None)

print('Modulo e c : ' + str(round(norm_c,2)))

# trasnformamolo a un vector vertical
cross = np.vstack(cross)

# Creamos a figura e preparamola para 3D
fig = plt.figure()
ax = fig.add_subplot(projection='3d')

axes_lim = [-13,13,-13,13,-13,13]

# Chamamos plot_vectors
fig, ax = plot_vectors(fig, ax, None, None, ["a","b"], None, axes_lim)
fig, ax = plot_vectors(fig, ax, None, np.array([None,None,None]), ["c"], None, axes_lim)

plt.show()

<font color='blue'>**Saida correcta:**  </font>
    
    a x b     : [-11   7   1]
    a x b (np): [-11   7   1]
    Modulo de c : 13.08

### Extra: produto de tres vectores

O produto mixto de tres vectores é unha combinación dos dous anteriores: defínese como o produto escalar dun vector $\mathbf{c}$ co produto vectorial dos outros dous, $\mathbf {a}$ e $\mathbf{b}$, é dicir:

$$(\mathbf{a} \times \mathbf{b}) \cdot \mathbf{c}$$

Este produto tamén ten un **significado xeométrico**: é o volume (con signo) do paralelepípedo definido por eses vectores:$\\[10pt]$

<img src="./images/triple.png" width="250"/>$\\[3pt]$

## **<span style="color:green"><b><i>TAREFA 4: produto mixto</i></b></span>**

Acha o produto mixto de $\mathbf{a}=(1,2,3)$, $\mathbf{b}=(3,1,2)$ e $\mathbf{c}=(2,2,1)$:

In [None]:
# TAREFA 4
# escribe aqui o teu codigo!

# Coordendas do vector
v = np.array(None)

#Vectores
a = v[:,0]
b = v[:,1]
c = v[:,2]

# acha â
hat_a = np.array(None)

# acha o produto vectorial
cross = None

# acha o produto mixto
triple_product = None
# triple_product = np.dot(np.cross(a,b),c)

print('Produto mixto:', triple_product)

<font color='blue'>**Saída correcta:**  </font>

       Produto mixto: 11

## 1.1.3 Transformación lineal de vectores <span id=113></span>

Como vimos antes, o produto vectorial de dous vectores é unha transformación lineal, é dicir, unha función lineal que transforma os elementos dos vectores implicados. Pero este produto é un caso particular dunha transformación lineal onde a matriz que define tal función lineal é creada a partir dos elementos dun vector. Unha definición máis xeral para as transformacións lineais no espazo 3D sería:

$$\mathbf{A}\mathbf{v} = \begin{bmatrix} a_1 & a_2 & a_3 \\ a_4 & a_5 & a_6 \\ a_7 & a_8 & a_9 \end{bmatrix} \begin{bmatrix} v_1 \\ v_2 \\ v_3\end{bmatrix} =  \begin{bmatrix} a_1v_1 + a_2v_2 + a_3v_3 \\ a_4v_1 + a_5v_2 + a_6v_3 \\ a_7v_1 + a_8v_2 + a_9v_3\end{bmatrix}$$

Ten en conta que podemos apilar un conxunto de $N$ vectores **columna**  $\{\mathbf{v}_i\}$ formando unha matriz $\mathbf{V}$, con dimensión $3\times N$, para que a transformación lineal sexa aplicada a cada vector individual. A matriz resultante será unha **pila de vectores columna transformados**.

$$\mathbf{A}\mathbf{V} = \mathbf{A}\begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 & \cdots & \mathbf{v}_N\end{bmatrix} = \begin{bmatrix} \mathbf{A}\mathbf{v}_1 & \mathbf{A}\mathbf{v}_2 & \cdots & \mathbf{A}\mathbf{v}_N \end{bmatrix}$$

Esta propiedade será extremadamente útil cando se implementen transformacións que deben aplicarse a un gran número de puntos.

Pero, que significa que unha operación (neste caso unha multiplicación matricial) é lineal? Significa que se cumpren as dúas propiedades seguintes:

- **Aditividade:** $f(\mathbf{x}_1 + \mathbf{x}_2) = f(\mathbf{x}_1) + f(\mathbf{x}_2)$$\\[5pt ]$
- **Escala:** $f(\alpha \mathbf{x}_1) = \alpha f(\mathbf{x}_1)$

E, de xeito equivalente, o principio de superposición tamén se mantén:

- **Superposición:** $f(\alpha \mathbf{x}_1 + \beta \mathbf{x}_2) = \alpha f(\mathbf{x}_1) + \beta f(\mathbf{x} _2) $

Afortunadamente, a multiplicación matricial satisface esta propiedade!

$$\mathbf{A}(\alpha \mathbf{x}_1 + \beta \mathbf{x}_2) = \alpha \mathbf{A} \mathbf{x}_1 + \beta \mathbf{A} \mathbf {x}_2 = \alpha \mathbf{y}_1 + \beta \mathbf{y}_2$$

é dicir, a transformación de combinacións lineais de vectores $(\alpha \mathbf{x}_1 + \beta \mathbf{x}_2)$ é a combinación lineal dos vectores transformados $(\alpha \mathbf{y}_1 + \beta \mathbf{y}_2)$. A seguinte figura mostra un exemplo desta propiedade en acción, dados dous vectores $\mathbf{x_1}=\begin{bmatrix}2 \\ 1\end{bmatrix}$ e $\mathbf{x_2}=\begin{bmatrix} 1 \\ 0\end{bmatrix}$ con $\alpha = 1$ e $\beta = 2$, e unha matriz $\mathbf{A}==\begin{bmatrix} 1 & 0 \\ 2 & 1\end{bmatrix}$:

<img src="./images/linear.png" align="center"/>

## **<span style="color:green"><b><i>TAREFA 5: Xogando coas transformacións lineais</i></b></span>**

Implementar un método completo `apply_transformation()`, que:

1. transforma un conxunto de vectores `v` segundo unha determinada transformación de entrada (matriz $\mathbf{A}$), e despois
2. mostra os vectores orixinais en negro e os transformados en vermello.

**Reutiliza o método** `plot_vectors()` para esta tarefa.

*NOTA: As etiquetas para os vectores transformados deben ser as mesmas que para os orixinais (pero aparecen en vermello).*

In [None]:
# TAREFA 5
def apply_transformation(transformation, v, origin, labels, axes_lim):

    """ Aplica unha transformación lineal a un conxunto de vectores 3D e representaos
        
         Argumentos:
             transformación: matriz 3x3 que define a transformación lineal
             v: Matriz que contén coordenadas vectoriales, cada columna contén un vector 3D
             origin: matriz que contén puntos de orixe vectorial para a matriz 'v'
             labels: matriz de cadeas que conteñen etiquetas para os vectores, debería ter a mesma lonxitude que as columnas en 'v'
             axes_lim: vector de 6 tamaños que contén os límites mínimo e máximo para cada eixe [X_min,X_max,X_min,X_max,Z_min,Z_max]
     """
    
    #Escribe aqui o teu codigo
    
    # Aplicamos a transforamcion
    transformed_v = None @ None
    
    # Creamos a figura e preparamola para 3D
    fig = plt.figure()
    ax = fig.add_subplot(projection='3d')

    # chamamos a plot_vectors
    fig, ax = plot_vectors(fig, ax, v, origin, labels, "black", axes_lim)
    fig, ax = plot_vectors(fig, ax, transformed_v, origin, labels, "red", axes_lim)

    plt.show()

Podes usar o seguinte código **para probar se os teus resultados son correctos**:

In [None]:
matplotlib.rcParams['figure.figsize'] = (6.0, 6.0)

# Transformacion
transformation = [[2,2,2],[0,2,0],[0,0,2]]

# Coordenadas referencia
v = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Orixe de coordendadas
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

apply_transformation(transformation,v,origin,["x","y","z"],[-3,3,-3,3,-3,3])

<font color='blue'>**Saída correcta:**  </font>

<img src="./images/example_transformation.png" width="500" align="left"/>
<img src="./images/blank.png" width="100" align="rigth"/>

## 1.1.3 Matriz de rotación <span id=113></span>

Unha matriz de rotación representa unha transformación lineal especial que xira os vectores conservando a súa lonxitude.

$$
\mathbf{R} =
\begin{bmatrix}
r_{11} & r_{12} & r_{13} \\
r_{21} & r_{22} & r_{23} \\
r_{32} & r_{32} & r_{33} \end{bmatrix}
= \underbrace{[r_x \ r_y \ r_z]}_{\text{coordenadas orixinais}\\ \text{trasnformadas}} \in \mathbb{R}^{3x3}
$$

Deste xeito, digamos que temos un determinado vector $\mathbf{p}^W$ que representa as coordenadas dun punto dun determinado sistema de referencia que chamaremos `MUNDO` (nótese no superíndice): $\mathbf{ p}^W=[p_x,p_y,p_z]^\texttt{T}$. Agora, podemos xiralo arredor da orixe das coordenadas e obter as súas novas coordenadas a través de:

$$
{\mathbf{p}^W}' = \mathbf{R}\mathbf{p}^W 
\ \ \rightarrow \ \ 
\begin{bmatrix} 
p_x' \\ p_y' \\ p_z' 
\end{bmatrix} 
= 
\mathbf{R} 
\begin{bmatrix} 
p_x \\ p_y \\ p_z 
\end{bmatrix}
$$

Se volvemos ao noso motor gráfico para o videoxogo, este podería corresponder ao caso de *un punto que xira arredor da cámara*, e chámase **rotación activa**, porque é o punto que está a xirar arredor do sistema de referencia. .

Pero podemos usar a matriz de rotación non só para xirar puntos senón tamén para **expresar rotacións entre diferentes sistemas de referencia**. Imaxina agora que temos dous sistemas de coordenadas: un global, que chamaremos `MUNDO` e outro local, que denotaremos por `CÁMARA`. E, non só iso, o sistema de referencia `CÁMARA` xira w.r.t. o `MUNDO` segundo unha determinada matriz de rotación $\mathbf{R}^W_C$. *Nota: o subíndice e o superíndice na notación da matriz $\mathbf{R}^W_C$ indican que debe entenderse como a rotación do marco de referencia `CAMERA` visto dende o `MUNDO`*.

Agora, imaxina que temos un determinado punto $\mathbf{p}^C$ con coordenadas no sistema de referencia `CAMERA` $\mathbf{p}^C=[p_x,p_y,p_z]^\texttt{T}$ e queremos coñecer as súas coordenadas $\mathbf{q}^W=[q_x,q_y,q_z]^\texttt{T}$ **dentro** do `MUNDO`.

<table>
    <tr><td><img src="./images/rotation.png" width="300" align="center"/></td></tr>
    <tr><td><center>Figura 1</center></td></tr>
</table>

Ben, isto pódese calcular coa mesma ecuación!:
$$
\mathbf{q}^W = \mathbf{R}^W_C\mathbf{p}^C \rightarrow 
\begin{bmatrix} 
q_x \\ q_y \\ q_z 
\end{bmatrix} = 
\mathbf{R}^W_C
\begin{bmatrix} 
p_x \\ p_y \\ p_z 
\end{bmatrix}
$$

Para entender isto, vexamos a figura anterior. Ten en conta que determinar as coordenadas do punto azul dentro do sistema de referencia global (en negro) é o mesmo que xirar o punto azul dentro do sistema de referencia local (en laranxa) e obter as súas novas coordenadas, e por iso se calculan exactamente igual.

Pero un paso máis, imaxina que agora queremos facer exactamente o **oposto**, é dicir, coñecer o valor das coordenadas globais $\mathbf{q}^W$, obtendo as coordenadas locais $\mathbf{p} ^C$ no sistema de referencia rotado. Neste caso podemos usar a **inversa da matriz de rotación** para obtelos:

$$
\mathbf{p}^C = \left(\mathbf{R}^W_C\right)^{-1}\mathbf{q}^W = 
\left(\mathbf{R}^W_C\right)^\texttt{T}\mathbf{q}^W = 
\left(\mathbf{R}^C_W\right)\mathbf{q}^W
\rightarrow 
\begin{bmatrix} 
p_x \\ p_y \\ p_z 
\end{bmatrix} = 
\mathbf{R}^\texttt{T}
\begin{bmatrix} 
q_x \\ q_y \\ q_z 
\end{bmatrix}
$$

Neste caso, podemos entender isto como se o punto estivese **estático** no ambiente e fose a cámara (ou o punto de vista do xogador, se queres) a que está a xirar dentro dela. Isto chámase **rotación pasiva**.

*Nota: É **moi importante** entender que, nestas ecuacións, $\mathbf{R}^W_C$ representa a rotación do sistema de referencia `CAMERA` con respecto ao sistema de referencia `MUNDO` mentres que $\mathbf{R}^C_W$ representa á inversa.*

Tamén podes ter notado nesta ecuación que escribimos que $\left(\mathbf{R}^W_C\right)^{-1} = \left(\mathbf{R}^W_C\right)^\texttt{T }$, e iso é porque as matrices de rotación son **ortogonais**, polo que cumpren estas dúas propiedades:

- A súa inversa é igual á súa transposición: $\mathbf{R}^\texttt{T}\mathbf{R} = \mathbf{R}\mathbf{R}^\texttt{T} = \mathbf{I} \rightarrow \mathbf{R}^\texttt{T} = \mathbf{R}^{-1}$
- $\mathbf{R}$ tamén verifica que $\texttt{det}(\mathbf{R}) = +1$

*Nota: lembra, se $\mathbf{R}$ é a matriz de rotación entre os sistemas `A` e `B`, entón $\mathbf{R}^\texttt{T}$ é a matriz de rotación entre o sistema ` B` e `A`.*

### Rotacións 3D

Centrándonos agora nas rotacións no espazo 3D, podemos definir **tres rotacións elementais**, unha en cada eixe $Z$, $Y$ e $X$, indicadas por *yaw*, *pitch* e *roll*, respectivamente:

<img src="./images/rotation_plane.png" width="500" align="center"/>

Estas rotacións elementais están representadas por tres matrices diferentes:

$\hspace{2cm}\mathbf{R}_z(\theta) = \begin{bmatrix} cos\theta & -sin\theta & 0 \\ sin\theta & cos\theta & 0 \\ 0 & 0 & 1 \end{bmatrix} \hspace{1cm} \mathbf{R}_y(\theta) = \begin{bmatrix} cos\theta & 0 & sen\theta \\ 0 & 1 & 0 \\ -sin\theta & 0 & cos\theta \end{bmatrix} \hspace{1cm} \mathbf{R}_x(\theta) = \begin{bmatrix} 1 & 0 & 0 \\ 0 & cos\theta & -sin\theta \\ 0 & sin\theta & cos\theta \end{bmatrix}\\[5pt]$

*Nota: Estas matrices de rotación elementais manteñen estática a transformación nun determinado eixe (por exemplo, a rotación de pitch non modifica os valores $y$).*

Usando cada unha destas matrices fai xirar un vector nun eixe, pero **e se queremos facer máis dunha rotación á vez?** Ben, só necesitamos multiplicalos nunha determinada orde!

$$
\mathbf{R}
=
\begin{bmatrix}
r_{11} & r_{12} & r_{13} \\
r_{21} & r_{22} & r_{23} \\
r_{31} & r_{32} & r_{33}
\end{bmatrix}
=
\mathbf{R}_z(\alpha)\mathbf{R}_y(\beta)\mathbf{R}_x(\theta)
$$

onde $\alpha$ = *ángulo de yaw*, $\beta$ = *ángulo de pitch* e $\theta$ = *ángulo de roll*.

**Pero por que importa a orde da multiplicación?** Porque a multiplicación matricial non é conmutativa! Son varias ordes diferentes como se poden multiplicar estas matrices pero a que aquí se presenta (é dicir, $Z-Y-X$) é unha das máis utilizadas (por exemplo en campos como a robótica, a navegación aérea, etc.).

Esta secuencia significa que:
- Primeiro, o sistema de referencia orixinal rótase un certo ángulo $\alpha$ arredor do seu eixe $Z$,
- A continuación, o sistema resultante (**xirado**) volve xirar un certo ángulo $\beta$ arredor do seu eixe $Y'$ **xirado**
- E finalmente rótase de novo un certo ángulo $\theta$ arredor do seu eixe **xirado** $X''$.

<img src="./images/rotation_order.png" width="900" align="center"/>

Ten en conta que cada rotación aplícase ao eixe xirado (isto chámase rotación *intrínseca*) e realízase mediante **postmultiplicación**. Se quixeramos xirar arredor do orixinal (eixe sen xirar) teriamos empregado a premultiplicación (isto chámase rotación *extrínseca*). En xeral, este segundo enfoque é menos intuitivo e prefírese o primeiro. Polo tanto, manten a orde indicada ao multiplicar as rotacións elementais.

### Agarda, pero, que pasa coas translacións?

Se nos centramos nas transformacións xerais entre sistemas de referencia, podes imaxinar que **normalmente as cámaras non se sitúan no centro do sistema de coordenadas `MUNDO`**, senón que se están movendo dentro do mundo, é dicir, non comparten a súa orixe de coordenadas. Isto significa que a cámara tamén se traduce w.r.t. o sistema de referencia `MUNDO`, polo que temos que incluír un vector de translación $\mathbf{t}^W_C$ para poder transformar puntos entre os dous marcos de referencia, non só rotalos!

Volvamos á Figura 1 e actualizada cunha transformación máis xeral (lembra que {Q} é o sistema de referencia `MUNDO` e {P} é o `CÁMARA`):

<table>
    <tr><td><img src="./images/rotation_and_translation.png" width="300" align="center"/></td></tr>
    <tr><td><center>Figura 2</center></td></tr>
</table>

Agora que a transformación entre os sistemas **inclúe unha tradución**, temos que:

$$\mathbf{q}^W = \mathbf{R}^W_C \mathbf{p}^C + \mathbf{t}^W_C$$

$$ \begin{bmatrix} q_x \\ q_y \\ q_z \end{bmatrix} 
= 
\begin{bmatrix} 
r_{11} & r_{12} & r_{13} \\ 
r_{21} & r_{22} & r_{23} \\ 
r_{31} & r_{32} & r_{33} 
\end{bmatrix} 
\begin{bmatrix} p_x \\ p_y \\ p_z 
\end{bmatrix} 
+ 
\begin{bmatrix} t_x \\ t_y \\ t_z \end{bmatrix}
$$

De novo, nesta ecuación $\mathbf{R}^W_C$ e $\mathbf{t}^W_C$ expresan a rotación e translación, respectivamente, do sistema de referencia `CÁMARA` w.r.t. o `MUNDO`, é dicir, a posición e orientación da `CÁMARA` dentro do `MUNDO`.

 ## **<span style="color:green"><b><i>TAREFA 6: Xirar e translación</i></b></span>**
 
Agora, imos implementar o método `apply_rotation_translation()`, que acepta os ángulos de rotación *yaw*, *pitch* e *roll* (en graos) e un vector de translación e aplica tales transformacións a un vector de entrada. Para iso **tedes a tarefa**:

1. Constrúe as matrices $\mathbf{R}_x$, $\mathbf{R}_y$ e $\mathbf{R}_z$ e combínaas na $\mathbf{R}$,
2. aplicar a rotación aos vectores de entrada,
3. aplicar a tradución ao resultado do paso anterior, e
4. mostrar ambos, o conxunto inicial de vectores e o transformado.

*Consello: podes transformar graos en radiáns usando [`radians()`](https://www.geeksforgeeks.org/degrees-and-radians-in-python/).*

In [None]:
# TAREFA 6
def apply_rotation_translation(v, origin, yaw, pitch, roll, translation, labels, axes_lim):
   
    """ Aplica unha transformación lineal a un conxunto de vectores 3D e representaos
        
         Argumentos:
             v: Matriz que contén coordenadas vectoriales, cada columna contén un vector 3D
             orixe: matriz que contén puntos de orixe vectorial para a matriz 'v'.
             yaw: graos para xirar o sistema de coordenadas arredor do eixe "Z".
             pitch: graos para xirar o sistema de coordenadas arredor do eixe "Y".
             roll: graos para xirar o sistema de coordenadas ao redor do eixe "X".
             translacion: vector columna que contén a tradución para cada eixe
             labels: matriz de cadeas que conteñen etiquetas para os vectores, debería ter a mesma lonxitude que as columnas en 'v'
             axes_lim: vector de 6 tamaños que contén os límites mínimo e máximo para cada eixe [X_min,X_max,X_min,X_max,Z_min,Z_max]
     """
    
    # Escribe aqui o teu odigo!
    
    # transforma a radians
    yaw = radians(None)
    pitch = radians(None)
    roll = radians(None)
    
    # 1. Construimos as matrices de rotacion
    Rx = np.array(None)
    Ry = np.array(None)
    Rz = np.array(None)
    
    # Combina as matrices de rotacion
    R = None
    
    # Aplica a trasnformacion
    transformed_v = None # aplicamos a rotacion
    transformed_origin = None # aplicamos a translacion
    
    # Creamos a figura e preparamola para 3D
    fig = plt.figure()
    ax = fig.add_subplot(projection='3d')

    # chamamos plot_vectors
    fig, ax = plot_vectors(fig, ax, v, origin, labels, "black", axes_lim)
    fig, ax = plot_vectors(fig, ax, transformed_v, transformed_origin, labels, "red", axes_lim)

    plt.show()

Podes usar o seguinte código **para probar se os teus resultados son correctos**:

In [None]:
# coordenadas dos vectores
v = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Orixe de coordenadas
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# Vector de translacion
translation = np.array([[1],[1],[1]])

# aplicamos a trasnformacion
apply_rotation_translation(v,origin,0,0,180,translation,["x","y","z"],[-3,3,-3,3,-3,3])

<font color='blue'>**Saida correcta:**  </font>

<img src="./images/example_transformation_2.png" width="500" align="left"/>
<img src="./images/blank.png" width="100" align="rigth"/>

Estas transformacións están moi relacionadas cun sistema de cámara nun videoxogo. Por exemplo, pode representar un movemento do xogador onde salta e xira. É dicir, estamos movendo o sistema de referencia `CAMERA` dentro do `MUNDO`. A continuación, **pídoche que** simules os seguintes movementos da cámara neste contexto, utilizando o método definido anteriormente.

- Xira **90 graos** á dereita e camiña **adiante 2 unidades**

In [None]:
# Escribe aqui o codigo!

# Coordenadas referencia
v = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Orixe de coordenadas
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# vector de translacion
translation = np.array(None)

# Aplicamos a tranformacion
apply_rotation_translation(v,origin,None,None,None,translation,["x","y","z"],[-3,3,-3,3,-3,3])

<font color='blue'>**Saída correcta:**  </font>

<img src="./images/example_transformation_3.png" width="500" align="left"/>
<img src="./images/blank.png" width="100" align="rigth"/>


- Mentres camiñas (**dúas unidades cara adiante**), salta (o noso personaxe pode **saltar unha unidade de altura**) e mira **45 graos cara ao chan** (por exemplo, saltar un obstáculo).

In [None]:
# Escribe aqui o codigo!

# Coordenadas referencia
v = np.array([[1,0,0],[0,1,0],[0,0,1]])

# Orixe de coordenadas
origin = np.array([[0,0,0],[0,0,0],[0,0,0]])

# vector de translacion
translation = np.array(None)

#Aplicamos a tranformacion
apply_rotation_translation(v,origin,None,None,None,translation,["x","y","z"],[-3,3,-3,3,-3,3])

<font color='blue'>**Saída desexada:**  </font>

<img src="./images/example_transformation_4.png" width="500" align="left"/>
<img src="./images/blank.png" width="100" align="rigth"/>


## Conclusión

Este foi un caderno de introdución que abrangue algunhas ferramentas matemáticas que son os bloques de construción para a formación de imaxes. Fixemos un bo traballo intentando dominar estas matemáticas e aprendemos:

- Como representar vectores e realizar produtos entre eles.
- As ideas detrás da transformación lineal de vectores.
- Como xirar e trasladar puntos ou vectores utilizando coordenadas cartesianas.