#Produto entre matrizes

Seja $\mathbf{A}$ uma matriz $N \times M$ e $\mathbf{B}$ uma matriz $M \times L$. Tais matrizes podem ser particionadas em linhas ou em colunas, tal como descrito abaixo:

$$\begin{split}
    \mathbf{A} 
    & = \left[
    \begin{array}{ccc}
        a_{11} & \cdots & a_{1M} \\
        \vdots &        & \vdots \\
        a_{N1} & \cdots & a_{NM}
    \end{array}
    \right]_{N \times M} \\\\
    & = \left[
    \begin{array}{c}
        \mathbf{A}(1,:) \\
        \vdots \\
        \mathbf{A}(N,:)
    \end{array}
    \right]_{N \times M} \\\\
    & = \left[
    \begin{array}{ccc}
        \mathbf{A}(:,1) &
        \cdots &
        \mathbf{A}(:,M)
    \end{array}
    \right]_{N \times M} \:
\end{split}$$

e

$$\begin{split}
    \mathbf{B} 
    & = \left[
    \begin{array}{ccc}
        b_{11} & \cdots & b_{1L} \\
        \vdots &        & \vdots \\
        b_{M1} & \cdots & b_{ML}
    \end{array}
    \right]_{M \times L} \\\\
    & = \left[
    \begin{array}{c}
        \mathbf{B}(1,:) \\
        \vdots \\
        \mathbf{B}(M,:)
    \end{array}
    \right]_{M \times L} \\\\
    & = \left[
    \begin{array}{ccc}
        \mathbf{B}(:,1) &
        \cdots &
        \mathbf{B}(:,L)
    \end{array}
    \right]_{M \times L} \: , \\
\end{split}$$

em que $\mathbf{A}(i,:)$, $i = 1, ..., N$, é o vetor $1 \times M$ que representa a $i$-ésima linha de $\mathbf{A}$ e $\mathbf{A}(:,j)$, $j = 1, ..., M$, é o vetor $N \times 1$ que representa a $j$-ésima coluna de $\mathbf{A}$. Analogamente, $\mathbf{B}(i,:)$, $i = 1, ..., M$, é o vetor $1 \times L$ que representa a $i$-ésima linha de $\mathbf{B}$ e $\mathbf{B}(:,j)$, $j = 1, ..., L$, é o vetor $M \times 1$ que representa a $j$-ésima coluna de $\mathbf{B}$.

Seja $\mathbf{C}$ a matriz $N \times L$ resultante do produto entre as matrizes $\mathbf{A}$ e $\mathbf{B}$. A expressão que descreve os elementos de $\mathbf{C}$ é dada por:

$$\begin{split}
\mathbf{C} 
    & = \left[
    \begin{array}{ccc}
        c_{11} & \cdots & c_{1L} \\
        \vdots &        & \vdots \\
        c_{N1} & \cdots & c_{NL}
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \left( a_{11} \, b_{11} + \cdots + a_{1M} \, b_{M1} \right) &
        \left( a_{11} \, b_{12} + \cdots + a_{1M} \, b_{M2} \right) &
        \cdots &
        \left( a_{11} \, b_{1L} + \cdots + a_{1M} \, b_{ML} \right) \\
        \left( a_{21} \, b_{11} + \cdots + a_{2M} \, b_{M1} \right) &
        \left( a_{21} \, b_{12} + \cdots + a_{2M} \, b_{M2} \right) &
        \cdots &
        \left( a_{21} \, b_{1L} + \cdots + a_{2M} \, b_{ML} \right) \\
        \vdots & \vdots & & \vdots \\
        \left( a_{N1} \, b_{11} + \cdots + a_{NM} \, b_{M1} \right) &
        \left( a_{N1} \, b_{12} + \cdots + a_{NM} \, b_{M2} \right) &
        \cdots &
        \left( a_{N1} \, b_{1L} + \cdots + a_{NM} \, b_{ML} \right)
    \end{array}
    \right]_{N \times L} \: .    
\end{split}
$$

##1) Formulação baseada no encadeamento de três laços

O algoritmo mais simples para calcular o produto $\mathbf{C} = \mathbf{A} \mathbf{B}$ é dado por:

-----
$\mathbf{C} = \mathbf{0}$

for $i = 1:N$

>for $j = 1:L$ 

>>for $k = 1:M$

>>>$c_{ij} = c_{ij} + a_{ik} \, b_{kj}$

>>end

>end

end

-----

Note que o loop $i$ percorre as linhas de $\mathbf{A}$, o loop $j$ percorre as colunas de $\mathbf{B}$ e o loop $k$ percorre os elementos ao longo da $i$-ésima linha de $\mathbf{A}$ e os elementos ao longo da $j$-ésima coluna de $\mathbf{B}$.

Compare este algoritmo com a expressão que descreve os elementos de $\mathbf{C}$.

##2) Formulação baseada no produto escalar

A expressão que descreve os elementos de $\mathbf{C}$ pode ser reescrita da seguinte forma:

$$\begin{split}
\mathbf{C} 
    & = \left[
    \begin{array}{ccc}
        c_{11} & \cdots & c_{1L} \\
        \vdots &        & \vdots \\
        c_{N1} & \cdots & c_{NL}
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \left( a_{11} \, b_{11} + \cdots + a_{1M} \, b_{M1} \right) &
        \left( a_{11} \, b_{12} + \cdots + a_{1M} \, b_{M2} \right) &
        \cdots &
        \left( a_{11} \, b_{1L} + \cdots + a_{1M} \, b_{ML} \right) \\
        \left( a_{21} \, b_{11} + \cdots + a_{2M} \, b_{M1} \right) &
        \left( a_{21} \, b_{12} + \cdots + a_{2M} \, b_{M2} \right) &
        \cdots &
        \left( a_{21} \, b_{1L} + \cdots + a_{2M} \, b_{ML} \right) \\
        \vdots & \vdots & & \vdots \\
        \left( a_{N1} \, b_{11} + \cdots + a_{NM} \, b_{M1} \right) &
        \left( a_{N1} \, b_{12} + \cdots + a_{NM} \, b_{M2} \right) &
        \cdots &
        \left( a_{N1} \, b_{1L} + \cdots + a_{NM} \, b_{ML} \right)
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \mathbf{A}(1,:) \mathbf{B}(:,1) &
        \mathbf{A}(1,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(1,:) \mathbf{B}(:,L) \\
        \mathbf{A}(2,:) \mathbf{B}(:,1) &
        \mathbf{A}(2,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(2,:) \mathbf{B}(:,L) \\        
        \vdots & \vdots & & \vdots \\
        \mathbf{A}(N,:) \mathbf{B}(:,1) &
        \mathbf{A}(N,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(N,:) \mathbf{B}(:,L) \\
    \end{array}
    \right]_{N \times L} \: ,
\end{split}
$$

em que $\mathbf{A}(i,:) \, \mathbf{B}(:,j)$ indica o produto escalar entre o vetor $\mathbf{A}(i,:)$, que é $1 \times M$, e o vetor $\mathbf{B}(:,j)$, que é $M \times 1$. Esta formulação consiste em representar cada elemento $c_{ij}$, $i = 1, ..., N$, $j = 1, ..., L$, como o produto escalar entre $\mathbf{A}(i,:)$ e $\mathbf{B}(:,j)$. Sendo assim, o algoritmo para calcular o produto $\mathbf{C} = \mathbf{A} \mathbf{B}$ pode ser reescrito da seguinte forma:

----
for $i = 1:N$

>for $j = 1:L$ 

>>$c_{ij} = \mathbf{A}(i,:) \, \mathbf{B}(:,j)$

>end

end

-----

Note que o loop $j$ percorre os elementos da $i$-ésima linha da matriz $\mathbf{C}$. Isso permite reescrever a expressão que descreve o elementos de $\mathbf{C}$ da seguinte forma:

$$\begin{split}
\mathbf{C} 
    & = \left[
    \begin{array}{cccc}
        \mathbf{A}(1,:) \mathbf{B}(:,1) &
        \mathbf{A}(1,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(1,:) \mathbf{B}(:,L) \\
        \mathbf{A}(2,:) \mathbf{B}(:,1) &
        \mathbf{A}(2,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(2,:) \mathbf{B}(:,L) \\        
        \vdots & \vdots & & \vdots \\
        \mathbf{A}(N,:) \mathbf{B}(:,1) &
        \mathbf{A}(N,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(N,:) \mathbf{B}(:,L) \\
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{c}
        \mathbf{A}(1,:)
        \left[ \begin{array}{cccc}
        \mathbf{B}(:,1) \: \mathbf{B}(:,2) \: \cdots \: \mathbf{B}(:,L)
        \end{array} \right] \\
        \vdots \\
        \mathbf{A}(N,:)
        \left[ \begin{array}{cccc}
        \mathbf{B}(:,1) \: \mathbf{B}(:,2) \: \cdots \: \mathbf{B}(:,L)
        \end{array} \right]
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{c}
        \mathbf{A}(1,:) \mathbf{B} \\
        \vdots \\
        \mathbf{A}(N,:) \mathbf{B}
    \end{array}
    \right]_{N \times L} \: .
\end{split}
$$

Note que esta expressão descreve cada linha $\mathbf{C}(i,:)$, $i = 1, ..., N$, de $\mathbf{C}$ como o produto entre $\mathbf{A}(i,:)$, $i = 1, ..., N$, que é a $i$-ésima linha de $\mathbf{A}$, e a matriz $\mathbf{B}$. Esta expressão permite reescrever o algoritmo para o cálculo de $\mathbf{C}$ da seguinte forma:

----
for $i = 1:N$

>$\mathbf{C}(i,:) = \mathbf{A}(i,:) \, \mathbf{B}$

end

-----

**ATENÇÃO:** $\mathbf{A}(i,:) \, \mathbf{B}$ indica o produto entre o vetor $\mathbf{A}(i,:)$, que é $1 \times M$, pela matriz $\mathbf{B}$, que é $M \times L$. Portanto, $\mathbf{C}(i,:)$ é um vetor $1 \times L$.

##3) Formulação baseada na combinação linear de colunas

A expressão que descreve os elementos de $\mathbf{C}$ também pode ser escrita da seguinte forma:

$$\begin{split}
\mathbf{C} 
    & = \left[
    \begin{array}{cccc}
        \mathbf{A}(1,:) \mathbf{B}(:,1) &
        \mathbf{A}(1,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(1,:) \mathbf{B}(:,L) \\
        \mathbf{A}(2,:) \mathbf{B}(:,1) &
        \mathbf{A}(2,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(2,:) \mathbf{B}(:,L) \\        
        \vdots & \vdots & & \vdots \\
        \mathbf{A}(N,:) \mathbf{B}(:,1) &
        \mathbf{A}(N,:) \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A}(N,:) \mathbf{B}(:,L) \\
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \left[ \begin{array}{c}
        \mathbf{A}(1,:) \\ \mathbf{A}(2,:) \\ \vdots \\ \mathbf{A}(M,:)
        \end{array} \right] \, \mathbf{B}(:,1) &
        \left[ \begin{array}{c}
        \mathbf{A}(1,:) \\ \mathbf{A}(2,:) \\ \vdots \\ \mathbf{A}(M,:)
        \end{array} \right] \, \mathbf{B}(:,2) &
        \cdots &
        \left[ \begin{array}{c}
        \mathbf{A}(1,:) \\ \mathbf{A}(2,:) \\ \vdots \\ \mathbf{A}(M,:)
        \end{array} \right] \, \mathbf{B}(:,L) &
        \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \mathbf{A} \, \mathbf{B}(:,1) &
        \mathbf{A} \, \mathbf{B}(:,2) &
        \cdots &
        \mathbf{A} \, \mathbf{B}(:,L)
    \end{array}
    \right]_{N \times L} \: .
\end{split}
$$

Esta formulação consiste em representar cada coluna $\mathbf{C}(:,j)$, $j = 1, ..., L$, pela combinação linear das colunas de $\mathbf{A}$, isto é, a $j$-ésima coluna de $\mathbf{C}$, $j = 1, ..., L$, é o produto entre a matriz $\mathbf{A}$ e a $j$-ésima, $j = 1, ..., L$, coluna de $\mathbf{B}$. Isso permite rearranjar a ordem dos loops $i$, $j$ e $k$ da "Formulação baseada no encadeamento de três laços", tal como mostrado abaixo:

-----
$\mathbf{C} = \mathbf{0}$

for $j = 1:L$ 

>for $k = 1:M$

>>for $i = 1:N$

>>>$c_{ij} = c_{ij} + a_{ik} \, b_{kj}$

>>end

>end

end

-----

Note que o loop $i$ representa a multiplicação da coluna $\mathbf{A}(:,k)$ pelo elemento $b_{kj}$. Este loop pode ser suprimido da seguinte forma:

-----
$\mathbf{C} = \mathbf{0}$

for $j = 1:L$ 

>for $k = 1:M$

>>$\mathbf{C}(:,j) = \mathbf{C}(:,j) + \mathbf{A}(:,k) \, b_{kj}$

>end

end

-----

**ATENÇÃO:** $\mathbf{A}(:,k) \, b_{kj}$ indica o produto entre o vetor $\mathbf{A}(:,k)$, que é $N \times 1$, pelo elemento $b_{kj}$, que é um escalar. Portanto, $\mathbf{C}(:,j)$ é um vetor $N \times 1$.

Por fim, note que o loop $k$ representa o produto entre $\mathbf{A}$ e as colunas $\mathbf{B}(:,j)$. Portanto, este loop pode ser suprimido da seguinte forma:

-----
for $j = 1:L$ 

>$\mathbf{C}(:,j) = \mathbf{A} \, \mathbf{B}(:,j)$

end

-----

**ATENÇÃO:** $\mathbf{A} \, \mathbf{B}(:,j)$ indica o produto entre a matriz $\mathbf{A}$, que é $N \times M$, pelo vetor $\mathbf{B}(:,j)$, que é $M \times 1$. Portanto, $\mathbf{C}(:,j)$ é um vetor $N \times 1$.

##4) Formulação baseada no produto direto

Esta formulação consiste em representar a matriz $\mathbf{C}$ como uma soma de matrizes definidas pelo produto direto entre as colunas $\mathbf{A}(:,k)$ e as linhas $\mathbf{B}(k,:)$, $k = 1, ..., M$. Para verificarmos esta soma de matrizes, basta manipular a expressão que determina os elementos de $\mathbf{C}$: 

$$\begin{split}
\mathbf{C} 
    & = \left[
    \begin{array}{ccc}
        c_{11} & \cdots & c_{1L} \\
        \vdots &        & \vdots \\
        c_{N1} & \cdots & c_{NL}
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        \left( a_{11} \, b_{11} + \cdots + a_{1M} \, b_{M1} \right) &
        \left( a_{11} \, b_{12} + \cdots + a_{1M} \, b_{M2} \right) &
        \cdots &
        \left( a_{11} \, b_{1L} + \cdots + a_{1M} \, b_{ML} \right) \\
        \left( a_{21} \, b_{11} + \cdots + a_{2M} \, b_{M1} \right) &
        \left( a_{21} \, b_{12} + \cdots + a_{2M} \, b_{M2} \right) &
        \cdots &
        \left( a_{21} \, b_{1L} + \cdots + a_{2M} \, b_{ML} \right) \\
        \vdots & \vdots & & \vdots \\
        \left( a_{N1} \, b_{11} + \cdots + a_{NM} \, b_{M1} \right) &
        \left( a_{N1} \, b_{12} + \cdots + a_{NM} \, b_{M2} \right) &
        \cdots &
        \left( a_{N1} \, b_{1L} + \cdots + a_{NM} \, b_{ML} \right)
    \end{array}
    \right]_{N \times L} \\\\
    & = \left[
    \begin{array}{cccc}
        a_{11} \, b_{11} & a_{11} \, b_{12} & \cdots & a_{11} \, b_{1L} \\
        a_{21} \, b_{11} & a_{21} \, b_{12} & \cdots & a_{21} \, b_{1L} \\
        \vdots & \vdots & & \vdots \\
        a_{N1} \, b_{11} & a_{N1} \, b_{12} & \cdots & a_{N1} \, b_{1L}
    \end{array}
    \right]_{N \times L} + \cdots +
    \left[
    \begin{array}{cccc}
        a_{1M} \, b_{M1} & a_{1M} \, b_{M2} & \cdots & a_{1M} \, b_{ML} \\
        a_{2M} \, b_{M1} & a_{2M} \, b_{M2} & \cdots & a_{2M} \, b_{ML} \\
        \vdots & \vdots & & \vdots \\
        a_{NM} \, b_{M1} & a_{NM} \, b_{M2} & \cdots & a_{NM} \, b_{ML}
    \end{array}
    \right]_{N \times L}
\end{split}
$$

Observe que cada uma dessas matrizes é o produto direto entre uma coluna de $\mathbf{A}$ e uma linha de $\mathbf{B}$:

$$\begin{split}
\mathbf{C} 
   & = \left[
    \begin{array}{cccc}
        a_{11} \, b_{11} & a_{11} \, b_{12} & \cdots & a_{11} \, b_{1L} \\
        a_{21} \, b_{11} & a_{21} \, b_{12} & \cdots & a_{21} \, b_{1L} \\
        \vdots & \vdots & & \vdots \\
        a_{N1} \, b_{11} & a_{N1} \, b_{12} & \cdots & a_{N1} \, b_{1L}
    \end{array}
    \right]_{N \times L} + \cdots +
    \left[
    \begin{array}{cccc}
        a_{1M} \, b_{M1} & a_{1M} \, b_{M2} & \cdots & a_{1M} \, b_{ML} \\
        a_{2M} \, b_{M1} & a_{2M} \, b_{M2} & \cdots & a_{2M} \, b_{ML} \\
        \vdots & \vdots & & \vdots \\
        a_{NM} \, b_{M1} & a_{NM} \, b_{M2} & \cdots & a_{NM} \, b_{ML}
    \end{array}
    \right]_{N \times L} \\\\
   & = \left[
    \begin{array}{c}
        a_{11} \, 
        \left[ \begin{array}{cccc}
        b_{11} \, b_{12} & \cdots & \, b_{1L} 
        \end{array} \right]\\
        a_{21} \, 
        \left[ \begin{array}{cccc}
        b_{11} \, b_{12} & \cdots & \, b_{1L} 
        \end{array} \right]\\
        \vdots \\
        a_{N1} \, 
        \left[ \begin{array}{cccc}
        b_{11} \, b_{12} & \cdots & \, b_{1L} 
        \end{array} \right]
    \end{array}
    \right]_{N \times L} + \cdots +
    \left[
    \begin{array}{c}
        a_{1M} \, 
        \left[ \begin{array}{cccc}
        b_{M1} \, b_{M2} & \cdots & \, b_{ML} 
        \end{array} \right]\\
        a_{2M} \, 
        \left[ \begin{array}{cccc}
        b_{M1} \, b_{M2} & \cdots & \, b_{ML} 
        \end{array} \right]\\
        \vdots \\
        a_{NM} \, 
        \left[ \begin{array}{cccc}
        b_{M1} \, b_{M2} & \cdots & \, b_{ML}
        \end{array} \right]
    \end{array}
    \right]_{N \times L} \\\\
    & = \mathbf{A}(:,1) \, \mathbf{B}(1,:) +
        \mathbf{A}(:,2) \, \mathbf{B}(2,:) +
        \cdots +
        \mathbf{A}(:,M) \, \mathbf{B}(M,:)
\end{split}
$$

Note que $\mathbf{A}(:,k) \, \mathbf{B}(k,:)$, $k = 1, ..., M$, representa o produto direto entre a $k$-ésima coluna de $\mathbf{A}$ e a $k$-ésima linha de $\mathbf{B}$. O cálculo dos elementos de $\mathbf{C}$ por meio desta expressão é equivalente a rearranjar a ordem dos loops $i$, $j$ e $k$ da "Formulação baseada no encadeamento de três laços", tal como mostrado abaixo:

-----
$\mathbf{C} = \mathbf{0}$

for $k = 1:M$

>for $j = 1:L$

>>for $i = 1:N$ 

>>>$c_{ij} = c_{ij} + a_{ik} \, b_{kj}$

>>end

>end

end

-----

Note que, tal como mostrado na "Formulação baseada na combinação linear de colunas", o loop $i$ representa a multiplicação da coluna $\mathbf{A}(:,k)$ pelo elemento $b_{kj}$ e, portanto, o loop $i$ pode ser suprimido da seguinte forma:

-----
$\mathbf{C} = \mathbf{0}$

for $k = 1:M$

>for $j = 1:L$

>>$\mathbf{C}(:,j) = \mathbf{C}(:,j) + \mathbf{A}(:,k) \, b_{kj}$

>end

end

-----

**ATENÇÃO:** $\mathbf{A}(:,k) \, b_{kj}$ indica o produto entre o vetor $\mathbf{A}(:,k)$, que é $N \times 1$, pelo elemento $b_{kj}$, que é um escalar. Portanto, $\mathbf{C}(:,j)$ é um vetor $N \times 1$.

Por fim, note que o loop $j$ representa o produto direto entre $\mathbf{A}(:,k)$ e $\mathbf{B}(k,:)$, tal que:

-----
$\mathbf{C} = \mathbf{0}$

for $k = 1:M$

>$\mathbf{C} = \mathbf{C} + \mathbf{A}(:,k) \, \mathbf{B}(k,:)$

end

-----

**ATENÇÃO:** $\mathbf{A}(:,k) \, \mathbf{B}(k,:)$ indica o produto direto entre o vetor $\mathbf{A}(:,k)$, que é $N \times 1$, e o vetor $\mathbf{B}(k,:)$, que é $1 \times L$. Portanto, $\mathbf{C}$ é uma matriz $N \times L$.

###Exercício

Implemente o produto $\mathbf{A} \mathbf{B}$ seguindo as quatro formulações diferentes apresentadas acima. **Cada implementação deve estar em uma função diferente**. Todas as implementações, exceto aquela baseada no encadeamento de três laços, devem, **obrigatoriamente**, utilizar as funções desenvolvidas previamente. **As implementações devem seguir o template da disciplina**.

###Exemplo de implementação em Python

In [1]:
import numpy as np

`C = A.dot(B)` ,

em que A e B são arrays do numpy.

In [2]:
A = np.array([[1.,2.],
              [3.,4.],
              [5.,6.]])
B = np.array([[7., 8.],
              [9., 10.]])

In [3]:
C = A.dot(B)

In [4]:
print C

[[  25.   28.]
 [  57.   64.]
 [  89.  100.]]
