<!-- Projeto Desenvolvido na Data Science Academy - www.datascienceacademy.com.br -->
# <font color='blue'>Data Science Academy</font>
## <font color='blue'>Matemática e Estatística Aplicada Para Data Science, Machine Learning e IA</font>
## <font color='blue'>Lista de Exercícios 4</font>
## <font color='blue'>Operações com Vetores em Análise de Dados e Data Science</font>

### Instalando e Carregando Pacotes


In [1]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
%pip install -q -U watermark

Note: you may need to restart the kernel to use updated packages.


In [2]:
# Imposts
import numpy as np
import scipy

In [3]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Data Science Academy" 

Author: Data Science Academy



**Resolva os exercícios abaixo usando Linguagem Python. Faça pesquisa complementar se necessário.**

### Exercício 1: Produto Escalar em Aplicação Prática

Descrição: Dados dois vetores que representam preferências de usuários em três categorias diferentes user1 = [4, 3, 2] e user2 = [1, 5, 4], calcule a similaridade entre esses usuários usando o produto escalar. 

In [5]:
user1 = np.array([4, 3, 2])
user2 = np.array([1, 5, 4])

similaridade = np.dot(user1, user2)
print(f"A simularide dos usuários é: {similaridade}")

A simularide dos usuários é: 27


O produto escalar entre dois vetores, também conhecido como produto interno ou dot product, é uma operação matemática que resulta em um único número. Este número é uma medida de certos tipos de similaridade entre os dois vetores. Agora, interpretando o valor de 27:

**Magnitude da Similaridade**: O valor absoluto (27 neste caso) indica a magnitude da similaridade. Quanto maior esse número, maior é a similaridade sob a métrica específica que o produto escalar representa.

**Direção e Orientação**: O produto escalar é positivo quando os vetores apontam na mesma direção geral e negativo quando apontam em direções opostas. Um valor de 27, sendo positivo, sugere que user1 e user2 têm uma orientação geral semelhante no espaço vetorial considerado.

**Contexto Específico**: A interpretação mais precisa depende do contexto onde esses vetores são aplicados. Por exemplo, se estes vetores representam preferências ou características em um sistema de recomendação, um valor alto pode indicar uma alta similaridade nessas preferências ou características.

**Normalização**: É importante considerar a magnitude dos vetores originais. Se os vetores forem muito grandes, até mesmo vetores relativamente diferentes podem ter um produto escalar alto. Em muitos casos, é útil normalizar os vetores antes de calcular o produto escalar para obter uma medida de similaridade mais significativa.

### Exercício 2: Multiplicação de Escalar por Vetor em Dados Reais

Descrição: Dada uma série de preços de ações prices = [120, 125, 130, 128, 135], ajuste os preços em 15% e calcule o novo preço das ações.

In [6]:
prices = np.array([120, 125, 130, 128, 135])
adjustment = 1.15
new_price = prices * adjustment

print(f"Novos preços: {new_price}")

Novos preços: [138.   143.75 149.5  147.2  155.25]


### Exercício 3: Otimização de Produto Escalar

Descrição: Encontre o vetor unitário que maximiza o produto escalar com o vetor v = [3, 4, 5]. Use técnicas de otimização para encontrar a solução.

In [8]:
import numpy as np
from scipy.optimize import minimize

def otimizar_produto_escalar(v):
   def objetivo(u):
      return -np.dot(u, v)
   
   def restricao(u):
      return np.linalg.norm(u) - 1.0
   
   u_inicial = np.array([1.0, 0.0, 0.0])

   resultado = minimize(objetivo, u_inicial, method='SLSQP', constraints={'type': 'eq', 'fun': restricao})

   return resultado.x, -resultado.fun

v = np.array([3, 4, 5])
u_otimo, produto_max = otimizar_produto_escalar(v)

u_analitico = v / np.linalg.norm(v)
produto_analitico = np.dot(u_analitico, v)

print(f"Vetor v: {v}")
print(f"Scipy - u ótimo: {u_otimo}")
print(f"Scipy - produto máximo: {produto_max:.6f}")
print(f"Analítico - u ótimo: {u_analitico}")
print(f"Analítico - produto máximo: {produto_analitico:.6f}")
print(f"Diferença: {np.linalg.norm(u_otimo - u_analitico):.8f}")

Vetor v: [3 4 5]
Scipy - u ótimo: [0.42425876 0.56558521 0.70719018]
Scipy - produto máximo: 7.071068
Analítico - u ótimo: [0.42426407 0.56568542 0.70710678]
Analítico - produto máximo: 7.071068
Diferença: 0.00013049


In [12]:
# Solução professor
from scipy.optimize import minimize

v = np.array([3, 4, 5])

def funcao_objetivo(x):
   return -np.dot(v, x)

constraint = {'type': 'eq', 'fun': lambda x: np.linalg.norm(x) - 1}

resultado = minimize(funcao_objetivo, np.ones(3), constraints = constraint)
vetor_otimizado = resultado.x

print(vetor_otimizado)

[0.42427197 0.56568183 0.70710492]


O objetivo é encontrar um vetor que maximize o produto escalar com um vetor dado v, sob a restrição de que o vetor resultante seja unitário (isto é, tenha norma igual a 1). 

No SciPy, **minimize** é uma função geral para otimização numérica de funções escalares.

A função "funcao_objetivo" é a função objetivo a ser otimizada. Ela calcula o produto escalar negativo do vetor v com um vetor x. O sinal negativo é usado porque a função minimize procura minimizar o valor da função objetivo. Neste caso, minimizar o negativo do produto escalar é o mesmo que maximizar o produto escalar.

A variável **constraint** é a restrição que exige que a norma (ou magnitude) do vetor x seja 1, tornando-o um vetor unitário. A chave 'type': 'eq' indica que é uma restrição de igualdade, ou seja, a função deve resultar em zero.

Esta linha abaixo:

resultado = minimize(funcao_objetivo, np.ones(3), constraints = constraint)

chama a função minimize, passando a função objetivo, um vetor inicial de [1, 1, 1] (três uns) e a restrição definida. A função minimize irá ajustar o vetor inicial para encontrar o vetor que maximiza o produto escalar com v enquanto mantém sua norma igual a 1.

Após a otimização, o vetor resultante é armazenado na propriedade x do objeto resultado. Este vetor é o vetor unitário que maximiza o produto escalar com v sob a restrição dada.

O código acima usa otimização numérica para encontrar um vetor unitário que tenha o máximo produto escalar possível com o vetor [3, 4, 5].

Acabamos de reproduzir (de forma simplificada) a ideia por trás do algoritmo de descida do gradiente, a principal técnica usada no treinamento de modelos de Deep Learning e diversos algoritmos mais simples de Machine Learning.

Machine Learning é, de fato, um problema de otimização matemática, onde queremos minimizar a função objetivo (função de erro), encontrando valores que façam com que a função tenha o menor resultado possível, ou seja, o modelo de Machine Learning tenha o menor erro possível.

In [13]:
# Calculando o produto escalar entre o vetor incial e o vetor resultante

produto_escalar = np.dot(v, vetor_otimizado)
print(f"Valor do produto escalar: {produto_escalar}")

Valor do produto escalar: 7.0710678347924105


### Exercício 4: Produto Vetorial e Direção Normal

Descrição: Dados três pontos no espaço 3D A = [1, 2, 3], B = [4, 5, 6], e C = [7, 8, 9], encontre um vetor normal ao plano definido por esses três pontos.

In [4]:
import numpy as np

def vetor_normal_plano(A, B, C):
   AB = B - A
   AC = C - A

   normal = np.cross(AB, AC)

   return AB, AC, normal

A = np.array([1, 2, 3])
B = np.array([4, 5, 6])
C = np.array([7, 8, 9])

print("=== VETOR NORMAL DO PLANO ===")
print(f"Ponto A: {A}")
print(f"Pronto B: {B}")
print(f"Pronto C: {C}")

AB, AC, normal = vetor_normal_plano(A, B, C)

print(f"\nVetores no plano:")
print(f"AB = {AB}")
print(f"AC = {AC}")

print(f"\nVetor normal:")
print(f"n = AB x AC = {normal}")
print(f"Magnitude: |n| = {np.linalg.norm(normal):.6f}")

dot_AB = np.dot(normal, AB)
dot_AC = np.dot(normal, AC)

print(f"\nVeriricação (deve ser ~0):")
print(f"n · AB = {dot_AB:.10f}")
print(f"n · AC = {dot_AC:.10f}")

if np.linalg.norm(normal) < 1e-10:
   print("\n AVISO: Os pontos são colineares!")
   print("Não definem um plano único.")
else:
   normal_unitario = normal / np.linalg.norm(normal)
   print("\nVetor normal unitário:")
   print(f"n̂ = {normal_unitario}")
   print(f"Magnitude: |n̂| = {np.linalg.norm(normal_unitario):.6f}")

print(f"\n=== EXEMPLO COM PONTOS NÃO COLIENARES ===")
A2 = np.array([0, 0, 0])
B2 = np.array([1, 0, 0])
C2 = np.array([0, 1, 0])

AB2, AC2, normal2 = vetor_normal_plano(A2, B2, C2)

print(f"Pontos: A={A2}, B={B2}, C={C2}")
print(f"AB = {AB2}")
print(f"AC = {AC2}")
print(f"Normal = {normal2}")
print(f"Normal unitário =  {normal2/np.linalg.norm(normal2)}")

=== VETOR NORMAL DO PLANO ===
Ponto A: [1 2 3]
Pronto B: [4 5 6]
Pronto C: [7 8 9]

Vetores no plano:
AB = [3 3 3]
AC = [6 6 6]

Vetor normal:
n = AB x AC = [0 0 0]
Magnitude: |n| = 0.000000

Veriricação (deve ser ~0):
n · AB = 0.0000000000
n · AC = 0.0000000000

 AVISO: Os pontos são colineares!
Não definem um plano único.

=== EXEMPLO COM PONTOS NÃO COLIENARES ===
Pontos: A=[0 0 0], B=[1 0 0], C=[0 1 0]
AB = [1 0 0]
AC = [0 1 0]
Normal = [0 0 1]
Normal unitário =  [0. 0. 1.]


In [8]:
# Solução professor
A = np.array([1, 2, 3])
B = np.array([4, 5, 6])
C = np.array([7, 8, 9])

AB = A - B
AC = C - A

vetor_normal = np.cross(AB, AC)
print(f"Valor do vetor normal: {vetor_normal}")

Valor do vetor normal: [0 0 0]


### Exercício 5: Produto Vetorial em Análise de Dados

Descrição: Em um conjunto de dados 3D com pontos p1 = [1, 2, 3], p2 = [4, 5, 6], e p3 = [7, 8, 9], encontre o vetor normal ao plano formado por esses três pontos e interprete seu significado em termos de orientação do plano.

Resposta:

O vetor normal ao plano definido pelos pontos A = [1, 2, 3], B = [4, 5, 6], e C = [7, 8, 9] resultou em [0, 0, 0]. Isso ocorre porque os pontos A, B, e C são colineares no espaço 3D, ou seja, eles estão alinhados em uma única linha reta. Portanto, não formam um plano distinto no qual um vetor normal único possa ser definido.

Em termos geométricos, quando três pontos são colineares, os vetores que os conectam (neste caso, AB e AC) são paralelos ou antiparalelos. O produto vetorial de dois vetores paralelos ou antiparalelos é sempre zero, o que explica o resultado obtido. 

In [17]:
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D


def analisar_pontos_3d(p1, p2, p3):
    v1 = p2 - p1
    v2 = p3 - p1

    normal = np.cross(v1, v2)
    magnitude_normal = np.linalg.norm(normal)

    colinear = magnitude_normal < 1e-10

    if not colinear:
        normal_unitario = (
            normal / magnitude_normal
        )  
    else:
        normal_unitario = None

    return v1, v2, normal, normal_unitario, colinear, magnitude_normal


def interpretar_orientacao(normal, normal_unitario):
    if normal_unitario is None:
        return ["Pontos colineares - não formam plano"]  

    x, y, z = normal_unitario

    interpretacoes = []

    if abs(z) > 0.8:
        if z > 0:
            interpretacoes.append("Plano quase horizontal (normal aponta para cima)")
        else:
            interpretacoes.append("Plano quase horizontal (normal aponta para baixo)")

    if abs(x) > 0.8:
        if x > 0:
            interpretacoes.append(
                "Plano quase vertical (normal aponta para +X)"
            )  
        else:
            interpretacoes.append(
                "Plano quase vertical (normal aponta para -X)"
            )  

    if abs(y) > 0.8:
        if y > 0:
            interpretacoes.append(
                "Plano quase vertical (normal aponta para +Y)"
            )  
        else:
            interpretacoes.append(
                "Plano quase vertical (normal aponta para -Y)"
            )  

    if not interpretacoes:
        interpretacoes.append("Plano inclinado (componentes X, Y, Z)")


# Dados
p1 = np.array([1, 2, 3])
p2 = np.array([4, 5, 6])
p3 = np.array([7, 8, 9])

print("=== ANÁLISE DE DADOS 3D ===")
print(f"Ponto 1: {p1}")
print(f"Ponto 2: {p2}")
print(f"Ponto 3: {p3}")

v1, v2, normal, normal_unitario, colinear, mag_normal = analisar_pontos_3d(p1, p2, p3)

print(f"\n=== VETORES DO PLANO ===")
print(f"v1 = p2 - p1 = {v1}")
print(f"v2 = p3 - p1 = {v2}")

print(f"\n=== PRODUTO VETORIAL ===")
print(f"Normal = v1 × v2 = {normal}")
print(f"Magnitude = {mag_normal:.10f}")

if colinear:
    print(f"\n RESULTADO: PONTOS COLINEARES")  # CORRIGIDO: adicionado emoji
    print("Os três pontos estão em linha reta!")
    print("Não definem um plano único.")

    ratio = v2 / v1 if np.all(v1 != 0) else None
    if ratio is not None and np.allclose(ratio, ratio[0]):
        print(f"Razão v2/v1 = {ratio[0]:.1f} (constante)")

    direcao = v1 / np.linalg.norm(v1)
    print(f"Direção da linha: {direcao}")

else:
    print(f"\n=== INTERPRETAÇÃO GEOMÉTRICA ===")
    print(f"Vetor normal unitário: {normal_unitario}")

    interpretacoes = interpretar_orientacao(normal, normal_unitario)
    for interpretacao in interpretacoes:
        print(f"• {interpretacao}")


print(f"\n=== EXEMPLO: PONTOS NÃO COLINEARES ===")
p1_ex = np.array([0, 0, 0])
p2_ex = np.array([3, 0, 0])
p3_ex = np.array([0, 3, 0])

v1_ex, v2_ex, normal_ex, normal_unit_ex, colinear_ex, mag_ex = analisar_pontos_3d(
    p1_ex, p2_ex, p3_ex
)

print(f"Pontos: {p1_ex}, {p2_ex}, {p3_ex}")
print(f"Normal: {normal_ex}")
print(f"Normal unitário: {normal_unit_ex}")

interpretacoes_ex = interpretar_orientacao(normal_ex, normal_unit_ex)
if interpretacoes_ex:  
    for interpretacao in interpretacoes_ex:
        print(f"• {interpretacao}")
else:
    print("• Erro na interpretação")

print(f"\n=== APLICAÇÕES EM ANÁLISE DE DADOS ===")
print("1. Detecção de colinearidade: pontos em linha reta")
print("2. Análise de superfícies: orientação de planos")
print("3. PCA 3D: direções principais de variação")
print("4. Computação gráfica: normais para iluminação")
print("5. Geometria computacional: orientação de faces")

print(f"\n=== SIGNIFICADO DO RESULTADO ===")
if colinear:
    print("• Os dados mostram uma relação LINEAR perfeita")
    print("• Todos os pontos seguem a mesma direção")
    print("• Pode indicar dependência linear entre variáveis")
    print("• Em análise de dados: redução de dimensionalidade natural")
else:
    print("• Os dados definem um plano único no espaço")
    print("• Existe variação em duas dimensões independentes")
    print("• O vetor normal indica a direção perpendicular ao plano")
    print("• Útil para análise de superfícies e orientações")

=== ANÁLISE DE DADOS 3D ===
Ponto 1: [1 2 3]
Ponto 2: [4 5 6]
Ponto 3: [7 8 9]

=== VETORES DO PLANO ===
v1 = p2 - p1 = [3 3 3]
v2 = p3 - p1 = [6 6 6]

=== PRODUTO VETORIAL ===
Normal = v1 × v2 = [0 0 0]
Magnitude = 0.0000000000

 RESULTADO: PONTOS COLINEARES
Os três pontos estão em linha reta!
Não definem um plano único.
Razão v2/v1 = 2.0 (constante)
Direção da linha: [0.57735027 0.57735027 0.57735027]

=== EXEMPLO: PONTOS NÃO COLINEARES ===
Pontos: [0 0 0], [3 0 0], [0 3 0]
Normal: [0 0 9]
Normal unitário: [0. 0. 1.]
• Erro na interpretação

=== APLICAÇÕES EM ANÁLISE DE DADOS ===
1. Detecção de colinearidade: pontos em linha reta
2. Análise de superfícies: orientação de planos
3. PCA 3D: direções principais de variação
4. Computação gráfica: normais para iluminação
5. Geometria computacional: orientação de faces

=== SIGNIFICADO DO RESULTADO ===
• Os dados mostram uma relação LINEAR perfeita
• Todos os pontos seguem a mesma direção
• Pode indicar dependência linear entre variáveis
• 

In [18]:
%reload_ext watermark
%watermark -a "Data Science Academy"

Author: Data Science Academy



In [19]:
%watermark -v -m

Python implementation: CPython
Python version       : 3.12.7
IPython version      : 8.27.0

Compiler    : GCC 11.2.0
OS          : Linux
Release     : 6.11.0-26-generic
Machine     : x86_64
Processor   : x86_64
CPU cores   : 12
Architecture: 64bit



In [21]:
%watermark --iversions

numpy     : 1.26.4
matplotlib: 3.9.2

