<a href="https://colab.research.google.com/github/Mestrie/regressao-linear-ex1_-Justino_Felipe_Lopes_Nunes/blob/main/regressao_linear_ex1_%3CJustino_Felipe_Lopes_Nunes%3E.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Functions
------------------------------------------------------
###compute_cost.py

In [1]:
"""
@file compute_cost.py
@brief Computes the cost for linear regression.
"""

import numpy as np

def compute_cost(X, y, theta):
    """
    Compute the cost for linear regression.

    This function calculates the mean squared error cost function J(θ) for linear regression:
    J(θ) = (1 / (2 * m)) * Σ (h(θ) - y)^2

    where:
    - J(θ) is the cost
    - m is the number of training examples
    - h(θ) is the hypothesis function (X @ theta)
    - y is the vector of observed values

    @param X: np.ndarray
        Feature matrix including the intercept term (shape: m x n).
    @param y: np.ndarray
        Target variable vector (shape: m,).
    @param theta: np.ndarray
        Parameter vector for linear regression (shape: n,).

    @return: float
        The computed cost value as a single float.
    """

    # get the number of training examples
    m = len(y)

    # Compute the predictions using the linear model by formula h(θ) = X @ θ
    h_o = X @ theta

    # Compute the error vector between predictions and actual values
    errors = h_o - y

    # Compute the cost as the mean squared error cost function using the formula
    J_o = (1 / (2 * m)) * np.sum(errors**2)

    return J_o


## gradient_descent.py



In [3]:
"""
@file gradient_descent.py
@brief Implementa o algoritmo de descida do gradiente para regressão linear.
"""

import numpy as np


def gradient_descent(X, y, theta, alpha, num_iters):
    """
    Executa a descida do gradiente para minimizar a função de custo J(θ)
    no contexto de regressão linear.

    @return: tuple[np.ndarray, np.ndarray]
        theta: vetor otimizado de parâmetros (n,).
        J_history: vetor com o histórico do valor da função de custo em cada iteração (num_iters,).
        theta_history: parâmetros em cada iteração (num_iters+1, n).
    """

    # Obtem o número de amostras
    m = len(y)

    # Inicializa o vetor de custo J_history
    J_history = np.zeros(num_iters)

    # Inicializa o vetor theta_history
    theta_history = np.zeros((num_iters + 1, theta.shape[0]))

    # Armazena os parâmetros iniciais
    theta_history[0] = theta

    for i in range(num_iters):
        # Calcula as previsões
        predictions = X @ theta

        # Calcula o erro
        erro = predictions - y

        # Calcula o gradiente
        gradient = (1/m) * (X.T @ erro)

        # Atualiza os parâmetros
        theta = theta - alpha * gradient

        # Armazena o custo da iteração atual
        J_history[i] = compute_cost(X, y, theta)

        # Armazena os parâmetros atualizados
        theta_history[i + 1] = theta

    return theta, J_history, theta_history


## plot_data.py

In [4]:
"""
@file plot_data.py
@brief Plots the data points.
"""

import matplotlib.pyplot as plt

def plot_data(x, y):
    """
    @brief Plot training data as red crosses.

    @param x np.ndarray Independent variable (population)
    @param y np.ndarray Dependent variable (profit)
    """
    plt.figure()
    plt.plot(x, y, 'rx', markersize=5)
    plt.xlabel('Population of City in 10,000s')
    plt.ylabel('Profit in $10,000s')
    plt.title('Training Data')
    plt.grid(True)
    plt.show()

## warm_up_exercise.py

In [5]:
"""
@file warm_up_exercise.py
@brief Returns a 5x5 identity matrix.
"""

import numpy as np

def warm_up_exercise1():
    """
    @brief Create and return a 5x5 identity matrix.

    @return np.ndarray Identity matrix (5x5)
    """
    return np.eye(5)

def warm_up_exercise2(m=5):
    """
    @brief Cria um vetor coluna de 1s, utilizado como termo de bias (intercepto) em regressão linear.

    @param m: int
        Número de exemplos (linhas).

    @return np.ndarray
        Vetor de shape (m, 1) com todos os valores iguais a 1.
    """
    return np.ones((m, 1))

def warm_up_exercise3(x):
    """
    @brief Adiciona uma coluna de 1s (bias) ao vetor de entrada x.

    @param x: np.ndarray
        Vetor unidimensional de shape (m,)

    @return np.ndarray
        Matriz de shape (m, 2), com a primeira coluna sendo 1s (bias) e a segunda os valores de x.
    """
    # obtem o número de exemplos
    m = len(x)
    # Garante que x é um vetor coluna usando reshape. Use np.reshape
    x = np.reshape(x, (m, 1))
    # Adiciona uma coluna de 1s (bias) ao vetor x. Use np.ones para criar um vetor de 1s
    bias = np.ones((m, 1))
    # Concatena a coluna de 1s (bias) com o vetor x. Use np.hstack para concatenar horizontalmente e retorne
    return np.hstack((bias, x))

def warm_up_exercise4(X, theta):
    """
    @brief Realiza a multiplicação matricial entre X e θ, simulando h(θ) = X @ θ.

    @param X: np.ndarray
        Matriz de entrada de shape (m, n)

    @param theta: np.ndarray
        Vetor de parâmetros de shape (n,)

    @return np.ndarray
        Vetor de predições (m,)
    """
    # retorna o resultado da multiplicação matricial entre X e θ
    return X @ theta

def warm_up_exercise5(predictions, y):
    """
    @brief Calcula o vetor de erros quadráticos (squared errors) entre as predições e os valores reais.

    @param predictions: np.ndarray
        Vetor de predições (m,)

    @param y: np.ndarray
        Vetor de valores reais (m,)

    @return np.ndarray
        Vetor com os erros quadráticos: (pred - y)^2
    """
    # Calcula o vetor de erros quadráticos (squared errors) entre as predições e os valores reais
    # O vetor de erros quadráticos é calculado como a diferença entre as predições e os valores reais
    return (predictions - y) ** 2

def warm_up_exercise6(errors):
    """
    @brief Calcula o custo médio (mean cost) a partir dos erros quadráticos.

    @param errors: np.ndarray
        Vetor de erros quadráticos (m,)

    @return float
        Custo médio (mean cost)
    """
    # O custo médio é calculado como a média dos erros quadráticos
    # Obtenha usando np.mean e não esqueça de dividir por 2
    return np.mean(errors) / 2

def warm_up_exercise7(X, y, theta):
    """
    @brief Calcula o custo médio (mean cost) para um modelo de regressão linear.

    @param X: np.ndarray
        Matriz de entrada de shape (m, n)

    @param y: np.ndarray
        Vetor de valores reais (m,)

    @param theta: np.ndarray
        Vetor de parâmetros de shape (n,)

    @return float
        Custo médio (mean cost)
    """
    # Use as funções auxiliares para calcular o custo médio
    # 1. Calcule as predições usando a função warm_up_exercise4
    # 2. Calcule os erros quadráticos usando a função warm_up_exercise5
    # 3. Calcule o custo médio usando a função warm_up_exercise6
    # 4. Retorne o custo médio
    predictions = warm_up_exercise4(X, theta)
    errors = warm_up_exercise5(predictions, y)
    return warm_up_exercise6(errors)
