In [1]:

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from joblib import dump, load
from sklearn.metrics import mean_absolute_error
from sklearn.tree import DecisionTreeRegressor
from sklearn.tree import DecisionTreeClassifier
import random

In [2]:

# Carregando o DataFrame
df = pd.read_csv('day.csv')

# lista de resultados reais
realResults = df['cnt'].head(10).tolist()

# Retirando colunas não úteis
df = df.drop(['dteday', 'registered', 'casual', 'workingday', 'instant', 'temp', 'cnt'], axis=1)

# Convertendo as primeiras 10 linhas em uma matriz 2D
X = df.head(10).values  # Isso cria uma matriz 2D
realResults = np.array(realResults)

In [3]:
# Exemplo de função de erro (Erro Quadrático Médio)
def erro(X, y, w, b):
    preds = X.dot(w) + b  # Predições
    return np.mean((preds - y) ** 2)  # Erro quadrático médio

# Função que calcula o gradiente do erro em relação aos pesos
def gradiente(X, y, w, b):
    m = len(X)
    preds = X.dot(w) + b
    dw = (2/m) * X.T.dot(preds - y)  # Gradiente de w
    db = (2/m) * np.sum(preds - y)  # Gradiente de b
    return dw, db

# Função de Gradient Descendente Estocástico (SGD)
def sgd(X, y, w, b, eta, n_iter):
    for i in range(n_iter):
        # Escolher uma amostra aleatória (SGD)
        random_index = np.random.randint(0, len(X))  # Escolher uma amostra aleatória
        X_i = X[random_index:random_index+1]  # Pegar uma amostra
        y_i = y[random_index:random_index+1]
        
        # Calcular o gradiente
        dw, db = gradiente(X_i, y_i, w, b)
        
        # Atualizar os pesos com o gradiente
        w -= eta * dw
        b -= eta * db
        
        # Mostrar o erro a cada 100 iterações
        if i % 100 == 0:
            print(f"Iteração {i}, Erro: {erro(X, y, w, b)}")
    
    return w, b

# Inicialização dos pesos
w = np.random.randn(X.shape[1])  # Peso aleatório
b = 0  # Inicializa o bias

# Taxa de aprendizado e número de iterações
eta = 0.01  # Taxa de aprendizado
n_iter = 1000  # Número de iterações

# Executando o Gradient Descendente Estocástico (SGD)
w, b = sgd(X, y, w, b, eta, n_iter)

print(f"Pesos finais: {w}, Bias final: {b}")

Iteração 0, Erro: 42.16419091962596
Iteração 100, Erro: 0.5201782419951237
Iteração 200, Erro: 0.2638590175461196
Iteração 300, Erro: 0.1664222887784515
Iteração 400, Erro: 0.058904828417903475
Iteração 500, Erro: 0.02943037031896852
Iteração 600, Erro: 0.014476847868796383
Iteração 700, Erro: 0.00699542430648441
Iteração 800, Erro: 0.00449266966057983
Iteração 900, Erro: 0.0017637881861007297
Pesos finais: [2.01659638], Bias final: 2.93206066366092
