In [1]:
import pandas as pd
from sqlalchemy import create_engine

db_connection_str = (
    "postgresql://postgres:postgres@localhost:5432/exposicao_arte"
)
db_connection = create_engine(db_connection_str)

df = pd.read_sql_query("SELECT * FROM avaliacoes_eventos", db_connection)

In [2]:
df.head()

Unnamed: 0,usuario_id,evento_id,gostou,avaliacao,id
0,524,22,Sim,3,243
1,516,22,Sim,4,244
2,155,22,Sim,4,245
3,370,22,Sim,3,246
4,102,22,Não,3,247


In [3]:
able = {}
for evento_id, dados in df.groupby("evento_id"):
    gostaram = dados["gostou"] == "Sim"
    count = gostaram.value_counts()
    able[evento_id] = count.get(True, 0), count.get(False, 0)

In [4]:
for evento, (gostou, nao_gostou) in able.items():
    total = gostou + nao_gostou
    print(
        f"evento={evento} total avaliações {total} - gostaram: {gostou / total:.2%} - não gostaram: {nao_gostou / total:.2%}"
    )

evento=22 total avaliações 9 - gostaram: 66.67% - não gostaram: 33.33%
evento=23 total avaliações 9 - gostaram: 100.00% - não gostaram: 0.00%
evento=24 total avaliações 16 - gostaram: 100.00% - não gostaram: 0.00%
evento=25 total avaliações 15 - gostaram: 53.33% - não gostaram: 46.67%
evento=26 total avaliações 20 - gostaram: 100.00% - não gostaram: 0.00%
evento=27 total avaliações 13 - gostaram: 61.54% - não gostaram: 38.46%
evento=28 total avaliações 7 - gostaram: 57.14% - não gostaram: 42.86%
evento=29 total avaliações 7 - gostaram: 42.86% - não gostaram: 57.14%
evento=30 total avaliações 17 - gostaram: 100.00% - não gostaram: 0.00%
evento=31 total avaliações 16 - gostaram: 100.00% - não gostaram: 0.00%
evento=32 total avaliações 5 - gostaram: 20.00% - não gostaram: 80.00%
evento=33 total avaliações 16 - gostaram: 37.50% - não gostaram: 62.50%
evento=34 total avaliações 12 - gostaram: 100.00% - não gostaram: 0.00%
evento=35 total avaliações 17 - gostaram: 35.29% - não gostaram: 64.7

In [5]:
df = pd.read_sql_query("SELECT * FROM eventos", db_connection)
df["id"] = df["id"].astype(int)

In [6]:
aprovacao_df = pd.DataFrame(
    [{"id": id, "participantes": sum(aa)} for (id, aa) in able.items()]
)

In [7]:
aprovacao_df.head()

Unnamed: 0,id,participantes
0,22,9
1,23,9
2,24,16
3,25,15
4,26,20


In [8]:
df = pd.merge(df, aprovacao_df, on="id", how="left")

In [9]:
df = df.dropna()

In [10]:
df.head()

Unnamed: 0,endereco,local,data,id_organizador,id_responsavel,nome,id,participantes
0,"Trecho de Sousa, 30\nVila São Rafael\n00468-07...",Bairro,2025-05-21 02:48:37.754458,104,104,Exposição Magni,22,9
1,"Feira Gabriel Camargo, 97\nDistrito Industrial...",Bairro,2024-12-07 12:42:43.880363,102,102,Exposição Non,23,9
2,"Fazenda de Monteiro, 505\nVila Suzana Primeira...",Centro,2025-05-22 21:07:31.651970,105,105,Exposição Quibusdam,24,16
3,Parque de Cavalcante\nVila Novo São Lucas\n790...,Bairro,2025-08-04 15:54:52.466345,103,103,Exposição Debitis,25,15
4,"Trevo Isaac Pereira, 63\nDom Bosco\n96542104 C...",Centro,2025-08-02 07:59:32.488563,105,105,Exposição Deleniti,26,20


In [11]:
df = df[["local", "participantes"]]

In [12]:
df = pd.get_dummies(df, columns=["local"], dtype=int)

In [13]:
df.head()

Unnamed: 0,participantes,local_Bairro,local_Centro
0,9,1,0
1,9,1,0
2,16,0,1
3,15,1,0
4,20,0,1


In [14]:
from sklearn.linear_model import LinearRegression

X = df[["local_Bairro", "local_Centro"]]
y = df["participantes"]
regresao = LinearRegression()

regresao.fit(X=X, y=y)

0,1,2
,fit_intercept,True
,copy_X,True
,tol,1e-06
,n_jobs,
,positive,False


In [15]:
X

Unnamed: 0,local_Bairro,local_Centro
0,1,0
1,1,0
2,0,1
3,1,0
4,0,1
...,...,...
95,1,0
96,0,1
97,1,0
98,0,1


In [16]:
evento = X.iloc[0]

print(evento)

resultado = regresao.predict(evento.values.reshape(1, -1))

local_Bairro    1
local_Centro    0
Name: 0, dtype: int64




In [17]:
float(resultado[0])

11.666666666666668

In [None]:
from pathlib import Path

import joblib
from sklearn.linear_model import LinearRegression

model_filename = Path.cwd().parent / "models" / "prever_evento.joblib"
joblib.dump(regresao, str(model_filename))

print(f"\nModelo salvo com sucesso no arquivo: '{model_filename}'")



Modelo salvo com sucesso no arquivo: '/home/daniel/projects/exposicao-arte-backend/models/prever_evento.joblib'


In [None]:
from sklearn.linear_model import LinearRegression

print(f"\nCarregando o modelo do arquivo: '{model_filename}'...")
loaded_model: LinearRegression = joblib.load(model_filename)
print("Modelo carregado com sucesso!")



Carregando o modelo do arquivo: 'linear_regression_model.joblib'...
Modelo carregado com sucesso!
