In [12]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import Ridge
import io

# 1. 학습 데이터 재정의 (사용자 레이블 및 피드백)
user_labels_data = """
❄ 에어컨을 26도로 설정하고 필요한 시간에만 켠다.,1
💡 집 안의 모든 조명을 형광등으로 유지한다.,-1
🧺 세탁물을 모아서 세탁기를 주 2~3회만 돌린다.,1
🔌 전기밥솥 보온 기능을 하루 종일 켜둔다.,-1
🔌 사용하지 않는 전자제품의 플러그를 뽑아둔다.,1
🥘 음식물 찌꺼기를 물로 씻어 하수구에 흘려보낸다.,-1
💧 세제를 사용한 걸레를 흐르는 물로 오래 헹군다.,-1
💧 기름 묻은 후라이팬을 키친타월로 닦은 후 설거지한다.,1
🗑 화장실에 물티슈나 기저귀를 버린다.,-1
💧 남은 약이나 폐기물을 약국 또는 지정 수거함에 버린다.,1
🛢 요리 중 냄비 뚜껑을 덮고 조리한다.,1
🔥 겨울철 보일러를 하루 종일 틀어놓고 외출한다.,-1
"""

# 데이터프레임 생성
user_df = pd.read_csv(io.StringIO(user_labels_data), header=None, names=["description", "score"])

# 학습 데이터 결합 후, NaN 값 제거
updated_train_data = updated_train_data.dropna(subset=["user_score"])

# 2. TF-IDF 벡터화 및 Ridge 회귀 모델 재학습
vectorizer = TfidfVectorizer()
X_train = vectorizer.fit_transform(updated_train_data["description"])
y_train = updated_train_data["user_score"].astype(float)

reg_model = Ridge()
reg_model.fit(X_train, y_train)

# 3. CSV 파일 불러오기 및 모델 예측
# 파일 경로는 필요에 따라 수정해주세요.
df_reloaded = pd.read_csv("./bulkdata/final_descriptions_with_scores.csv")

# description 칼럼 기반 예측 수행
X_all = vectorizer.transform(df_reloaded["description"])
reg_predictions = reg_model.predict(X_all)

# 이진 긍/부정 판단: 0보다 크면 1(긍정), 그렇지 않으면 -1(부정)
df_reloaded["PN"] = [1 if score > 0 else -1 for score in reg_predictions]

# 결과 미리 보기
print(df_reloaded.head(100))


                            description  score  PN
0         ❄ 에어컨을 26도로 설정하고 필요한 시간에만 켠다.   0.50   1
1             💡 집 안의 모든 조명을 형광등으로 유지한다.  -0.66  -1
2          🧺 세탁물을 모아서 세탁기를 주 2~3회만 돌린다.   0.67   1
3              🔌 전기밥솥 보온 기능을 하루 종일 켜둔다.  -0.70  -1
4            🔌 사용하지 않는 전자제품의 플러그를 뽑아둔다.   0.50   1
5          🥘 음식물 찌꺼기를 물로 씻어 하수구에 흘려보낸다.  -0.53  -1
6          💧 세제를 사용한 걸레를 흐르는 물로 오래 헹군다.  -0.53  -1
7       💧 기름 묻은 후라이팬을 키친타월로 닦은 후 설거지한다.   0.50   1
8                 🗑 화장실에 물티슈나 기저귀를 버린다.  -0.46  -1
9      💧 남은 약이나 폐기물을 약국 또는 지정 수거함에 버린다.   0.47   1
10               🛢 요리 중 냄비 뚜껑을 덮고 조리한다.   0.50   1
11          🔥 겨울철 보일러를 하루 종일 틀어놓고 외출한다.  -0.57  -1
12     🔥 보일러 온도는 낮추고, 온수는 필요한 만큼만 사용한다.   0.21   1
13         🛢 가스레인지에 불꽃이 냄비 바깥으로 퍼지게 켠다.   0.31   1
14  🛢 가스 누출 점검을 정기적으로 하고, 오래된 호스를 교체한다.   0.01   1
15         🧺 세탁물을 모아서 세탁기를 주 2~3회만 돌린다.   0.67   1
16            💡 집 안의 모든 조명을 형광등으로 유지한다.  -0.66  -1
17                        🧺 매일 세탁기를 돌린다   0.43   1
18             🔌 전기밥솥 보온 기능을 하루