# 키워드 분석

In [25]:
import pandas as pd
import re

# ✅ 텍스트 정제 함수 (감정 표현 제거 포함)
def clean_text(text):
    if pd.isna(text):
        return ''
    text = str(text)
    text = re.sub(r'\n', ' ', text)                # 줄바꿈 제거
    text = re.sub(r'\|\|', ' ', text)              # 댓글 구분자 제거
    text = re.sub(r'[ㅠㅜㅋㅍㅎ]+', '', text)         # 감정 표현 제거 (ex: ㅠㅠ, ㅜㅜ, ㅋㅋ, ㅎㅎ)
    text = re.sub(r'[^\w\s가-힣]', '', text)        # 특수문자 제거 (한글, 영문, 숫자만 유지)
    text = re.sub(r'\s+', ' ', text)               # 중복 공백 제거
    return text.strip()

# ✅ 날짜 변환 함수 (datetime 변환 후 시:분:초 제거)
def convert_datetime(date_str):
    try:
        return pd.to_datetime(date_str, format='%Y.%m.%d. %H:%M', errors='coerce').date()
    except:
        return pd.NaT

# ✅ CSV 불러오기
file_path = "./data/8.전세계약QnA.csv"  # ← 파일 경로 필요 시 수정
df = pd.read_csv(file_path)

# ✅ 텍스트 컬럼 정제 (기존 컬럼에 덮어쓰기)
for col in ['제목', '본문', '댓글']:
    df[col] = df[col].apply(clean_text)

# ✅ 날짜 컬럼 정제 (datetime 변환 후 시:분:초 제거)
df['날짜'] = df['날짜'].apply(convert_datetime)

# ✅ 결과 확인
print(df[['제목', '본문', '댓글', '날짜']].head())

                                       제목  \
0          전세 만기 날 보증금 미반환 새집 전입신고 문제 입니다   
1                        곧 이사인데 궁금한게 생겨서요   
2  계약금과 실제 보증금이 달라서 보증보험 가입이 안 된대요 어떻게 해야   
3                          해외거주 임대인과 전세계약   
4             전세 보증금 미반환 시 계약 기간 자동 연장인가요   

                                                  본문  \
0  기존에 거주중인 집 만기 날과 새 집 입주일이 6월 20일로 같습니다 하지만 기존 ...   
1  허그대출 받아서 이사예정인데요 보통 대출오전중에 집주인한테 들어간다하더라구요 나머지...   
2  안녕하세요 계약서에 적힌 금액5억 7천이랑 실제 보증금5억 5천 이 달라서 전세보증...   
3  가계약금 넣고 목요일 계약서 작성 예정인데 임대인이 해외 거주하여 아내분이 대신 온...   
4  매매가 안되서 보증금 줄 돈이 없다고 해요 만기일 까지 보증금을 못 돌려 받으면 2...   

                                                  댓글          날짜  
0  안녕하세요 이건 정말 고민되는 상황입니다 결론부터 말씀드리면 보증금을 지키려면 기존...  2025-06-17  
1  제경험으론 잔금치르면서 or 이사들어가는 시간에 전화해서 비번알려달라고 했던것같네요...  2025-06-16  
2  몹쓸 사람들 중개인도 그걸 돈을 다 받아먹고 앉아있네요 보증보험 계약기간 12 기간...  2025-06-16  
3  허그에다 물어보심이 빠를 것 같습니다 1 전입신고는 가능합니다 2 주민등록 주소는 ...  2025-06-15  
4  1 계약기간 만료 2개월 잔까지 계약해지의 통지기 임대인에게 도달되지 아니하면 계약...  202

In [26]:
df

Unnamed: 0,제목,닉네임,날짜,본문,댓글
0,전세 만기 날 보증금 미반환 새집 전입신고 문제 입니다,인천l젠시수,2025-06-17,기존에 거주중인 집 만기 날과 새 집 입주일이 6월 20일로 같습니다 하지만 기존 ...,안녕하세요 이건 정말 고민되는 상황입니다 결론부터 말씀드리면 보증금을 지키려면 기존...
1,곧 이사인데 궁금한게 생겨서요,내돈돌려줘00,2025-06-16,허그대출 받아서 이사예정인데요 보통 대출오전중에 집주인한테 들어간다하더라구요 나머지...,제경험으론 잔금치르면서 or 이사들어가는 시간에 전화해서 비번알려달라고 했던것같네요...
2,계약금과 실제 보증금이 달라서 보증보험 가입이 안 된대요 어떻게 해야,소망이룸,2025-06-16,안녕하세요 계약서에 적힌 금액5억 7천이랑 실제 보증금5억 5천 이 달라서 전세보증...,몹쓸 사람들 중개인도 그걸 돈을 다 받아먹고 앉아있네요 보증보험 계약기간 12 기간...
3,해외거주 임대인과 전세계약,공차차차,2025-06-15,가계약금 넣고 목요일 계약서 작성 예정인데 임대인이 해외 거주하여 아내분이 대신 온...,허그에다 물어보심이 빠를 것 같습니다 1 전입신고는 가능합니다 2 주민등록 주소는 ...
4,전세 보증금 미반환 시 계약 기간 자동 연장인가요,모든것에감사3,2025-06-15,매매가 안되서 보증금 줄 돈이 없다고 해요 만기일 까지 보증금을 못 돌려 받으면 2...,1 계약기간 만료 2개월 잔까지 계약해지의 통지기 임대인에게 도달되지 아니하면 계약...
...,...,...,...,...,...
1045,내용증명보내는거요,쭌민다건,2023-01-09,3월 15일 만기이고 집주인이 당장은 돈이없다 그래서 매매로 내놨다 라고 하시는데 ...,만기일 2개월 전까지 계약 해지 통보가 도달해야해서 상당히 촉박한데 집주인 기분 나...
1046,중도해지 신청할까 하는데 그래도 문자로 기록 남겨야 할까요,달자매,2023-01-09,집주인이랑은 연락 되는 상태이고 중도해합의서 작성 요청 드릴 예정인데 그래도 만기 ...,중도해지요청 저도할까하는데 어땋게 되셨어요 저는 혹시 몰라서 중도해지합의서 쓰는 날...
1047,묵시적 갱신대출연장 시 임대인에게 연락 해봐야할까요,에이엠투피엠,2023-01-09,전세 최초 2년 계약 후 만료되기 1개월 전인 시점인데요 아직 임대인 임차인 상호 ...,문자남기시는게 좋을것같아요 임대인께 연락드렸어요 감사합니다
1048,2년 다 채우고 나가야하나요,엔젤이얌,2023-01-08,1201652520185242년22000만원전세권설정 2201852520205242...,1 연혁 34번에서 이미 묵시적 갱신된 계약입니다 4번에서 계약 조건을 언급한 것은...


In [18]:
output_path = "회생파산_전처리_완료.csv"  # 저장 파일명 변경 가능
df.to_csv(output_path, index=False, encoding='utf-8-sig')
print(f"✅ 저장 완료: {output_path}")

✅ 저장 완료: 회생파산_전처리_완료.csv


# 감성분석

In [21]:
import pandas as pd
import re

# ✅ 감성 분석용 텍스트 정제 함수
def clean_text_for_sentiment(text):
    if pd.isna(text):
        return ''
    text = str(text)
    text = text.replace('||', '[SEP]')               # 댓글 구분자 유지
    text = re.sub(r'\n', ' ', text)                  # 줄바꿈 제거
    text = re.sub(r'[“”‘’]', '', text)               # 비표준 따옴표 제거
    # ✅ 감정 표현 및 강조 구두점은 살림: ㅠㅠ, ㅋㅋ, !!, ??, [SEP]
    text = re.sub(r'[^\w\s가-힣.,!?ㅠㅜㅋㅎ\[\]SEP]+', '', text)
    text = re.sub(r'\s+', ' ', text)                 # 중복 공백 제거
    return text.strip()

# ✅ 날짜 변환 함수 (시:분:초 제거 포함)
def convert_datetime(date_str):
    try:
        return pd.to_datetime(date_str, format='%Y.%m.%d. %H:%M', errors='coerce').date()
    except:
        return pd.NaT

# ✅ CSV 불러오기
file_path = "./data/4. 회생파산문의.csv"  # ← 파일 경로 수정 필요
df = pd.read_csv(file_path)

# ✅ 텍스트 컬럼 전처리 (덮어쓰기)
for col in ['제목', '본문', '댓글']:
    df[col] = df[col].apply(clean_text_for_sentiment)

# ✅ 날짜 컬럼 전처리 (datetime 변환 후 시:분:초 제거)
df['날짜'] = df['날짜'].apply(convert_datetime)

# ✅ 결과 확인
print(df[['제목', '본문', '댓글', '날짜']].head())

                                            제목  \
0                     진짜 다들 하루에도 몇십명씩 가입하네요 ㅠㅠ   
1                       전세사기당했어요. 전세대출 파산가능할까요   
2                        공시지가하락으로 재연장이 어렵다고합니다   
3                                   고견 부탁드립니다.   
4  신림동 원룸전세 알아보는데, 대부분 보증보험 가입이 안된다는데 왜 그런걸까요?   

                                                  본문  \
0  현실인가봐요.. 진짜 전세 들어온게 죄인건지 이제 우후죽순으로 보증금 미반환해서 경...   
1  제작년. 사기를당했습니다 2억가까이 전세사기인데 집주인이 계약금 대출금만 먹고 잠적...   
2  안녕하세요 답답한마음에 글 올립니다 2023년 3월24일에 2억7천에 전세계약을했구...   
3  안녕하세요 만기 18일 전에 은행의 대출 연장 거절로 임대인에게 퇴거를 해야할것같다...   
4                                              궁금하네요   

                                                  댓글          날짜  
0  지금 은행에서 다가구나 빌라쩍으로 전세대출 안해주다보니 더 심할거에요 [SEP] 그...  2025-06-13  
1  와 진짜 썩을놈이네요 [SEP] ㅠㅠ갈기갈기찢어버리고싶어요 [SEP] 파산하면 안되...  2025-06-12  
2  안녕하세요 카페 공식 제휴 업체 지름길 법무법인입니다. 만일 궁금한 사항이 있다면 ...  2025-06-09  
3  제가 알기론 묵시적갱신이라고 해도 2년을 살 수있고 이기간내에라도 임차인은 언제든지...  2025-06-06  
4  일단 다가구는 보증보험 가입이 안될거고 요즘

In [22]:
df

Unnamed: 0,제목,닉네임,날짜,본문,댓글
0,진짜 다들 하루에도 몇십명씩 가입하네요 ㅠㅠ,낫2,2025-06-13,현실인가봐요.. 진짜 전세 들어온게 죄인건지 이제 우후죽순으로 보증금 미반환해서 경...,지금 은행에서 다가구나 빌라쩍으로 전세대출 안해주다보니 더 심할거에요 [SEP] 그...
1,전세사기당했어요. 전세대출 파산가능할까요,안녕333,2025-06-12,제작년. 사기를당했습니다 2억가까이 전세사기인데 집주인이 계약금 대출금만 먹고 잠적...,와 진짜 썩을놈이네요 [SEP] ㅠㅠ갈기갈기찢어버리고싶어요 [SEP] 파산하면 안되...
2,공시지가하락으로 재연장이 어렵다고합니다,Yk,2025-06-09,안녕하세요 답답한마음에 글 올립니다 2023년 3월24일에 2억7천에 전세계약을했구...,안녕하세요 카페 공식 제휴 업체 지름길 법무법인입니다. 만일 궁금한 사항이 있다면 ...
3,고견 부탁드립니다.,이건아니지,2025-06-06,안녕하세요 만기 18일 전에 은행의 대출 연장 거절로 임대인에게 퇴거를 해야할것같다...,제가 알기론 묵시적갱신이라고 해도 2년을 살 수있고 이기간내에라도 임차인은 언제든지...
4,"신림동 원룸전세 알아보는데, 대부분 보증보험 가입이 안된다는데 왜 그런걸까요?",서울유과,2025-06-01,궁금하네요,일단 다가구는 보증보험 가입이 안될거고 요즘따라 전세사기가 많아서 그런 매물 씨가 ...
...,...,...,...,...,...
93,전세집에 가압류가 들어왔습니다,애덩123,2024-07-02,전세 오피스텔 1.7억에 살고있는데 두달후 만료입니다 허그 보증보험 들었구요 계약3...,감사합니다 [SEP] 애덩님에 전입신고 후 잡힌 가압류 등등은 애덩님이 상관 안하셔...
94,도와주시면 정말 감사하겠습니다 ㅠㅠ,허승범범,2024-07-01,1. 저는 올해 2월에 전세로 들어왔고 청년버팀목대출을 받은 상태입니다. 전세 1억...,별문제는 없을것같습니다. [SEP] 정말 감사합니다 ㅠㅠ [SEP] 안녕하세요. 전...
95,전세사기피해자인데... 도와주세요,고양이냥냥펀치,2024-06-27,안녕하세요 혼자 알아보다가 머리 아프고 막막해서 여기 여쭤봅니다 제가 회사 근처 2...,안녕하세요. 전세 세입자 모임 카페 공식 제휴 업체 지름길 법무법인입니다. 개인회생...
96,보증보험 안들었는데 전세사기...어떡해요 개인회생 해야 할까요?,닥지롱이77,2024-06-27,결혼 앞두고 이게 무슨 날벼락인지 모르겠습니다 신용대출까지 껴서 얻은 전세 건물인데...,"확정일자, 전입신고가 가압류 및 압류보다 더 느린상태 인가요??? [SEP] 개인회..."


In [23]:
output_path = "./data/회생파산_감성분석용전처리.csv"
df.to_csv(output_path, index=False, encoding='utf-8-sig')
print(f"✅ 저장 완료: {output_path}")

✅ 저장 완료: ./data/회생파산_감성분석용전처리.csv
