In [1]:
import pandas as pd
import torch
from transformers import ElectraTokenizer, ElectraForSequenceClassification

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Load pre-trained ELECTRA model and tokenizer for sentiment analysis
tokenizer = ElectraTokenizer.from_pretrained('monologg/koelectra-base-v3-discriminator')
model = ElectraForSequenceClassification.from_pretrained('monologg/koelectra-base-v3-discriminator')

# Ensure the model is in evaluation mode
model.eval()

# Define a function to perform sentiment analysis
def analyze_sentiment_electra(text):
    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
    with torch.no_grad():
        outputs = model(**inputs)
    logits = outputs.logits
    sentiment = torch.softmax(logits, dim=-1).numpy()
    positive_score = sentiment[0][1]
    return positive_score



Some weights of ElectraForSequenceClassification were not initialized from the model checkpoint at monologg/koelectra-base-v3-discriminator and are newly initialized: ['classifier.dense.bias', 'classifier.dense.weight', 'classifier.out_proj.bias', 'classifier.out_proj.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


In [3]:
# Load the CSV file
file_path_csv = './youtube_channel_comments_cleaneddata.csv'
data_csv = pd.read_csv(file_path_csv)
# 
data_csv.head()

Unnamed: 0,channelId,channelTitle,channelPublishedAt,subscriberCount,videoId,videoTitle,videoAuthorId,videoPublishedAt,viewCount,likeCount,dislikeCount,commentId,commentAuthor,authorId,commentText,commentLikeCount,commentPublishedAt,parentCommentId
0,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgyHIKXYAWXA29XlJoB4AaABAg,@asd236678able,UCn4W1SwEDohMgiWRQM2PQzQ,영상 보나 까 함량이 다 다른데 어느 정도 먹는 게 좋을까요 그리고 베르 베린이 흡...,0,2024-05-31 22:55:20+00:00,
1,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgzKPXBso10Qu8atexx4AaABAg,@asd236678able,UCn4W1SwEDohMgiWRQM2PQzQ,베르베린 추천보고 먹고 있는데 식곤증 사라지고 체지방 감소 효과가 있씁니 다 감사감사,0,2024-05-31 22:52:07+00:00,
2,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgzRawgWkL7l2_dfUYp4AaABAg,@user-kt4kx7nl6g,UCD-WkP7GpgPzB-CvvhsmROA,저는 심방세동 부정맥약 복용 중인데 같이 먹어도 될까요 고맙습니다,0,2024-05-31 22:44:07+00:00,
3,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,Ugzc0BFkbdSHrs8OTIt4AaABAg,@user-kt4kx7nl6g,UCD-WkP7GpgPzB-CvvhsmROA,약사님 답글 주시면 정말 감사하겠습니다 심근경색 약 먹고 있는 남편이 당뇨가 걱정인...,0,2024-05-31 22:37:16+00:00,
4,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgxHA5mR-FxDzrgDpqd4AaABAg,@icto.,UC1sviI9Yhzo5tDrLM7tcGTw,베르베린 600mg 랑 비타민C 3000mg 같이 먹어도 될까요 간이나 신장에 무리...,0,2024-05-31 22:22:13+00:00,


In [4]:
# Fill missing commentText with empty string and perform sentiment analysis
data_csv['commentText'] = data_csv['commentText'].fillna('')
data_csv.describe()


Unnamed: 0,subscriberCount,viewCount,likeCount,dislikeCount,commentLikeCount
count,27236.0,27236.0,27236.0,27236.0,27236.0
mean,1275576.0,214426.6,4304.707005,0.0,1.879865
std,706422.5,257858.8,4810.388066,0.0,14.813501
min,5700.0,115.0,0.0,0.0,0.0
25%,454000.0,49063.0,1466.0,0.0,0.0
50%,1780000.0,100892.0,2653.0,0.0,0.0
75%,1780000.0,263184.0,5793.0,0.0,1.0
max,1780000.0,1182732.0,35875.0,0.0,1609.0


In [5]:
# Apply sentiment analysis to each comment and reply
data_csv['sentiment_electra'] = data_csv['commentText'].apply(analyze_sentiment_electra)
# 결과데이터 요약 보기
data_csv.head()


Unnamed: 0,channelId,channelTitle,channelPublishedAt,subscriberCount,videoId,videoTitle,videoAuthorId,videoPublishedAt,viewCount,likeCount,dislikeCount,commentId,commentAuthor,authorId,commentText,commentLikeCount,commentPublishedAt,parentCommentId,sentiment_electra
0,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgyHIKXYAWXA29XlJoB4AaABAg,@asd236678able,UCn4W1SwEDohMgiWRQM2PQzQ,영상 보나 까 함량이 다 다른데 어느 정도 먹는 게 좋을까요 그리고 베르 베린이 흡...,0,2024-05-31 22:55:20+00:00,,0.480674
1,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgzKPXBso10Qu8atexx4AaABAg,@asd236678able,UCn4W1SwEDohMgiWRQM2PQzQ,베르베린 추천보고 먹고 있는데 식곤증 사라지고 체지방 감소 효과가 있씁니 다 감사감사,0,2024-05-31 22:52:07+00:00,,0.482281
2,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgzRawgWkL7l2_dfUYp4AaABAg,@user-kt4kx7nl6g,UCD-WkP7GpgPzB-CvvhsmROA,저는 심방세동 부정맥약 복용 중인데 같이 먹어도 될까요 고맙습니다,0,2024-05-31 22:44:07+00:00,,0.497698
3,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,Ugzc0BFkbdSHrs8OTIt4AaABAg,@user-kt4kx7nl6g,UCD-WkP7GpgPzB-CvvhsmROA,약사님 답글 주시면 정말 감사하겠습니다 심근경색 약 먹고 있는 남편이 당뇨가 걱정인...,0,2024-05-31 22:37:16+00:00,,0.491237
4,UCMFk5S7g5DY-CZNVh_Kyz_A,약사가 들려주는 약 이야기,2017-03-02 02:28:38+00:00,1780000,RAO61ojyDDc,혈당을 뚝 떨어뜨리고 당뇨병을 예방 하는 가성비 좋은 베르베린부터 최고 품질의 베르...,UCMFk5S7g5DY-CZNVh_Kyz_A,2024-05-31 10:00:18+00:00,18637,1110,0,UgxHA5mR-FxDzrgDpqd4AaABAg,@icto.,UC1sviI9Yhzo5tDrLM7tcGTw,베르베린 600mg 랑 비타민C 3000mg 같이 먹어도 될까요 간이나 신장에 무리...,0,2024-05-31 22:22:13+00:00,,0.487875


In [12]:
# 주요 컬럼 데이터 보기
# print(data_csv[['channelTitle','subscriberCount','videoTitle','commentText','sentiment_electra']])
print(data_csv[['commentText','sentiment_electra']][50:])


                                             commentText  sentiment_electra
50      궁금해서 여쭤봅니다만 3시간 전 영상을 보고 구해 드셨는데 벌써 아주 효과를 보셨다고요           0.498119
51                                        도움이 되셨다니 다행입니다           0.513314
52     us erju 7nl 7gl2y 3주 전인 가 당뇨에 좋은 베르베린 소개시swans...           0.489290
53     yakstory 119 natural factor는 좀비싸서 swanson 제품 샀...           0.499803
54     매번 검 강검진 시 피검사하면 공복 혈당이 100104 사이를 왔다 갔다 하면서 정...           0.487142
...                                                  ...                ...
27231                                              감사합니다           0.496060
27232                                      바나나 먹어도 살 찌네요           0.502684
27233                                                  네           0.498961
27234                                 이지님 다이어트 영상을 잘 볼게요           0.484700
27235                                         봐주셔서 감사드려요           0.517644

[27186 rows x 2 columns]
