# HuggingfaceのBERTモデルを利用した感情分析

### 必要なモジュールのインストール
pytorchとtransformaers[ja]をインストールします。

In [None]:
!pip install torch torchvision
!pip install transformers[ja]

In [3]:
from transformers import pipeline, AutoModelForSequenceClassification, BertJapaneseTokenizer

### 日本語文章の感情分析

BERTの日本語モデルを利用します。事前学習済(pretrained)のBERTモデルをロードします。

"sentiment-analysis"は"text-classification" の別名で、pipelineとして、"TextClassificationPipeline"を返します。

https://huggingface.co/docs/transformers/main_classes/pipelines

In [12]:
bert_model_ja = AutoModelForSequenceClassification.from_pretrained('daigo/bert-base-japanese-sentiment') 
tokenizer_ja = BertJapaneseTokenizer.from_pretrained('cl-tohoku/bert-base-japanese-whole-word-masking')
analyzer_ja = pipeline("sentiment-analysis",model=bert_model_ja,tokenizer=tokenizer_ja)

In [10]:
print(analyzer_ja("今日のセミナーは楽しい"))
print(analyzer_ja("先生がいなくて悲しい"))

[{'label': 'ポジティブ', 'score': 0.9800318479537964}]
[{'label': 'ネガティブ', 'score': 0.9910997748374939}]


### 英文の感情分析

In [13]:
bert_model_en = "finiteautomata/bertweet-base-sentiment-analysis"
analyzer_en = pipeline(model=bert_model_en)

Downloading:   0%|          | 0.00/0.99k [00:00<?, ?B/s]

emoji is not installed, thus not converting emoticons or emojis into text. Please install emoji: pip3 install emoji


In [14]:
print(analyzer_en("Today's seminar is fun."))
print(analyzer_en("I am sad since the teacher is not here."))

[{'label': 'POS', 'score': 0.988452136516571}]
[{'label': 'NEG', 'score': 0.9774743914604187}]
