# Rozpoznawanie mowy nienawiści #
## przy użyciu metod i narzędzi Big Data ##


<b> Mowa nienawiści</b> - to „wypowiedzi, które szerzą, propagują i usprawiedliwiają nienawiść rasową, ksenofobię, antysemityzm oraz inne formy nietolerancji, podważające bezpieczeństwo demokratyczne, spoistość kulturową i pluralizm".

Mowa nienawiści (ang. hate speech) jest zjawiskiem, które polega na używaniu języka w celu rozbudzenia, rozpowszechniania czy usprawiedliwiania nienawiści i dyskryminacji, jak również przemocy wobec konkretnych osób, grup osób, przedstawicieli mniejszości czy jakiegokolwiek innego podmiotu będącego „na celowniku” danej wypowiedzi. Akceptacja mowy nienawiści w wymiarze społecznym prowadzi do utrwalania się stereotypów, uprzedzeń i powodując mniejszą akceptację przedstawicieli grup ‘hejtowanych’ może także prowadzić do tzw. przestępstw z nienawiści (ang. hate crimes). Mowa nienawiści przyjmuje różne formy i dlatego istnieje trudność w jednoznacznym określeniu czym ona dokładnie jest. Mimo iż żadna z wielu powstałych dotychczas definicji tego zjawiska nie jest powszechnie akceptowana i używana, to dosyć często mowę nienawiści rozumie się zgodnie z definicją Rady Europy.

<b>Przestępstwo z nienawiści — definicja Biura Instytucji Demokratycznych i Praw Człowieka Organizacji Bezpieczeństwa i Współpracy w Europie (ODIHR-OSCE) </b>

Przestępstwem z nienawiści jest każde przestępstwo natury kryminalnej, wymierzone w ludzi i ich mienie, w wyniku którego ofiara lub inny cel przestępstwa, są dobierane ze względu na ich faktyczne bądź domniemane powiązanie, związek, przynależność, członkostwo lub udzielanie wsparcia grupie wyróżnianej na podstawie cech charakterystycznych wspólnych dla jej członków, takich jak faktyczna lub domniemana rasa, narodowość lub pochodzenie etniczne, język, kolor skóry, religia, płeć, wiek, niepełnosprawność fizyczna lub psychiczna, orientacja seksualna lub inne podobne cechy.

Cenzura skrajnuych bądź oryginalny poglądów w interncie nie jest dobra gdyż zakłóca wolność słowa lecz używanie ogromnych serwisów internetowych jak platformy social media do propagowania wypowiedzi na pograniczu z przestępstwem niw powinno mieć miejsca. Z tego powodu wszystkie liczące się platformy używają podobnych algorytmów alby w początkowej fazie zablokować lub usunąć wpis charakteryzujący się powyższymi cechami.

### Plan działania ###
1. Pobranie zbioru danych ✅
2. Oczyszczenie zbioru - wyodrębnienie bezpośrednich zwrotów bez interpunkcji i znaków specjalnych ✅
3. Zbudowanie modelu ✅
- osadzenie słów (ang. word embedding) - przetwarzanie języka naturalnego [Wikipedia](https://en.wikipedia.org/wiki/Word_embedding), [Towards Data Science](https://towardsdatascience.com/introduction-to-word-embeddings-4cf857b12edc)
- zapisanie zdań/słów w postaci liczb (wektorów) - metoda CountVectorizer()  - [Towards Data Science](https://towardsdatascience.com/natural-language-processing-count-vectorization-with-scikit-learn-e7804269bb5e) 
4. Podział danych na treningowe i testowe ✅
5. Uczenie modelu ✅
  - algorytm klasyfikacji 
  - [opcjonalnie] algorytm SGD - stochastic gradiernt descent
6. Testowanie ✅
7. [Opcjonalnie] zbudowanie małej aplikacji webowej aby ktoś mógł sobie sprawdzić czy wypowiedź będzie uznanan za 'hate speech'.

Źródła/inspiracje: \
[artykuł Towards DataScience - najbardziej kompletny](https://towardsdatascience.com/how-to-create-your-own-hate-tweet-detector-704508c34cd0) \
[artykuł 1](https://thecleverprogrammer.com/2021/07/25/hate-speech-detection-with-machine-learning/) \
[artykuł 2](https://thecleverprogrammer.com/2021/07/30/end-to-end-hate-speech-detection-with-python/) \
[dane](https://raw.githubusercontent.com/amankharwal/Website-data/master/twitter.csv)

Algorytm do klasyfikacji:
- Regresja liniowa \

Model regresji logistycznej jest modelem do obliczania prawdopodobieństw między 0 a 1. Komentarze dotyczące mowy nienawiści oznaczymy jako 1, a zwykłe zdania jako 0, nastpnie wyznaczymy współczynniki funkcji logistycznej za pomocą wektorów Tf-idf.

In [2]:
# import bibliotek
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
import nltk
from nltk.stem import WordNetLemmatizer
import re
import numpy as np
from nltk.tokenize import sent_tokenize, word_tokenize
nltk.download('wordnet')
nltk.download('omw-1.4')
nltk.download('stopwords')
stemmer = nltk.SnowballStemmer("english")
from nltk.corpus import stopwords
import string
stopword=set(stopwords.words('english'))
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import SGDClassifier
from sklearn.metrics import accuracy_score, classification_report

[nltk_data] Downloading package wordnet to
[nltk_data]     C:\Users\sztef\AppData\Roaming\nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package omw-1.4 to
[nltk_data]     C:\Users\sztef\AppData\Roaming\nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\sztef\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


1. Pobieramy zbiór danych

In [3]:
url = "https://raw.githubusercontent.com/amankharwal/Website-data/master/twitter.csv"
df =  pd.read_csv(url)

In [4]:
df['tweet']

0        !!! RT @mayasolovely: As a woman you shouldn't...
1        !!!!! RT @mleew17: boy dats cold...tyga dwn ba...
2        !!!!!!! RT @UrKindOfBrand Dawg!!!! RT @80sbaby...
3        !!!!!!!!! RT @C_G_Anderson: @viva_based she lo...
4        !!!!!!!!!!!!! RT @ShenikaRoberts: The shit you...
                               ...                        
24778    you's a muthaf***in lie &#8220;@LifeAsKing: @2...
24779    you've gone and broke the wrong heart baby, an...
24780    young buck wanna eat!!.. dat nigguh like I ain...
24781                youu got wild bitches tellin you lies
24782    ~~Ruffled | Ntac Eileen Dahlia - Beautiful col...
Name: tweet, Length: 24783, dtype: object

Dodajemy nową kolumnę "labels" do naszego zbioru danych jako etykiety, które będą zawierać wartości takie jak:

In [5]:
df["labels"] = df["class"].map({0: "Hate Speech", 
                                    1: "Offensive Language", 
                                    2: "No Hate and Offensive"})

data = df[["tweet", "labels"]]
data

Unnamed: 0,tweet,labels
0,!!! RT @mayasolovely: As a woman you shouldn't...,No Hate and Offensive
1,!!!!! RT @mleew17: boy dats cold...tyga dwn ba...,Offensive Language
2,!!!!!!! RT @UrKindOfBrand Dawg!!!! RT @80sbaby...,Offensive Language
3,!!!!!!!!! RT @C_G_Anderson: @viva_based she lo...,Offensive Language
4,!!!!!!!!!!!!! RT @ShenikaRoberts: The shit you...,Offensive Language
...,...,...
24778,you's a muthaf***in lie &#8220;@LifeAsKing: @2...,Offensive Language
24779,"you've gone and broke the wrong heart baby, an...",No Hate and Offensive
24780,young buck wanna eat!!.. dat nigguh like I ain...,Offensive Language
24781,youu got wild bitches tellin you lies,Offensive Language


2. Oczyszczamy zbiór danych

In [6]:
def clean(text):
    text = str(text).lower()
    text = re.sub("[!@?~_*,:.&#;|,]", "", text)
    text = re.sub('^\s+', '', text)
    text = re.sub('^\t', '', text)
    text = re.sub('[0-9]', '', text)
    text = re.sub('rt ', '', text) # sunięcie symbolu rt (retweet)
    text = [word for word in text.split(' ') if word not in stopword]
    text=" ".join(text)
    text = [stemmer.stem(word) for word in text.split(' ')]
    text=" ".join(text)
    return text

clean_tweets = data["tweet"].apply(clean)
clean_tweets

0        mayasolov woman complain clean hous amp man al...
1        mleew boy dat coldtyga dwn bad cuffin dat hoe ...
2        urkindofbrand dawg sbabylif ever fuck bitch st...
3                      cganderson vivabas look like tranni
4        shenikarobert shit hear might true might faker...
                               ...                        
24778    you muthafin lie lifeask pearl coreyemanuel ri...
24779         gone broke wrong heababi drove redneck crazi
24780    young buck wanna eat dat nigguh like aint fuck...
24781                       youu got wild bitch tellin lie
24782    ruffl  ntac eileen dahlia - beauti color combi...
Name: tweet, Length: 24783, dtype: object

4. Dzielimy dane na treningowe (70%) i testujące (30%)

In [7]:
x = np.array(clean_tweets)
y = np.array(data["labels"])

cv = CountVectorizer()

X = cv.fit_transform(x) #dopasowujemy dane
X

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

5. Trenujemy nasz model uczenia maszynowego do rozpoznawania mowy nienawiści

In [8]:
clf = DecisionTreeClassifier()
clf.fit(X_train,y_train)


In [9]:
y_pred = clf.predict(X_test)
y_pred

array(['Offensive Language', 'Offensive Language', 'Offensive Language',
       ..., 'No Hate and Offensive', 'Offensive Language', 'Hate Speech'],
      dtype=object)

6. Testujemy nasz model

In [10]:
# zestawnienie wyników w ramce danych
results = pd.DataFrame(y_test)
results['y pred'] = y_pred
results

Unnamed: 0,0,y pred
0,Offensive Language,Offensive Language
1,Offensive Language,Offensive Language
2,No Hate and Offensive,Offensive Language
3,Offensive Language,Hate Speech
4,Offensive Language,Offensive Language
...,...,...
7430,Offensive Language,Offensive Language
7431,Offensive Language,Offensive Language
7432,Offensive Language,No Hate and Offensive
7433,Offensive Language,Offensive Language


In [11]:
sample = "I will kill you nigga"
data = cv.transform([sample]).toarray()
print(clf.predict(data))

['Offensive Language']


### Zastosowanie klasyfikatora SGD - stochastic gradient descent ###

In [12]:
clf1 = SGDClassifier()
clf1.fit(X_train,y_train)
y_pred1 = clf1.predict(X_test)
y_pred1

array(['Offensive Language', 'Offensive Language', 'Offensive Language',
       ..., 'No Hate and Offensive', 'Offensive Language',
       'Offensive Language'], dtype='<U21')

In [13]:
results = pd.DataFrame(y_test)
results['y pred tree'] = y_pred
results['y pred SGD'] = y_pred1
results

Unnamed: 0,0,y pred tree,y pred SGD
0,Offensive Language,Offensive Language,Offensive Language
1,Offensive Language,Offensive Language,Offensive Language
2,No Hate and Offensive,Offensive Language,Offensive Language
3,Offensive Language,Hate Speech,Offensive Language
4,Offensive Language,Offensive Language,Offensive Language
...,...,...,...
7430,Offensive Language,Offensive Language,Offensive Language
7431,Offensive Language,Offensive Language,Offensive Language
7432,Offensive Language,No Hate and Offensive,No Hate and Offensive
7433,Offensive Language,Offensive Language,Offensive Language


In [14]:
accu_tree = accuracy_score(y_test, y_pred)
accu_sgd = accuracy_score(y_test, y_pred1)
print("accuracy of Decision Tree Classifier: ", round(accu_tree * 100, 2),"%")
print("accuracy of Stohastic Gradient Descent: ", round(accu_sgd * 100, 2),"%")

accuracy of Decision Tree Classifier:  87.16 %
accuracy of Stohastic Gradient Descent:  89.41 %


In [15]:
cr = classification_report(y_test, y_pred)
cr1 = classification_report(y_test, y_pred1)
print(cr)
print(cr1)

                       precision    recall  f1-score   support

          Hate Speech       0.36      0.40      0.38       427
No Hate and Offensive       0.81      0.82      0.82      1261
   Offensive Language       0.93      0.92      0.92      5747

             accuracy                           0.87      7435
            macro avg       0.70      0.71      0.70      7435
         weighted avg       0.88      0.87      0.87      7435

                       precision    recall  f1-score   support

          Hate Speech       0.43      0.23      0.30       427
No Hate and Offensive       0.82      0.88      0.85      1261
   Offensive Language       0.93      0.95      0.94      5747

             accuracy                           0.89      7435
            macro avg       0.73      0.69      0.70      7435
         weighted avg       0.88      0.89      0.89      7435



In [16]:
import pickle

In [16]:
pickle.dump(clf1, open('model.pkl','wb'))

In [19]:
pickle.dump(cv, open('cv.pkl', 'wb'))

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=249ee95b-a831-4e4f-8154-f40a957b292c' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>