Skip to content

jakubkorczakowski/twitter-gender-prediction-project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Przewidywanie płci użytkowników serwisu Twitter

Główny notebook projeku: Projektv4

Opis projektu

Zbiór danych

Zbiór danych, który będziemy analizować zawiera dane dotyczące użytkowników serwisu Twitter. Opisane są m. in. opis profilu, tekst tweetu oraz kolory profilu użytkownika.

Cel projektu

Celem projektu jest przewidywanie płci użytkownika na podstawie informacji dostępnych na jego profilu w serwisie Twitter.

Etapy projektu

Eksploracyjna analiza danych

  • sprawdzenie zależności między posiadanymi danymi,
  • zbadanie ich zakresów i stopnia zmienności,
  • analiza stopnia wypełnienia danych,
  • przetwarzanie języka naturalnego,
  • wizualizacja.

Opracowanie modelu

  • opracowanie modelu klasyfikacji,
  • dobór cech,
  • wyciągnięcie wniosków z zależności.

Wykorzystywane modele:

  • Multinomial Naive Bayesian Classifier,
  • KNeighbors Classifier,
  • Random Forest Classifier.