Skip to content

AnodeGrindYo/OC_IA_P07

Repository files navigation

Projet 7: Détection des Bad Buzz grâce au Deep Learning

Objectif

L'objectif de ce projet est de développer un prototype d'un produit d'Intelligence Artificielle qui permet de prédire le sentiment associé à un tweet. Le modèle doit être capable de déterminer si le tweet est positif ou négatif et s'il est susceptible de provoquer un buzz potentiellement nuisible à la réputation de la société Air Paradis. Le projet vise également à réaliser les trois approches suivantes:

  1. Modèle sur mesure simple: un modèle classique de classification binaire
  2. Modèle sur mesure avancé: développer un modèle basé sur des réseaux de neurones profonds avec une couche d'embedding et essayer au moins deux word embeddings différents
  3. Modèle avancé BERT Finalement, la solution la plus performante sera déployée via une API. Le service recevra un tweet en entrée et retournera le sentiment associé prédit par le modèle.

Données

Les données utilisées pour ce projet sont des tweets Open source.

Technologies

Le projet utilise les technologies suivantes:

  • Pandas
  • Numpy
  • Seaborn
  • Matplotlib
  • Scikit-learn
  • Tensorflow
  • Keras
  • FAST API
  • AWS EC2
  • uvicorn
  • NLP
  • BERT
  • Word2Vec
  • GloVe
  • Deep Learning
  • Neural Networks
  • nginx

Compétences évaluées

Ce projet permet d'évaluer les compétences suivantes:

Choix de la méthode de plongement de mots pertinente pour un modèle de Deep Learning Conception et déploiement continu d'un moteur d’inférence dans le Cloud Évaluation de la performance d’un modèle de Deep Learning sur des données textuelles Réalisation d'une présentation orale d’une démarche de modélisation Rédaction d'une note méthodologique pour communiquer sa démarche de modélisation Définition et mise en œuvre d'un pipeline d’entraînement des modèles Entraînement d'un modèle Deep Learning sur des données textuelles Mise en œuvre d'un logiciel de version de code Sélection des méthodes de prétraitement du texte pour un modèle de Deep Learning

Mots clés

#machineLearning, #AzureMachineLearning, #AzureCognitiveServices, #MicrosoftAzure, #AWS, #deepLearning, #naturalLanguageProcessing, #NLP, #stemming, #lemmatization, #wordEmbeddings, #matrixEmbedding, #word2vec, #glove, #padding, #wordclouds, #tensorFlow, #keras, #fastAPI, #confusionMatrix, #accuracy, #precision, #recall, #f1Score, #AUC, #logisticRegression, #featureHashing, #nGramFeatureExtraction, #frequencyScore, #TF-IDF, #recurrentNeuralNetwork, #bidirectionalNeuralNetwork, #LSTM, #GPU, #prototype, #exploratoryDatanalysis, #dataScience, #artificialIntelligence, #bigdata, #digitalMarketing, #consulting, #tweets.

About

Détectez les Bad Buzz grâce au Deep Learning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages