SmartReader is a news aggregator that learns what subjects you are interested in.
- Les principaux médias proposent des flux RSS:
RSS = + de l'article + un vers le site concerné- Pas besoin de scrapping
- On peut se baser sur la pour extrarire "les thèmes" de l'article
- Dans un premier temps, on renvoie l'utilisateur vers le site
- Parsing de l'article
- Plusieurs algos permettent d'extraire text + meta data
- Extraction de caractéristique:
- Identifier un "pattern" d'utilisation récurrente de mots
- Taguer les articles
- Utilisation du NLP
- Attribuer des scores à chaque article (thème, style de rédaction, longueur de l'article ... à identifier)
- Déterminer les préférences de l'utilisateur en étudiant son utilisation
- Trouver des méthodes pour évaluer les poids à associer aux scores
- Programmer une application Android
- Interface à étudier plus tard
- Utiliser la Google Cloud Platform / App Engine pour les serveurs
- Algorithme de classification des articles
- Algorithme de recommendation
- Création de la base des données d'articles
- Partie serveur
- Développement de l'application Android
Project based on the cookiecutter data science project template. #cookiecutterdatascience