Skip to content

itsabdessalam/web-parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web Parser titre projet

Petit programme permettant de parser le code html d'une Page

screen projet

Objectif

Utiliser les notions vues en cours, à savoir : les fonctions, les collections, streams,...

Instructions

  1. Récuperer le code html d'une page à partir de son url dans un fichier .txt
  2. Passer le fichier en lecture et renommez la page ainsi que la src des images
  3. Mettre tous les textes en gras
  4. Supprimer tous les scripts javascript
  5. Faire une recherche dans le texte du mot qui a le plus d'occurences

Execution du programme

Ce projet a été réalisé sur Archlinux en utilisant Visual Studio Code

Linux

Si vous êtes sous Linux vérifiez que vous avez ces paquets installés

  • dotnet-host
  • dotnet-runtime-2.0
  • dotnet-sdk-2.0

Ensuite deplacez vous dans le dossier contenant le projet et lancez la commande :

dotnet run

Windows

Si vous êtes sous Windows ouvrez le dossier avec Visual Studio

L'ensemble des fichiers crées sera sur le Bureau

Améliorations

Utilser HtmlAgilityPack pour plus de fonctionnalités

Auteur

Abdessalam BENHARIRA

Releases

No releases published

Packages

No packages published

Languages