Queryer

Queryer est un outil de web crawling écrit en Python qui vous permet d'accélérer vos recherches sur le web. Il utilise principalement le module Selenium et les techniques de web scraping pour vous permettre de lancer la même recherche sur plusieurs moteurs de recherche à la fois et de vous fournir une sortie formattée selon votre choix. Il offre aussi l'extraction d'addresse mail et de numéro de téléphone depuis différents site web.

Fonctionnalités

Support de multiples moteurs de recherches (Google, Mojeek, Bing, Qwant)
Extraction d'addresses mail et de numéro de télephone
Choix de la profondeur des recherches
Quotation des résultats obtenus
Suppression des résultasts jugées inutiles
Choix d.u.es moteurs à utiliser

Commandes

Le fichier d'exécution du programme est le fichier start.py qui founi les commandes search et extract pour l'utilisation du crawler. search ou extract représente la commande à exécuter.

search

search permet de lancer une recherche sur un mot clé. Les options disponibles sont:

Option	Diminutif	Valeur	Défaut	Commentaire
--search	-S	Expression à recherche	Hello, world	C'est l'expression que vous auriez saisi dans la barre de recherche dans un moteur conventielle
--engines	-e	Moteurs de recherches à utiliser	01234	C'est une combinaison de valeur entre 0 et 4 pour exprimer le.s moteurs pour la recherche.
--deep	-d	Profondeur de la recherche	3	C'est un entier qui défini combien de page seront parcouru pour chaque moteur
--output	-o	Fichier de sortie	<slug-de-la-recherche.csv>	Fichier de redirection des résultats. Les formats CSV et JSON sont supportés.
--browser	-b	Navigateur web à utilser	chrome	Une valeur de l'ensemblre {chrome, firefox}

Pour lancer par exemple une recherche sur des magasins de voiture au Bénin par exemple, vous pouvez juste lancer:

python start.py search -S "Magasin voiture Bénin" -d 4 -e 034

Cette commande recherche Magasin voiture Bénin avec une profondeur de 4 pages par recherches sur les moteurs de recherches Google, Bing, Qwant

Tables des moteurs de recherches pour l'arguments engines

Code	Moteur
0	Google
1	Mojeek
2	Brave (Bêta)
3	Bing
4	Qwant

extract

La commande extract permet l'extraction de mail et téléphone d'un site web. L'exemple suivant permet d'extraire mail et téléphone du site BeCrypto Coinlist.

python start.py extract -H https://becrypto-coinlist.herokuapp.com/

L'option -H est la seule nécessaire et permet specifier l'URL du site.

Dépendances

En dehors des modules du fichier requirements.txt, vous aurez besoin du navigateur web Chrome, et du driver compatible avec sa version.

Mise en place

Ouvrez votre terminal
Clonez le repo ci avec la commande git clone https://github.com/ParfaitD9/queryer.git
Rendez vous dans le dossier queryer créé
Créez un environnement virtuel afin d'isoler vos dépendances python -m venv venv
Activez votre environnement virtuel : source venv/bin/activate sous Linux/MacOS ou venv/Scripts/activate
Renommez le fichier .env.exemple en .env et specifiez le chemin pour chromedriver et/ou geckodriver
Installez les dépendances nécessaires avec pip install -r requirements.txt

Votre programme est maintenant en place. Let's enjoy.

Vous pouvez lancez une des commandes de commandes pour vérifier. Vos résultats de recherches sont disponibles dans le dossier results.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
results		results
.env.exemple		.env.exemple
.gitignore		.gitignore
README.md		README.md
engines.py		engines.py
linker.py		linker.py
requirements.txt		requirements.txt
start.py		start.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Queryer

Fonctionnalités

Commandes

search

Tables des moteurs de recherches pour l'arguments engines

extract

Dépendances

Mise en place

About

Releases

Packages

Languages

ParfaitD9/queryer

Folders and files

Latest commit

History

Repository files navigation

Queryer

Fonctionnalités

Commandes

search

Tables des moteurs de recherches pour l'arguments engines

extract

Dépendances

Mise en place

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages