-
Notifications
You must be signed in to change notification settings - Fork 42
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Chapitre récupération de données numériques (scraping) #38
Comments
Je viens de commit un brouillon pour ce chapitre : 22b045a -- mais ne suis pas certain que l'exemple soit le plus approprié. Let me know what you think :) P.S. truc difficile à gérer pour ce chapitre : la gestion des données récupérées. Pour ne pas avoir à les scraper à chaque fois, est-ce qu'on peut les mettre en cache ? Le dossier fait < 200 KB. |
En tout cas j'aime bien le thème. Ce qui manque peut-être c'est de savoir à quoi pourrait nous servir les données collectées ensuite. Juste pour bien comprendre que le scraping c'est juste une étape de collecte avant de se lancer dans certaines analyses. Faut-il présenter un peu plus ce qu'est le scraping ? Le type de choses qu'on peut récupérer sur Internet ? A quoi ca peut servir (par exemple analyses sociologiques, etc.) Pas de soucis pour une mise en cache. Dans Quelques détails :
Pour info, j'ai le warning suivant
Je suis sous Windows. Un truc à creuser ? Une note explicative ? |
Of course, je viens de tomber sur cette discussion tidyverse/lubridate#194 A mon avis, il faut faire un encadré pour expliquer ce point précis. Faut-il adapter le code à coup de test sur |
|
Concernant la gestion du cache, toutes mes excuses, je n'avais pas compris que tu faisais référence au système de cache natif de knitr, ce qui effectivement est le plus simple car le système détecte tout seul s'il faut recalculer. Du coup j'ai fait ce commit : 50d3274 Quel que soit le fichier, le cache est est mis dans un sous-répertoire Je me demande si ça ne vaudrait pas le coup en fait d'activer le cache par défaut pour tous les chapitres (avec |
Lien à ajouter dans une section Aller plus loin : http://data.hypotheses.org/516 |
Largement de qui faire un autre chapitre !!! |
@briatte Hello, tu vas bien ? Pour info : #166 (comment)
Veux-tu jeter un oeil à cela ? |
J'ai un exemple ici (communiqués du FN), qui peut aussi servir pour le chapitre réseaux, d'ailleurs, et un autre exemple ici (comptes Twitter des eurodéputés). Les deux exemples sont courts et faciles, et basés sur des sites Internet qui, avec un peu de chance, devraient rester disponibles.
Un autre exemple ici, par Alexandre Hobeika et Étienne Ollion.
The text was updated successfully, but these errors were encountered: