Skip to content

Commit

Permalink
Merge pull request #303 from tcurvelo/master
Browse files Browse the repository at this point in the history
Adiciona recomendações de material de raspagem de dados
  • Loading branch information
leportella committed Nov 12, 2018
2 parents d8bc92e + ceb3ade commit 7a85d8b
Show file tree
Hide file tree
Showing 2 changed files with 30 additions and 8 deletions.
18 changes: 10 additions & 8 deletions README.md
Expand Up @@ -4,15 +4,16 @@

--


**DISCLAIMER**: *Este repositório foi feito pela e para a comunidade. Existem opiniões divergentes sobre o que é básico e o que é avançado entre outros temas.
Caso discorde de alguma coisa que está escrita aqui, fique a vontade para fazer um pull request melhorando as descrições feitas aqui.*

O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios...
Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.
O intuito é agregar o conhecimento que se espalha em diversos grupos e iniciativas. Muitas vezes esse conhecimento fica espalhado em drives, pockets e outros meios...
Dessa forma, esse repositório visa ajudar os iniciantes e servir como referência para os experientes.

Se possuir material interessante, por favor compartilhe com a comunidade. Estamos aqui para crescermos juntos.

Dessa iniciativa também nasceu o [Pizza de Dados](http://pizzadedados.com/), um podcast brasileiro
Dessa iniciativa também nasceu o [Pizza de Dados](http://pizzadedados.com/), um podcast brasileiro
focado em ciência de dados. Se tiver um tempinho, prestigie esse trabalho 100% brasileiro.

No mais, é isso. Bem vinda(o), pequena(o) padawan :)
Expand Down Expand Up @@ -50,9 +51,10 @@ No mais, é isso. Bem vinda(o), pequena(o) padawan :)
* [Notícias Legais](https://github.com/leportella/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Podcasts](https://github.com/leportella/datascience-pizza/blob/master/topicos/podcasts.md)
* [Processamento de Linguagem Natural](https://github.com/leportella/datascience-pizza/blob/master/topicos/processamento-de-linguagem-natural.md)
* [Raspagem de Dados](https://github.com/leportella/datascience-pizza/blob/master/topicos/raspagem-de-dados.md)
* [Reportagens relevantes](https://github.com/leportella/datascience-pizza/blob/master/topicos/noticias-legais.md)
* [Visualização de dados](https://github.com/leportella/datascience-pizza/blob/master/topicos/visualizacao-de-dados.md)

--------------------------------------------------
<h2 id="recomendacoes">Recomendações</h2>

Expand Down Expand Up @@ -81,7 +83,7 @@ No mais, é isso. Bem vinda(o), pequena(o) padawan :)
- Spark
- Estatística Bayesiana
- Hive
- Hadoop
- Hadoop
- Julia
- Computação distribuída com AWS e Google Cloud

Expand All @@ -96,20 +98,20 @@ No mais, é isso. Bem vinda(o), pequena(o) padawan :)
- [Scikit-learn](http://scikit-learn.org)
- [NLTK](http://www.nltk.org/)
- [PyTorch](https://pytorch.org/)

<h3 id="emr">Em R</h3>

- [h2o (Machine Learning)](http://docs.h2o.ai/)
- [mlr(Machine Learning)](https://www.rdocumentation.org/packages/mlr/versions/2.13)
- [xgboost(Machine Learning)](https://www.rdocumentation.org/packages/xgboost/versions/0.4-4/topics/xgboost)
- [dplyr(Manipulação de Dados)](https://www.rdocumentation.org/packages/dplyr/versions/0.5.0)
- [ggplot2 (Visualização)](https://www.rdocumentation.org/packages/ggplot2/versions/3.0.0)

--------------------------------------------------
<h2 id="videos">Vídeos</h2>

### Estudos

- [Lista de cursos online](http://www.kdnuggets.com/education/online.html) by KDnuggets
- [Playlist de Treinamento](https://www.youtube.com/playlist?list=PL9ooVrP1hQOGR57Y4g1LFhn1JXVgn1lkX) by Edureka!

Expand Down
20 changes: 20 additions & 0 deletions topicos/raspagem-de-dados.md
@@ -0,0 +1,20 @@
# Raspagem de Dados

<h2 id="podcasts">Podcast</h2>

- [Pizza de Dados, Episódio 009: Sobre Crawlers e Scrapers](http://pizzadedados.com/episodio-009/) | **pt-br**


<h2 id="videos">Videos</h2>

- [Getting Started with Web Scraping using Scrapy](https://www.youtube.com/watch?v=vkA1cWN4DEc&list=PLZyvi_9gamL-EE3zQJbU5N3nzJcfNeFHU) | **en**


<h2 id="artigos">Artigos</h2>

- [Scrapy Tutorial](https://doc.scrapy.org/en/latest/intro/tutorial.html) | **en**


<h2 id="livros">Livros</h2>

- [Learn Scrapy](https://www.packtpub.com/big-data-and-business-intelligence/learning-scrapy) | **en**

0 comments on commit 7a85d8b

Please sign in to comment.