Twitter Trending # and @ Analytics

Este repositório consiste no deploy e exemplo de uma aplicação Spark Streaming para coleta de Hashtags (#) e Contas (@) mais comentadas no Twitter em tempo real.

Requisitos
1. Criar conta na API do Twitter
2. Criar um Cluster com Hadoop (HDFS + Yarn) com o Spark
3. Certificar que em todos os nós do cluster há Docker instalado

Tutorial

Em todos os nós do cluster, executar:

sh build.sh

Isso irá construir as imagens dos DashBoards e da aplicação do Twitter. Antes de construir as imagens, certifique as variáveis de ambiente nos arquivos Dockerfile

No nó mestre da aplicação, executar:

sh start.sh

Para construir a imagem do Twitter, é necessário um arquivo .env com as seguintes configurações:

ACCESS_TOKEN=<access_token>
ACCESS_SECRET=<access_secret>
CONSUMER_KEY=<consumer_key>
CONSUMER_SECRET=<consumer_secret>
BEARER=<bearer>

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
imagens		imagens
services		services
.gitignore		.gitignore
README.md		README.md
build.sh		build.sh
start.sh		start.sh
twitter-down.sh		twitter-down.sh
twitter.sh		twitter.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

imagens

imagens

services

services

.gitignore

.gitignore

README.md

README.md

build.sh

build.sh

start.sh

start.sh

twitter-down.sh

twitter-down.sh

twitter.sh

twitter.sh

Repository files navigation

Twitter Trending # and @ Analytics

Tutorial

Links legais sobre Spark Streaming:

Dúvidas?

Escreva uma Issue, mande um PR ;)

About

Releases

Packages

Languages

marcosfpr/spark_streaming_twitter

Folders and files

Latest commit

History

Repository files navigation

Twitter Trending # and @ Analytics

Tutorial

Links legais sobre Spark Streaming:

Dúvidas?

Escreva uma Issue, mande um PR ;)

About

Topics

Resources

Stars

Watchers

Forks

Languages