Skip to content

DAG that extracts news that uses the Amazon company's name

Notifications You must be signed in to change notification settings

brprado/airflow_extract_amzn_news

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

Sobre o projeto

O Apache Airflow é uma plataforma de gerenciamento de fluxo de trabalho que permite a automação de tarefas e fluxos de trabalho complexos. No código apresentado, o Airflow é usado para agendar a execução da extração de notícias diariamente. Ele também é usado para executar dois tipos de tarefas: uma tarefa para criar o diretório onde o arquivo de saída será salvo e outra tarefa para executar a extração das notícias e salvar o arquivo resultante.

Além do Apache Airflow, o código também faz uso de outras bibliotecas importantes, como o pandas, que é usado para formatar e converter os dados em um DataFrame, e o Finnhub, que é usado para fazer a chamada à API Finnhub para extrair as notícias.

Uma empresa do setor financeiro ou varejista pode tirar proveito desses dados usando NLP, por exemplo, para realizar análises de sentimento ou análises de tópicos em suas notícias coletadas. Com a análise de sentimento, é possível identificar se as notícias são positivas, negativas ou neutras em relação à empresa, ajudando a empresa a entender a percepção do público sobre a marca. Já a análise de tópicos pode ajudar a identificar os tópicos mais relevantes para a empresa, auxiliando na identificação de tendências e oportunidades de negócios.

Outra forma de aproveitar esses dados é usando NER (Named Entity Recognition) para identificar as entidades relevantes nas notícias coletadas. Isso pode ajudar a empresa a entender quais são as pessoas, empresas ou organizações mencionadas com mais frequência nas notícias relacionadas ao seu negócio. Essas informações podem ser usadas para entender o cenário competitivo, identificar parceiros potenciais e avaliar oportunidades de colaboração.

Em resumo, o Apache Airflow e as bibliotecas utilizadas no código apresentado podem ser usados para coletar dados relevantes para uma empresa do setor financeiro ou varejista, e a análise desses dados utilizando NLP pode gerar insights importantes para tomadas de decisões estratégicas.

About

DAG that extracts news that uses the Amazon company's name

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages