Skip to content

Web crawler em C# que usa a biblioteca AngleSharp para extrair detalhes de eventos do site "https://minhaentrada.com.br". Ele analisa o HTML da página e recupera informações como título, data, local e links dos eventos.

Notifications You must be signed in to change notification settings

lucasfogliarini/MinhaEntradaCrawler.ConsoleApp

Repository files navigation

O que é isso, GPT?

Isso é um web crawler escrito em C#. Ele é usado para extrair informações de eventos de um site específico, no caso, o site "https://minhaentrada.com.br". O código utiliza a biblioteca AngleSharp para fazer a análise do DOM (Document Object Model) da página HTML e extrair os detalhes dos eventos listados.

Vou explicar um pouco sobre cada parte do código:

  1. Classe MinhaEntradaCrawler: Esta é a classe principal do código. Ela contém um construtor que recebe o nome do organizador de eventos como parâmetro e cria o URL para a agenda do organizador. A classe também tem um método CrawlEventsAsync que aceita uma data de início e uma data de término como parâmetros e retorna uma lista de eventos que ocorrem dentro desse intervalo de datas.

  2. Método GetHtmlDocumentAsync: Este método é responsável por obter o conteúdo HTML da página usando a classe HttpClient, e em seguida, cria um documento HTML com a ajuda da biblioteca AngleSharp. Ele configura um objeto BrowsingContext que é usado para carregar o HTML e criar um documento DOM.

  3. Método ExtractEvents: Neste método, o DOM da página é analisado para extrair as informações dos eventos. Ele utiliza seletores CSS para encontrar os elementos relevantes na página HTML, como títulos, datas, locais, URLs de imagem e links para os eventos. As informações são extraídas e usadas para criar objetos do tipo Event, que são então adicionados a uma lista.

ChatGPT Version: https://help.openai.com/en/articles/6825453-chatgpt-release-notes

About

Web crawler em C# que usa a biblioteca AngleSharp para extrair detalhes de eventos do site "https://minhaentrada.com.br". Ele analisa o HTML da página e recupera informações como título, data, local e links dos eventos.

Topics

Resources

Stars

Watchers

Forks

Languages