Skip to content

Commit

Permalink
Update scraper.rb
Browse files Browse the repository at this point in the history
  • Loading branch information
BfB-Schenefeld committed Apr 22, 2024
1 parent ce56ae2 commit 2f50972
Showing 1 changed file with 7 additions and 11 deletions.
18 changes: 7 additions & 11 deletions scraper.rb
Original file line number Diff line number Diff line change
Expand Up @@ -35,20 +35,15 @@ def scrape_event_details(event_url)
document.css('tr').each do |row|
index_number = row.css('td.tonr a').text.strip rescue ''
betreff = row.css('td.tobetreff div a').text.strip rescue row.css('td.tobetreff div').text.strip
betreff_link = row.at_css('td.tobetreff div a')
betreff_url = betreff_link ? "https://www.sitzungsdienst-schenefeld.de/bi/#{betreff_link['href']}" : "-"
vorlage_link = row.at_css('td.tovonr a')

# Überprüfen, ob eine Vorlage vorhanden ist und entsprechend formatieren
if vorlage_link
vorlage_text = vorlage_link.text.strip
vorlage_url = "https://www.sitzungsdienst-schenefeld.de/bi/#{vorlage_link['href']}"
else
vorlage_text = "-"
vorlage_url = "-"
end
vorlage_text = vorlage_link ? vorlage_link.text.strip : "-"
vorlage_url = vorlage_link ? "https://www.sitzungsdienst-schenefeld.de/bi/#{vorlage_link['href']}" : "-"

if !index_number.empty? && !betreff.empty?
event_data << [index_number, betreff, vorlage_text, vorlage_url]
puts "Gefunden: #{index_number}, Betreff: #{betreff}, Vorlage: #{vorlage_text}, Vorlage URL: #{vorlage_url}"
event_data << [index_number, betreff, betreff_url, vorlage_text, vorlage_url]
puts "Gefunden: #{index_number}, Betreff: #{betreff}, Betreff URL: #{betreff_url}, Vorlage: #{vorlage_text}, Vorlage URL: #{vorlage_url}"
end
end
return event_data
Expand All @@ -64,3 +59,4 @@ def scrape_event_details(event_url)




0 comments on commit 2f50972

Please sign in to comment.