# Objektorientiert

## Aufgabe: Ausgabe als Datei speichern
- Schaue dir das Modul csv an, und zwar die writer - Funktion: https://docs.python.org/3/library/csv.html#csv.writer
- Passe dann den Ausgabe-Code so an, dass statt der Ausgabe hier im Notebook eine .csv-Datei gespeichert wird. Verwende als Spaltentrenner (Separator) ein Semikolon, und als "quotechar" die doppelten Anführungszeichen.

In [40]:
import csv
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import time  # Timer, um die Webseite bei einer Schleife vor versehentlichem request-spam zu schützen.

In [41]:
class CrawledArticle():  # Damit wird ein Artikel durch den ArticleFetcher gespeichert
    def __init__(self, title, emoji, content, image):
        self.title = title
        self.emoji = emoji
        self.content = content
        self.image = image
        
class ArticleFetcher():
    def fetch(self):
        url = "http://python.beispiel.programmierenlernen.io/index.php"
        articles = []

        while url != "":
            print(url)
            
            time.sleep(1)  # Hält das Programm für eine Sekunde an
            r = requests.get(url)
            page = BeautifulSoup(r.text, "html.parser")
            
            for card in page.select(".card"):
                title = card.select(".card-title span")[1].text
                emoji = card.select_one(".emoji").text
                content = card.select_one(".card-text").text
                image = urljoin(url, card.select_one("img").attrs["src"])
                
                crawled = CrawledArticle(title, emoji, content, image)
                articles.append(crawled)        
            
            next_button = page.select_one(".navigation .btn")
            if next_button:
                next_page = next_button.attrs["href"]
                next_page = urljoin(url, next_page)
                url = next_page
            else:
                url = ""
    
        return articles

## Artikel fetchen

In [64]:
fetcher = ArticleFetcher()
articles = fetcher.fetch()

http://python.beispiel.programmierenlernen.io/index.php
http://python.beispiel.programmierenlernen.io/index.php?page=2
http://python.beispiel.programmierenlernen.io/index.php?page=3
http://python.beispiel.programmierenlernen.io/index.php?page=4
http://python.beispiel.programmierenlernen.io/index.php?page=5
http://python.beispiel.programmierenlernen.io/index.php?page=6


## Artikel schreiben

In [69]:
with open("articles.csv", "w", newline="", encoding='utf-8') as csvfile:
    article_writer = csv.writer(csvfile, delimiter=";", quotechar='"')
    for article in articles:
        article_writer.writerow([article.emoji, article.title, article.content, article.image])
        
    print("done")

done


## Musterlösung

In [73]:
import csv
fetcher = ArticleFetcher()

with open("articles_muster.csv", "w", newline="", encoding="utf-8") as csvfile:
    articlewriter = csv.writer(csvfile, delimiter=";", quotechar='"')
    
    for article in fetcher.fetch():
        articlewriter.writerow([article.emoji, article.title, article.content, article.image])

http://python.beispiel.programmierenlernen.io/index.php
http://python.beispiel.programmierenlernen.io/index.php?page=2
http://python.beispiel.programmierenlernen.io/index.php?page=3
http://python.beispiel.programmierenlernen.io/index.php?page=4
http://python.beispiel.programmierenlernen.io/index.php?page=5
http://python.beispiel.programmierenlernen.io/index.php?page=6
