# Objektorientiert

## Klassen

In [28]:
import requests
from bs4 import BeautifulSoup

In [35]:
class CrawledArticle():  # Damit wird ein Artikel durch den ArticleFetcher gespeichert
    def __init__(self, title, emoji, content, image):
        self.title = title
        self.emoji = emoji
        self.content = content
        self.image = image

class ArticleFetcher():
    def fetch(self):
        r = requests.get("http://python.beispiel.programmierenlernen.io/index.php")
        page = BeautifulSoup(r.text, "html.parser")
        articles = []  # Speicher vorbereitet

        for card in page.select(".card"):
            title = card.select(".card-title span")[1].text
            emoji = card.select_one(".emoji").text
            content = card.select_one(".card-text").text
            image = card.select_one("img").attrs["src"]

            crawled = CrawledArticle(title, emoji, content, image)  # Daten vom ArticleFetcher in CrawledArticle laden
            articles.append(crawled)  # Daten vom ArticleFetcher in articles Speicher laden
    
        return articles

In [34]:
fetcher = ArticleFetcher()
articles = fetcher.fetch()

for article in articles:
    print(article.title)

Polarised modular conglomeration
Cross-group contextually-based middleware
De-engineered encompassing structure
Fully-configurable multi-tasking interface
Versatile eco-centric core
Optional maximized utilisation
Open-architected secondary product


## Korrekte URL-Pfade zeigen

In [46]:
# So wird nur der relative Link angegeben
for article in articles:
    print(article.image)

./img/1.jpg
./img/2.jpg
./img/3.jpg
./img/4.jpg
./img/5.jpg
./img/6.jpg
./img/7.jpg


In [47]:
#  urllib Modul benötigt um relative links umzuwandeln
from urllib.parse import urljoin

In [51]:
# Beispiel:
urljoin("http://python.beispiel.programmierenlernen.io/index.php", "./img/1.jpg")

'http://python.beispiel.programmierenlernen.io/img/1.jpg'

## Ergebnis

In [69]:
class CrawledArticle():  # Damit wird ein Artikel durch den ArticleFetcher gespeichert
    def __init__(self, title, emoji, content, image):
        self.title = title
        self.emoji = emoji
        self.content = content
        self.image = image

class ArticleFetcher():
    def fetch(self):
        url = "http://python.beispiel.programmierenlernen.io/index.php"  # In Variable stecken, wenn mehrmals benutzt wird
        r = requests.get(url)
        
        page = BeautifulSoup(r.text, "html.parser")
        articles = []  # Speicher vorbereitet

        for card in page.select(".card"):
            title = card.select(".card-title span")[1].text
            emoji = card.select_one(".emoji").text
            content = card.select_one(".card-text").text
            image = urljoin(url, card.select_one("img").attrs["src"])  # hier mit urljoin sagen, dass das die relative adresse ist

            crawled = CrawledArticle(title, emoji, content, image)  # Daten vom ArticleFetcher in CrawledArticle laden
            articles.append(crawled)  # Daten vom ArticleFetcher in articles Speicher laden

        return articles

In [70]:
fetcher = ArticleFetcher()
articles = fetcher.fetch()

for article in articles:
    print(article.image)

http://python.beispiel.programmierenlernen.io/img/1.jpg
http://python.beispiel.programmierenlernen.io/img/2.jpg
http://python.beispiel.programmierenlernen.io/img/3.jpg
http://python.beispiel.programmierenlernen.io/img/4.jpg
http://python.beispiel.programmierenlernen.io/img/5.jpg
http://python.beispiel.programmierenlernen.io/img/6.jpg
http://python.beispiel.programmierenlernen.io/img/7.jpg


# :3