### Základní pilíře objektově-orientovaného programování

---
Ve skutečnosti jde o **čtyři teoretické základy**, kterých lze využívat v OOP, příp. na kterých obecně stojí:

1. **Polymorfismus** (*~polymorphism*),
2. **zapouzdření** (*~encapsulation*),
3. **dědičnost** (*~inheritance*),
4. **abstrakce** (*~abstraction*).

<br>

#### Polymorfismus ( ~polymorphism)

---
Polymorfismus je koncept, který stojí za efektivním (pěkným) pozadím OOP. Doslova znamená *mnohotvárnost*.

<br>

Příkladem může být zabudovaná funkce `len` (resp. magická metoda `__len__`

In [None]:
print(
    len("Matous"),                                                             # str
    len(["město", "moře", "kuře", "stavení"]),                                 # list
    len({"jmeno": "Matous", "prijmeni": "Holinka", "email": "matous@nic.cz"}), # dict
    sep="\n"
)

<br>

Vidíš, že funkce `len` umí pracovat s různými datovými typy.

<br>

Vrací specifickou hodnotu pro každý datový typ zvlášť.

1. `str`, délka řetězce,
2. `list`, počet údajů v sekvenci,
3. `dict`, počet klíčů v objektu

<br>

Dále tento koncept umožňuje přepisovat jména a použití **metod**:

In [None]:
class IHnedTopicScraper:
    """Scrape links from the given url."""
    scraped_links: int = 0
        
    def __init__(self, url: str):
        self.url = url
        IHnedTopicScraper.add_link()
    
    def show_status(self) -> None:
        print(f"Already collected {self.scraped_links} topics..")
        
    @classmethod
    def add_link(cls) -> None:
        cls.scraped_links += 1

In [None]:
IHnedTopicScraper.scraped_links

In [None]:
ihned_links = IHnedTopicScraper("zprava-1")
ihned_links.show_status()

<br>

V ukázce s třídou instancí `ihned_links` nám instanční metoda `show_status` zprostředkuje textový výstup.

In [None]:
class DataFrameProcessor:
    """Process two given dataframes"""
    
    def __init__(self, df1, df2):
        self.df1 = df1
        self.df2 = df2
        self.merged = False
        
    def merge_two_dfs(self):
        # ...
        self.merged = True
        
    def show_status(self) -> bool:
        if self.merged:
            print("DataFrames successfully merged..")
            return True
        print("Cannot merge two dfs..")
        return False

In [None]:
proc_1 = DataFrameProcessor("df1", "df2")

In [None]:
proc_1.merge_two_dfs()
proc_1.show_status()

<br>

Ve druhé ukázce se třídou `DataFrameProcessor` nám stejnojmenná metoda `show_status` nejenom vypisuje text, ale současně vrací pomocnou `bool` hodnotu.

<br>

#### Zapouzdření (~encapsulation)

---

V podstatě jde o omezení přístupu (nebo schování) **atributů** a **metod** ve třídě.

<br>

V kombinaci s **chráněnými objekty** chceme některé procesy zajistit a současně nekomplikovat uživatelské použití.

In [None]:
class BookRecommender:
    """Recommend the book to the user according to his assignment"""
    
    def __init__(self, title: str, author: str):
        self.title = title
        self.author = author

        if self.__update_app():
            self.run_app()

    def __update_app(self) -> bool:
        print("Updating app..")
        return True
        
    def run_app(self):
        print(
            "Running app..",
            f"Adding book: {self.title}",
            sep="\n"
        )

In [None]:
app = BookRecommender("Treason", "Timothy Zahn")

<br>

Pomocí zapouzdření můžeme schovat procesy potřebné pro správný běh našeho modulu a zamezit jeho používání:

In [None]:
app.__update_app()

<br>

Zapouzdření brání v přístupu k atributům nebo metodám omylem ale ne záměrně.

<br>

#### Dědičnost (~inheritence)

---

**Dědičnost** je prvek OOP, díky kterému můžeme přenášet **atributy** a **metody** jedné třídy (*rodičovské*) na její *potomky*:

In [1]:
class Employee:
    """Create a new employee object."""

    def __init__(self, name: str, age: int, wage: int = 0):
        self.age = age
        self.name = name
        self.wage = wage
        self.access_db: bool = False
        self.access_vcs: bool = False
        self.email = self.__generate_email()

    def __generate_email(self):
        domain: str = "@nic.cz"
        return f"Email: {self.name.lower()}{domain}"

In [None]:
first_emp = Employee("Lukas", 28, 30_000)

In [None]:
print(
    first_emp.name,
    first_emp.age,
    first_emp.email,
    first_emp.access_vcs,
    sep="\n"
)

<br>

Vytvořili jsme instanci nového zaměstnance. Jde o úvodní pozici bez zaměření, bez zaškolení.

<br>

Později potřebuješ do systému zaevidovat novou pozici, *tester*:

In [None]:
class Tester:
    """Create a new tester object."""

    def __init__(self, name: str, age: int, wage: int = 0):
        self.age = age
        self.name = name
        self.wage = wage
        self.access_db: bool = False
        self.access_vcs: bool = False
        self.email = self.__generate_email()

    def __generate_email(self):
        domain: str = "@nic.cz"
        return f"Email: {self.name.lower()}{domain}"
    
    def get_access_to_vcs(self):
        self.access_vcs: bool = True
        print("Added to the repository as a tester")

In [None]:
tester_1 = Tester("Matous", 30, 40_000)
tester_1.get_access_to_vcs()

<br>

Na první pohled ale vidíš, že mít dvě podobné třídy pod sebou není efektivní a oponuje to jednomu s principů vývoje softwaru (DRY).

<br>

Pokud budeš chtít do systému specifikovat novou třídu, která bude mít:
1. Částečnou funkcionalitu nebo objekty existující třídy,
2. novou funkcionalitu.

<br>

.. dědičnost můžeš můžeš použít právě pro rozšíření původní třídy:

In [2]:
class Tester(Employee):
    """Create a new tester object."""
    
    def get_access_to_vcs(self):
        self.access_vcs: bool = True
        print("Added to the repository as a tester")

In [11]:
tester_1 = Tester("Matous", 30, 40_000)
tester_1.get_access_to_vcs()

Added to the repository as a tester


<br>

Vidíš, že třída `Tester` má svoji vlastní metodu `get_access_to_vcs`.

<br>

Současně ale zdědila základní instanční atributy ze třídy `Employee`:

In [None]:
print(
    tester_1.name,
    tester_1.age,
    tester_1.email,
    tester_1.access_vcs,
    sep="\n"
)

<br>

V průběhu času budeš chtít přidat nový typ zaměstnance, opět můžeš aplikovat dědičnost:

In [12]:
class BigDataEngineer(Employee):
    """Create a new big data engineer object."""

    def get_access_to_vcs(self):
        self.access_vcs: bool = True
        print("Added to the repository..")
        
    def get_access_to_db(self):
        self.access_db: bool = True
        print("Added to the dbs..")

In [13]:
data_ai_1 = BigDataEngineer("Petr", 31, 100_000)
data_ai_1.get_access_to_vcs()
data_ai_1.get_access_to_db()

Added to the repository..
Added to the dbs..


<br>

Poslední třída `BigDataEngineer` je opět potomkem třídy `Employee`, takže pro ni platí stejná pravidla jako pro třídu `Tester`.

In [None]:
print(
    data_ai_1.name,
    data_ai_1.age,
    data_ai_1.email,
    data_ai_1.access_vcs,
    data_ai_1.access_db,
    sep="\n"
)

<br>

Všimni si ale metody `get_access_to_vcs`. Obě třídy potomků mají tuto metodu společnou. 

<br>

Nebylo by výhodnější ji přesunout do původní třídy?

In [14]:
class BigDataEngineer(Employee, Tester):
        
    def get_access_to_db(self):
        self.access_db: bool = True
        print("Added to the dbs..")

TypeError: Cannot create a consistent method resolution
order (MRO) for bases Employee, Tester

<br>

Při dědičnosti je potřeba dbát na pravidla, kdo od koho může dědit objekty.

<br>

Někdy se ale může začít proces dědičnost mírně zvrtávat:

In [15]:
class Employee:
    pass

class FrontendDev(Employee):
    pass

class BackendDev(Employee):
    pass

class FullstackDev(FrontendDev, BackendDev):
    pass

<br>

Jednotlivé odkazování přestává být zřetelné a program se stává příliš komplexní.

<br>

Nejprve interpret vyhledává metody nebo atributy v aktuální třídě (potomkovi) a potom teprve začíná sledovat řád, který jsme nastavili pomocí dědičnosti.

<br>

Tento směr se nazývá jako **MRO** (*~method resolution order*), který je v podstatě sadou pravidel při dědění.

In [16]:
class Employee:
    def me(self):
        print("Třída 'Employee'")

class FrontendDev(Employee):
    def me(self):
        print("\t --> Třída 'FrontendDev'")

class BackendDev(Employee):
    def me(self):
        print("\t --> Třída 'BackendDev'")

class FullstackDev(FrontendDev, BackendDev):
    pass

In [17]:
emp = Employee()
back = BackendDev()
front = FrontendDev()
full = FullstackDev()

In [18]:
emp.me()
back.me()
front.me()
full.me()

Třída 'Employee'
	 --> Třída 'BackendDev'
	 --> Třída 'FrontendDev'
	 --> Třída 'FrontendDev'


<br>

Někdy se *MRO* označuje také jako linearizace procesu dědění.

<br>

Pokud mám toto *diamantové* schéma dědění, potom si třída `FullstackDev` vezme stejnojmennou metodu z **prvního** zapsaného rodiče.

In [19]:
class Employee:

    def __init__(self, name: str, email: str):
        self.name = name
        self.email = email

class Developer(Employee):

    def __init__(self, certificate):
        self.certificate = certificate

In [20]:
emp = Employee("Matous", "matous@nic.cz")

In [21]:
dev = Developer("Petr", "petr@nic.cz", "PythonEngetoCert")

TypeError: __init__() takes 2 positional arguments but 4 were given

In [22]:
dev = Developer("PythonEngetoCert")

In [23]:
dev.name

AttributeError: 'Developer' object has no attribute 'name'

In [25]:
dev.certificate

'PythonEngetoCert'

<br>

Co dělat?
1. Přidat **nový atribut** i do dceřinné třídy,
2. doplnit původní metodu `__init__`, (starší varianta),
3. doplnit `__super__` metodu.

<br>

###### Nové atributy

In [None]:
class Developer(Employee):
    
    def __init__(self, name: str, email: str, certificate: str):
        self.name = name
        self.email = email
        self.certificate = certificate

In [None]:
dev = Developer("Petr", "petr@nic.cz", "PythonEngetoCert")

In [None]:
print(
    dev.name,
    dev.email,
    dev.certificate,
    sep="\n"
)

<br>

###### Přepsat metodu __init__()

In [None]:
class Developer(Employee):
    def __init__(self, name: str, email: str, certificate: str):
        Employee.__init__(self, name, email)
        self.certificate = certificate

In [None]:
dev = Developer("Petr", "petr@nic.cz", "PythonEngetoCert")

In [None]:
print(
    dev.name,
    dev.email,
    dev.certificate,
    sep="\n"
)

<br>

###### Použít funkci super()

In [None]:
class Developer(Employee):
    def __init__(self, name: str, email: str, certificate: str):
        super().__init__(name, email)
        self.certificate = certificate

In [None]:
dev = Developer("Petr", "petr@nic.cz", "PythonEngetoCert")

In [None]:
print(
    dev.name,
    dev.email,
    dev.certificate,
    sep="\n"
)

<br>

#### Abstrakce

---
Tento pilíř se zaměřuje zejména na **skrývání interních implementací** procesu nebo metod před uživatelem.

<br>

Ve výsledku uživatel ví, co dělá, ale neví, jak celý proces pracuje.

<br>

Představ si fotoaparát na svém telefonu. Víš jak jej spustit a použít. Nepotřebuješ znát všechny potřebné atributy a metody, které pracují na pozadí.

<br>

Praktickou obecná ukázka abstrakce pro datový typ `str`:
```python
"matous".title()     # "Matous"
"1234".isnumeric()   # True
"OOP".isupper()      # True
```

<br>

Abstrakce v OOP Pythonu:

In [None]:
class GooglePaymentProcessor:
    def pay(self):
        print("Processing GooglePay..")
        print("Verifying security code..")
        print("Changing order status..")
        print("-" * 25)

In [None]:
order_1 = GooglePaymentProcessor()
order_1.pay()

<br>

Jako potenciální vývojář eshopu není tvojí náplní zpracovávat samotnou platbu, ale implementovat její spuštění.

<br>

Současně potřebuješ doplnit další způsoby platby. Třeba služba `ApplePay`, `Paypal`, aj.

<br>

V takovém okamžiku můžeš použít modul `abc`:

In [None]:
from abc import ABC, abstractmethod  # abstraktní třída a metoda

class PaymentProcessor(ABC):  # naše hlavní třída zdědí označení abstraktní třídy
    
    @abstractmethod           # označíme abstraktní metodu/metody
    def pay(self):
        """Process, verify and change the status of the given order."""
        pass                  # nepíšeš žádné ohlášení, pouze 'pass'


class GooglePaymentProcessor(PaymentProcessor):    # podtřídy zdědí od rodiče funkcionalitu
    def pay(self):
        print("Processing GooglePay..")
        print("Verifying security code..")
        print("Changing order status..")
        print("-" * 25)
        
class ApplePaymentProcessor(PaPaymentProcessor):   # podtřídy zdědí od rodiče funkcionalitu
    pass

class PaypalPaymentProcessor(PaPaymentProcessor):  # podtřídy zdědí od rodiče funkcionalitu
    pass

In [None]:
order_1 = GooglePaymentProcessor()

order_1.pay()

<br>

`ABC` je metoda, kterou musíš zdědit z modulu `abc`. Python defaultně nepracuje s konceptem abstraktních tříd jako jiné jazyky.

<br>

Dále musíš označit metodu jako abstraktní metodu. Použij dekorátor `@abstractmethod`.

<br>

V abstraktní metodě nepíšeš žádné ohlášení, pouze dokumentaci abstraktní metody a ohlášení `pass`.

<br>

Výsledkem je potom abstraktní třída `PaymentProcessor`, kterou jako uživatel (programátor) vidíš.
 
<br> 

Konkrátní metody v rámci ostatních dceřinných tříd jsou uživateli skryté (abstraktní metoda na ně odkazuje).

<br>

#### Úloha

---
Třetí úlohou je scraper, který postahuje odkazy a zatřídí je.

<br>

Průběh modulu:

<br>

Následný výstup:

In [None]:
import datetime
from urllib.parse import urlparse, urljoin

import bs4
import requests


class ScraperInitializer:
    """Create session and return the bs4.BeautifulSoup object."""
    def __init__(self, url: str = ""):
        self.url = url
        
    @property
    def url(self):
        return self._url = url
    
    @url.setter
    def url(self, val: str):
        if 

    def send_get_request(self) -> requests.models.Response:
        return requests.get(self.url)

    def parse_response(self, response) -> bs4.BeautifulSoup:
        return bs4.BeautifulSoup(response.content, features="html.parser")


class LinkScraper:
    """Collects links of various types from a main url"""

    def __init__(self, soup: bs4.BeautifulSoup, url: str, keyword: str):
        self.soup = soup
        self.netloc = url
        self.keyword = keyword

    def collect_all_links(self) -> set:
        return {
            urljoin(self.netloc, link.get("href"))
            for link in self.soup.find_all("a")
            if "href" in link.attrs and self.is_keyword(link.get("href"))
        }
    
    def is_keyword(self, link: str) -> bool:
        return self.keyword in urlparse(link).path


class LinkCollector:
    fmt: str = "%d/%m/%y, %H:%M:%S"
    number_of_links: int = 0
    
    def __init__(self, scheme, netloc, path):
        self.scheme = scheme
        self.netloc = netloc
        self.path = path
        self.date = datetime.datetime.now().strftime(self.fmt)
        

class LinkProcessor:
    
    def __init__(self, links: set):
        self.links = links
        self.results = list()
        
    def add_links(self):
        for link in self.links:
            self.results.append(
                LinkCollector(
                    scheme=urlparse(link).scheme,
                    netloc=urlparse(link).netloc,
                    path=urlparse(link).path,
                )
            )


# iniciuj objekt pro scraper
products = ScraperInitializer("https://engeto.cz")     # "product"
jobs = ScraperInitializer("https://junior.guru/jobs")  # "jobs"
news = ScraperInitializer("https://idnes.cz")          # "zpravy"

prod_links = LinkScraper(
    products.parse_response(products.send_get_request()),
    products.url,
    "product",
)

saved = LinkProcessor(
    prod_links.collect_all_links()
)
saved.add_links()
# runner = LinkScraperInitializer()
# parsed_html = runner.parse_html(runner.send_get_request(host))
saved.results


In [None]:
saved.results[0].__dict__

In [None]:
main = "https://engeto.cz"
path = 'https://engeto.cz/product/detail-terminu-online-python-akademie-17-1-4-4-2022/'
new = urljoin(main, path)
dict(urlparse(new))