[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/prokaj/elte-python/blob/main/7-gyakorlat.ipynb)

## Házi feladatok


1. Írjunk egy függvényt, aminek két paramétere van egy string-ekből álló lista és pozitív egész küszöbérték. A függvény visszatérési értéke azon karakterek listája, amelyek legalább a küszöbértékben megadott számú sztringben előfordulnak.

   Pl. ha a függvényünk neve `frequent_chars`, akkor

   ```
   frequent_chars(["alma", "malna","golya"], 3)
   ```
   
   értéke `["a","l"]`. Ha a küszöbérték három helyett kettő lenne, akkor még az `"m"` is bekerülne a listába.
   
   A visszaadott lista legyen sorba rendezve. Lássuk el a függvényt típus annotációval, írjunk hozzá `docstring`-et (magyarul vagy angolul, ahogy kényelmesebb).
   
   Írjunk teszt függvényt, ami ellenőrzi, legalább az alábbi esetkre ellenőrzi a helyes működést:
   
   - Az eredmény nem függ a stringek sorrendjétől az argumentumként kapott listában.
   
   - A stringek listája üres.
   
   - Véletlenszerű stringekből álló lista.
   
   - Ugyanaz a string ismétlődik sokszor.



- Van-e olyan adatszerkezet, ami kiszűri az ismétlődéseket?
- Van-e olyan osztály, ami megszámolja az ismétlődéseket? 

In [11]:
from collections import Counter
from itertools import chain

def frequent_chars(lst: list, n: int) -> list:
    """
    Parameters:

    lst: list of strings
    n: threshold

    Return value:

    The list of those characters, in alphabetical order, that are in at least n strings in lst.    
    """
    cnt = Counter(chain.from_iterable(map(set, lst)))
    return sorted((x for x, c in cnt.items() if c>=n)) 

A teszteléshez, **Jupyteres környezet**ben, az `ipytest` csomag kényelmes. 

In [12]:
try:
    import ipytest
    ipytest.autoconfig()
    
except ModuleNotFoundError:
    print("Trying to install ipytest")
    ! pip install ipytest --quiet
    print("Try again!")

In [13]:
%%ipytest

from itertools import permutations

def test_frequent_chars():
    lst = ["alma", "golya", "malna"]
    for lst1 in permutations(lst):
        assert frequent_chars(lst, 2) == frequent_chars(lst1, 2)
    
    assert frequent_chars([], 1) == []

    assert frequent_chars(["adgwro", "adgget", "adgw", "weti"], 2) == ["a", "d", "e", "g", "t", "w"]

    assert frequent_chars(["alma"]*5, 6) == []

    assert frequent_chars(["alma"]*5, 4) == ["a", "l", "m"]
    
    assert frequent_chars(["alma"]*5, 5) == ["a", "l", "m"]


[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.00s[0m[0m



2. Írjunk egy függvényt, ami egy sorozatból kigyűjti az különböző elemeket és mindegyikhez feljegyzi hol fordulnak elő. Feltehető, hogy a sorozat elemei használhatóak kulcsként egy szótárban.

   Pl. Ha függvény neve collect_positions, akkor
   
   ```
   collect_positions("ababcda")
   ```

   hívás eredménye:
   
   ```
   {"a": [0, 2, 6], "b":[1, 3], "c": [4], "d": [5]}
   ```

   A visszaadott szótárban az értékek legyenek nagyságszerinti sorba rendezve. Lássuk el a függvényt típus annotációval, írjunk hozzá docstring-et (magyarul vagy angolul, ahogy kényelmesebb).
   
   Írjunk teszt függvényt, ami ellenőrzi, legalább az alábbi esetkre ellenőrzi a helyes működést:
   
   - Az argumentum legalább 10 hosszú string
   
   - Az argumentum stringek legalább 10 hosszú listája.
   
   - Az argumentum map hivás eredménye, pl. ha az előző pontban használt lista `lst`, akkor `map(str.upper, lst)`, vagy `map(str.lower, lst)`
   
   - A sorozat üres.
   
   A megoldásban jól jöhet az `enumerate` függvény


In [15]:
from typing import Sequence
from collections import defaultdict

def collect_positions(seq: Sequence) -> dict:
    """
    Returns for each element in seq the list of occurences.
    """
    d = defaultdict(list)
    
    for i, c in enumerate(seq):
        d[c].append(i)

    return dict(d)

In [16]:
%%ipytest

def test_collect_positions():
    assert collect_positions("ababcda") == {"a": [0, 2, 6], "b":[1, 3], "c": [4], "d": [5]}
    assert collect_positions(["alma", "körte"]) == {"alma":[0], "körte":[1]}
    assert collect_positions(map(str.upper, ["alma", "körte"])) == {"ALMA":[0], "KÖRTE":[1]}
    assert collect_positions([]) == {}

    

[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.00s[0m[0m


## Feladat előadásról

Adva van egy szövegfile. [P0022.txt](https://eltehu.sharepoint.com/:t:/s/Crs22-23-1bevtudprogm22ea1Bevezetsatudomnyosprogramozsbaelad/EcraA_ZkX4VGpoCn4mzaCCcBlKbsnmDqrm_EejiXr7-57g?e=BhFq1M)

Ebben a fájlban keresztnevek vannak. Hány olyan lényegében különböző névpár van, hogy a pár második eleme az első névnek a megfordítottja?

pl. ("NORA", "ARON")


Az ("ARON", "NORA") pár nem különbözik lényegében az előzőtől.

A nevek kezdőbetűit tekintve melyik az 5 leggyakoribb? W-vel vagy C-vel kezdődik több név?

In [17]:
import urllib.request as request

url = "https://eltehu.sharepoint.com/:t:/s/Crs22-23-1bevtudprogm22ea1Bevezetsatudomnyosprogramozsbaelad/EcraA_ZkX4VGpoCn4mzaCCcBlKbsnmDqrm_EejiXr7-57g?e=BhFq1M"
try:
    request.urlretrieve(url, "P0022_names.txt")

except request.HTTPError:
    print("Download manually!")


Download manually!


Alternatíva:

- https://www.gutenberg.org/files/3201/files/NAMES.TXT
- https://github.com/dominictarr/random-name/raw/master/names.txt

1993-as gyűjtemény GB és US nevekből, részletesen [itt](https://www.gutenberg.org/ebooks/3201)

In [18]:
url = "https://github.com/dominictarr/random-name/raw/master/names.txt"

try:
    request.urlretrieve(url, "P0022_names.txt")

except request.HTTPError:
    print("Download manually!")


In [19]:
with open("./P0022_names.txt") as f:
    names = [line.strip().upper() for line in f]

len(names)

21985

In [20]:
from itertools import combinations

Párok brute force-szal.

In [21]:
%%time
pairs = [(a,b) for a, b in combinations(names, 2) if a[::-1]==b] + [(a,a) for a in names if a==a[::-1]]
len(pairs)

CPU times: user 22.6 s, sys: 0 ns, total: 22.6 s
Wall time: 22.6 s


191

In [22]:
%%time
A = set(names)
pairs = [(x, x[::-1]) for x in names if x<=x[::-1] and x[::-1] in A]
len(pairs)

CPU times: user 6.19 ms, sys: 0 ns, total: 6.19 ms
Wall time: 6.1 ms


191

In [23]:
from collections import Counter

counter = Counter(x[0] for x in names)
counter.most_common(5)

[('S', 1763), ('M', 1691), ('C', 1602), ('A', 1544), ('B', 1541)]

## Újabb feladat előadásról

Adott egy kifejezés, ami a `(`, `)`, `[` és `]` karakterekből állhat. Állapítsuk meg, hogy a kifejezés helyesen zárójelezett-e vagy sem.

pl. `([()])` helyes zárójelezés, `([(]))` nem az, mert a szögletes zárójelpár tartalmaz pár nélküli nyitó zárójelet.

Próbáljuk megoldani stack-kel (listával).

In [28]:
pairs = "()[]{}"
closing_to_opening = dict(zip(pairs[1::2], pairs[::2]))
opening = set(closing_to_opening.values())

In [29]:
def as_mapping(d):
    return ", ".join(" -> ".join(x) for x in d.items())

print(f"opening = {''.join(opening)},  closing_to_opening={as_mapping(closing_to_opening)}")

opening = ({[,  closing_to_opening=) -> (, ] -> [, } -> {


Egészítsük ki a következő kódot!

In [34]:
def is_balanced(string):
    stack = []
    for x in string:
        if x in opening:
            stack.append(x)
        else:
            if (not stack) or (stack[-1]!=closing_symbols[x]):
                return False
            stack.pop()
    return not stack

In [35]:
%%ipytest

def test_is_balanced():
    assert is_balanced("[([(()[]())])]") == True
    assert is_balanced("[[))") == False
    assert is_balanced("") == True
    assert is_balanced("[") == False
    assert is_balanced(")") == False

[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.00s[0m[0m


## Osztály defínicó

Már láttuk, hogy osztályt a `class` kulcsszóval lehet definiálni.

```
class MyClass:
    ....
```

Általában legalább az alábbi metódusokat implementálja az ember

- `__init__`. Ezt akkor hívja meg a Python értelmező, amikor egyedet létrehozunk.
  ```
  obj = MyClass(paraméterek)
  ```

- `__repr__`. Ezt akkor hívja meg a Python értelmező, amikor interaktív környezetben a visszatérési értéket meg kell mutatni, vagy `repr(obj)` esetén. Nincs benne `print`, egy sztinget ad vissza, amit az interpreter kiír.

- `__str__`. Ezt akkor hívja meg a Python értelmező, amikor `print`-eljük az objektumot. Ennek sincs mellékhatása, egy sztringet ad vissza, amit aztán a rendszer ha akar kiír. 

`class` neveket CamelCase konvencióval szokás megadni. Azaz ha több szóból áll a név akkor szóköz nélkül a szavak nagy kezdőbetűvel összefűzve: `my class -> MyClass`, `symmetric matrix ->SymmetricMatrix` 

In [36]:
class Dummy:
    def __init__(self, arg1=1, arg2=2, *, kwarg=None):
        print(f"{type(self).__name__}.__init__ called with ({arg1}, {arg2}, kwarg={kwarg})")
        self.arg1 = arg1
        self.arg2 = arg2
        self.kwarg = kwarg

    def __str__(self):
        print(f"{type(self).__name__}.__str__")
        
        return "Dummy class"

    def __repr__(self):
        print(f"{type(self).__name__}.__repr__")

        return f"{type(self).__name__}({self.arg1}, {self.arg2}, kwarg={self.kwarg})"

In [37]:
obj = Dummy()
print("---")
print("calling str:")
str(obj)
print("---")
print("calling repr:")
repr(obj)
print("---")
print("f-string:")
print(f"str:{str(obj)}, repr:{repr(obj)}")
print("---")
print("printing obj:", obj)
print("---")
print("REPL print:")
obj

Dummy.__init__ called with (1, 2, kwarg=None)
---
calling str:
Dummy.__str__
---
calling repr:
Dummy.__repr__
---
f-string:
Dummy.__str__
Dummy.__repr__
str:Dummy class, repr:Dummy(1, 2, kwarg=None)
---
printing obj: Dummy.__str__
Dummy class
---
REPL print:
Dummy.__repr__


Dummy(1, 2, kwarg=None)

### Példa kevésbé triviális osztályra, egyéni azonosító minden egyednek.

In [38]:
class ID:
    code: int = -1
    
    def __init__(self):
        self.code = self.next_id()

    def __repr__(self) -> str:
        return f"ID({self.code}/{type(self).code})"
    
    @classmethod
    def next_id(cls) -> int:
        cls.code += 1
        return cls.code


In [39]:
i0 = ID()
i1 = ID()
i2 = ID()


i0,i1,i2, ID.__dict__, i0.__dict__

(ID(0/2),
 ID(1/2),
 ID(2/2),
 mappingproxy({'__module__': '__main__',
               '__annotations__': {'code': int},
               'code': 2,
               '__init__': <function __main__.ID.__init__(self)>,
               '__repr__': <function __main__.ID.__repr__(self) -> str>,
               'next_id': <classmethod at 0x7f1cda15f8b0>,
               '__dict__': <attribute '__dict__' of 'ID' objects>,
               '__weakref__': <attribute '__weakref__' of 'ID' objects>,
               '__doc__': None}),
 {'code': 0})

### Halmaz típus listával

Előadáson javasolta az előadó, hogy implementáljuk a halmaz típus néhány műveletét **lista** segítségével. 

Egészítsük ki az alábbi kódot:

In [47]:
class Set:
    def __init__(self, initial_value=None):
        ## jó ez így?? Ha nem javítsuk ki!
        ## pl. Set((1,1,1)) mi lesz? 
        # self._value = [] if initial_value is None else list(initial_value)
    
        self._value = []
        if initial_value is not None:
            for x in initial_value:
                self.add(x)

    def __str__(self):
        return f"{type(self).__name__} with {len(self._value)} element."
    
    def __repr__(self):
        return f"{{{', '.join(map(repr, self._value))}}}"
    
    def add(self, x):
        if x not in self._value:
            self._value.append(x)
        return self

    def union(self, other):
        result = Set(self._value)
        return result.update(other)

    def update(self, other):
        for x in other:
            self.add(x)
        return self

    def intersection(self, other):
        result = Set()
        for x in other:
            if x in self:
                result.add(x)
        return result

    def difference(self, other):
        result = Set()
        for x in self:
            if x not in other:
                result.add(x)
        return result

    def __or__(self, other):
        # only for testing that | really calls this
        print(f"__or__({self!r}, {other!r})")
        return self.union(other)

    def __and__(self, other):
        # only for testing that & really calls this
        print(f"__and__({self!r}, {other!r})")
        return self.intersection(other)

    def __iter__(self):
        return iter(self._value)

    def __contains__(self, x):
        return x in self._value        

    def __xor__(self, other):
        # only for testing if ^ really calls this
        print(f"__xor__({self!r}, {other!r})")
        result = Set()
        for x in other:
            if x not in self:
                result.add(x)
        for x in self:
            if x not in other:
                result.add(x)
        return result

    def __add__(self, other):
        return self.union(other)

    def __iadd__(self, other):
        # only for testing if += really calls this
        print(f"__iadd__({self!r}, {other!r})")
        return self.update(other)

    ## adjuk hozzá a __sub__, __isub__, __iand__, __ior__, __ixor__ stb dunder metódusokat is.
    ## először tényleges implementáció nélkül, a fenti stílusban.



In [49]:
A = Set((1,2,3))
B = Set((2,4))
A += B
print(f"{A}, {repr(A)}")
A|B, A&B, A^B, A+B

__iadd__({1, 2, 3}, {2, 4})
Set with 4 element., {1, 2, 3, 4}
__or__({1, 2, 3, 4}, {2, 4})
__and__({1, 2, 3, 4}, {2, 4})
__xor__({1, 2, 3, 4}, {2, 4})


({1, 2, 3, 4}, {2, 4}, {1, 3}, {1, 2, 3, 4})