[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/prokaj/elte-python/blob/main/6-gyakorlat.ipynb)

## Feladatok előadásról


### 2-sum

Adott egy $n\leq 10^5$ szám és egy $n$ hosszú $a$ lista, melynek elemeire $-10^{5} \leq a_i \leq 10^5$ teljesül.

Keressünk olyan $1\leq p<q\leq n$ indexpárt, hogy $a[p] = −a[q]$, ha ilyen létezik.


Például:
```
5
5 4 -5 6 8
```

itt egy lehetséges válasz `(0, 2)`

**Ötlet**: iteráljunk végig az indexpárokon és vizsgáljuk meg minden esetben, hogy teljesíti-e a feltételeket.

Ezt a megoldási módszert, amiben potenciálisan minden lehetséges jelöltet kipróbálunk, **brute force**-alapú (nyers erő) megoldásnak nevezünk. A brute force megoldás mindig működik, a kérdés inkább az, hogy vajon nem tudunk-e ennél jobbat kitalálni.

In [1]:
from itertools import combinations

def solve_2_sum(seq):
    for (i1, x1), (i2, x2) in combinations(enumerate(seq), 2):
        if x1 == -x2:
            return i1, i2
                
    return None


In [2]:
def format_ns(t):
    for unit in ['ns', 'μs', 'ms']:
        if t<1000:
            return f"{t:.2f} {unit}"
        t /= 1000
    return f"{t:.2f} s"

In [3]:
import random
import time

random.seed(2112)

xss = [[random.randint(-10**5, 10**5) for _ in range(50_000)],
       list(range(1,51)),
       list(range(1,501)),
       list(range(1,5_001))]

for xs in xss:
    t = time.perf_counter_ns()
    res = solve_2_sum(xs)
    print(f"run time: {format_ns(time.perf_counter_ns() - t)}")
    print(f"solution: {res}, check xs[res]={tuple(xs[i] for i in res) if res else res}")



run time: 31.35 ms
solution: (1, 6739), check xs[res]=(30064, -30064)
run time: 75.22 μs
solution: None, check xs[res]=None
run time: 6.71 ms
solution: None, check xs[res]=None
run time: 544.29 ms
solution: None, check xs[res]=None


A futási idő négyzetes a sorozat hosszában. Ha a bemenet 50_000 hosszúságú, akkor várhatóan
$$
    550*100~\text{ms} = 55~000~\text{ms} = 55~\text{s} 
$$
a futási idő

Milyen típus lenne alkalmas a már látott értékek és legalább egy hozzájuk tartozó index tárolására?

Egészítsük ki a következő függvényt

In [4]:
def solve_2_sum_better(seq):
    
    for i, x in enumerate(seq):
        ## ha -x volt korábban return 
        pass
    return None

In [5]:
random.seed(2112)

xss = [
       [random.randint(-10**5, 10**5) for _ in range(50_000)], 
       list(range(1,51)),list(range(1,501)),
       list(range(1,5_001)),
       list(range(1,50_001)),
       [1]*50, [1]*500, [1]*5_000, [1]*50_000
       ]
       

for xs in xss:
    print(f"---xs min={min(xs)}, max={max(xs)}, len(xs)={len(xs)}")

    t = time.perf_counter_ns()
    res = solve_2_sum_better(xs)
    print(f"   run time: {format_ns(time.perf_counter_ns() - t)}")
    print(f"   solution: {res}, check xs[res]={tuple(xs[i] for i in res) if res else res}")
    print("---")

---xs min=-99999, max=99997, len(xs)=50000
   run time: 1.49 ms
   solution: None, check xs[res]=None
---
---xs min=1, max=50, len(xs)=50
   run time: 2.86 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=500, len(xs)=500
   run time: 12.71 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=5000, len(xs)=5000
   run time: 150.02 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=50000, len(xs)=50000
   run time: 1.51 ms
   solution: None, check xs[res]=None
---
---xs min=1, max=1, len(xs)=50
   run time: 2.86 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=1, len(xs)=500
   run time: 12.29 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=1, len(xs)=5000
   run time: 144.85 μs
   solution: None, check xs[res]=None
---
---xs min=1, max=1, len(xs)=50000
   run time: 1.59 ms
   solution: None, check xs[res]=None
---


## Fibonacci zárt alakban

Ötlet. $f_{n} = f_{n-1}+f_{n-2}$ megoldását keressük $f_n=x^n$ alakban, alkalmas $x$-szel. Azaz oldjuk meg a
$$
    x^{n} = x^{n-1}+x^{n-2},\quad n\geq 2
$$
egyenletet. Az azonosan nulla sorozat nem érdekel minket. Ha $x\neq0$, akkor átosztás és átrendezés után
$$
    x^2-x-1=0\quad x_{1,2}=\frac{1\pm\sqrt{(-1)^2-4\cdot(-1)}}{2}=\frac{1\pm\sqrt{5}}2
$$
Tetszőleges $c_1,c_2\in\mathbb{R}$ számokra
$$
    f_n=c_1 x_1^n +c_2x_2^n
$$ 
kielégíti a Fibinacci sorozat rekurzióját. Ahhoz, hogy $f_0=0$, $f_1=1$ is teljesüljön,
$$
    f_0 = c_1+c_2 = 0,\quad f_1=c_1x_1+c_2x_2=c_1(x_1-x_2)=1
$$
is kell. $x_1-x_2=\sqrt{5}$, azaz $c_1=\frac{\sqrt{5}}{5}$ és $c_2=-\frac{\sqrt{5}}{5}$.

A $f_0=0$, $f_1=1$ kezdeti értékekből induló sorozat $n$. tagja zárt alakban tehát:
$$
    f_0=0,\quad
    f_1=1,\quad
    f_n = \frac{1}{\sqrt{5}}\left(\left(\frac{1+\sqrt{5}}{2}\right)^n- \left(\frac{1-\sqrt{5}}{2}\right)^n\right)
$$


Előadás a sorozatot $f_0=1$, $f_1=1$-ből indítottuk. Ez csak az index eltolását jelenti, ha ugyanis $f_0=0$, $f_1=1$, akkor $f_2=1$ és megkapjuk az elődáson szereplő értékeket az eggyel nagyobb indexű helyen.

Előadás változatra a zárt alak:
$$
    f_0=1,\quad
    f_1=1,\quad
    f_n = \frac{1}{\sqrt{5}}\left(\left(\frac{1+\sqrt{5}}{2}\right)^{n+1}- \left(\frac{1-\sqrt{5}}{2}\right)^{n+1}\right)
$$

**Próbáljuk ki, hogy működik-e?**

Egészítsük ki a következő függvény definíciót!

In [6]:
import math

sqrt5 = math.sqrt(5)

def fibonacci_super_fast(n):
    pass


def fibonacci(n):
    a, b = 1, 1
    for _ in range(n):
        a, b = a+b, a
    return b

In [7]:
try:
    import ipytest
    ipytest.autoconfig()
    
except ModuleNotFoundError:
    print("Trying to install ipytest")
    ! pip install ipytest --quiet
    print("Try again!")

In [8]:
%%ipytest

def test_fibonacci():
    assert fibonacci(0) == 1
    assert fibonacci(1) == 1
    assert fibonacci(2) == 2
    assert fibonacci(3) == 3
    assert fibonacci(4) == 5
    
def test_super_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_super_fast(n)
    

[32m.[0m[31mF[0m[31m                                                                                           [100%][0m
[31m[1m____________________________________ test_super_fibonacci_fast _____________________________________[0m

    [94mdef[39;49;00m [92mtest_super_fibonacci_fast[39;49;00m():
        [94mfor[39;49;00m n [95min[39;49;00m [96mrange[39;49;00m([94m100[39;49;00m):
>           [94massert[39;49;00m fibonacci(n) == fibonacci_super_fast(n)
[1m[31mE           assert 1 == None[0m
[1m[31mE            +  where 1 = fibonacci(0)[0m
[1m[31mE            +  and   None = fibonacci_super_fast(0)[0m

[1m[31m/tmp/ipykernel_591802/882599773.py[0m:10: AssertionError
FAILED tmpa99y5wau.py::test_super_fibonacci_fast - assert 1 == None
[31m[31m[1m1 failed[0m, [32m1 passed[0m[31m in 0.08s[0m[0m


Mi okozza a hibát? Meg lehet oldani?

Ötletek:

1. $a+b\sqrt{5}$ alakú számokkal dolgozunk, ahol $a$, $b$ racionális. A python képes kezelni racionális számokat
   `Fraction` erre építve definálhatunk egy osztályt, ami a $\mathbb(Q)(\sqrt{5})=\left\{a+b\sqrt{5}\colon a,b\in\mathbb{Q}\right\}$ testet implementálja: Összeadás, kivonás, szorzás, osztás, hatványozás és akkor a kerekítési hibáktól megszabadulunk. (HF.)

2. Újra gondoljuk a zárt alakot.
   
   Ha $v_n=(f_{n+1},f_n)^T$, akkor $n>0$-re
   $$
      v_n = \begin{pmatrix}f_{n+1}\\f_{n}\end{pmatrix} = 
      \underbrace{\begin{pmatrix}1 & 1\\ 1 & 0\end{pmatrix}}_{=A}\begin{pmatrix}f_{n}\\f_{n-1}\end{pmatrix} = A v_{n-1}
   $$
   Itt $v_0=(1,1)^T$ és iterálva az összefüggést:
   $$
      v_n=Av_{n-1}=A(A v_{n-2})=\cdots= A^n v_0
   $$
   Az $A$ mátrix elemei egészek, $A^n$ is ilyen, azaz elég az (egész értékű) $A$ mátrix $n$. hatványát kiszámolni.
   $$
      f_n = (0, 1) A^n v_0
   $$

   Ha $n = \sum_{i} r_i 2^i$, ahol $r_i\in\{0,1\}$ a diakikus jegyek sorozata, akkor
   $$
      A^n = \prod_{i: r_i=1} A^{2^i}
   $$ 

   Írjunk egy függvényt, ami $2\times 2$ mátrixok szorzatát számolja ki! Ennek segítségével implementáljuk a mátrix hatványozást!

   Mátrixokat kényelmesen ábrázolhatunk listákkal, pl. `A = [A_11, A_12, A_21, A_22]`. Ráadásul a mi esetünkben, a mátrix szimmetrikus, az hatványozásnál megmarad, akár ezt is kihasználhatjuk.


#### Mi köze a két zárt alaknak egymáshoz?

Otthon gondolkodjunk rajta!

In [9]:

def mat_mul(A, B):
    """
    product of self-adjoint 2x2 matrices
    given in the following format
    A = [A_11, A_12, A_22]
    
    The return value has the same format!
    """
    return [A[0]*B[0]+A[1]*B[1], A[0]*B[1]+A[1]*B[2], A[1]*B[1]+A[2]*B[2]]

def mat_pow(A, n):
    n, r = divmod(n, 2)
    B =  A if r==1 else [1, 0, 1]## identity matrix 
    while n>0:
        A = mat_mul(A, A)
        n, r = divmod(n, 2)
        if r==1:
            B = mat_mul(B, A)
    return B
    

def mat_str(A):
    a = [str(ai) for ai in A]
    max_width = max(len(ai) for ai in a)
    format_str = f">{max_width}"
    return  f"{a[0]:{format_str}} {a[1]:{format_str}}\n{a[1]:{format_str}} {a[2]:{format_str}}"


In [10]:
A = [1,1,0]
print(f"A=\n{mat_str([1,1,0])}\n---")

B = mat_mul(A, A)
exponent=2
print(f"A^{exponent}=\n{mat_str(B)}\n---")

for _ in range(5):
    B = mat_mul(B, B)
    exponent *= 2
    print(f"A^{exponent}=\n{mat_str(B)}\n---")


A=
1 1
1 0
---
A^2=
2 1
1 1
---
A^4=
5 3
3 2
---
A^8=
34 21
21 13
---
A^16=
1597  987
 987  610
---
A^32=
3524578 2178309
2178309 1346269
---
A^64=
17167680177565 10610209857723
10610209857723  6557470319842
---


In [11]:
%%ipytest

def test_mat_exp():
    A = [1,1,1]
    assert mat_pow(A, 0) == [1, 0, 1]
    assert mat_pow(A, 1) == A
    B = A
    for k in range(2, 10):
        B = mat_mul(B, A)
        assert mat_pow(A, k) == B

[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.00s[0m[0m


In [12]:
def fibonacci_fast(n):
    A = [1, 1, 0]
    B = mat_pow(A, n)
    # B = A**n
    # (0, 1) B (1, 1)^T = B_21+B_22
    return B[1]+B[2]

In [13]:
%%ipytest

def test_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_fast(n)


[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.01s[0m[0m


Melyik változat a gyorsabb?

In [14]:
for n in [10, 100, 1000, 10_000]:
    for f in [fibonacci, fibonacci_fast]:
        txt = f"{f.__name__}({n}):"
        print(f"{txt:>25}", end=" ")
        %timeit f(n)



           fibonacci(10): 857 ns ± 17.8 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)
      fibonacci_fast(10): 2.3 µs ± 14.1 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
          fibonacci(100): 3.59 µs ± 29 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
     fibonacci_fast(100): 4.15 µs ± 50.6 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
         fibonacci(1000): 45 µs ± 426 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)
    fibonacci_fast(1000): 8.65 µs ± 46.1 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
        fibonacci(10000): 1.21 ms ± 30.2 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
   fibonacci_fast(10000): 81.2 µs ± 547 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


### Mátrix class

Néhány műveletet defináltunk 2x2 szimmetrikus mátrixokra. Ezt elegánsabban is megtehetjük. 

In [15]:
class SymmetricMatrix:
    """Symmetric 2x2 matrix"""
    
    def __init__(self, values):
        self.values = list(values)
    
    def __mul__(self, other):
        A = self.values
        B = other.values 
        result = [A[0]*B[0]+A[1]*B[1], A[0]*B[1]+A[1]*B[2], A[1]*B[1]+A[2]*B[2]]
        return type(self)(result)

    def __add__(self, other):
        return type(self)(ai+bi for ai, bi in zip(self.values, other.values))
    
    def __pow__(self, n):
        n, r = divmod(n, 2)
        B = self if r==1 else type(self)([1, 0, 1]) ## identity matrix
        A = self 
        while n>0:
            A = A * A
            n, r = divmod(n, 2)
            if r==1:
                B = B * A
        return B

    def __repr__(self):
        return f"{type(self).__name__}({self.values})"

    def __str__(self):
        a = [str(ai) for ai in self.values]
        max_width = max(len(ai) for ai in a)
        format_str = f">{max_width}"
        return  f"{a[0]:{format_str}} {a[1]:{format_str}}\n{a[1]:{format_str}} {a[2]:{format_str}}"


In [16]:
def fibonacci_fast2(n):
    B = SymmetricMatrix([1, 1, 0])**n
    # B = A**n
    # (0, 1) B (1, 1)^T = B_21+B_22
    _, b , c = B.values
    return b+c

In [17]:
%%ipytest

def test_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_fast2(n)


[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.01s[0m[0m


In [22]:
for n in [100, 1000]:
    for f in [fibonacci, fibonacci_fast, fibonacci_fast2]:
        txt = f"{f.__name__}({n}):"
        print(f"{txt:>25}", end=" ")
        %timeit f(n)


          fibonacci(100): 3.62 µs ± 31.5 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
     fibonacci_fast(100): 4.13 µs ± 20.1 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
    fibonacci_fast2(100): 7.37 µs ± 36.5 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
         fibonacci(1000): 43.9 µs ± 410 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)
    fibonacci_fast(1000): 8.62 µs ± 41.1 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
   fibonacci_fast2(1000): 13.6 µs ± 87.1 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


Az eleganciának ára van. Lehetne optimalizálni a hatványozást úgy, 
hogy csak a végén hozzuk létre a SymmetricMatrix típust

## Kivételkezelés

    try:
        pass
    except:
        pass
    else:
        pass
    finally:
        pass
        
Nem nagyon fogunk olyan kódot írni, ami ezt használja. Kivéve két esetet:

- üres sorozat kezelése `next` `iter` hívásoknál: `StopIteration`

- Adatok letöltése internetről. `TimeoutError`, `HTTPError` stb.

- Saját kontexus `with` statementhez, hasonló ahhoz, amit file olvasásnál láttunk előadáson.


****


## Olvasás fileból

    with open(filename, mode) as file:
       do_something with file
       
- `filename` a file elérési útja
- `mode` 
  + `r` reading olvasás
  + `w` writing írás
  + `b` binary
  + `t` text
  + `a` append
  
  Ha nem adjuk meg `rt`.
  
  Lehetne még `r, w, rb, wb, a`
  

### Feladat.

Írjuk meg a `grep` program egyszerűsített változatát.

A `grep` soronként olvas egy szövegfileból és a megadott mintát tartalmazó sorokat kiírja a kimenetre.

Képes arra, hogy kiírja a mintát tartalmazó sorral együtt azt megelőző és azt követő néhány sort is.

A mi változatunk egy generator függvény lesz, ami a megadott file soraiból azokat tartja meg, amik az adott mintát tartalmazzák.


In [19]:
%%writefile test.txt
első sor
második sor
harmadik
utolsó

Overwriting test.txt


In [20]:
filename = "test.txt"

with open(filename, "r") as file:
    print(file)
    print(f"---{filename}:")
    for line in file:
        print(line, end="")
    print("---")
        

<_io.TextIOWrapper name='test.txt' mode='r' encoding='UTF-8'>
---test.txt:
első sor
második sor
harmadik
utolsó
---


Egészítsük ki a következő kódot!

In [23]:
def simple_grep(filename: str, pattern: str): # Generator[str]
    with open(filename, "r") as file:
        for line in file:
            if pattern in line:
                yield line

In [24]:
list(simple_grep("test.txt", "ls"))

['első sor\n', 'utolsó\n']

### Adatok olvasása netről

Ez  megoldható `urllib.request` modullal


In [25]:
import urllib.request as request

url = "https://www.gutenberg.org/files/1342/1342-0.txt" # Pride and prejudice
url = "https://www.gutenberg.org/ebooks/67098.txt.utf-8" # Winnie the pooh

with request.urlopen(url) as file:
    btext = file.read()

print(type(btext))

<class 'bytes'>


In [26]:
text = btext.decode()
lines = text.split("\n")


In [28]:
len(lines), lines[40:50]

(4003,
 ['                        When We Were Very Young\r',
  '\r',
  '    "_The best book of verses for children_ _ever written._"--A. EDWARD\r',
  '    NEWTON in _The Atlantic Monthly_.\r',
  '\r',
  '              Fourteen Songs from When We Were Very Young\r',
  '\r',
  '    Words by A. A. Milne. Music by H. Fraser-Simson. Decorations by\r',
  '    E. H. Shepard.\r',
  '\r'])

### File letöltés 

In [29]:
request.urlretrieve?

[0;31mSignature:[0m [0mrequest[0m[0;34m.[0m[0murlretrieve[0m[0;34m([0m[0murl[0m[0;34m,[0m [0mfilename[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreporthook[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mdata[0m[0;34m=[0m[0;32mNone[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Retrieve a URL into a temporary location on disk.

Requires a URL argument. If a filename is passed, it is used as
the temporary file location. The reporthook argument should be
a callable that accepts a block number, a read size, and the
total file size of the URL target. The data argument should be
valid URL encoded data.

If a filename is passed and the URL points to a local resource,
the result is a copy from local file to new file.

Returns a tuple containing the path to the newly created
data file as well as the resulting HTTPMessage object.
[0;31mFile:[0m      ~/.config/jupyterlab-desktop/jlab_server/lib/python3.8/urllib/request.py
[0;31mType:[0m      function


In [30]:
request.urlretrieve(url, "winnie-the-pooh.txt")

('winnie-the-pooh.txt', <http.client.HTTPMessage at 0x7fa1d1209d90>)

In [31]:
! ls

1-gyakorlat.ipynb  6-gyakorlat.ipynb  Digraph.gv       test.txt
2-gyakorlat.ipynb  7-gyakorlat.ipynb  Digraph.gv.pdf   winnie-the-pooh.txt
3-gyakorlat.ipynb  8-gyakorlat.ipynb  P0022_names.txt
4-gyakorlat.ipynb  9-gyakorlat.ipynb  __pycache__
5-gyakorlat.ipynb  conway.py	      README.md


In [32]:
! head winnie-the-pooh.txt

The Project Gutenberg eBook of Winnie-the-Pooh, by A. A. Milne

This eBook is for the use of anyone anywhere in the United States and
most other parts of the world at no cost and with almost no restrictions
whatsoever. You may copy it, give it away or re-use it under the terms
of the Project Gutenberg License included with this eBook or online at
www.gutenberg.org. If you are not located in the United States, you
will have to check the laws of the country where you are located before
using this eBook.



In [33]:
def simple_grep(filename: str, pattern: str): # Generator[str]
    with open(filename, "r") as file:
        for lineno, line in enumerate(file):
            if pattern in line.lower():
                yield lineno, line

## Melyek a leggyakoribb szavak a Micimackó angol változatában? 

In [34]:
from collections import Counter

In [35]:
def words(lines):
    for line in lines:
        for word in line.split():
            yield word

Gondoljuk meg, hogyan tudnánk az írásjelektől megszabadulni!

In [36]:
with open("winnie-the-pooh.txt") as textfile:
    counter = Counter(map(str.lower, words(textfile)))
len(counter)

4557

In [38]:
counter.most_common(20)

[('and', 995),
 ('the', 879),
 ('to', 634),
 ('he', 634),
 ('a', 588),
 ('of', 507),
 ('said', 445),
 ('it', 369),
 ('in', 322),
 ('you', 320),
 ('was', 288),
 ('i', 273),
 ('his', 220),
 ('that', 212),
 ('as', 185),
 ('with', 165),
 ('had', 164),
 ('pooh', 164),
 ('at', 159),
 ('for', 156)]

## Feladat előadásról

Adva van egy szövegfile. [P0022.txt](https://eltehu.sharepoint.com/:t:/s/Crs22-23-1bevtudprogm22ea1Bevezetsatudomnyosprogramozsbaelad/EcraA_ZkX4VGpoCn4mzaCCcBlKbsnmDqrm_EejiXr7-57g?e=BhFq1M)

Ebben a fájlban keresztnevek vannak. Hány olyan lényegében különböző névpár van, hogy a pár második eleme az első névnek a megfordítottja?

pl. ("NORA", "ARON")


Az ("ARON", "NORA") pár nem különbözik lényegében az előzőtől.

A nevek kezdőbetűit tekintve melyik az 5 leggyakoribb? W-vel vagy C-vel kezdődik több név?

In [39]:
import urllib.request as request

url = "https://eltehu.sharepoint.com/:t:/s/Crs22-23-1bevtudprogm22ea1Bevezetsatudomnyosprogramozsbaelad/EcraA_ZkX4VGpoCn4mzaCCcBlKbsnmDqrm_EejiXr7-57g?e=BhFq1M"
try:
    request.urlretrieve(url, "P0022_names.txt")

except request.HTTPError:
    print("Downnload manually!")


Downnload manually!


In [40]:
with open("./P0022_names.txt") as f:
    names = [line.strip() for line in f]
len(names)

21985

In [41]:
from itertools import combinations


Párok brute force-szal.

In [42]:
%%time
[(a,b) for a, b in combinations(names, 2) if a[::-1]==b] + [(a,a) for a in names if a==a[::-1]]


CPU times: user 22.5 s, sys: 20 ms, total: 22.5 s
Wall time: 22.6 s


[]

In [43]:
%%time
A = set(names)
pairs = [(x, x[::-1]) for x in names if x<=x[::-1] and x[::-1] in A]
len(pairs)

CPU times: user 12.8 ms, sys: 2 µs, total: 12.8 ms
Wall time: 11.8 ms


0

In [44]:
from collections import Counter

counter = Counter(x[0] for x in names)
counter.most_common(5)

[('S', 1763), ('M', 1691), ('C', 1602), ('A', 1544), ('B', 1541)]