# Random Math Time

Zapoznamy się z modułami biblioteki standardowej:

* random, math, time

<br>


A w szczególności z funkcjami:

*  RANDOM
    * randrange, randint, choice, choices, sample, random, uniform, shuffle

<br>

* MATH
    * gcd, lcm, perm, prod, exp, log, pow, sqrt, cos, sin
    
<br>

* TIME
    * sleep, time, ctime, perf_counter


<br>


## Random

Moduł *random* zawiera funkcjonalność generowania liczb pseudolosowych z różnych rozkładów. Wykorzystywany jest w tym algorytm *Mersenne Twister*.

In [1]:
import random

# ziarno - stan wewnętrzny generatora (domyślnie czas systemowy)
random.seed(7122023)

# 'losowa' liczba całkowita z przedziału domkniętego [a, b]
random.randint(0, 5)

5

In [2]:
studenci = ["Janusz", "Bożydar", "Ola"]

# 'losowy' element z sekwencji (do oblania)
random.choice(studenci)

'Janusz'

In [3]:
import string

# losowanie k elementów z populacji z zwracaniem, możliwe podanie wag
tresc_zadania_dla_studentow = " ".join(["".join(random.choices(string.ascii_lowercase, k=random.randint(1,10))) 
                                        for i in range(random.randint(10, 20))])

print("Zadanie 1. ", tresc_zadania_dla_studentow[0].upper() + tresc_zadania_dla_studentow[1:] + ".")

Zadanie 1.  Iqqrpvp vmh ujzxvjd pcl oo iauvarqpq yd leeu zk mp wins hqr rlxp eyfbo hxezudnyzy.


In [4]:
# zwraca listę k unikalnych elementów z sekwencji (bez zwracania)

random.sample(studenci, k=2)

['Bożydar', 'Ola']

In [5]:
# 'losowy' element z range
# choice(range(start, stop, step))

ocena_testu = random.randrange(0, 100, 5)
print(ocena_testu)

55


In [6]:
# z przedizału [0, 1)

random.random()

0.7258058265902769

In [7]:
random.uniform(10, 20)

14.860756019580869

In [8]:
# miesza elementy listy in-place, zwraca None

print(studenci)
random.shuffle(studenci)
print(studenci)

['Janusz', 'Bożydar', 'Ola']
['Bożydar', 'Ola', 'Janusz']


## Math

Funkcje matematyczne, ale nie dla liczb urojonych.. (skromna selekcja)

In [9]:
import math

# Największy wspólny dzielnik, przydatny w zadaniach algorytmicznych..
math.gcd(69, 420, 666, 2137, 80085)

1

In [10]:
# Najmniejsza wspólna wielokrotność

math.lcm(2, 3, 4, 5, 7)

420

In [11]:
# liczba wyboru k z n bez powtórzeń (n! / (n - k)!)

math.perm(5, 2)

20

In [12]:
# iloczyn z kolekcji

math.prod([2, 3, 5])

30

In [13]:
# e^x

math.exp(3)

20.085536923187668

In [14]:
# log a o podstawie b (domyślnie math.e)

math.log(8, 2)

3.0

In [15]:
# x**y

math.pow(2, 3)

8.0

In [16]:
# x^(1/2)

math.sqrt(5)

2.23606797749979

In [17]:
# sin(x) w radianach

math.sin(1)

0.8414709848078965

## Time

Funkcje związane z *czasem*.. mogą zależeć od systemu operacyjnego. Czas mierzony jest w sekundach od początku *epoki*.

In [18]:
import time

t = time.time()
print(t)

# konwersja do czasu lokalnego
print(time.ctime(t))

1733410733.6669922
Thu Dec  5 15:58:53 2024


In [19]:
# data pierwszej epoki

print(time.gmtime(0))

time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=1, tm_isdst=0)


In [20]:
# pomiar czasu do benchmarkingu / można również perf_counter_ns() dla większej precyzji

t0 = time.perf_counter()

# bezczynność w sekundach
time.sleep(5)

t1 = time.perf_counter()

print(f"obliczenia wykonane w {t1-t0} sekund!")

obliczenia wykonane w 5.0002335999161005 sekund!


### Naiwan metoda szukania miejsc zerowych wielomianów

Metoda **Fixed-point iteration**, w ogólności najpewniej wybuchnie. Można to przetestować podając inne początkowe wartości x. Najpierw przekształcamy równanie do postaci x = *wyrażenie*. Następnie ustawiamy x na *coś* i mocno trzymamy kciuki. Procedurę zatrzymujemy gdy osiągniemy dopuszczony poziom błędu.

x<sub>n+1</sub> = f(x<sub>n</sub>)

In [21]:
def f(x):
    # równanie 2*x**2 - 5*x + 3 = 0 --> x = (2*x**2 + 3)/5
    return (2*x**2 + 3)/5

x = 0 # zgadujemy

for i in range(1, 101):
    new_x = f(x)
    
    if abs(new_x - x) < 0.000001:
        break
        
    x = new_x
    
print(f"Miejsce zerowe w x = {new_x:.2f} znalezione w {i} iteracjach")

Miejsce zerowe w x = 1.00 znalezione w 50 iteracjach


## Dodatek: Trochę o profilowaniu kodu

In [22]:
import cProfile
import re

cProfile.run('re.compile("foo|bar")')

         218 function calls (211 primitive calls) in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 __init__.py:225(compile)
        1    0.000    0.000    0.000    0.000 __init__.py:272(_compile)
        1    0.000    0.000    0.000    0.000 _compiler.py:214(_compile_charset)
        1    0.000    0.000    0.000    0.000 _compiler.py:241(_optimize_charset)
      3/1    0.000    0.000    0.000    0.000 _compiler.py:37(_compile)
        2    0.000    0.000    0.000    0.000 _compiler.py:426(_get_iscased)
        1    0.000    0.000    0.000    0.000 _compiler.py:434(_get_literal_prefix)
        1    0.000    0.000    0.000    0.000 _compiler.py:465(_get_charset_prefix)
        1    0.000    0.000    0.000    0.000 _compiler.py:509(_compile_info)
        2    0.000    0.000    0.000    0.000 _compiler.py:568

In [23]:
import pstats


def some_function():
    total = 0
    for i in range(1, 1000000):
        total += i
    return total

with cProfile.Profile() as profiler: # cProfile z 'menadżerem kontekstu' | zdefiniowane __enter__, __exit__ btw
    some_function()          # kod profilowany

stats = pstats.Stats(profiler)
stats.strip_dirs()           # usuwa informacje o ścieżkach
stats.sort_stats('cumtime')  # lepiej tottime  
stats.print_stats(10)
# stats.dump_stats(filename) # do pliku, następnie wizualizacja np. z snakeviz

         3 function calls in 0.053 seconds

   Ordered by: cumulative time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.053    0.053    0.053    0.053 3540897544.py:4(some_function)
        1    0.000    0.000    0.000    0.000 cProfile.py:118(__exit__)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




<pstats.Stats at 0x1c0a94c0490>

[scalene](https://github.com/plasma-umass/scalene) Inne narzędzie do profilowania.\
[snakeviz](https://github.com/jiffyclub/snakeviz) Narzędzie do wizualizacji pstats (jedno z wielu)

## Dodatek: Sympy - obliczenia symboliczne

In [27]:
from sympy import diff, symbols
from sympy.abc import x

#x = symbols('x')
diff(2*x**2 - 5*x + 3)

4*x - 5

**Zadanie 1.** Napisz funkcję generującą 'losowe' sekwencje DNA o zadanej długości.

**Zadanie 2.** Zaimplementuj metodę Newtona - Raphsona wyszukiwania miejsc zerowych wielomianów. Kod może wyglądać tak samo co w przypadku metody Fixed-point iteration za wyjątkiem sposobu obliczania nowego x. Teraz należy obliczać go zogdnie z poniższym wzorem:

**x<sub>n+1</sub> = x<sub>n</sub> - f(x<sub>n</sub>) / f'(x<sub>n</sub>)**

Obliczenia wykonaj dla funkcji f(x) = 2*x**2 - 5*x + 3.

**Zadanie 3.** Zaimplementuj klasę *LinearRegression* (inicjalizator powinien przyjmować dwie listy - X i Y) posiadającą metody:

* *fit* obliczjącą wartości parametrów a i b równania liniowego:

<br>

$\Huge b = \frac{\bar{y} \sum x _{i} ^{2} - \bar{x} \sum x _{i} y _{i}}{\sum x _{i} ^{2} - n\bar{x} ^{2}}$

<br>

$\Huge a = \frac{\sum x _{i} y _{i} - \bar{x} \sum y _{i}}{\sum x _{i} ^{2} - n\bar{x} ^{2}}$

<br>

gdzie $\bar{x}$ i $\bar{y}$ to średnie list X i Y.

* metodę predict (obliczającą z równania y dla x)

* metodę calc_r_squared obliczającą współczynnik determinacji $R^{2}$ dany wzorem:

$\Huge R ^{2} = \frac{\sum (\hat{y} _{i} - \bar{y}) ^{2}}{\sum (y _{i} - \bar{y}) ^{2}}$

gdzie $y _{i}$ to i-ta obserwacja, $\bar{y}$ to średnia Y, a $\hat{y} _{i}$ to wartość przewidzaina dla i-tego x.

Następnie zaimplementuj funkcję pomocniczą generującą syntetyczne dane np. poprzez dodawanie losowych wartości do y obliczonych dla zadanej funkcji liniowej dla losowych x-ów z zadanego przedziału..