# Párhuzamos programozás

## Példa: átlagos átmérő

In [1]:
import networkx as nx
import time
import numpy as np

Ki szeretném számolni átlagos átmérőjét a gráfokak. Egy gráf átmérője a maximális legrövidebb út hossza. Ehhez írtam egy függvényt.

In [2]:
def diameter(graph_type, graph_args):
    # generate a graph
    if graph_type=='erdos-renyi':
        G = nx.erdos_renyi_graph(*graph_args)
    if graph_type=='barabasi':
        G = nx.barabasi_albert_graph(*graph_args)
    if graph_type=='random-geometric':
        random_geometric_graph(*graph_args)
    
    # calculate the shortest path for all node pairs
    paths=dict(nx.shortest_path_length(G))
    
    # return max of the shortes path
    return max(max(paths[node].values()) for node in paths.keys())

In [3]:
 # paths[node][other_node] node és az other_node közötti legrövidebb ut hossza

#### Erdős Rényi gráf

wiki: https://hu.wikipedia.org/wiki/Erd%C5%91s%E2%80%93R%C3%A9nyi-modell

In [4]:
graph_type='erdos-renyi'
#csúcsok száma
n = 1000
#összekötés valószínűsége két csúcs között
p = 0.05
graph_args=(n,p)

In [5]:
diameter(graph_type, graph_args)

3

In [16]:
iterations=100

In [17]:
t=time.time()
results = []
for i in range(iterations):
    results.append(diameter(graph_type, graph_args))

print(f'Átlagos átmérő {graph_type} gráfban {graph_args} argumentumokkal: {np.mean(results)}')    
print(f'Futási idő:{time.time() - t}')

KeyboardInterrupt: 

#### Barabási-Albert gráf

wiki: https://hu.wikipedia.org/wiki/Barab%C3%A1si%E2%80%93Albert-modell

In [8]:
graph_type='barabasi'
# csúcsok száma
n = 1000
# új élek száma minden csúccsal
m = 2
graph_args=(n,m)

In [9]:
t=time.time()
results = []
for i in range(iterations):
    results.append(diameter(graph_type, graph_args))

print(f'Átlagos átmérő {graph_type} gráfban {graph_args} argumentumokkal: {np.mean(results)}')    
print(f'Futási idő:{time.time() - t}')

Átlagos átmérő barabasi gráfban (1000, 2) argumentumokkal: 7.4
Futási idő:4.308086633682251


### Párhuzamosítás, multiprocessing modul

Futtassuk párhuzamosan, amit lehet!!! htop paranccsal nézhetjük a processorok munkáját, vagy a feladatkezeőben!


In [10]:
import multiprocessing

In [11]:
graph_type='erdos-renyi'
#csúcsok száma
n = 1000
#összekötés valószínűsége két csúcs között
p = 0.05
graph_args=(n,p)

In [18]:
t=time.time()
pool = multiprocessing.Pool(processes=5)

results = []
for i in range(iterations):
    results.append(pool.apply_async(diameter, args=(graph_type, graph_args)))

pool.close()
pool.join()

results_save=[]
for i in range(iterations):
    results_save.append(results[i].get())
    
print(f'Átlagos átmérő {graph_type} gráfban {graph_args} argumentumokkal: {np.mean(results_save)}')    
print(f'Futási idő:{time.time() - t}')

Átlagos átmérő barabasi gráfban (1000, 2) argumentumokkal: 7.26
Futási idő:22.925119638442993


Még egy szint, párhuzamosítsuk a gráf typusok ciklusát is!

In [14]:
graphs=[]

graph_type='erdos-renyi'
n = 1000
p = 0.01
graph_args=(n,p)

graphs.append({'type':graph_type,'args':graph_args})

graph_type='barabasi'
n = 1000
m = 2
graph_args=(n,m)

graphs.append({'type':graph_type,'args':graph_args})

In [15]:
t=time.time()
pool = multiprocessing.Pool(processes=5)

results = []
for graph in graphs:
    results_graph=[]
    graph_type=graph['type']
    graph_args=graph['args']
    for i in range(iterations):
        results_graph.append(pool.apply_async(diameter, args=(graph_type, graph_args)))
    results.append(results_graph)

pool.close()
pool.join()


for graph_i,graph in enumerate(graphs):
    results_save=[]
    graph_type=graph['type']
    graph_args=graph['args']
    for i in range(iterations):
        results_save.append(results[graph_i][i].get())
    print(f'Átlagos átmérő {graph_type} gráfban {graph_args} argumentumokkal: {np.mean(results_save)}')        
    print('')
print(f'Futási idő:{time.time() - t}')




Átlagos átmérő erdos-renyi gráfban (1000, 0.01) argumentumokkal: 5.8

Átlagos átmérő barabasi gráfban (1000, 2) argumentumokkal: 7.6

Futási idő:2.844782590866089


# Csoportmunka:

***Téma: pandas, adatok, ábrák, numpy***

**Leírás:**

Mindent lehet használni: régi notebookok, elődás, internet, ami kell jöhet!

Feladat: adatelemzés

Dolgozzatok Közösen, osszátok fel magatok között a feladatokat, passzoljátok át a függvényeket. Cél: minél több feladat teljesítése időre. És legyen leglalább egy notebookotok, amiben egyesítitek a megoldásokat és elkülditek nekem emailen! -> jutalom: mindenkinek egy pont a csapaton belül.

A gyak12 mappában található csoportmunka nevű táblázaton belül találjátok az adathalmazok leírását és a hozzájuk tartozó feladatokat. Válaszzátok ki a számotokra szimpatikusabb adathalmazt, és dolgozzatok rajta csoportban a 15:20-ig. Utána egyesítsétek a kódotokat egy notebookba, majd küldjétek el nekem, hogy át tudjam nézni és ki tudjam majd rakni githubra.

Jó Munkát! :)