In [10]:
using LinearAlgebraicRepresentation
Lar = LinearAlgebraicRepresentation
using IntervalTrees
using SparseArrays
using NearestNeighbors
using DataStructures
using OrderedCollections
using BenchmarkTools
using LinearAlgebra

## Funzione da ottimizzare

In [11]:
function frag_face(V, EV, FE, sp_idx, sigma)

    vs_num = size(V, 1)

	# 2D transformation of sigma face
    sigmavs = (abs.(FE[sigma:sigma,:]) * abs.(EV))[1,:].nzind
    sV = V[sigmavs, :]
    sEV = EV[FE[sigma, :].nzind, sigmavs]
    M = submanifold_mapping(sV)
    tV = ([V ones(vs_num)]*M)[:, 1:3]  # folle convertire *tutti* i vertici
    sV = tV[sigmavs, :]
    # sigma face intersection with faces in sp_idx[sigma]
    for i in sp_idx[sigma]
        tmpV, tmpEV = face_int(tV, EV, FE[i, :])
		sV, sEV
        sV, sEV = skel_merge(sV, sEV, tmpV, tmpEV)
    end
    
    # computation of 2D arrangement of sigma face
    sV = sV[:, 1:2]
    nV, nEV, nFE = Lar.planar_arrangement(sV, sEV, sparsevec(ones(Int8, length(sigmavs))))
    if nV == nothing ## not possible !! ... (each original face maps to its decomposition)
        return [], spzeros(Int8, 0,0), spzeros(Int8, 0,0)
    end
    nvsize = size(nV, 1)
    nV = [nV zeros(nvsize) ones(nvsize)]*inv(M)[:, 1:3] ## ????
    return nV, nEV, nFE
end

frag_face (generic function with 1 method)

## Dipendenze della funzione

In [12]:
function face_int(V::Lar.Points, EV::Lar.ChainOp, face::Lar.Cell)
    vs = Lar.buildFV(EV, face)
    retV = Lar.Points(undef, 0, 3)
    visited_verts = []
    for i in 1:length(vs)
        o = V[vs[i],:]
        j = i < length(vs) ? i+1 : 1
        d = V[vs[j],:] - o

        err = 10e-8
        # err = 10e-4
        if !(-err < d[3] < err)

            alpha = -o[3] / d[3]

            if -err <= alpha <= 1+err
                p = o + alpha*d

                if -err < alpha < err || 1-err < alpha < 1+err
                    if !(Lar.vin(p, visited_verts))
                        push!(visited_verts, p)
                        retV = [retV; reshape(p, 1, 3)]
                    end
                else
                    retV = [retV; reshape(p, 1, 3)]
                end
            end
        end

    end

    vnum = size(retV, 1)


    if vnum == 1
        vnum = 0
        retV = Lar.Points(undef, 0, 3)
    end
    enum = (÷)(vnum, 2)
    retEV = spzeros(Int8, enum, vnum)

    for i in 1:enum
        retEV[i, 2*i-1:2*i] = [-1, 1]
    end

    retV, retEV
end

function submanifold_mapping(vs)
    u1 = vs[2,:] - vs[1,:]
    u2 = vs[3,:] - vs[1,:]
    u3 = cross(u1, u2)
    T = Matrix{Float64}(LinearAlgebra.I, 4, 4)
    T[4, 1:3] = - vs[1,:]
    M = Matrix{Float64}(LinearAlgebra.I, 4, 4)
    M[1:3, 1:3] = [u1 u2 u3]
    return T*M
end

function skel_merge(V1::Lar.Points, EV1::Lar.ChainOp, V2::Lar.Points, EV2::Lar.ChainOp)
    V = [V1; V2]
    EV = blockdiag(EV1,EV2)
    return V, EV
end
function skel_merge(V1::Lar.Points, EV1::Lar.ChainOp, FE1::Lar.ChainOp, V2::Lar.Points, EV2::Lar.ChainOp, FE2::Lar.ChainOp)
    FE = blockdiag(FE1,FE2)
    V, EV = skel_merge(V1, EV1, V2, EV2)
    return V, EV, FE
end


skel_merge (generic function with 2 methods)

## Dati in input

In [13]:
numThet = 60
b=[[(-4.0*numThet), (4.0*numThet)+20, ((4.0*numThet)/2), ((4.0*numThet)/2)],
[10.0, 10.0, -40.0, 5.0],
[0.0, 0.0, 0.0, -1.0]]
EV=[[1,2],[1,3],[1,4],[2,3],[2,4],[3,4]]
FV=[[1,2,3],[1,2,4],[1,3,4],[2,3,4]]
CV=[[1,2,3,4]]

for i=2:(numThet+1)
    push!(b[1],(1.0 + i*4))
    push!(b[2],(1.0))
    push!(b[3],(-0.5))

    push!(b[1],(4.0 + i*4))
    push!(b[2],(1.0))
    push!(b[3],(-0.5))

    push!(b[1],(2.5 + i*4))
    push!(b[2],(4.0))
    push!(b[3],(-0.5))

    push!(b[1],(2.5 + i*4))
    push!(b[2],(2.5))
    push!(b[3],(0.5))

    push!(EV,[1+4*(i-1),2+4*(i-1)])
    push!(EV,[1+4*(i-1),3+4*(i-1)])
    push!(EV,[1+4*(i-1),4+4*(i-1)])
    push!(EV,[2+4*(i-1),3+4*(i-1)])
    push!(EV,[2+4*(i-1),4+4*(i-1)])
    push!(EV,[3+4*(i-1),4+4*(i-1)])

    push!(FV,[1+4*(i-1),2+4*(i-1),3+4*(i-1)])
    push!(FV,[1+4*(i-1),2+4*(i-1),4+4*(i-1)])
    push!(FV,[1+4*(i-1),3+4*(i-1),4+4*(i-1)])
    push!(FV,[2+4*(i-1),3+4*(i-1),4+4*(i-1)])

    push!(CV,[1+4*(i-1),2+4*(i-1),3+4*(i-1),4+4*(i-1)])
end
V = permutedims(reshape(hcat(b...), (length(b[1]), length(b))))
sp_idx = Lar.spaceindex((V,FV))

copEV = Lar.coboundary_0(EV::Lar.Cells)
copFE = Lar.coboundary_1(V, FV::Lar.Cells, EV::Lar.Cells)
V = convert(Array{Float64,2},V') 
sigma=1 #Faccia che interseca tutti i 240 tetraedri

1

## 0) Benchmark vecchia funzione

In [14]:
@btime frag_face(V,copEV,copFE,sp_idx,sigma)

  87.070 ms (747621 allocations: 41.79 MiB)


([-240.0 9.99999999999991 0.0; 260.0 10.000000000000364 0.0; … ; 234.5 3.2499999999999094 0.0; 238.5 3.2499999999999094 0.0], 
  [1  ,   1]  =  -1
  [2  ,   1]  =  -1
  [1  ,   2]  =  1
  [3  ,   2]  =  -1
  [2  ,   3]  =  1
  [5  ,   3]  =  -1
  [4  ,   4]  =  -1
  [5  ,   4]  =  1
  [6  ,   4]  =  -1
  [3  ,   5]  =  1
  [4  ,   5]  =  1
  [7  ,   5]  =  -1
  ⋮
  [175, 171]  =  -1
  [173, 172]  =  1
  [174, 172]  =  -1
  [174, 173]  =  1
  [175, 173]  =  1
  [176, 174]  =  -1
  [178, 174]  =  -1
  [176, 175]  =  1
  [177, 175]  =  -1
  [177, 176]  =  1
  [178, 176]  =  1
  [6  , 177]  =  1
  [7  , 177]  =  1, 
  [1 ,   1]  =  1
  [1 ,   2]  =  -1
  [1 ,   3]  =  1
  [2 ,   4]  =  -1
  [1 ,   5]  =  -1
  [1 ,   6]  =  -1
  [2 ,   6]  =  1
  [1 ,   7]  =  1
  [2 ,   7]  =  -1
  [1 ,   8]  =  -1
  [3 ,   8]  =  1
  [1 ,   9]  =  -1
  ⋮
  [57, 172]  =  -1
  [1 , 173]  =  -1
  [58, 173]  =  1
  [1 , 174]  =  -1
  [58, 174]  =  1
  [1 , 175]  =  1
  [58, 175]  =  -1
  [1 , 176]  =  -1
  [5

## 1) Controllo se la funzione è type Unstable

In [15]:
@code_warntype frag_face(V,copEV,copFE,sp_idx,sigma)

Variables
  #self#[36m::Core.Compiler.Const(frag_face, false)[39m
  V[36m::Array{Float64,2}[39m
  EV[36m::SparseMatrixCSC{Int8,Int64}[39m
  FE[36m::SparseMatrixCSC{Int8,Int64}[39m
  sp_idx[36m::Array{Array{Int64,1},1}[39m
  sigma[36m::Int64[39m
  @_7[91m[1m::Any[22m[39m
  vs_num[36m::Int64[39m
  sigmavs[36m::Array{Int64,1}[39m
  sEV[36m::SparseMatrixCSC{Int8,Int64}[39m
  M[36m::Array{Float64,2}[39m
  tV[36m::Array{Float64,2}[39m
  @_13[33m[1m::Union{Nothing, Tuple{Int64,Int64}}[22m[39m
  sV[91m[1m::Array{_A,2} where _A[22m[39m
  nEV[91m[1m::Any[22m[39m
  nFE[91m[1m::Any[22m[39m
  nvsize[91m[1m::Any[22m[39m
  nV[91m[1m::Any[22m[39m
  i[36m::Int64[39m
  @_20[36m::Int64[39m
  @_21[36m::Int64[39m
  tmpV[91m[1m::Any[22m[39m
  tmpEV[91m[1m::Union{SparseMatrixCSC{Int8,_A} where _A<:Integer, SparseVector{Int8,_A} where _A<:Integer}[22m[39m

Body[91m[1m::Tuple{Any,Any,Any}[22m[39m
[90m1 ─[39m       Core.NewvarNode(:(@_7))
[9

la funzione NON è type unstable in quanto ho nell'output la stringa:

    Body::Tuple{Any,Any,Any}

## 2) Refactoring codice  
  
Analizzando il codice, ci siamo accorti che quando si applica la rototraslazione dei punti nel piano z=0 rispetto alla faccia sigma, essa viene applicata a tutti i punti V. (dell'intero modello!!!)  
  
Questo non è necessario, in quanto lo spaceindex ci dice già a priori quali facce intersecano con la faccia sigma, quindi è sufficiente applicare la rototraslazione ai soli punti di sigma e ai punti delle facce i contenute in spaceindex(sigma), non a tutti i punti V.

In [16]:
function face_int2(V::Lar.Points, EV::Lar.ChainOp, face::Lar.Cell)
    retV = Lar.Points(undef, 0, 3)
    visited_verts = []
    for i in 1:size(V,1)
        o = V[i,:]
        j = i < size(V,1) ? i+1 : 1
        d = V[j,:] - o
        err = 10e-8
        # err = 10e-4
        if !(-err < d[3] < err)

            alpha = -o[3] / d[3]

            if -err <= alpha <= 1+err
                p = o + alpha*d

                if -err < alpha < err || 1-err < alpha < 1+err
                    if !(Lar.vin(p, visited_verts))
                        push!(visited_verts, p)
                        retV = [retV; reshape(p, 1, 3)]
                    end
                else
                    retV = [retV; reshape(p, 1, 3)]
                end
            end
        end

    end

    vnum = size(retV, 1)


    if vnum == 1
        vnum = 0
        retV = Lar.Points(undef, 0, 3)
    end
    enum = (÷)(vnum, 2)
    retEV = spzeros(Int8, enum, vnum)

    for i in 1:enum
        retEV[i, 2*i-1:2*i] = [-1, 1]
    end

    retV, retEV
end

function frag_face2(V, EV, FE, sp_idx, sigma)
    vs_num = size(V, 1)
	# 2D transformation of sigma face
    sigmavs = (abs.(FE[sigma:sigma,:]) * abs.(EV))[1,:].nzind
    sV = V[sigmavs, :]
    sEV = EV[FE[sigma, :].nzind, sigmavs]
    M = submanifold_mapping(sV)
    
    #APPLICO LA ROTO TRASLAZIONE AI SOLI PUNTI DELLA FACCIA SIGMA
    sV = ([sV ones(size(sV,1))]*M)[:, 1:3] 
    
    #Inizializzo vertici faccia i prima del for per evitare la distruzione 
    #e riallocazione a ogni iterazione...
    # sigma face intersection with faces in sp_idx[sigma]
    for i in sp_idx[sigma]
        faceivs = (abs.(FE[i:i,:]) * abs.(EV))[1,:].nzind
        faceiV = V[faceivs, :]
        
        #APPLICO LA ROTO TRASLAZIONE AI SOLI PUNTI DELLA FACCIA I CONTENUTA NELLO SPACEINDEX
        tV = ([faceiV ones(size(faceiV, 1))]*M)[:, 1:3] 
        
            tmpV, tmpEV = face_int2(tV, EV, FE[i, :])
            sV, sEV = skel_merge(sV, sEV, tmpV, tmpEV)
    end
    
    # computation of 2D arrangement of sigma face
    sV = sV[:, 1:2]
    nV, nEV, nFE = Lar.Arrangement.planar_arrangement(sV, sEV, sparsevec(ones(Int8, length(sigmavs))))
    if nV == nothing ## not possible !! ... (each original face maps to its decomposition)
        return [], spzeros(Int8, 0,0), spzeros(Int8, 0,0)
    end
    nvsize = size(nV, 1)
    nV = [nV zeros(nvsize) ones(nvsize)]*inv(M)[:, 1:3] ## ????
    return nV, nEV, nFE
    
end

@btime frag_face2(V,copEV,copFE,sp_idx,sigma)

  94.301 ms (732614 allocations: 44.02 MiB)


([-240.0 9.99999999999991 0.0; 260.0 10.000000000000364 0.0; … ; 234.5 3.2499999999999094 0.0; 238.5 3.2499999999999094 0.0], 
  [1  ,   1]  =  -1
  [2  ,   1]  =  -1
  [1  ,   2]  =  1
  [3  ,   2]  =  -1
  [2  ,   3]  =  1
  [5  ,   3]  =  -1
  [4  ,   4]  =  -1
  [5  ,   4]  =  1
  [6  ,   4]  =  -1
  [3  ,   5]  =  1
  [4  ,   5]  =  1
  [7  ,   5]  =  -1
  ⋮
  [175, 171]  =  -1
  [173, 172]  =  1
  [174, 172]  =  -1
  [174, 173]  =  1
  [175, 173]  =  1
  [176, 174]  =  -1
  [178, 174]  =  -1
  [176, 175]  =  1
  [177, 175]  =  -1
  [177, 176]  =  1
  [178, 176]  =  1
  [6  , 177]  =  1
  [7  , 177]  =  1, 
  [1 ,   1]  =  1
  [1 ,   2]  =  -1
  [1 ,   3]  =  1
  [2 ,   4]  =  -1
  [1 ,   5]  =  -1
  [1 ,   6]  =  -1
  [2 ,   6]  =  1
  [1 ,   7]  =  1
  [2 ,   7]  =  -1
  [1 ,   8]  =  -1
  [3 ,   8]  =  1
  [1 ,   9]  =  -1
  ⋮
  [57, 172]  =  -1
  [1 , 173]  =  -1
  [58, 173]  =  1
  [1 , 174]  =  -1
  [58, 174]  =  1
  [1 , 175]  =  1
  [58, 175]  =  -1
  [1 , 176]  =  -1
  [5

## 3) Parallelizzazione cicli con i Threads  
  
Per eseguire questa cella, aprire il proprio REPL Julia e aprire questo notebook con i comandi:

ENV["JULIA_NUM_THREADS"] = 4 (o un altro numero)
using IJulia
notebook()

Noi studenti, avendo computer dual-core abbiamo fissato in numero di threads pari a 2. Allocarne di più sarebbe stato inutile (in quanto i threads >2 avrebbero aspettato comunque ..) e anzi, mettendo un numero di threads pari a 4 su un dual-core abbiamo notato un grosso peggioramento delle performance dovuta probabilmente all'attesa.
  
PROBLEMA! (risolto)

Per usare i threads in questa funzione è stato necessario applicare un lock e unlock sulla chiamata a funzione di skel_merge. Quest'ultima infatti va a fondere i risultati (vertici e copEV) ottenuti dall'intersezione di sigma e tutte le sue facce, creando un conflitto WRITE WRITE tra i threads, che cercano entrambi di scrivere i loro vertici e copEV trovati.  
Il Lock e Unlock costituiscono tuttavia un bottleneck per la funzione, infatti il guadagno in termini di tempo derivato dalla parallelizzazione del codice si è ridotto notevolmente. Probabilmente aggiungendo un numero superiore di thread si possono comunque migliorare ulteriormente le performance.

In [18]:
using Base.Threads
function frag_face2(V, EV, FE, sp_idx, sigma)
    vs_num = size(V, 1)
	# 2D transformation of sigma face
    sigmavs = (abs.(FE[sigma:sigma,:]) * abs.(EV))[1,:].nzind
    sV = V[sigmavs, :]
    sEV = EV[FE[sigma, :].nzind, sigmavs]
    M = submanifold_mapping(sV)
    
    #APPLICO LA ROTO TRASLAZIONE AI SOLI PUNTI DELLA FACCIA SIGMA
    sV = ([sV ones(size(sV,1))]*M)[:, 1:3] 
    
    m = Threads.Condition();
    # sigma face intersection with faces in sp_idx[sigma]
    
    tmpVs  = Array{Array{Float64,2}}(undef,nthreads())
    tmpEVs = Array{}
    @threads for i in sp_idx[sigma]
        faceivs = (abs.(FE[i:i,:]) * abs.(EV))[1,:].nzind
        faceiV = V[faceivs, :]
        
        #APPLICO LA ROTO TRASLAZIONE AI SOLI PUNTI DELLA FACCIA I CONTENUTA NELLO SPACEINDEX
        tV = ([faceiV ones(size(faceiV, 1))]*M)[:, 1:3] 
        
        tmpV, tmpEV = face_int2(tV, EV, FE[i, :])
        lock(m)
        sV, sEV = skel_merge(sV, sEV, tmpV, tmpEV)
        unlock(m)
    end
    
    # computation of 2D arrangement of sigma face
    sV = sV[:, 1:2]
    nV, nEV, nFE = Lar.Arrangement.planar_arrangement(sV, sEV, sparsevec(ones(Int8, length(sigmavs))))
    if nV == nothing ## not possible !! ... (each original face maps to its decomposition)
        return [], spzeros(Int8, 0,0), spzeros(Int8, 0,0)
    end
    nvsize = size(nV, 1)
    nV = [nV zeros(nvsize) ones(nvsize)]*inv(M)[:, 1:3] ## ????
    return nV, nEV, nFE
    
end

print("Numero threads allocati :")
println(nthreads())
@btime frag_face2(V,copEV,copFE,sp_idx,sigma)[1]

Numero threads allocati :2
  84.839 ms (733484 allocations: 44.03 MiB)


177×3 Array{Float64,2}:
 -240.0     10.0      0.0
  260.0     10.0      0.0
  120.0    -40.0      0.0
  237.935    2.11957  0.0
  238.894    2.46212  0.0
  126.5      3.25     0.0
  127.25     1.75     0.0
  131.25     1.75     0.0
  129.75     1.75     0.0
  130.5      3.25     0.0
   11.25     1.75     0.0
    9.75     1.75     0.0
   10.5      3.25     0.0
    ⋮                 
  234.5      3.25     0.0
  115.25     1.75     0.0
  113.75     1.75     0.0
  114.5      3.25     0.0
  238.5      3.25     0.0
  119.25     1.75     0.0
  117.75     1.75     0.0
  118.5      3.25     0.0
  123.25     1.75     0.0
  121.75     1.75     0.0
  122.5      3.25     0.0
  125.75     1.75     0.0