In [None]:
import plotly.express as px
from string import Template
from IPython.core.display import display, HTML

%load_ext cypher
%config CypherMagic.uri='http://neo4j:neo@localhost:7474/db/data'

In [None]:
from IPython.display import HTML, Javascript, display

def configure_d3():
    """Tell require where to get d3 from in `require(['d3'])`"""
    display(Javascript("""
    require.config({ 
      paths: {
        lodash: "https://cdnjs.cloudflare.com/ajax/libs/lodash.js/4.17.15/lodash.min",  
        d3: "https://d3js.org/d3.v4.min"
      }
    })"""))


configure_d3()

# Strukturanalysen mit Software Analytics

## Fragestellung

<center>In welche fachlichen Komponenten strukturiert sich die Anwendung und wie hängen diese voneinander ab?</center>

## Datenquelle

* Java-Strukturen des Shopizer-Systems mittels jQAssistant gescannt und in Neo4j abfragbar


* Identifikation der fachlichen Komponenten im Source Code notwendig

## Annahmen

* Fachliche Komponenten prägen sich im Service-Layer (`com.salesmanager.core.business.services.<Komponente>`) aus
   * Packages mit den gleichen Namen aber in anderen Parent-Packages gehören zur gleichen fachlichen Komponente

## Validierung

* Grafische Übersicht über die exisitierenden fachlichen Komponenten und deren Abhängigkeiten
* Tabellarische Übersicht über Code, welcher nicht zu Komponenten zugeordnet werden konnten (für späteres Pot-Processing)


* Review der fachlichen Komponenten erfolgt nach Präsentation durch Domänenexperten
* Prüfung fachlicher Abhängigkeiten auf Korrektheit
* Im Falle von Fehlern: Evaluierung der Analyse/Refactoring im Code

## Implementierung

* Identifikation der fachlichen Komponenten über Sub-Packages in `com.salesmanager.core.business.services`
   * Anreicherung des Graphs um zusätzliche Knoten je fachlicher Komponente (:BoundedContext)
   * Zuordnung aller Typen in Packages mit dem Namen einer fachlichen Komponente zu eben diesem Bounded Context [:CONTAINS]
   
   
* Aggregation der Abhängigkeiten zwischen Typen auf die Ebene der fachlichen Komponenten ([:DEPENDS_ON])
   * Anzahl der Abhängigkeiten (Kopplungsgrad) als Eigenschaft der Beziehung (weight)

In [None]:
%%cypher
// Anlegen eines Knoten je Fachlichkeit
MATCH    (p:Package:Shopizer)-[:CONTAINS]->(bC:Package:Shopizer)
WHERE    p.fqn = "com.salesmanager.core.business.services"
WITH     collect(DISTINCT bC.name) AS boundedContexts
UNWIND   boundedContexts AS boundedContext
MERGE    (bC:BoundedContext {name: boundedContext})

In [None]:
%%cypher
// Zuordnen der Klassen zu den Bounded Contexts
MATCH    (bC:BoundedContext),
         (p:Package:Shopizer)-[:CONTAINS*]->(t:Type:Shopizer)
WHERE    p.name = bC.name
MERGE    (bC)-[:CONTAINS]->(t)
RETURN   bC.name AS BoundedContext, count(t) AS Size
ORDER BY Size DESC

In [None]:
%%cypher 
// Anreicherung der Abhängigkeiten zwischen Bounded Contexts (ohne Data Layer)
MATCH  (bC1:BoundedContext)-[:CONTAINS]->(t1:Type:Shopizer),    
       (bC2:BoundedContext)-[:CONTAINS]->(t2:Type:Shopizer),
       (t1)-[dep:DEPENDS_ON]->(t2)
WHERE  NOT exists((t1)-[:ANNOTATED_BY]-()-[:OF_TYPE]->(:Type{fqn: 'javax.persistence.Entity'})) AND
       NOT exists((t2)-[:ANNOTATED_BY]-()-[:OF_TYPE]->(:Type{fqn: 'javax.persistence.Entity'}))
WITH   bC1, bC2, sum(dep.weight) AS weight    
MERGE  (bC1)-[:DEPENDS_ON{weight: weight}]->(bC2)    

## Ergebnisse

In [None]:
%%cypher
// Prozentualer Anteil der zugeordneten Klassen
MATCH (t:Type:Shopizer)
WITH count(t) AS Total
MATCH (:BoundedContext)-[:CONTAINS]->(t:Type:Shopizer)
RETURN 100 * count(t) / Total AS Coverage

In [None]:
%%cypher
// Nicht zugeordnete Klassen
MATCH (p:Package)-[:CONTAINS*]->(t:Type:Shopizer)
WHERE NOT EXISTS((:BoundedContext)-[:CONTAINS]->(t))
RETURN p.fqn AS Package, count(DISTINCT t) AS Count
ORDER BY Count DESC, Package ASC

In [None]:
subdomainSize = %cypher MATCH (bC:BoundedContext),                            \
                       (p:Package:Shopizer)-[:CONTAINS*]->(t:Type:Shopizer)   \
                 WHERE p.name = bC.name                                       \
                 MERGE (bC)-[:CONTAINS]->(t)                                  \
                 RETURN bC.name AS  BoundedContext,                           \
                        count(DISTINCT t) AS Classes

df = subdomainSize.get_dataframe()
fig = px.pie(df, values='Classes', names='BoundedContext', title='Größe der einzelnen Bounded Contexts')
fig.show()

In [None]:
# Abhängigkeiten zwischen Bounded Contexts (Domain Layer)
bCRelations = %cypher MATCH (bC1:BoundedContext)-[d:DEPENDS_ON]->(bC2:BoundedContext) \
                      RETURN bC1.name AS Source, \
                             bC2.name AS Target, \
                             d.weight AS X_Count

bounded_context_connections = bCRelations.get_dataframe()

In [None]:
text = Template(open('vis/chord/chord-diagram.html', 'r').read().replace("\n","")).substitute({
    'chord_data': bounded_context_connections.to_csv(index = False).replace("\r\n","\\n").replace("\n","\\n"), 
    'container': 'bc-chord-diagram'})

HTML(text)

## Nächste Schritte

* Vorstellung der Ergebnisse und Besprechung mit den Domänenexperten
   * ggf. Korrekturen bzw. Verfeinerung der Analyse
* Aufnahme der Übersicht über fachliche Komponenten in die Dokumentation   