In [None]:
import pandas as pd 
from string import Template
from IPython.core.display import display, HTML

%load_ext cypher
%config CypherMagic.uri='http://neo4j:neo@localhost:7474/db/data'

In [None]:
base_html = """
<!DOCTYPE html>
<html>
  <head>
  <script type="text/javascript" src="http://kozea.github.com/pygal.js/javascripts/svg.jquery.js"></script>
  <script type="text/javascript" src="https://kozea.github.io/pygal.js/2.0.x/pygal-tooltips.min.js""></script>
  </head>
  <body>
    <figure>
      {rendered_chart}
    </figure>
  </body>
</html>
"""

# Hot Spot Analysen mit Software Analysen

## Fragestellung

<center>Welche Module sind besonders instabil bzw. änderungskritisch?</center>

## Datenquelle

* Java-Strukturen des Shopizer-Systems mittels jQAssistant gescannt und in Neo4j abfragbar
* Git-Historie des Shopizer-Systems mittels jQAssistant gescannt und in Neo4j abfragbar


* Identifikation der fachlichen Komponenten (Module) im Source Code notwendig (siehe 01)
* Matching zwischen Änderungshäufigkeit und Modulen

## Annahmen

## Validierung

* grafische Darstellung der Instabilität und Abstraktheit je fachlichem Modul

## Implementierung

* Berechnung der Komplexitätsmetriken nach Robert C. Martin auf Modulebene
   * Efferent Coupling (Ce)
      * Anzahl der ausgehenden Abhängigkeiten (Fan-Out) einer Komponente
   * Afferent Coupling (Ca)
      * Anzahl der eingehenden Abhängigkeiten (Fan-In) einer Komponente
   * Instabilität (I) = Ce / (Ce + Ca)
      * Stabilität gegenüber Änderungen an anderen Komponenten (geringer = stabiler)
      * Aber: Je stabiler desto schwerer zu ändern da viele abhängige Komponenten
   * Abstraktheit (A) = Na / Nc
      * Anteil abstrakter (Methoden/Klassen) an Gesamtheit der Komponente
   * Distanz (D) = |A + I - 1|
      * Abstand vom optimalen Verhältnis zwischen Abstraktheit und Instabilität (höher = schlechter)

* Zone of Pain
  * Stabil (I klein) und Konkret (A klein)
    * Änderungen an diesen Komponenten führen zu vielen Änderungen in abhängigen Komponenten
* Zone of Uselessnes
  * Instabil (I groß) und Abstract (A groß)
    * Bereitgestellte abstrakte Komponenten finden keine Verwendung

In [None]:
%%cypher
// Markierung aller Shopizer-Knoten (Dup 00)
MATCH (artifact:Main:Artifact{group: "com.shopizer"})
SET   artifact:Shopizer
WITH  artifact
MATCH (artifact)-[:CONTAINS]->(c)
SET   c:Shopizer

In [None]:
%%cypher
// Anlegen eines Knoten je Fachlichkeit (Dup 01)
MATCH    (p:Package:Shopizer)-[:CONTAINS]->(bC:Package:Shopizer)
WHERE    p.fqn = "com.salesmanager.core.business.services"
WITH     collect(DISTINCT bC.name) AS boundedContexts
UNWIND   boundedContexts AS boundedContext
MERGE    (bC:BoundedContext {name: boundedContext})

In [None]:
%%cypher
// Zuordnen der Klassen zu den Bounded Contexts (Dup 01)
MATCH    (bC:BoundedContext),
         (p:Package:Shopizer)-[:CONTAINS*]->(t:Type:Shopizer)
WHERE    p.name = bC.name
MERGE    (bC)-[:CONTAINS]->(t)

In [None]:
# Berechnung der Module Instability
module_instability_query = %cypher MATCH    (bC1:BoundedContext) \
                                   WITH     bC1 \
                                   MATCH    (bC1)-[:CONTAINS]->(t:Type:Shopizer)-[:DEPENDS_ON]->(d:Type:Shopizer)<-[:CONTAINS]-(bC2:BoundedContext) \
                                   WHERE    bC1 <> bC2 \
                                   WITH     bC1,\
                                            count(d) AS EfferentCoupling \
                                   MATCH    (bC1)-[:CONTAINS]->(t:Type:Shopizer)<-[:DEPENDS_ON]-(d:Type:Shopizer)<-[:CONTAINS]-(bC2:BoundedContext) \
                                   WHERE    bC1 <> bC2 \
                                   WITH     bC1, \
                                            EfferentCoupling, count(d) AS AfferentCoupling \
                                   WITH     bC1, \
                                            toFloat(EfferentCoupling) / (EfferentCoupling + AfferentCoupling) AS Instability \
                                   RETURN   bC1.name AS Name, Instability \
                                   ORDER BY Instability DESC
module_instability_df = module_instability_query.get_dataframe()

In [None]:
# Berechnung der Module Abstractness
module_abstractness_query = %cypher MATCH    (bC:BoundedContext)-[:CONTAINS]->(t:Type:Shopizer) \
                                    WITH     bC, \
                                             count(t) AS Total \
                                    OPTIONAL MATCH (bC)-[:CONTAINS]->(t:Type:Shopizer) \
                                    WHERE    t:Interface OR exists(t.abstract) \
                                    WITH     bC, \
                                             toFloat(count(t)) / Total AS Abstractness \
                                    RETURN   bC.name AS Name, Abstractness \
                                    ORDER BY Abstractness DESC 
module_abstractness_df = module_abstractness_query.get_dataframe()

In [None]:
# Berechnung der Module Distance
module_distance_df = pd.merge(module_instability_df, module_abstractness_df, how='outer', on = ['Name'])
module_distance_df = module_distance_df.fillna(0)

module_distance_doc = []
for _id in module_distance_df.T:
    data = module_distance_df.T[_id]
    values = {'value': (data.Abstractness, data.Instability), 'label': data.Name}
    module_distance_doc.append(values)

## Ergebniss

In [None]:
xy_module_chart = pg.XY(stroke=False, x_title='Abstractness', y_title='Instability')
xy_module_chart.title = 'Robert C. Martin Distance'
xy_module_chart.add('Abstractness to Instability', module_distance_doc)
xy_module_chart.add('Optimum', [(0, 1), (1, 0)], stroke=True)
xy_module_chart.add('Zone of Pain', [(0, 0.3), (0.3, 0)], stroke=True)
xy_module_chart.add('Zone of Uselesness', [(1, 0.7), (0.7, 1)], stroke=True)
display(HTML(base_html.format(rendered_chart=xy_module_chart.render(is_unicode=True))))

## Nächste Schritte

* Planung von Refaktorisierungsschritten für kritischste Komponenten:
   * Merchant, Reference, Common