# Einführung in Software Analytics mit Jupyter Notebooks

* Jupyter Notebooks sind JSON-Dokumente
   * dieses besteht aus Ein- und Ausgabezellen
   * Eingabezellen haben einen Typ, z.B. Markdown oder Code

* Hinter einem Notebook steht ein Kernel, hier z.B. Python 3
   * damit kann Python-Code geschrieben und ausgeführt werden
   * Jupyter Notebooks sind damit interaktiv
   * mit Bibliotheken wie Pandas oder Plotly können Analysen umgesetzt oder Daten visualisiert werden

* Erweiterungen bringen zusätzliche Funktionalität und erwitern die Fähigkeiten von Zellen
   * 'cypher'-Erweiterung ermöglicht verbinden und abfragen einer Neo4j-Datenbank

In [None]:
%load_ext cypher
%config CypherMagic.uri='http://neo4j:neo@localhost:7474/db/data'

In [None]:
%%cypher 
MATCH (t:Type:Java)
WHERE t.fqn STARTS WITH "com.salesmanager"
RETURN count(t)

* Bibliotheken für Python ermöglichen die grafische Aufarbeitung der Ergebnisse
   * Plotly und Pygal bieten viele Diagrammtypen und sind gut dokumentiert
   * Integration von D3JS (embedden des HTML) sind als Notlösung auch machbar, technisch aber aufwendiger

In [None]:
import plotly.express as px

In [None]:
artifactSize = %cypher MATCH (a:Java:Main:Artifact)-[:CONTAINS]->(t:Type) \
                       WHERE a.group STARTS WITH "com.shopizer"           \
                       RETURN a.name AS  Artifact,                        \
                              count(DISTINCT t) AS Classes

df = artifactSize.get_dataframe()
fig = px.pie(df, values='Classes', names='Artifact', title='Größe der einzelnen Artefakte')
fig.show()

* auch das Anreichern von Informationen im Graphen ist möglich

In [None]:
%%cypher
// Markierung aller Shopizer-Knoten
MATCH (artifact:Main:Artifact{group: "com.shopizer"})
SET artifact:Shopizer
WITH artifact
MATCH (artifact)-[:CONTAINS]->(c)
SET c:Shopizer
RETURN artifact.name AS Artifact, 
       count(DISTINCT c) AS ContentCount
ORDER BY artifact.name