### Tutorial: Visualizing the Silk Road Blockchain with Graphistry and Neo4j

Investigating large datasets becomes easier by directly visualizing cypher (BOLT) query results with Graphistry. This tutorial walks through querying Neo4j, visualizing the results, and additional configurations and queries.

This analysis is based on a ...

## Investigar ambiente e dispositivos disponíveis localmente

In [1]:
import os, sys, pip
import platform, subprocess

def try_amb():
    ## Visualizar versões dos principais componentes
    
    pyVer      = sys.version
    pipVer     = pip.__version__
    
    print('\nVERSÕES DAS PRINCIPAIS BIBLIOTECAS INSTALADAS NO ENVIROMENT')
    print('Interpretador em uso:', sys.executable)
    
    # Improved handling of the 'CONDA_DEFAULT_ENV' environment variable
    try:
        print('    Ambiente Conda ativado:', os.environ['CONDA_DEFAULT_ENV'])
    except KeyError:
        print('    Ambiente Conda ativado: Não disponível')
    
    print('     Python: ' + pyVer, '\n        Pip:', pipVer, '\n')

def check_nvcc():
    # Identifica o sistema operacional
    os_type = platform.system()
    
    # Dependendo do sistema operacional, altere o comando e o delimitador
    if os_type == "Linux":
        nvcc_path = "/usr/local/cuda/bin/nvcc"
        cmd = "which"
    elif os_type == "Windows":
        cmd = "where"
        nvcc_path = subprocess.check_output(f"{cmd} nvcc", shell=True).decode('utf-8').strip()
    else:
        print("Sistema Operacional não suportado.")
        return
    try:
        nvcc_output = subprocess.check_output(f"{nvcc_path} -V", shell=True).decode('utf-8')
        print(nvcc_output)
    except Exception as e:
        print(f"NVCC não encontrado no sistema: {e}")

def try_gpu():
    print('\nVERSÕES DOS DRIVERS CUDA, PYTORCH E GPU')
    try:
        check_nvcc()
    except Exception as e:
        print("NVCC não encontrado:",e,"\n")
    try:
        import torch
        print('    PyTorch:',torch.__version__)
        device = 'cuda' if torch.cuda.is_available() else 'cpu'
        print('Dispositivo:',device)
        print('Disponível :',device,torch.cuda.is_available(),' | Inicializado:',torch.cuda.is_initialized(),'| Capacidade:',torch.cuda.get_device_capability(device=None))
        print('Nome GPU   :',torch.cuda.get_device_name(0),'         | Quantidade:',torch.cuda.device_count(),'\n')
    except Exception as e:
        print('  ERRO!! Ao configurar a GPU:',e,'\n')

try_amb()
try_gpu()


VERSÕES DAS PRINCIPAIS BIBLIOTECAS INSTALADAS NO ENVIROMENT
Interpretador em uso: /bin/python3
    Ambiente Conda ativado: base
     Python: 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0] 
        Pip: 23.3.1 


VERSÕES DOS DRIVERS CUDA, PYTORCH E GPU
NVCC não encontrado no sistema: Command '/usr/local/cuda/bin/nvcc -V' returned non-zero exit status 127.


/bin/sh: 1: /usr/local/cuda/bin/nvcc: not found


    PyTorch: 2.1.1+cu121
Dispositivo: cpu
  ERRO!! Ao configurar a GPU: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx 



## Instalações para Plataforma computacional CUDA 12.x

    setuptools
    bilbiotecas especializadas Nvidia
    Nvidia RAPIDS.AI

Observação:
Para melhor desempenho, a configuração usada para ajustar a heurística demanda instalação de:

    cuDNN 8.9.6 em GPUs Maxwell e Pascal com CUDA 11.8, e 

    cuDNN 8.9.6 em todas as outras novas GPUs com CUDA 12.2 atualização 1

In [2]:
# !pip3 install -U setuptools pip

## Instalar bibliotecas especializadas Nvidia

### cuTensor
cuTENSOR é uma biblioteca CUDA de alto desempenho para tensores primitivos.¶
A escolha da instalação adequada conforme cada sistema operacional e ambiente é feita em:

https://developer.nvidia.com/cutensor-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=deb_local

### cuSPARSELt
Nvidia cuSPARSELt é uma biblioteca CUDA de alto desempenho dedicada a operações gerais de matriz-matriz nas quais pelo menos um operando é uma matriz esparsa:

$$ D = Activation(\alpha op(A) \cdot op(B) + \beta op(C) + bias) \cdot scale $$

onde op(A)/op(B) refere-se à operações no local, como transposição/não transposição, e alfa, beta, scale são escalares.

Demonstrações em:

https://github.com/NVIDIA/CUDALibrarySamples/tree/master/cuSPARSELt/matmul

https://github.com/NVIDIA/CUDALibrarySamples/blob/master/cuSPARSELt/matmul_advanced/matmul_advanced_example.cpp

### Nvidia cuDNN
A biblioteca NVIDIA CUDA® Deep Neural Network (cuDNN) é uma biblioteca de primitivas acelerada por GPU para redes neurais profundas . cuDNN fornece implementações altamente ajustadas para rotinas padrão, como convolução direta e reversa, atenção, matmul, pooling e normalização. 

Será preciso se cadastrar junto à Nvidia para ter acesso aos arquivos fonte e escolher o download adequado com os drivers CUDA instalados, por exemplo para CUDA 12.x escolher "Download cuDNN v8.9.6 (November 1st, 2023), for CUDA 12.x" e depois o sistema operacional adequado, por exemplo, para Linux Ubuntu: Local Installer for Ubuntu22.04 cross-sbsa (Deb).

https://developer.nvidia.com/rdp/cudnn-download

### Nvidia NCCL
A NVIDIA Collective Communication Library (NCCL) implementa primitivas de comunicação multi-GPU e multi-nós otimizadas para GPUs e redes NVIDIA. NCCL fornece rotinas como all-gather, all-reduce, broadcast, redução, redução de dispersão, bem como envio e recebimento ponto a ponto que são otimizados para alcançar alta largura de banda e baixa latência em interconexões de alta velocidade PCIe e NVLink dentro um nó e pela rede NVIDIA Mellanox entre nós.

https://developer.nvidia.com/nccl

## Install Nvidia RAPIDS.AI

In [3]:
# #https://rapids.ai/
# !pip install \
#     --extra-index-url=https://pypi.nvidia.com \
#     cudf-cu12 dask-cudf-cu12 cuml-cu12 cugraph-cu12 cuspatial-cu12 cuproj-cu12 cuxfilter-cu12 cucim

# Hardware GPU compatível

Verificar compatibilidade com sua GPU disponível em:

https://developer.nvidia.com/cuda-gpus

## Install CuPy do PyPI 

CuPy é uma biblioteca de array compatível com NumPy/SciPy para computação acelerada por GPU com Python. CuPy atua como um substituto imediato para executar código NumPy/SciPy existente em plataformas NVIDIA CUDA ou AMD ROCm .

CuPy fornece ndarraymatrizes esparsas e as rotinas associadas para dispositivos GPU, todos tendo a mesma API que NumPy e SciPy:

    Matriz N-dimensional ( ndarray): cupy.ndarray

Tipos de dados (dtypes): booleano ( bool_), inteiro ( int8, int16, int32, int64, uint8, uint16, uint32, uint64), float ( float16, float32, float64) e complexo ( complex64, complex128)

Suporta a semântica idêntica a numpy.ndarray, incluindo indexação e transmissão básica/avançada

    Matrizes esparsas : cupyx.scipy.sparse

Matriz esparsa 2-D: csr_matrix, coo_matrix, csc_matrix, edia_matrix

    Rotinas NumPy

Funções em nível de módulo (cupy.*)

Funções de Álgebra Linear (cupy.linalg.*)

Transformada Rápida de Fourier (cupy.fft.*)

Gerador de números aleatórios (cupy.random.*)

    Rotinas SciPy

Transformadas Discretas de Fourier (cupyx.scipy.fft.*ecupyx.scipy.fftpack.*)

Álgebra Linear Avançada (cupyx.scipy.linalg.*)

Processamento de imagens multidimensionais (cupyx.scipy.ndimage.*)

Matrizes Esparsas (cupyx.scipy.sparse.*)

Álgebra Linear Esparsa (cupyx.scipy.sparse.linalg.*)

Funções Especiais (cupyx.scipy.special.*)

Processamento de Sinal (cupyx.scipy.signal.*)

Funções Estatísticas (cupyx.scipy.stats.*)

As rotinas são apoiadas por bibliotecas CUDA (cuBLAS, cuFFT, cuSPARSE, cuSOLVER, cuRAND), Thrust, CUB e cuTENSOR para fornecer o melhor desempenho.

Também é possível implementar facilmente kernels CUDA personalizados que funcionam ndarrayusando:

    Modelos de kernel : defina rapidamente operações de redução e elemento a elemento como um único kernel CUDA

    Kernel bruto : importe código CUDA C/C++ existente

    Transpiler Just-in-time (JIT) : Gere o kernel CUDA a partir do código-fonte Python

    Kernel Fusion : funde várias operações CuPy em um único kernel CUDA

CuPy pode ser executado em ambientes multi-GPU ou cluster. O pacote de comunicação distribuída ( cupyx.distributed) fornece primitivas coletivas e ponto a ponto para ndarray, apoiado por NCCL.

Para usuários que precisam de controle mais refinado para desempenho, o acesso aos recursos CUDA de baixo nível está disponível:

    Fluxo e evento : fluxo CUDA e fluxo padrão por thread são suportados por todas as APIs

    Pool de memória : alocador de memória personalizável com um pool de memória integrado

    Profiler : Suporta código de criação de perfil usando CUDA Profiler e NVTX

    Vinculação de API de host : chame diretamente bibliotecas CUDA, como APIs NCCL, cuDNN, cuTENSOR e cuSPARSELt do Python

CuPy implementa APIs padrão para troca de dados e interoperabilidade, como DLPack , CUDA Array Interface , __array_ufunc__( NEP 13 ), __array_function__( NEP 18 ) e Array API Standard . Graças a esses protocolos, CuPy integra-se facilmente com NumPy, PyTorch, TensorFlow, MPI4Py e quaisquer outras bibliotecas que suportem o padrão.

Wheels (pacotes binários pré-compilados) estão disponíveis para Linux e Windows. Os nomes dos pacotes são diferentes dependendo da versão do CUDA Toolkit.

Siga as orientações em:

https://docs.cupy.dev/en/stable/install.html#install-reinstall

In [4]:
!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Fri_Jan__6_16:45:21_PST_2023
Cuda compilation tools, release 12.0, V12.0.140
Build cuda_12.0.r12.0/compiler.32267302_0


In [5]:
## Instalar para CUDA Drivers v11
# !pip3 uninstall cupy
# !pip3 uninstall cupy-cuda11x -y

In [6]:
## Instalar para CUDA Drivers v12
# !pip3 install cupy-cuda12x

In [8]:
# import cupy-cuda12x

### Em Linux, executar no terminal

    wget https://developer.download.nvidia.com/compute/libcutensor/1.7.0/local_installers/libcutensor-local-repo-ubuntu2204-1.7.0_1.0-1_amd64.deb
    sudo dpkg -i libcutensor-local-repo-ubuntu2204-1.7.0_1.0-1_amd64.deb
    sudo cp /var/libcutensor-local-repo-ubuntu2204-1.7.0/libcutensor-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
    sudo apt-get -y install libcutensor1 libcutensor-dev libcutensor-doc

# Extrair dados do Neo4j

In [11]:
!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Fri_Jan__6_16:45:21_PST_2023
Cuda compilation tools, release 12.0, V12.0.140
Build cuda_12.0.r12.0/compiler.32267302_0


In [None]:
# sudo apt-get install cuXfilter cuXfilter-dev
# !pip3 install cuXfilter

In [None]:
from collections import defaultdict
from neo4j import GraphDatabase

class Neo4jQuery:
    def __init__(self, uri, user, password):
        self._driver = GraphDatabase.driver(uri, auth=(user, password))

    def close(self):
        self._driver.close()

    def get_graph_data(self):
        with self._driver.session() as session:
            # Consulta para incluir filtros e lógicas específicas para gerar o grafo
            result = session.run("MATCH (n)-[r]->(m) RETURN n, r, m")
            nodes = {}
            links = []
            node_labels_count = defaultdict(int)  # Para contar a frequência dos rótulos dos nós
            relationship_types_count = defaultdict(int)  # Para contar a frequência dos tipos de relacionamentos

            for record in result:
                start_node = record['n']
                end_node = record['m']
                relationship = record['r']
                
                # Adiciona nós ao dicionário se ainda não estiverem presentes
                if start_node.element_id not in nodes:
                    nodes[start_node.element_id] = {'id': start_node.element_id, 'label': list(start_node.labels)[0]}
                    node_labels_count[list(start_node.labels)[0]] += 1
                if end_node.element_id not in nodes:
                    nodes[end_node.element_id] = {'id': end_node.element_id, 'label': list(end_node.labels)[0]}
                    node_labels_count[list(end_node.labels)[0]] += 1
                
                # Adiciona o relacionamento à lista de links
                links.append({
                    'source': start_node.element_id,
                    'target': end_node.element_id,
                    'type': relationship.type,
                    'properties': dict(relationship)
                })
                relationship_types_count[relationship.type] += 1

            graph_data = {
                'nodes': list(nodes.values()),
                'links': links,
                'node_count': len(nodes),
                'link_count': len(links),
                'node_labels_count': dict(node_labels_count),  # Converte o defaultdict para um dicionário normal
                'relationship_types_count': dict(relationship_types_count)  # Converte o defaultdict para um dicionário normal                
            }

            # Converte o dicionário de nós para uma lista para uso em d3.js
            return graph_data

# Uso da classe:
neo4j_query = Neo4jQuery('neo4j://localhost:7687', 'neo4j', 'password')
graph_data = neo4j_query.get_graph_data()
neo4j_query.close()

# Após a chamada, graph_data agora contém a contagem de nós e arestas
print(f"   Quantidade de nós: {graph_data['node_count']}")
# Defina a ordem específica das chaves
ordered_node_labels = ['ÁrvoreCNPq', 'GrandeÁrea', 'Área', 'Subárea', 'Especialidade']

# Imprima o conteúdo de graph_data['node_labels_count'] na ordem especificada
for label in ordered_node_labels:
    count = graph_data['node_labels_count'].get(label, 0)  # Obtém a contagem, ou 0 se a chave não existir
    print(f"{label:>20}: {count}")

print(f"\n Contagem de arestas: {graph_data['link_count']}")
# Defina a ordem específica das chaves
ordered_edge_labels = ['CONTÉM', 'CONTÉM_ÁREA', 'CONTÉM_SUBÁREA', 'CONTÉM_ESPECIALIDADE']

# Imprima o conteúdo de graph_data['node_labels_count'] na ordem especificada
for label in ordered_edge_labels:
    count = graph_data['relationship_types_count'].get(label, 0)  # Obtém a contagem, ou 0 se a chave não existir
    print(f"{label:>20}: {count}")

In [None]:
import cudf
import cugraph
import json

# Conversão dos dados extraídos para DataFrames do RAPIDS.AI
nodes_df = cudf.DataFrame(graph_data['nodes'])
edges_df = cudf.DataFrame(graph_data['links'])

# Criando um Graph no cuGraph
G = cugraph.Graph()
G.from_cudf_edgelist(edges_df, source='source', destination='target')

# Identificação de comunidades com cugraph
# Louvain é um método comum para detecção de comunidades
partitions, modularity_score = cugraph.louvain(G)

# Adiciona a informação de partição aos nós
nodes_df = nodes_df.merge(partitions, left_on='id', right_on='vertex', how='left')

# Agora, temos um DataFrame nodes_df que inclui a informação de comunidade para cada nó
# Podemos visualizar isso com cuXfilter.

# Instanciação e configuração do cuXfilter
from cuXfilter import charts
import cuXfilter

# Criação de um DataFrame cuXfilter a partir do DataFrame cuDF
cux_df = cuXfilter.DataFrame.from_dataframe(nodes_df)

# Configuração dos gráficos para visualização
chart1 = charts.cudatashader.scatter(x='x', y='y', aggregate_col='partition')
chart2 = charts.panel_widgets.range_slider('partition')

# Configuração do Dashboard
d = cux_df.dashboard([chart1, chart2])

# Mostrar o Dashboard
# d.show()

## Preparar dados para visualização

In [None]:
consistent_graph_data = []
for record in graph_data:
    # Ensure all records have the same keys, potentially with None values
    consistent_record = {key: record.get(key, None) for key in expected_keys}
    consistent_graph_data.append(consistent_record)

df = pd.DataFrame(consistent_graph_data)
df

In [None]:
import pandas as pd
import cudf

# Converta para DataFrame do pandas
df = pd.DataFrame(graph_data)

# Converta o DataFrame do pandas para o DataFrame do cuDF
gdf = cudf.DataFrame.from_pandas(df)
gdf

Para visualizar dados de grafos extraídos do Neo4j usando cuXfilter, você seguirá uma série de etapas gerais que envolvem:

1. **Extração de Dados do Neo4j**: Utilize uma consulta Cypher para extrair dados de nós e arestas do banco de dados Neo4j.

2. **Preparação dos Dados**: Transforme os dados extraídos para o formato adequado para serem processados por cuGraph e visualizados por cuXfilter.

3. **Análise com cuGraph**: Realize a análise de grafos usando a biblioteca cuGraph da RAPIDS.AI, caso você queira detectar comunidades ou calcular outras métricas de grafos.

4. **Visualização com cuXfilter**: Use a biblioteca cuXfilter para criar visualizações interativas a partir dos resultados da análise.

### Exemplo de Workflow

**1. Extração de dados do Neo4j:**
```python
from neo4j import GraphDatabase

# Função para extrair dados
def extract_data(uri, user, password, query):
    data = []
    driver = GraphDatabase.driver(uri, auth=(user, password))
    with driver.session() as session:
        results = session.run(query)
        for record in results:
            data.append(record)
    driver.close()
    return data

# Defina sua consulta Cypher aqui
cypher_query = '''
MATCH (n)-[r]->(m)
RETURN id(n) as source, id(m) as target, type(r) as type, r.weight as weight
'''

# Substitua pelos seus detalhes de conexão do Neo4j
neo4j_uri = 'bolt://localhost:7687'
neo4j_user = 'neo4j'
neo4j_password = 'password'

# Extraia os dados
graph_data = extract_data(neo4j_uri, neo4j_user, neo4j_password, cypher_query)
```

**2. Preparação dos Dados:**
Assumindo que você já tem `graph_data` como uma lista de dicionários com chaves `source`, `target` e `weight`, você pode transformá-lo em um DataFrame pandas e, em seguida, converter para um DataFrame cuDF, que é o formato de dados necessário para a biblioteca RAPIDS cuGraph.

```python
import pandas as pd
import cudf

# Converta para DataFrame do pandas
df = pd.DataFrame(graph_data)

# Converta o DataFrame do pandas para o DataFrame do cuDF
gdf = cudf.DataFrame.from_pandas(df)
```

**3. Análise com cuGraph:**
```python
import cugraph

# Crie um grafo cuGraph
G = cugraph.Graph()
G.from_cudf_edgelist(gdf, source='source', destination='target', edge_attr='weight')
```

**4. Visualização com cuXfilter:**
```python
import cuxfilter as cxf

# Defina o esquema de dados para cuXfilter
chart = cxf.charts.datashader.edge_bundle(G, 'source', 'target')

# Crie um dashboard cuXfilter
d = cxf.DataFrame.from_dataframe(gdf)
d.add_chart(chart)

# Mostra o dashboard no Jupyter Notebook
await d.preview()
```

Note que este é um fluxo de trabalho genérico e pode precisar ser ajustado de acordo com a sua configuração específica e os detalhes dos dados do Neo4j. Você também pode precisar instalar as bibliotecas necessárias e lidar com as dependências de hardware, como garantir que uma GPU compatível esteja disponível para uso com RAPIDS.AI.

**Connect**

* You may need to reconnect if your Neo4j connection closes
* Uncomment the below section for non-Graphistry notebook servers

In [None]:
NEO4J = {
    'uri': "bolt://localhost:7687", 
    'auth': ("neo4j", "password")
}

graphistry.register(bolt=NEO4J)

# To specify Graphistry account & server, use:
# graphistry.register(api=3, username='...', password='...', protocol='https', server='hub.graphistry.com')
# For more options, see https://github.com/graphistry/pygraphistry#configure


## Optional: Load tainted transactions into your own Neo4j DB
To populate your own Neo4j instance, set one or both of the top commands to True

In [None]:
DELETE_EXISTING_DATABASE=True
POPULATE_DATABASE=True

if DELETE_EXISTING_DATABASE:
    driver = GraphDatabase.driver(**NEO4J)
    with driver.session() as session:      
        # split into 2 transancations case of memory limit errors
        print('Deleting existing transactions')
        tx = session.begin_transaction()
        tx.run("""MATCH (a:Account)-[r]->(b) DELETE r""")      
        tx.commit()      
        print('Deleting existing accounts')
        tx = session.begin_transaction()      
        tx.run("""MATCH (a:Account) DELETE a""")     
        tx.commit()
        print('Delete successful')

if POPULATE_DATABASE:
    edges = pd.read_csv('https://www.dropbox.com/s/q1daa707y99ind9/edges.csv?dl=1')
    edges = edges.rename(columns={'Amount $': "USD", 'Transaction ID': 'Transaction'})[['USD', 'Date', 'Source', 'Destination', 'Transaction']]
    id_len = len(edges['Source'][0].split('...')[0]) #truncate IDs (dirty data)
    edges = edges.assign(
    Source=edges['Source'].apply(lambda id: id[:id_len]),
    Destination=edges['Destination'].apply(lambda id: id[:id_len]))
    ROSS_FULL='2a37b3bdca935152335c2097e5da367db24209cc'
    ROSS = ROSS_FULL[:32]
    CARL_FULL = 'b2233dd22ade4c9978ec1fd1fbb36eb7f9b4609e'
    CARL = CARL_FULL[:32]
    CARL_NICK = 'Carl Force (DEA)'
    ROSS_NICK = 'Ross Ulbricht (SilkRoad)'
    nodes = pd.read_csv('https://www.dropbox.com/s/nf796f1asow8tx7/nodes.csv?dl=1')
    nodes = nodes.rename(columns={'Balance $': 'USD', 'Balance (avg) $': 'USD_avg', 'Balance (max) $': 'USD_max', 'Tainted Coins': 'Tainted_Coins'})[['Account', 'USD', 'USD_avg', 'USD_max', 'Tainted_Coins']]
    nodes['Account'] = nodes['Account'].apply(lambda id: id[:id_len])
    nodes['Account'] = nodes['Account'].apply(lambda id: CARL_NICK if id == CARL else ROSS_NICK if id == ROSS else id)
    driver = GraphDatabase.driver(**NEO4J)
    with driver.session() as session:      
        tx = session.begin_transaction()                  
        print('Loading', len(nodes), 'accounts')
        for index, row in nodes.iterrows():
            if index % 2000 == 0:
                print('Committing', index - 2000, '...', index)
                tx.commit()
                tx = session.begin_transaction()
            tx.run("""
            CREATE (a:Account {
              Account: $Account,
              USD: $USD, USD_avg: $USD_avg, USD_max: $USD_max, Tainted_Coins: $Tainted_Coins
            })            
            RETURN id(a)
            """, **row)
            if index % 2000 == 0:
                print(index)
        print('Committing rest')
        tx.commit()
        tx = session.begin_transaction()
        print('Creating index on Account')
        # tx.run("""  CREATE INDEX ON :Account(Account)  """) # Sintaxe na versão anterior à 4.x
        tx.run("""CREATE INDEX FOR (a:Account) ON (a.Account)""")
        tx.commit()
    STATUS=1000
    BATCH=2000
    driver = GraphDatabase.driver(**NEO4J)

    with driver.session() as session:
        tx = session.begin_transaction()
        print('Loading', len(edges), 'transactions')      
        for index, row in edges.iterrows(): 
            tx.run("""MATCH (a:Account),(b:Account)
                  WHERE a.Account = $Source AND b.Account = $Destination
                  CREATE (a)-[r:PAYMENT { 
                    Source: $Source, Destination: $Destination, USD: $USD, Date: $Date, Transaction: $Transaction 
                  }]->(b)
                  """, **row)
            if index % STATUS == 0:
                print(index)
            if index % BATCH == 0 and index > 0:
                print('sending batch out')
                tx.commit()
                print('... done')
                tx = session.begin_transaction()
        tx.commit()

## Cypher Demos

### 1a. Warmup: Visualize all $7K - $10K transactions
Try panning and zooming (same touchpad/mouse controls as Google Maps), and clicking on individual wallets and transactions.

In [None]:
g = graphistry.cypher("""
      MATCH (a)-[r:PAYMENT]->(b) WHERE r.USD > 7000 AND r.USD < 10000  RETURN a, r, b ORDER BY r.USD DESC
  """)

In [None]:
g.plot()

Screenshot
![Bitcoin transactions between $7K and 10K](https://www.dropbox.com/s/kt0str2k8azs922/screenshot0.png?dl=1)

### 1b. Cleanup: Configure node and edge titles to use amount fields
* **Static config**: We can preconfigure the visualization from directly within the notebook
* **Dynamic config**: Try dynamically improving the visualization on-the-fly within the tool by 
  * Do `add histogram for...` on `edge:USD` and `point:USD_MAX`
  * Set edge/point coloring using them, and selecting a "Gradient (Spectral7 7)" blend, and toggling to reverse order (so cold to hot). 
  * For `point:USD_MAX`, toggle it to controling point size, and in the `Scene settings`,  increase the point size slider

In [None]:
g = g\
  .bind(point_title='Account')\
  .bind(edge_title='USD')

g.plot()

### 2. Look for all transactions 1-5 hops from embezzling DEA Agent Carl Force

#### 2a. Downstream
Where did most of Carl's money go? 
* Try setting up filters on `edge:USD` to separate out small vs big money flows.

In [None]:
g.cypher("""
    match (a)-[r:PAYMENT*1..20]->(b) 
    where a.Account = $root and ALL(transfer IN r WHERE transfer.USD > $min_amount and transfer.USD < $max_amount )
    return a, r, b
  """, 
  {'root': "Carl Force (DEA)", 
   'min_amount': 999, 
   'max_amount': 99999}).plot() 

Screenshot:

![Carl Force's bitcoin accounts](https://www.dropbox.com/s/nh1uo4iuqvav5xm/screenshot1.png?dl=1)

#### 2b. Upstream
From where did Carl get most of his money?

In [None]:
g.cypher("""
      match (a)-[r:PAYMENT*1..10]->(b) 
      where b.Account=$sink and ALL(transfer IN r WHERE transfer.USD > $min_amount and transfer.USD < $max_amount )
      return r, a, b
    """, 
    {'sink': "Carl Force (DEA)",
    'min_amount': 1999, 
    'max_amount': 99999}).plot()

Screenshot:

![Carl Force embezzling money from the Silk Road](https://www.dropbox.com/s/qvw6s5zi1dddq78/screenshot2.png?dl=1)

## 3. Paths between Silk Road and Carl Force

In [None]:
g.cypher("match (a)-[r:PAYMENT*1..10]->(b) where a.Account=$silk and b.Account=$dea return r, a, b", 
         {'dea': "Carl Force (DEA)", "silk": "Ross Ulbricht (SilkRoad)"}).plot()

## Further Reading

* UI Guide: https://hub.graphistry.com/docs/ui/index/
* Python client tutorials & demos: https://github.com/graphistry/pygraphistry 
* DEA incident: https://arstechnica.com/tech-policy/2016/08/stealing-bitcoins-with-badges-how-silk-roads-dirty-cops-got-caught/ 