# Comandos Avançados em Cypher

Considere o arquivo CSV armazenado no endereço:
https://github.com/santanche/lab2learn/blob/master/data/faers-2017-dron/drug.csv

Ele é um arquivo que relaciona um conjunto de drogas combinando duas fontes de dados:
* [FAERS (FDA Adverse Event Reporting System)](https://open.fda.gov/data/faers/) - a relação de drogas vem desta fonte, onde são relatados efeitos adversos do uso de drogas.
* [DRON (The Drug Ontology)](https://bioportal.bioontology.org/ontologies/DRON) - o código de cada droga vem dessa fonte, onde as drogas são organizadas por categorias.

## `LOAD`

É possível se realizar a leitura de arquivos CSV diretamente dentro de uma base Neo4j utilizando-se a sentença `LOAD` composta com o `CREATE`.

O comando a seguir carrega o CSV e o coloca em um grafo Neo4j. Note que cada linha do arquivo CSV é colocado em uma instância de uma variável indicada (chamamos de `line`). As colunas (`code` e `name`) passam a ser um atributos dessa instância e podemos atribuí-los a propriedades do nó:

~~~cypher
LOAD CSV WITH HEADERS FROM 'https://raw.githubusercontent.com/santanche/lab2learn/master/data/faers-2017-dron/drug.csv' AS line
CREATE (:Drug {code: line.code, name: line.name})
~~~

## `CREATE INDEX`

Muitas operações serão realizadas usando-se o código da droga como chave, portanto, é interessante a criação de um índice sobre ele:

~~~cypher
CREATE INDEX ON :Drug(code)
~~~

Vale a pena olhar o resultado, mas recomendamos que você limite o número de nós a ser apresentados usando a cláusula `LIMIT`:

~~~cypher
MATCH (d)
RETURN d
LIMIT 50
~~~

## Hierarquia DRON

O arquivo https://github.com/santanche/lab2learn/blob/master/data/faers-2017-dron/drughierarchy.csv estabelece uma relação de hierarquia entre drogas e categorias de drogas. Cada vez que uma droga ou categoria de droga é subordinada a outra, há um registro indicando a droga (`codedrug`) e a categoria a que ela está subordinada (`parent`).

Por essa razão o arquivo de drogas visto anteriormente também tem categorias de drogas cadastradas.

## Exercício

Escreva uma query Cypher que leia esse arquivo CSV e crie conexões representando essas relações de subordinação, ou seja, cada tupla irá gerar uma aresta rotulada como `:Parent` ligando a droga ou categoria àquela que ela é subordinada. Use a referência sem formato para o arquivo https://raw.githubusercontent.com/santanche/lab2learn/master/data/faers-2017-dron/drughierarchy.csv

Você pode usar o `MATCH` composto com o `LOAD` e o `CREATE`.

### Resolução

~~~cypher
(escreva aqui a resolução em Cypher)
~~~

## Exercício

Escreva um código que a categoria "CHEMICAL ENTITY" e todas as drogas subordinadas.

### Resolução

~~~cypher
(escreva aqui a resolução em Cypher)
~~~

## Funções de Agregação

Funções como `COUNT`, `SUM`, `AVG`, `MIN` e `MAX` podem agregar o resultado retornado pelo `RETURN`. 

A query a seguir retorna o número de drogas:

~~~cypher
MATCH (d:Drug)
RETURN COUNT(d)
~~~

## Exercício

Escreva um código que conte quantas drogas estão subordinadas à "CHEMICAL ENTITY".

### Resolução

~~~cypher
(escreva aqui a resolução em Cypher)
~~~