# Códigos para a geração de dados de proveniência

- Notebook para a geração de dados de proveniência utilizando o [prov](https://github.com/trungdong/prov), uma biblioteca para a geração de proveniência em Python. A proveniência é gerada a partir de um arquivo de configuração em formato JSON. O arquivo de configuração contém as informações necessárias para a geração, como o nome do arquivo, o autor, a descrição, a data de criação, entre outros. A biblioteca prov gera um arquivo no formato PROV-JSON, que pode ser visualizado utilizando o [Prov Viewer](https://github.com/gems-uff/prov-viewer).

- O arquivo de proveniência gerado pode ser visualizado [aqui]().

[![Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/charlespimentel/DS_queimadas_pantanal/blob/main/prov_generator.ipynb)
> Execute a célula abaixo se estiver usando Google Colab para instalar as dependências necessárias.



In [None]:
# Para rodar este notebook no Google Colab, é necessário fazer o donwload dos arquivos disponibilizados no repositório do GitHub. Para isso, siga os seguintes passos:
# 1. Clique no botão "Open in Colab"
# 2. Execute a célula abaixo para fazer o download dos arquivos

# Fazer download dos arquivos do projeto no GitHub
!git clone https://github.com/charlespimentel/DS_queimadas_pantanal

# Mover todos os aquivos para a pasta raiz
!mv DS_queimadas_pantanal/* .

In [1]:
from prov.model import ProvDocument
import datetime

In [None]:
# Criando novo documento de proveniência
d1 = ProvDocument()

In [None]:
# Declarando namespace
d1.add_namespace('now', 'https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx/nownews/')
# Declarando namespace
d1.add_namespace('foaf', 'https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx/nownews/people/')
# Declarando namespace
d1.add_namespace('art', 'https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx/ns/#')

In [None]:
#Entidade
e1 = d1.entity('now:https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx')
d1.agent('foaf:Isaac, Charles')

In [None]:

# Atribuindo o artigo ao agente
d1.wasAttributedTo(e1, 'foaf:Isaac, Charles')

In [None]:
# Declarando namespace
d1.add_namespace('Lasa', 'https://lasa.ufrj.br/')

In [None]:
d1.entity( 'Lasa:https://github.com/charlespimentel/DS_queimadas_pantanal/tree/main/Data_Lasa_12_21' ,{'prov:label':'Lasa_12_21','prov: type':'void: Dataset'})

In [None]:

# Adicionando uma Atividade
d1.add_namespace('is', 'https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx/is/#')
d1.activity('is:writeArticle')

In [None]:
# Uso e Geração
d1.used('is:writeArticle', 'Lasa:https://github.com/charlespimentel/DS_queimadas_pantanal/tree/main/Data_Lasa_12_21')
d1.wasGeneratedBy('now:https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx', 'is:writeArticle')

In [None]:
agent    = input("Enter the name of the AGENT WHO is running the program: ")        #PROV-Agent
entity   = input("Enter the name of the ENTITY dataset: ")                          #PROV-Entity
activity = input("Enter the name of the ACTIVITY: ")                                #PROV-Activity
graph = entity

In [None]:
d1.add_namespace('ufrj', 'http://www.ufrj.br/ppgi/')
d1.add_namespace('foaf', 'http://xmlns.com/foaf/0.1/')
d1.add_namespace('greco', 'http://www.ufrj.br/ppgi/greco/#')

In [None]:
# Adicionando Entidade
entity = "ufrj:"+ entity
e1 = d1.entity(entity)

# Adicionando Agente
agent = "foaf:"+ agent
d1.agent(agent)

# Atribuindo a execução do experimento ao PROV-Agent
d1.wasAttributedTo(e1, agent)

# Adicionando uma atividade
activity = "greco:"+ activity
d1.activity(activity)

# Geração
d1.wasGeneratedBy( entity, activity)

In [None]:
# Adicionando um papel para o PROV-Agent
d1.agent(agent, {'prov:hadRole': 'Executor', 'foaf:mbox': '{pimentelufrj,isaac.dcesares}@gmail.com', 'prov:attributedAtTime': str(datetime.datetime.utcnow())})
d1.entity(entity, {'prov:generatedAtTime': str(datetime.datetime.utcnow())})

In [None]:
d1.wasDerivedFrom('now:https://github.com/charlespimentel/DS_queimadas_pantanal/blob/main/artigo_queimadas_pantanal.docx', 'Inpe:https://github.com/charlespimentel/DS_queimadas_pantanal/tree/main/Data_Inpe_12_20','Lasa:https://github.com/charlespimentel/DS_queimadas_pantanal/tree/main/Data_Lasa_12_21')

In [None]:
# O que temos até agora (in PROV-N)
print(d1.get_provn())

In [None]:
from prov.dot import prov_to_dot
dot = prov_to_dot(d1)
graph = graph +".png"
dot.write_png('article-prov.png')

In [None]:

from IPython.display import Image
Image('article-prov.png')