<a href="https://colab.research.google.com/github/HelderVieira/ppgti1/blob/main/Helder_Vieira_da_Silva_Atividade_Web_Sem%C3%A2ntica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Atividade - Web Semântica

## Parte 1 - Teoria

1. O que é a Web Semântica e como ela difere da Web tradicional?

De acordo com o artigo "Linked Data: da Web de Documentos para a
Web de Dados", a Web Semântica é uma extensão da Web atual que tem como objetivo principal facilitar a interpretação e integração de dados na Web.

**Diferenças entre a Web Semântica e a Web tradicional (Web de Documentos):**

*   **Interpretação de Dados:**
    *   **Web Tradicional:** Os dados são organizados principalmente para serem lidos e compreendidos por humanos. A semântica dos conteúdos não é facilmente extraída por agentes de software, exigindo um grande esforço de implementação para que um agente de software possa entender e interpretar os dados.
    *   **Web Semântica:** Busca atribuir significado aos dados, interligando-os com outros conjuntos de dados ou domínios de conhecimento. Isso permite que tanto usuários quanto agentes de software possam interpretar e entender os dados de forma mais eficiente.

*   **Foco:**
    *   **Web Tradicional:** É centrada em documentos, onde a interação é feita principalmente através de navegadores HTML e hiperlinks para navegar entre páginas.
    *   **Web Semântica:** É centrada em dados, utilizando tecnologias como RDF (Resource Description Framework) para representar os dados e SPARQL como linguagem de consulta para acessar esses dados.

*   **Objetivo:**
    *   **Web Tradicional:** Organizar informações para apresentação e leitura humana.
    *   **Web Semântica:** Facilitar a interpretação e integração de dados, permitindo a criação de uma "Web de Dados" onde os dados são conectados semanticamente e podem ser lidos automaticamente por agentes de software.

Em resumo, a Web Semântica representa uma evolução da Web atual, buscando torná-la mais inteligente e capaz de processar e interligar informações de forma automática, facilitando a criação de aplicações mais complexas e eficientes.

2. 	Qual a diferença entre Linked Data, Linked Open Data e Dados Abertos?

* **Linked Data**: Refere-se a um conjunto de práticas para publicar e conectar dados estruturados na Web, com o objetivo de criar uma "Web de Dados". Essas práticas são fundamentadas em tecnologias Web, como HTTP e URI, para permitir a leitura automática dos dados por agentes de software. O foco está na interligação semântica dos dados, facilitando a integração de informações de diferentes fontes.

* **Dados Abertos**: Dados Abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa, sujeitos, no máximo, a requisitos de atribuição e compartilhamento. O foco está na acessibilidade e na liberdade de uso dos dados.   

3. O que é o modelo de 5 estrelas de publicação de dados na Web e quais são seus níveis?


O modelo de 5 estrelas de publicação de dados na Web é um esquema de classificação que avalia a qualidade e a abertura dos dados publicados na Web. Cada estrela representa um nível de qualidade e acessibilidade dos dados, tornando-os progressivamente mais úteis e fáceis de usar por pessoas e aplicações.

Os níveis do modelo são:

\*. Os dados estão disponíveis na Web em qualquer formato, sob uma licença aberta. Exemplo: um documento PDF sob uma licença aberta.

\*\*. A condição anterior + disponível como dados estruturados legíveis por máquina. Exemplo: Arquivo Excel ao invés de uma imagem escaneada de uma tabela.

\*\*\*. Todas as anteriores + utilizar um formato não proprietário. Exemplo: um arquivo CSV em vez de Excel.

\*\*\*\*. Todas as anteriores + utilizar URIs bem desenhadas para identificar os recursos, então as pessoas podem referenciá-los.

\*\*\*\*\*. Todas as anteriores + ligar os dados com dados de outros.

## Parte 2 - Prática

### Configuração do Ambiente

Antes de rodar as consultas, instale a biblioteca necessária e defina o endpoint da DBpedia:

In [1]:
!pip install SPARQLWrapper

from SPARQLWrapper import SPARQLWrapper, JSON

dbpedia_endpoint = "https://dbpedia.org/sparql"

def run_sparql_query(query):
    sparql = SPARQLWrapper(dbpedia_endpoint)
    sparql.setQuery(query)
    sparql.setReturnFormat(JSON)
    results = sparql.query().convert()
    return results["results"]["bindings"]

Collecting SPARQLWrapper
  Downloading SPARQLWrapper-2.0.0-py3-none-any.whl.metadata (2.0 kB)
Collecting rdflib>=6.1.1 (from SPARQLWrapper)
  Downloading rdflib-7.1.4-py3-none-any.whl.metadata (11 kB)
Downloading SPARQLWrapper-2.0.0-py3-none-any.whl (28 kB)
Downloading rdflib-7.1.4-py3-none-any.whl (565 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m565.1/565.1 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: rdflib, SPARQLWrapper
Successfully installed SPARQLWrapper-2.0.0 rdflib-7.1.4


Exemplo: Liste os 10 primeiros filmes da DBPedia com título e diretor

In [8]:
query = """
SELECT ?filme ?titulo ?diretor WHERE {
  ?filme rdf:type dbo:Film .
  ?filme rdfs:label ?titulo .
  ?filme dbo:director ?diretor .
  FILTER (lang(?titulo) = 'pt')
} LIMIT 10
"""

results = run_sparql_query(query)
for result in results:
    print(result)

{'filme': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Ca-bau-kan'}, 'titulo': {'type': 'literal', 'xml:lang': 'pt', 'value': 'Ca-bau-kan'}, 'diretor': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Nia_Dinata'}}
{'filme': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Cabaret_(1972_film)'}, 'titulo': {'type': 'literal', 'xml:lang': 'pt', 'value': 'Cabaret (filme)'}, 'diretor': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Bob_Fosse'}}
{'filme': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Cabaret_Balkan'}, 'titulo': {'type': 'literal', 'xml:lang': 'pt', 'value': 'Bure baruta'}, 'diretor': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Goran_Paskaljević'}}
{'filme': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Cabeza_de_Vaca_(film)'}, 'titulo': {'type': 'literal', 'xml:lang': 'pt', 'value': 'Cabeza de Vaca (filme)'}, 'diretor': {'type': 'uri', 'value': 'http://dbpedia.org/resource/Nicolás_Echevarría'}}
{'filme': {'type': 'uri', 'v

4. Construa uma consulta SPARQL que retorne a data, local de nascimento e nacionalidade do piloto Ayrton Senna.

In [14]:
query = """
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbr: <http://dbpedia.org/resource/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>

SELECT ?dataNascimento ?localNascimentoLabel WHERE {
  dbr:Ayrton_Senna dbo:birthDate ?dataNascimento ;
                      dbo:birthPlace ?localNascimento .

  # Obtendo o rótulo do local de nascimento
  ?localNascimento rdfs:label ?localNascimentoLabel .

  FILTER (lang(?localNascimentoLabel) = "pt")
}
"""

results = run_sparql_query(query)

display(results)

[{'dataNascimento': {'type': 'typed-literal',
   'datatype': 'http://www.w3.org/2001/XMLSchema#date',
   'value': '1960-03-21'},
  'localNascimentoLabel': {'type': 'literal',
   'xml:lang': 'pt',
   'value': 'São Paulo'}},
 {'dataNascimento': {'type': 'typed-literal',
   'datatype': 'http://www.w3.org/2001/XMLSchema#date',
   'value': '1960-03-21'},
  'localNascimentoLabel': {'type': 'literal',
   'xml:lang': 'pt',
   'value': 'Grande Prêmio do Brasil de 1986'}},
 {'dataNascimento': {'type': 'typed-literal',
   'datatype': 'http://www.w3.org/2001/XMLSchema#date',
   'value': '1960-03-21'},
  'localNascimentoLabel': {'type': 'literal',
   'xml:lang': 'pt',
   'value': 'São Paulo (estado)'}}]

5. Construa uma consulta SPARQL que retorne a data e local de nascimento e a data de morte de Michael Jackson.

In [12]:
query = """
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbr: <http://dbpedia.org/resource/>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>

SELECT ?dataNascimento ?localNascimentoLabel ?dataMorte WHERE {
  dbr:Michael_Jackson dbo:birthDate ?dataNascimento ;
                      dbo:birthPlace ?localNascimento ;
                      dbo:deathDate ?dataMorte .

  # Obtendo o rótulo do local de nascimento
  ?localNascimento rdfs:label ?localNascimentoLabel .

  FILTER (lang(?localNascimentoLabel) = "pt")
}
"""

results = run_sparql_query(query)
for result in results:
    print(result)

{'dataNascimento': {'type': 'typed-literal', 'datatype': 'http://www.w3.org/2001/XMLSchema#date', 'value': '1958-08-29'}, 'localNascimentoLabel': {'type': 'literal', 'xml:lang': 'pt', 'value': 'Gary (Indiana)'}, 'dataMorte': {'type': 'typed-literal', 'datatype': 'http://www.w3.org/2001/XMLSchema#date', 'value': '2009-06-25'}}
