<a href="https://colab.research.google.com/github/fidelgabriel21/IA_PC1/blob/main/MusicData_FromWeb.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En este cuaderno se mostrará como obtener datos relacionada a la industria de la música del repositorio de Jamendo http://dbtune.org/jamendo/ , utilizando rdflib.

# Instalación de la librería RDFLib

In [None]:
%pip install rdflib

# Importando la librería RDFLib

In [None]:
from rdflib import URIRef, BNode, Literal
from rdflib import Namespace
from rdflib.namespace import RDF, RDFS, FOAF, DC
from rdflib import ConjunctiveGraph
from rdflib import Graph

Se trabajará con la información de todos los artista que nos brinda Jamendo, con esta crearemos el grafo


In [None]:
from rdflib import Graph

j = Graph()
j.parse("http://dbtune.org/jamendo/all/artist")

print(j.serialize(format="turtle").decode("utf-8"))

Cada subject del grafo j, noda indicará una URIRef con información de un determinado artista, para obtener esta data podemos crear múltiples grafos que representen a cada artista

In [None]:
i = 0 
a = Graph()
for s,o in j.subject_objects():
    i = i + 1 
    if(i == 10): #solo los 10 primeros
        break
    id = s.split('/')
    a.parse(f'http://dbtune.org/jamendo/artist/{id[5]}')
print(a.serialize(format="turtle").decode("utf-8"))

Ahora en el grafo a, tenemos datos sobre diferentes artistas que se pueden extraer mediante un filtro, un ejemplo de esto 
sería extraer name.

In [None]:
from rdflib.namespace import FOAF

print('Artists names:',end = '\n\n')
for s,o in a.subject_objects(FOAF.name):
  print(o)

In [None]:
#o las URI de los records que han hecho
print('All records made by Artists:',end = '\n\n')

for s,o in a.subject_objects(FOAF.made):
  print(o)

In [None]:
#Analizando un record
r = Graph()
r.parse("http://dbtune.org/jamendo/record/2190")
print(r.serialize(format="turtle").decode("utf-8"))

In [None]:

Data = {}
for s,p,o in a.triples((None,FOAF.name,None)):
  id = s.split('/')[5]
  Data[id] = []
  Data[id].append(o)
for s,p,o in a.triples((None,FOAF.made,None)):
  id = s.split('/')[5]
  Data[id].append(o)

for key,item in Data.items():
  for i in range(len(item)):
    if i == 0:
      print(f'The Artist name {item[i]} made:',end='')
    else:
      print(item[i],end=' ')
  print()




# Extracción de la estructura RDF

Extrayendo la estructura RDF online que se encuentra en la plataforma de Jamendo en el siguiente enlace http://dbtune.org/jamendo/all/artist

In [None]:
g = Graph()
g.parse("http://dbtune.org/jamendo/all/artist", format="xml")

In [None]:
len(g)

Extrayendo los recursos relacionados a MUSICARTIST

In [None]:
num_artists = 50
i = 1
m = Graph()
for s, o in g.subject_objects():
  if i == num_artists:
    break
  id = s.split('/')
  m.parse(f'http://dbtune.org/jamendo/artist/{id[5]}')
  i += 1

Extrayendo los RECORDs relacionados a cada MUSICARTIST

In [None]:
for s, o in m.subject_objects(FOAF.made):
  id = o.split('/')
  m.parse(f'http://dbtune.org/jamendo/record/{id[5]}')

Extrayendo los TRACKs relacionados a cada RECORD

In [None]:
ns1 = URIRef("http://purl.org/ontology/mo/track")

for s,o in m.subject_objects(ns1):
  id = o.split('/')
  m.parse(f'http://dbtune.org/jamendo/track/{id[5]}')

Extrayendo los TAGs relacionados a cada RECORD

In [None]:
ns2 = URIRef("http://www.holygoat.co.uk/owl/redwood/0.1/tags/taggedWithTag")

for s,o in m.subject_objects(ns2):
  id = o.split('/')
  m.parse(f'http://dbtune.org/jamendo/tag/{id[5]}')

Guardando la estructura que se extrajo en todo el proceso

In [None]:
m.serialize(destination='music.rdf', format='xml')

# Modelado del Grafo

Definiendo los namespace que usaremos

In [None]:
ns1 = URIRef("http://purl.org/ontology/mo/")
ns2 = URIRef("http://www.holygoat.co.uk/owl/redwood/0.1/tags/")
owl = URIRef("http://www.w3.org/2002/07/owl#")

Cargando el archivo music.rdf

In [None]:
g = ConjunctiveGraph()
g.parse("music.rdf", format="xml")

In [None]:
len(g)

In [None]:
print(g.serialize(format="turtle").decode("utf-8"))

# Inferencias

## Primera inferencia
Encontrar los Tracks que fueron hechos por cada Artist

In [None]:
for subject, record in g.subject_objects(FOAF.made):
  for track in g.transitive_objects(record, ns1 + "track"):
    #print(str(subject) + " made " + str(track))
    print(g.value(subject, FOAF.name) + " made " + g.value(track, DC.title))

## Segunda inferencia
Encontrar los tipos de música (Tags) a los que pertence la producción de cada Artist

In [None]:
for subject, record in g.subject_objects(FOAF.made):
  for tag in g.transitive_objects(record, ns2 + "taggedWithTag"):
    #print(str(subject) + " made " + str(tag))
    print(g.value(subject, FOAF.name) + " made " + g.value(tag, ns2 + "tagName") + " music")

## Tercera inferencia
Encontrar las licencias bajo las cuales cada Artist lanza su producción

In [None]:
for subject, record in g.subject_objects(FOAF.made):
  for track in g.transitive_objects(record, ns1 + "track"):
    #print(str(subject) + " made " + str(track))
    print(g.value(subject, FOAF.name) + " made work under " + g.value(track, ns1 + "license") + " license")