In [1]:
import pandas as pd
from sqlalchemy import create_engine

# Conexión a PostgreSQL
user = "userGESTDB"
password = "passGESTDB"
host = "postgres_db"  # nombre del servicio en docker-compose
port = "5432"
db = "GESTDB"

engine = create_engine(f"postgresql://{user}:{password}@{host}:{port}/{db}")

# Leemos todas las tablas
df_grado = pd.read_sql("SELECT * FROM grado;", engine)
df_universidad = pd.read_sql("SELECT * FROM universidad;", engine)
df_facultad = pd.read_sql("SELECT * FROM facultad;", engine)
df_nota_corte = pd.read_sql("SELECT * FROM nota_corte;", engine)
df_area = pd.read_sql("SELECT * FROM area;", engine)
df_rama = pd.read_sql("SELECT * FROM rama;", engine)
df_grado_ofertado = pd.read_sql("SELECT * FROM grado_ofertado;", engine)


In [2]:
! pip install rdflib



In [3]:
from rdflib import Graph, Namespace, Literal, RDF, RDFS, XSD, URIRef

# Definir prefijos
sch = Namespace("https://schema.org/")
dat = Namespace("http://example.org/universidadesMadrid#")

g = Graph()
g.bind("sch", sch)
g.bind("dat", dat)
g.bind("xsd", XSD)



In [4]:
# 1️⃣ Ramas -> CategoryCodeSet
for _, row in df_rama.iterrows():
    rama_uri = dat[f"rama_{row['id']}"]
    g.add((rama_uri, RDF.type, sch.CategoryCodeSet))
    g.add((rama_uri, sch.name, Literal(row["nombre"], datatype=XSD.string)))


In [5]:

# 2️⃣ Áreas -> CategoryCode
for _, row in df_area.iterrows():
    area_uri = dat[f"area_{row['id']}"]
    rama_uri = dat[f"rama_{row['id_rama']}"]
    g.add((area_uri, RDF.type, sch.CategoryCode))
    g.add((area_uri, sch.name, Literal(row["nombre"], datatype=XSD.string)))
    g.add((area_uri, sch.inCodeSet, rama_uri))
    g.add((rama_uri, sch.hasCategoryCode, area_uri))



In [6]:
# 3️⃣ Universidades -> CollegeOrUniversity
for _, row in df_universidad.iterrows():
    uni_uri = dat[f"univ_{row['id']}"]
    g.add((uni_uri, RDF.type, sch.CollegeOrUniversity))
    g.add((uni_uri, sch.legalName, Literal(row["nombre"], datatype=XSD.string)))



In [7]:
# 4️⃣ Facultades -> School
for _, row in df_facultad.iterrows():
    fac_uri = dat[f"fac_{row['id']}"]
    uni_uri = dat[f"univ_{row['id_universidad']}"]
    g.add((fac_uri, RDF.type, sch.School))
    g.add((fac_uri, sch.legalName, Literal(row["nombre"], datatype=XSD.string)))
    g.add((fac_uri, sch.telephone, Literal(row["telefono"], datatype=XSD.string)))
    g.add((fac_uri, sch.email, Literal(row["email"], datatype=XSD.string)))
    g.add((fac_uri, sch.url, Literal(row["web"], datatype=XSD.string)))
    g.add((fac_uri, sch.address, Literal(row["direccion"], datatype=XSD.string)))
    g.add((fac_uri, sch.containedInPlace, uni_uri))
    g.add((uni_uri, sch.containsPlace, fac_uri))



In [8]:
# 5️⃣ Grados -> EducationalOccupationalProgram
for _, row in df_grado.iterrows():
    grado_uri = dat[f"grado_{row['id']}"]
    area_uri = dat[f"area_{row['id_area']}"]
    g.add((grado_uri, RDF.type, sch.EducationalOccupationalProgram))
    g.add((grado_uri, sch.name, Literal(row["nombre"], datatype=XSD.string)))
    g.add((grado_uri, sch.description, Literal(row["descripcion"], datatype=XSD.string)))
    g.add((grado_uri, sch.occupationalCategory, area_uri))
    g.add((area_uri, dat.hasOccupationalProgram, grado_uri))



In [9]:
# 6️⃣ Grado ofertado -> CourseInstance
for _, row in df_grado_ofertado.iterrows():
    curso_uri = dat[f"curso_{row['id']}"]
    grado_uri = dat[f"grado_{row['id_grado']}"]
    fac_uri = dat[f"fac_{row['id_facultad']}"]
    g.add((curso_uri, RDF.type, sch.CourseInstance))
    g.add((curso_uri, sch.about, grado_uri))
    g.add((curso_uri, sch.location, fac_uri))


In [10]:

# 7️⃣ Nota de corte -> CutOffScore
for _, row in df_nota_corte.iterrows():
    nota_uri = dat[f"nota_{row['id']}"]
    curso_uri = dat[f"curso_{row['id_grado_ofertado']}"]
    g.add((nota_uri, RDF.type, dat.CutOffScore))
    g.add((nota_uri, dat.educational_program, curso_uri))
    g.add((nota_uri, dat.value, Literal(float(row["nota"]), datatype=XSD.float)))
    g.add((nota_uri, dat.year, Literal(row["año"], datatype=XSD.gYear)))
    g.add((nota_uri, dat.call, Literal(row["convocatoria"], datatype=XSD.string)))
    g.add((nota_uri, dat.group, Literal(row["grupo"], datatype=XSD.string)))



In [11]:
# Guardar en archivo TTL
g.serialize(destination="universidadesMadrid.ttl", format="turtle")
print("✅ Archivo universidadesMadrid.ttl generado correctamente.")

✅ Archivo universidadesMadrid.ttl generado correctamente.


In [12]:
df_facultad.head()
sparql wrapper

Unnamed: 0,id,nombre,id_universidad,direccion,telefono,web,email
0,1,Facultad de Filosofía,1,"Paseo de la Senda del Rey, 7 (Edificio Humanid...",91 398 69 03,www.uned.es,negociado.alumnos.filosofia@adm.uned.es
1,2,Facultad de Comunicación y Artes Campus de Mad...,2,"C/ Santa Cruz de Marcenado, 27 28015 Madrid",91 452 11 03,www.nebrija.com,informa@nebrija.com
2,3,Facultad de Bellas Artes Campus de Moncloa,3,"C/ Pintor el Greco, 2 28040 Madrid",91 394 35 60,www.ucm.es,safba@ucm.es
3,4,Facultad de Ciencias de la Comunicación Ctra,4,,91 351 03 03 / 91 709 14 00,www.ufv.es,info@ufv.es
4,5,Facultad de Artes y Humanidades Campus de Aran...,5,"C/ San Pascual, s/n 28300 Aranjuez (Madrid)",91 488 44 21,www.urjc.es,aranjuez.secretariadealumnos@urjc.es
