Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Use keywords that are shared from known vocabularies #51

Open
salgo60 opened this issue Oct 19, 2022 · 21 comments
Open

Use keywords that are shared from known vocabularies #51

salgo60 opened this issue Oct 19, 2022 · 21 comments
Labels
Data.europa.eu data quality guidelines DIGGbacklog Metadatadebt Metadata som borde vara bättre https://twitter.com/hashtag/MetadataDebt?src=hashtag_click

Comments

@salgo60
Copy link
Owner

salgo60 commented Oct 19, 2022

DIGGS task id: /topic/364 IA diggsweden/DCAT-AP-SE#86

We need keywords that are shared from known vocabularies see FAIRDATA I2 (Meta)data use vocabularies that follow the FAIR principles samma som diggsweden/DCAT-AP-SE#86
compare salgo60/SDGMapperSweden#6 (comment)
see salgo60/ProjectOutdoorGyms#120 (comment)

image

image

Page 45 August 2021 doi:10.2830/333095
image

image

image

image

image

image

@salgo60 salgo60 mentioned this issue Oct 19, 2022
20 tasks
@salgo60 salgo60 changed the title we need keywords that are shared from known vocabularies see samma som DIGGS task id: /topic/364 need keywords that are shared from known vocabularies see samma som Oct 19, 2022
@salgo60 salgo60 added Metadatadebt Metadata som borde vara bättre https://twitter.com/hashtag/MetadataDebt?src=hashtag_click DIGGbacklog labels Oct 19, 2022
@salgo60 salgo60 changed the title DIGGS task id: /topic/364 need keywords that are shared from known vocabularies see samma som Use keywords that are shared from known vocabularies Oct 20, 2022
@salgo60
Copy link
Owner Author

salgo60 commented Nov 9, 2022

Exempel hur fel saker görs idag i Dataportalen med textsträngar

Eftersom inte ett gemensamt vokabulär används kan man inte ens enkelt hitta alla som skapat metadata för leverantörsfakturor.... finns säkert fler namn på detta...

@salgo60
Copy link
Owner Author

salgo60 commented Nov 10, 2022

Borde finnas alla begrepp som staten använder som länkade data och hur dom begreppen är kopplade med SKOS "till known vocabularies" som rekommenderas av andra e.g. EU och Tesaurus EUROVOC

Jmf ELI:is_about

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 12, 2022

jmf DCAT-AP-NO har obligatorisk koppling

image

image

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 16, 2022

Dagens kaos i dataportalen och #metadatadebt

image

Europeiska Dataportalen

där blandas nu alla språk med textsträngar se DIGGSweden/DCAT-AP-SE-Processor #4

NOSAD

Kul projekt men ingen meatdata, inga ämnesord från kontrollerade vokabulär, inga persistenta identifierare FAIRDATA F1 #12 se test med att skapa metadata av deras websidor i en csv fil och Wikibase OSWALD

@salgo60
Copy link
Owner Author

salgo60 commented Nov 21, 2022

Ide att ha en "semantisk tíllsyn" länk

  • idag ser vi få om ingen som skapar bra semantik

image

@jonassodergren
Copy link

Offentligkod.se är inte taffligt. @dpriskorn @salgo60 Helt orimlig slutsats. Vi var ju överens om att börja med persistent identifierare för varje programvara i katalogen. Men jag uppdaterar ju katalogen när jag får en minut över här och var. Poängen är ju att datat inte ska vara perfekt från början, utan att vi i forumet tillsammans skapar ett bra dataset via ett öppet arbetssätt (via återkoppling i denna tråd etc). Det är ju inte svårt för mig att stänga ner projektet och återkomma när jag är klar, exempelvis orgnummer är ju enkelt att lägga till.

@salgo60
Copy link
Owner Author

salgo60 commented Nov 23, 2022

Offentligkod.se är inte taffligt. @dpriskorn @salgo60

Jag tror vi kommer från 2 olika håll... kan jag inte enkelt koppla ihop saker för att saknas tydlighet vilken programvara det syftas på så har vi inte semantisk interoperabilitet....

Nina skrev några rader på Forumet vilka programvaror DIGG använde och det var ett mindre €#%#& att göra en någonsådar koppling til WD

  • skall data som offentlig kod ligga til grund som ett hjälpmedel att t.ex. hitta säkerhetsluckor måste det vara yudligt vad denna textsträng är samma som dvs. 5-star data

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 23, 2022

Exempel sida där det borde tas höjd att peka på "known vocabularies" #51 så att det fungerar på Europa portalen... att skicka runt textsträngar med språkkod funkar inte

image

image

@jonassodergren
Copy link

Klart jag håller med om att semantisk interoperabilitet är viktigt. Säger bara att det medvetet ska införas stegvis i detta fall. Dock tycker jag sårbarheter ska detekteras utifrån exakta versioner etc utifrån den faktisksa källkoden som finns på Github, så katalogen ska inte användas i det syftet tycker jag. Vad är din rekommendation för nyckelord Magnus? Har inte hunnit gå igenom vokabulären (eu-länken).

@dpriskorn
Copy link
Contributor

dpriskorn commented Nov 23, 2022

@salgo60 kul att du hittat ett bra exempel i Norge som svenska myndigheterna kan ta rygg på. Jag har ofta sett hur lagar och arbetssätt jag känner igen från DK introduceras så småningom även i SE under mina 13 år här.

Dock är det oklart om bristerna som påpekats ens är begripliga för de som rattar spakarna på regeringskansliet eller politikerna som styr. Det får tiden visa.

@dpriskorn
Copy link
Contributor

dpriskorn commented Nov 23, 2022

Man skulle ju kunna fråga de öppet data ansvariga på regeringskansliets infrastrukturdepartement om varför SE avviker från resten av världen när det gäller delning av data utan semantisk interoperabilitet i dataportalen.
Dock vill jag påpeka att jag även hittat textsträngar och liknande brister som du påpekar i datamängder om vandringsleder från New York och Pennsylvania

@salgo60
Copy link
Owner Author

salgo60 commented Nov 23, 2022

Jag hittade Norge på EDPs presentationer om teknisk öppenhet (se EDP "Understanding open data: technical openness" video/slides) vilket är nog så viktigt men inte handlar om licens som brukar kallas politisk öppenhet ( se EDP "Understanding open data: legal openess" Friday 18 November 2022 at 10.00-11.30 CET video/slides)

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 23, 2022

@dpriskorn här har du JSON på det som landar i Euopean Data Portal

Kollar man på nyckelord som används så borde nog skolungarna lära sig cs = tjeckiska ;-)

#European Data portal Keywords most used
PREFIX dcat: <http://www.w3.org/ns/dcat#>
PREFIX dc: <http://purl.org/dc/terms/>

SELECT ?key (count(?s) AS ?count) 
WHERE {?s a dcat:Dataset . ?s dcat:keyword ?key} 
GROUP BY ?key
order by desc (?count)

image

image

image

image

image

image

Kunskapsgraf hos EDP

Jag hade fräckheten på ett EDP event 17 nov 2021 att säga att när Google hade presenterat hur dom jobbar med Kunskapsgrafer så

springer inte EDP åt fel håll som skickar runt massa text strängar med en språktag

EDP svar var lite mummel vid 54:20 och jag uppfatta att problemet dom såg var kompetensen ute i länderna dvs. för Sverige skulle det vara DIGGs förmåga med KG #70

Googles presentation 22:30 med Knowledge graph reconciliation....

  • både EDP och svenska portalen saknar detta steget och saknar KG är min känsla...
    • det som skickas in visas för slutanvändarna... kan vara att textsträngar översätts men det blir gissar jag samma haveri som Europeana och konstnärer jag visade på 2019 - vet inte om EDPs datakvaliten diskuteras någonstans.... har inte hört någon på den svenska portalen som använder det datat....

image

Kunskapsgraf hos NOSAD

Se #77-18 verkar helt saknas en drivkraft att våga ta steget med bra metadata utan DIGG fokuserar på forum regler... Vaffor då då - varför gör dom på detta vis

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 24, 2022

Vad är din rekommendation för nyckelord Magnus?

@jonassodergren hade hoppats du hade varit på metaverse snacket idag....

Lösa tankar

  1. mervärdet kommer om saker styrs upp - idag saknas det aktivt städande, verkar som alla laddar upp det dom vill och ombeds läsa manualen...
  2. min bakgrund säger att kontrollerade vokabulär är det man skall ha och att även DIGG skulle skapa svenska vokabulär som länkas med EUs....
  3. kollar man på @dpriskorn så har han skapat magiska verktyg som märker upp vetenskapliga dokument i Wikidata med ämnesord som bestäms av den som kör verktyget.... bra eller dålig?

Min vaga tro är att mästaren på findability Google kör sin kunskapsgraf som dom kopplar ihop allt med inklusive metadata om dataset sedan är deras sökmotor smart och söker i delar av kunskapsgrafen efter säkert mycket hemliga algoritmer....

Så mitt svar kopplingar skall man ha men kanske enklast är att ta kända vokabulär och göra som EU säger ovan

  • bäst är att alla som gör liknande verktyg i Europa pratar ihop sig gissar jag

@dpriskorn
Copy link
Contributor

@dpriskorn här har du JSON på det som landar i Euopean Data Portal

Mm. Intressant att de kör RDF öht. Det hade jag inte väntat mig. Vem rattar RDF-obtologin hos SKR?
Här beskriver de sig själva med textstäng endast.
image
image
Ingen reconsiliering verkar ha gjorts. Det är en RDF silo verkar det som 🤷‍♂️

@dpriskorn
Copy link
Contributor

Undrar om SKR är med i molnet.
image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 24, 2022

Intressant att de kör RDF

@dpriskorn det är entryscape så det är nog csv in och geggig rdf ut ingen semantiker har anställts....

Senast jag kontakta SKR om kommuninfo och öppen data var deras data bara en test utan licens kan vara samma data som nu seglar runt utan att någon tar ägarskap för datat och bryr sig,,.,,

@salgo60
Copy link
Owner Author

salgo60 commented Nov 24, 2022

Feedback SKR om deras data 2020 dvs. Inget ägande mer trams...

image

@salgo60
Copy link
Owner Author

salgo60 commented Dec 13, 2022

GITHUB #86 Länkade nyckelord och begrepp har nu varit öppen i 19 månader jag försöker få en status om DIGG gör något

image

Hur tafligt Europeiska dataportalen fungerar idag --> att ingen reagerar betyder att det är fel kompetenser i projekt som Nationell Dataverkstad #30 "Styra upp att bra metadata skickas med DCAT-AP till EDP" / DIGG --> #100

image

@salgo60
Copy link
Owner Author

salgo60 commented Feb 23, 2023

Se GIST Koommundiarie mha chatgpt.md

@salgo60
Copy link
Owner Author

salgo60 commented Aug 25, 2024

Detta borde vara del av DIGGs kvalitetsrapport #878 878

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Data.europa.eu data quality guidelines DIGGbacklog Metadatadebt Metadata som borde vara bättre https://twitter.com/hashtag/MetadataDebt?src=hashtag_click
Projects
Status: 📋 Backlog
Development

No branches or pull requests

3 participants