Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

KB Tidningsarkivet #153

Open
salgo60 opened this issue Jun 29, 2023 · 15 comments
Open

KB Tidningsarkivet #153

salgo60 opened this issue Jun 29, 2023 · 15 comments

Comments

@salgo60
Copy link
Owner

salgo60 commented Jun 29, 2023

Vad kan göras med KB:s tidningsarkiv och svenska Riksdagsmän se fråga till KB 2023 jun

image

@salgo60
Copy link
Owner Author

salgo60 commented Jun 29, 2023

Vad kan göras med KB:s tidnigsarkiv och svenska Riksdagsmän se fråga

Har ni en länkmodell? Och var är den beskriven,,,

Jag vilja se beskrivet

  1. hur man länkar sida
  2. del av sida
  3. en viss artikel, ett stycke i artikel
  4. om ni har stöd för IIIF om ja exempel på detta
  5. har ni planer att koppla ihop personer i LIBRISXL med identifierade personer/platser/händelser i Tidningsarkiven
  6. var/hur jobbar ni med länkade data för tidningsarkivet dvs. skapa https:5 star data
  7. ni pratar om framtida leveranser har ni en produktägare, identifierade tasks som finns i er backlog....
  8. Finns API:er till ert data och var beskrivs det
  9. Använder ni TEI eller har planer jmf hur projektet med Riksdagens corpus arbetar

Jag håller på med Wikidata och vi gör en hel del med Humlab då det gäller att ta fram data om Riksdagsmän och ser Tidningarkivet som en bra källa att koppla platser/ personer/ vad som sägs i Riksdagens dokument och koppla det till relevanta saker i tidningar-

Se exempel hur Humlab i TEI kopplar vem som pratar till WIkidata

@salgo60
Copy link
Owner Author

salgo60 commented Jul 2, 2023

Work in progress

Test att koppla Ämnen till artiklar i tidningsartiklar hos KB

Wikidata Q10716836 graf / von Sydowska morden

iNaturalist jobbar med Research Grade

image

Graf - WIkidata

image

Exempel dagens sökningar

image image

Wikidata Q10527198 graf - Potatisupproret/ Potatiskravallerna 1917 / Wikipedia Hunger- och militärdemonstrationerna 1917

@salgo60
Copy link
Owner Author

salgo60 commented Jul 2, 2023

Metadata fråga 2017

Se även fråga oktober 15, 2017 kl. 2:30 om persistenta identifierare och mera metadata om tidningarna - inget SVAR KB 2023

image

Vad har hänt 5 år senare på Wikidata/Wikipedia 2023

@salgo60
Copy link
Owner Author

salgo60 commented Jul 2, 2023

Diskussion på sv:Wikipedia

image

Väldigt lite länkas till tidningsarkivet gissar dagens lösning är för old-school med messa text...

Hittills har det gått **ganska trögt med att använda Svenska dagstidningar som referens.** I skrivande stund har vi bara 4368 länkar till tidningar.kb.se, och då räknar vi med alla namnrymder. Tjänsten lanserades i juni 2014, så det innebär att vi snittar 1,33 nya länkar per dag sedan lansering. Det ska dock sägas att många som har tillgång till DN och SvD:s arkiv istället länkar till tidningarna själva och det finns många användare som inte länkar alls.

Använda Tidningsartiklarna för att se till att WIkipedia täcker allt

image

Nu när hela tidningssamlingen är digitaliserad, skulle vi teoretiskt kunna gå igenom hela samlingen och pricka av att alla omnämnda jordbävningar och vulkanutbrott är täckta av Wikipedia.

Kan LLM användas <-> stämma av Wikidatas kvaliten?

@MansMeg vet du några projekt som gjort liknande...

@salgo60
Copy link
Owner Author

salgo60 commented Jul 3, 2023

Vad tänker släktforskare se fråga Anbytarforum

image image

@salgo60
Copy link
Owner Author

salgo60 commented Jul 3, 2023

Ny version av Tidningsarkivet utvecklas 2022---

Inloggning och möjlighet att spara och hantera favoriter
Fler filtreringsmöjligheter
Utökad metadata kring varje sökträff
Utökad funktionalitet vid visning av materialet
Vising av Highlight på tidningssidan
image

@salgo60
Copy link
Owner Author

salgo60 commented Jul 3, 2023

Question telegram use KB newspapers to check coverage of Wikidata

image image

@salgo60
Copy link
Owner Author

salgo60 commented Jul 3, 2023

Kan KB skapa sitt eget WIkidata för svenska historiska tidningar <-> ett facit på att Sveriges kulturarv dokumenteras

image

KB börjar nu kunna LLM så kanske dom är mogna att skapa en kunskapsgraph modell Wikidata men för svenska historiska Tidningar som vi skulle kunna koppla till och säga samma som från Wikidata - tanken svindlar och kunde som LA2 säger vara ett snyggt facit att hela Sveriges kulturarv dokumenteras

image image

@salgo60
Copy link
Owner Author

salgo60 commented Oct 4, 2023

Skickade in fråga om status länk där det borde dyka upp

image

@salgo60
Copy link
Owner Author

salgo60 commented Oct 4, 2023

Fråga om att skapa egna IIIF Manifest länk

image

@salgo60
Copy link
Owner Author

salgo60 commented Oct 17, 2023

image

@salgo60
Copy link
Owner Author

salgo60 commented Nov 5, 2023

Nedanstående dokument ser jag inte pratar om länkade data cc: @dpriskorn

@dpriskorn
Copy link
Collaborator

Mm, jag känner mig inte förvånad.

@salgo60
Copy link
Owner Author

salgo60 commented Nov 16, 2023

Exempel på fördelar om KBs Tidningsarkiv hade strukturerad data i botten modell Wikidata och stödjer SPARQL sökning

Jag har integrerat bilder från Svenskt Porträttarkiv, som nu finns i Wikicommons under kategorin 'c:Category:Porträttbok', med Wikidata. Dessa bilder visar svenska riksdagsmän från omkring 1900 och deras partitillhörighet vid den tiden. I Wikidata har vi information från boken "Tvåkammar-riksdagen 1867–1970" (Q110346241), skapad 1985 och framåt. Jag använder detta för att jämföra hur riksdagsmän betecknades som "vilde" (partilösa) i denna bok, skriven runt 1985, med hur de beskrevs kring 1900. Mer information finns på mitt GitHub-projekt "#139 Porträttbook about 'vilde'". Om dessa uppgifter hade bara varit scannade bilder och en textmassa utan strukturerad data hade inte detta varit möjligt....

Genom att använda Wikidata och Wikicommons med strukturerad data, kan vi dra nytta av strukturerad och lättåtkomlig information som går långt utöver vad dagens KB tidningsarkivs lösning kan erbjuda. Detta tillåter oss och andra att utföra djupare analyser, skapa visuella sammanställningar och koppla samman historiska data på ett sätt som inte är genomförbart med enbart textlänkar i en artikel.

Direktiv Tidningar.docx
Projekt Tidningar Slutrapport Handläggare Hillevi Nyberg 2022-10-26 KB 2021-982
Projektplan Tidningar 2021 08 30.docx

@salgo60
Copy link
Owner Author

salgo60 commented Nov 18, 2023

Riksarkivet söker nu ML kunniga se FB….

Skall en organisation som KB börja flyga tror jag även semantiska nivån måste lyftas nu ser vi att KB famlat sedan 2011 med att tro att befintlig personal kan leverera men vi ser efter 12 år bara dålig data och dåliga applikationer som Tidningsarkivet och Libris XL

Det lyft jag ser är när

  1. vi har tidningsartiklar, personer i artiklarna, platserna i artiklarna, händelser i artiklarna
  2. när dessa kan belägga/ knyta ihop olika historiska händelser som har skett och visa hur saker beskrivits över tid

diggsweden/persistent-identifiers-investigation#13 (comment)

Idag 2023 ser jag forskarna i Riksdagens corpus sitta och klippa och klistra från en bok från 1985 medans Wikicommons idag har tack vare Omar på Föreningen Svenskt Porträttarkiv massa scannade artiklar på riksdagspersoner från tidigt 1900 där vi kan se hur dessa personers beskrevs då och dessa texter är OCR scannade och finns i SPA apiet

Jag har skrivit en SPARQL som
• söker fram alla personer i Wikidata med ”parti” som innehåller text strängen ”vilde” och har källa boken Tvåkammarriksdagen

  • denna sökning skickas sedan ned till Wikicommons där porträttböcker hämtas fram som avbildar dessa riksdagsmän

—> att vi kan få se hur författarna till boken beskriver personer och hur dessa personer beskrevs vid tiden få händelsen skedde

#139

Annan intressant semantisk finess är att man med PROV enligt chatGPT kan ange att detta uttalande kom från personen själv

prov:wasInfluencedBy :SelfDeclaration

#139 (comment)

Ser framför mig att spelas korten rätt så kan vi i framtiden jmf den historiska forskningen över tid med vad tidningsartiklar, handskrifter hos Riksarkivet säger eller forskare på den tiden skrev…

——-
Skall detta steg tas så är det inte bara ML kunskap som skall in utan hela området med Digital Humaniora måste lyfta sig…. Jag ringde upp Pelle Snickars och försökte vara tydlig med att dom jobbar fel som inte har Persistenta identifierare i projektet Riksdagens corpus vilket nu verkar ske men dom har enl. mig inte tagit tag i detta med PROV och ännu mindre att olika källor från olika tidpunkter i historien säger olika saker….

Jag har börjat testa detta med Wikidatas ”rang” modell att ange att Wikidata har motstridiga källor dvs. att Riksarkivet SBL påstår något som inte kan bekräftas av kyrkböckerna eller till och kyrkböckerna säger är fel
ex SPaRQL https://w.wiki/7SWN

Skall vårt grundata lyftas till denna nivå måste alla spela på samma spelplan och det skall finnas semantiska diskussioner… tycker jag ser att RAÄ nu ”nysatsar” men inte kommit längre än man visade 2012 med sin demo vilket gör mig övertygad om att saker som Digisam etc där man torrsimmar i 10 år inte gör folk klokare utan in med ML kunniga som Riksdagens corpus och våga ha en dialog med foliehattarna på Wikidata som ju faktiskt levererar på 200 språk, vågar låta alla skriva, kan hantera motstridiga fakta och trots allt detta är bättre än KB, RAÄ, Riksdagens öppna data och Riksarkivet att veta vem som suttit i svensk Riksdag….

Enorma möjligheter finns men ny kompetens måste vågas tas in…. jag brukar säga att det finns en anledning att Tesla inte anställde körskollärare för att utveckla självkörande bilar…. nu tycker jag kulturarvet allt för länge sprungit på ”bilskollärare ” spåret och ser tyvärr att RAÄ gör ett nytt försök 2023 med ”Nationell strategi för digitalt kulturarv 2023” salgo60/SamlaLibris#37

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants