Skip to content
JanSkvrnak edited this page Dec 31, 2022 · 7 revisions

WACloud: Centralizované rozhraní pro vytěžování velkých dat z webového archivu

Průvodní dokumentace k výsledku typu ověřená technologie

Autoři výsledku: Marie Haškovcová, Zdenko Vozár, Jan Škvrňák, Tomáš Foltýn, Michaela Bežová, Jaroslav Kvasnica, Jan Lehečka, Pavel Ircing, Jan Švec, Luboš Šmídl, Vlasta Radová, Josef Michálek, Matouš Pilnáček, Paulína Tabery

WACloud: Centralizované rozhraní pro vytěžování velkých dat z webového archivu je nástroj, který umožňuje badatelům práci s archivními webovými daty. Pro generování a kategorizaci textových výstupů využívá pokročilé postupy strojového zpracování a pomocí fulltextového a fasetového vyhledávání nabízí široké možnosti definice datových setů. Badatelé tak mohou na základě svých požadavků získávat relevantní data pro svůj další výzkum. Analýza témat a jejich automatická detekce je založena na základě hlubokých neuronových sítí, používány jsou i postupy rozpoznávání informací z video nebo audio souborů. Rozhraní umožňuje získávání datasetů napříč daty webového archivu, což otevírá nové možnosti pro jejich analýzu.

Technická dokumentace

Uživatelská dokumentace