Szemantikus adatgazdagítás példái a kulturális intézményekben
Absztrakt
Tanulmányomban a szemantikus adatgazdagításról és a módszereinek csoportosításáról szólok a
közgyűjtemények világában. A szemantikus adatgazdagítás az adatgazdagításnak egy speciális formája, amely során megbízható helyekről származó linkekkel egészítik ki a meglevő forrásokat. Az Europeana meghatározása szerint a szemantikus adatgazdagítás az a folyamat, amely során kontrollált adatcsomagokból (például névterekből, online lexikonokból) vagy értékkészletszótárakból származó linkeket kapcsolnak a meglevő metaadatokhoz. Az egyes formatípusok bemutatásánál Marcia Lei Zeng, a téma egyik legkorábbi kutatójának csoportosítását használom (strukturált, félig strukturált és strukturálatlan adatok), valamint bemutatok néhány eszközt, valamint hazai és nemzetközi példákat. A tanulmány végén röviden arra is kitérek, hogy hogyan lehet felhasználni a mesterséges intelligenciát a meglevő adatgazdagítási eszközök mellett.
Kulcsszavak:
szemantikus adatgazdagítás, RDA, metaadatok, wikidata, kapcsolt adatokHivatkozások
Baca, M., Gill, M. (2015) Encoding Multilingual Knowledge Systems in the Digital Age: The Getty Vocabularies. Knowledge Organization, 42(4), p. 232–243. https://doi.org/10.5771/0943-7444-2015-4-232
Bernasconi, E. et al. (2023) Linked Data Interfaces: A Survey. Information, 14(9), art. 483. https://doi.org/10.3390/info14090483
Berners-Lee, T., Hendler, J., Lassila, O. (2001) The semantic web. Scientific American, 284(5), p. 34–43. https://doi.org/10.1038/scientificamerican0501-34
Daquino, M. et al. (2017) Enhancing Semantic Expressivity in the Cultural Heritage Domain: Exposing the Zeri Photo Archive as Linked Open Data. Journal on Computing and Cultural Heritage, 10(4), art. 21. https://doi.org/10.1145/3051487
De Smedt, S. et al. (2024) Ten lessons learned from the mass digitisation of a herbarium collection. PhytoKeys, 244, p. 23–37. https://doi.org/10.3897/phytokeys.244.120112
Dobás, K., Fellegi, Zs., Palkó, G. (2023) A kis gömböc meséje – az ITIdata irodalomtudományos adatbázis fejlesztése 2022–2023-ban. In: Hungarnet Egyesület (szerk.) Új technológiákkal, új tartalmakkal a jövő digitális transzformációja felé: 32. Networkshop: országos konferencia, Veszprém, április 12–14. p. 192–198. Hungarnet Egyesület, Budapest. https://doi.org/10.31915/NWS.2023.28
Dobás, K., Szekrényes, I. (2025) Az ITIdata szemantikus adatbázis új keresőfelületei. In: Oktatási, kutatási és közgyűjteményi infrastruktúrák és tartalmak: digitális transzformáció felsőfokon: Networkshop 2025: 34. Országos Informatikai Konferencia, Győr, május 13–15. p. 58–65. Hungarnet Egyesület, Budapest. ISBN: 978-615-6792-15-0. https://doi.org/10.31915/NWS.2025.7
Fan, W., Zeng, M. L. (2024) Exploring the Generation Path of Smart Data for the Activation and Utilization of Cultural Heritage in the New Era of AI. Journal of Library Science in China, 50(2), p. 4–29. https://doi.org/10.13530/j.cnki.jlis.2024010
Gracy, K. F., Zeng, M. L., Skirvin, L. (2013) Exploring Methods to Improve Access to Music Resources by Aligning Library Data with Linked Data: A Report of Methodologies and Preliminary Findings. Journal of the American Society for Information Science and Technology, 64(10), p. 2078–2099. https://doi.org/10.1002/asi.22914
Hamburger, S. (2011) Functional Requirements for Authority Data: A Conceptual Model. Library Collections, Acquisitions, & Technical Services, 35(1), p. 41. https://doi.org/10.1080/14649055.2011.10766293
Hinze, A. et al. (2019) Capisco: Low-Cost Concept-Based Access to Digital Libraries. International Journal on Digital Libraries, 20(4), p. 307–334. https://doi.org/10.1007/s00799-018-0232-3
Hubay, M. (2019) Tények, mítoszok és lehetőségek a szemantikus web világában. Könyvtári Figyelő, 29(2), p. 245–253. Elérhető: https://epa.oszk.hu/00100/00143/00356/pdf/ (Utolsó elérés: 2026. 06. 01.)
Hubay, M. (2020a) Adatgazdagítás, adatszolgáltatás és discovery hagyományos és szemantikus metaadat-környezetben. Tudományos és Műszaki Tájékoztatás, 67(5), p. 291–300. Elérhető: https://journals.bme.hu/tmt/article/view/35421 (Utolsó elérés: 2026. 06. 01.)
Hubay, M. (2020b) Rekordkapcsolattól a szemantikus kapcsolatig: A Petőfi Irodalmi Múzeum személynévtere és az értelemmel teli világháló. In: Hagyományok és kihívások, p. 115–123. https://doi.org/10.21862/HagyKihiv_2019.115
Koch, W., Koch, G. (2017) Aggregation and Management of Metadata in the Context of Europeana. VOEB-Mitteilungen, 70(2), p. 170–178. https://doi.org/10.31263/voebm.v70i2.1776
Lehmann, J. et al. (2015) DBpedia – A Large-Scale, Multilingual Knowledge Base Extracted from Wikipedia. Semantic Web, 6(2), p. 167–195. https://doi.org/10.3233/SW-140134
Mering, M. (2019) IFLA Library Reference Model, RDA, and Serials in a Nutshell. Serials Review, 45(1–2), p. 66–68. https://doi.org/10.1080/00987913.2019.1627691
Micsik, A., Turbucz, S., Tóth, Z. (2015) Exploring Publication Metadata Graphs with the LODmilla Browser and Editor. International Journal on Digital Libraries, 16(1), p. 15–24. https://doi.org/10.1007/s00799-014-0130-2
Neuböck, V. G. (2019) Crowdsourcing an der oberösterreichischen Landesbibliothek. VOEB-Mitteilungen, 72(2), p. 297–309. https://doi.org/10.31263/voebm.v72i2.2834
Stiller, J. (2024) Multilingual Developments in Digital Cultural Heritage - Problem Space and Solutions. EuropeanaTech Insight, 2024(17). Elérhető: https://pro.europeana.eu/page/issue-17-multilinguality (Utolsó elérés: 2026. 06. 04.)
Subirats, I., Zeng, M. L. (2020) Linked Open Data Enabled Bibliographical Data (LODE-BD) 3.0. FAO, Rome. Elérhető: https://openknowledge.fao.org/handle/20.500.14283/cb2209en (Utolsó elérés: 2026. 06. 01.)
Ungváry, R. (2019) Besorolási, szabványosított, normatív vagy »autorizált«. Tudományos és Műszaki Tájékoztatás, 66(6), p. 328–342. Elérhető: https://journals.bme.hu/tmt/article/view/35873 (Utolsó elérés: 2026. 06. 01.)
Vlachidis, A. et al. (2013) Automatic Metadata Generation in an Archaeological Digital Library: Semantic Annotation of Grey Literature. In: Przepiórkowski, A. et al. (szerk.) Computational Linguistics: Applications. p. 187–202. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-34399-5_10
Weitz, J. et al. (2016) Mining MARC's Hidden Treasures: Initial Investigations Into How Notes of the Past Might Shape Our Future. Journal of Library Metadata, 16(3–4), p. 166–180. https://doi.org/10.1080/19386389.2016.1262653
Willer, M., Dunsire, G. (2013) Bibliographic Information Organization in the Semantic Web. Chandos Publishing, Oxford. https://doi.org/10.1533/9781780633978
Zeng, M. L., Chan, L. M. (2004) Trends and Issues in Establishing Interoperability among Knowledge Organization Systems. Journal of the American Society for Information Science and Technology, 55(5), p. 377–395. https://doi.org/10.1002/asi.10387
Zeng, M. L. (2019) Semantic Enrichment for Enhancing LAM Data and Supporting Digital Humanities. Profesional de La Informacion, 28(1). https://doi.org/10.3145/epi.2019.ene.03
Zumer, M., Zeng, M. L., Mitchell, J. S. (2012) FRBRizing KOS Relationships: Applying the FRBR Model to Versions of the DDC. In: Neelameghan, A., Raghavan, K. S. (szerk.) Categories, Contexts and Relations in Knowledge Organization. p. 190–194. Ergon-Verlag
GmbH, Wurzburg. Elérhető: https://www.webofscience.com/wos/woscc/full-record/WOS:000342292200029 (Utolsó elérés: 2026. 06. 01.)
