coli-conc Logo

Inhaltserschließung des K10plus als Open Data

2022-07-12

Der K10plus-Katalog umfasst bibliographische Angaben und Bestandsnachweise der Bibliotheken des Südwestdeutsche Bibliotheksverbund (SWB), des Gemeinsamen Bibliotheksverbundes (GBV) und weiterer Forschungseinrichtungen. Mit mehr als 200 Millionen Nachweisen zu rund 80 Millionen Publikationen ist er der umfangreichste Katalog im deutschsprachigen Raum. Die Daten des K10plus sind über Schnittstellen und als Datenbankdump in MARC und RDF als Open Data verfügbar.

Zur Auswertung von Sacherschließungsdaten wurde nun im Rahmen des Projekt coli-conc ein Auszug des K10plus mit allen Sacherschließungsdaten als Forschungsdatensatz veröffentlicht:

Die Datensätze umfassen rund 14 Gigabyte im normalisierten PICA+ Format. Eine Beschreibung der Daten und eine zufällige Stichprobe von 10.000 Datensätzen sind enthalten. Die Beschreibung der PICA-Felder ist unter https://format.k10plus.de/avram.pl abrufbar.

Aufbauend auf diesem Forschungsdatensatz sollen weiter aufbereitete Daten und Auswertungen erstellt und publiziert werden. Hinweise zur Verarbeitung der Daten werden in einem git-Repository gesammelt.

Mehr Beiträge

2022-06-23

The software library cocoda-sdk can be used to access terminologies from various sources

2022-05-13

Informationen zum Einbinden eigener Vokabulare in Cocoda anhand verschiedener Beispiele.

2022-04-27

Concordances can now be managed inside Cocoda

2022-04-25

Weitere Vokabulare in BARTOC und Cocoda verfügbar.

2022-02-04

Die neue Version des DDC-Analysetool coli-ana bringt Verbesserungen und ermöglicht die Eintragung von DDC-Zerlegungen in den K10plus-Katalog

2021-11-22

Performance improvements and many bug fixes