29.05.2013: Projekt Culturegraph: Datenvernetzung im Kultursektor

Ziel von Culturegraph ist es die Datenvernetzung im kulturellen Sektor voranzutreiben und verteilte, geschlossene Datenquellen zu einem offenen Wissensnetz zu verknüpfen. Die zentrale Idee dahinter ist der Aufbau einer Infrastruktur, die gezielt die Vernetzung bibliographischer Daten, Thesauri, Klassifikationen und Normdaten unterstützt.
Momentan beinhaltet Culturegraph über 100 Millionen Metadatendatensätze. Um diese Datenmenge effizient zu verarbeiten werden eine Reihe von leistungsfähigen Java-Technologien genutzt: Hadoop MapReduce für Berechnungen, HBase für die Datenhaltung, Lucene für Suchen, Tomcat und Spring für die Weboberfläche. Darüber hinaus wurde eine domänenspezifische Sprache für die Transformation von semistrukturierten Daten entwickelt. Alle im Rahmen von Culturegraph genutzte und neu entwickelte Software ist Open Source.

Im Vortrag wird Markus die Architektur von Culturegraph vorstellen, mit besonderem Fokus auf die getroffenen Design Entscheidungen und die gemachten Erfahrungen. Darüber hinaus werden auch ausgewählte Projekt Ergebnisse präsentiert.

Markus M. Geipel studierte Diplom-Informatik an der Technischen Universität München und promovierte anschließend in einer interdisziplinären Forschungsgruppe an der ETH Zürich. Seit Anfang 2011 arbeitet er bei der Deutschen Nationalbibliothek in den Projekten Deutsche Digitale Bibliothek und Culturegraph. Sein thematischer Fokus liegt auf den Bereichen Datenvernetzung und Software Architektur.        

Der JUGF-Stammtisch findet am 29.05.2013 ab 18:30 Uhr in der Deutschen Nationalbibliothek statt.

Nach der Veranstaltung treffen wir uns wie immer noch zum Stammtisch bei Essen & Trinken in der Apfelweinwirtschaft Frank, reserviert ist ab 20:30.

Anfahrt zur Deutschen Nationalbibliothek
  • ÖPV: Mit U5 direkt vom HBF (oder Konstablerwache). Auf dem Ring mit Bus 32.
  • Fahrrad-Ständer vor dem Gebäude.
  • PKW: Tiefgarage, kostenpflichtig, bis 22:00 geöffnet

Anmelden könnt ihr euch wie immer mit Doodle.


Comments