Semantisches Modell

Ein Semantisches Datenmodell ist im Rahmen eines Datenbankprojektes eine abstrakte, formale Beschreibung und Darstellung eines Ausschnittes der in einem bestimmten Zusammenhang (z. B. eines Projekts) 'wahrgenommenen Welt'. Zur Formulierung semantischer Datenmodelle existieren verschiedene Modellierungssprachen, von denen das Entity-Relationship-Modell das bekannteste ist.

Für semantische Modelle werden in der Praxis auch andere Begriffe benutzt, zum Beispiel: konzeptionelles (Daten-) Modell, konzeptuelles Datenbankschema.

Semantische Modelle werden im Rahmen der Analyse- und Entwurfsphasen in Projekten der Softwareentwicklung erarbeitet - letztlich als Grundlage für die Entwicklung / Inbetriebsetzung einer Datenbank. Die Datenbank selbst wird dann durch ein sogenanntes logisches Modell (z.B. ein relationen Modell) konzipiert, das wiederum in ein physisches Schema überführt wird.

Das Semantische Modell ist in der fachlichen Analysephase geeignet, beliebige Informationszusammenhänge eindeutig und übersichtlich darzustellen. Ein semantisches Datenmodell hat den Zweck, bereits in der Analysephase alle fachlich relevanten Aspekte um das Thema 'Daten' möglichst genau und vollständig sowie einheitlich strukturiert aufzunehmen und darzustellen. Alle fachlich wichtigen Aspekte zu den als relevant festgestellten Daten werden möglichst genau definiert. IT-technische Implementierungsaspekte spielen noch keine Rolle. Das Modell ist keine 'technische Dokumentation'. Vielmehr kennen / verstehen fachlich orientierte Projektmitarbeiter (nach kurzer Einweisung in die Methodik) alles, was darin dargestellt und beschrieben ist. Auch unterstützen Datenmodelle durch ihre begriffs- und strukturbildende Wirkung die Unternehmenskommunikation - in Projekten und im Geschäftsbetrieb, fachlich und technisch.

In der Entwurfsphase werden semantische Modelle ausgebaut und um technische Aspekte wie Datentypen oder Schlüsselbeziehungen ergänzt.

Aus welchen Bestandteilen ein semantisches Modell besteht, ist von der jeweiligen Modellierungssprache abhängig. Die vorherrschende Sprache zur Beschreibung von semantischen Datenmodellen ist das 1976 von Peter Chen konzipierte Entity-Relationship-Modell (ER-Modell) oder eine ihrer zahlreichen Erweiterungen. Daneben wird, insbesondere zur objektorientierten Modellierung, die Unified Modeling Language (UML) eingesetzt.

Wesentliche Arbeitsinhalte bei der Erstellung eines semantischen Modells:

  • Aus den als kontextrelevant ermittelten 'Informationsbegriffen' werden Einheiten ('Entitäten') identifiziert und – als 'Entitätsklassen' – benannt, "ÜBER die" Informationen verarbeitet und / oder gespeichert werden müssen.

  • Beispiel (Banken): Name, Geburtsdatum, Kontoeröffnungsdatum, Überweisungsbetrag, Saldo, Zinssatz, Postleitzahl werden sinnvoll zu PERSON, KONTO, ÜBERWEISUNG, ORT zusammengefasst.

  • Es wird ermittelt, welche Beziehungen zwischen diesen Entitäten bestehen oder bestehen können (Relations oder Relationships sind namensgebend für das ERM).

  • Beispiel: Jedes KONTO gehört 1 Person; Umkehrung: jede PERSON kann mehrere Konten unterhalten.

  • Die ermittelten Sachverhalte werden textuell beschrieben und i. d. R. grafisch dargestellt, z. B. durch ein ER-Diagramm.

Form, Inhalte und Begriffe erstellter Datenmodelle können sehr unterschiedlich sein und sind z. B. von folgenden Kriterien abhängig:

  • Verwendete Modellierungsmethodik: Nach UML erstellte Modelle sehen anders aus als nach ERM erstellte.

  • Zweck der Modellerstellung: Datenbank-Neudesign erfordert detailliertere Beschreibungen als wenn (z. B. in einem Wartungsprojekt) die zu verarbeitenden Daten bereits existieren.

  • Verwendete Modellierungswerkzeuge: Grafikform von Beziehungen (Raute oder Linie ...), Bezeichnung von Begriffen (Beziehung, Relation) sind werkzeugspezifisch unterschiedlich.

  • Projekt- / unternehmensspezifischen Regeln: Detaillierungsgrad der Modellierung (z.B. bei Beziehungen); Vorgabe "Das Datenmodell wird erst im DV-Konzept erstellt"