Getty Images/iStockphoto

NoSQL-Datenbanktypen erklärt: dokumentorientierte Datenbanken

Dokumentorientierte NoSQL-Datenbanken speichern Informationen in Dokumenten mit spezifischen Schlüsseln. Die Datenbanken haben verschiedene Vor- und Nachteile.

Wissenschaftler sind Problemlöser. Es gibt technologische Fortschritte, die zufällig entstanden sind, und solche, die erforscht wurden. Unabhängig davon, wie viel Aufwand in die Suche nach einer Antwort investiert wird, sind diese Antworten immer ein Mittel zum Zweck, Lösungen für ein Problem.

NoSQL-Datenbanken wurden als Reaktion auf die Notwendigkeit geschaffen, bestimmte Einschränkungen relationaler Datenbanken zu überwinden. Diese Einschränkungen sind in der Regel darauf zurückzuführen, dass man sich von dem engen Tabellenschema relationaler Datenbanken lösen muss.

Ein großer Vorteil von NoSQL-Datenbanken ist ihre Leistung und Skalierbarkeit. Sie sind in der Regel schnell bei der Verarbeitung der gespeicherten Daten. Schließlich ist eine weitere Einschränkung, die mit NoSQL überwunden wird, die Vielfalt der Datentypen, die gespeichert werden können.

NoSQL-Datenbankfamilie
Abbildung 1: Die verschiedenen Arten von NoSQL-Datenbanken.

Was sind dokumentenorientierte Datenbanken?

Eine dokumentorientierte Datenbank, auch Dokumentenspeicher genannt, speichert Informationen in CML-, YAML-, JSON- oder Binärdokumenten wie BSON. Um diese Dokumente als Ganzes zu organisieren, wird jedem Dokument ein bestimmter Schlüssel zugewiesen. Durch diese Eigenschaft ähneln Dokumentenspeicher Schlüsselwertspeichern.

Obwohl Dokumentenspeicher kein einheitliches Schema haben, sind sie in der Regel so organisiert, dass sie sich leicht nutzen und schließlich analysieren lassen. Das bedeutet, dass sie bis zu einem gewissen Grad strukturiert sind. Da jedes Objekt in der Regel in einem einzigen Dokument gespeichert wird, müssen keine Beziehungen zwischen Dokumenten definiert werden.

Diese Dokumente sind in keiner Weise mit Tabellen einer relationalen Datenbank vergleichbar; sie haben keine festgelegte Anzahl von Feldern, Slots oder ähnlichem, und es gibt keine Leerstellen – die fehlenden Informationen werden einfach ausgelassen, anstatt dass ein leerer Slot dafür übrig bleibt. Daten können hinzugefügt, bearbeitet, entfernt und abgefragt werden.

Die jedem Dokument zugewiesenen Schlüssel sind eindeutige Kennungen, die für den Zugriff auf Daten in der Datenbank erforderlich sind, in der Regel ein Pfad, eine Zeichenfolge oder ein Uniform Resource Identifier (URI). IDs werden in der Regel in der Datenbank indiziert, um das Abrufen von Daten zu beschleunigen.

Der Inhalt von Dokumenten in einem Dokumentenspeicher wird mit Metadaten klassifiziert. Dank dieser Funktion erkennt die Datenbank, welche Art von Informationen sie enthält – ob ein Feld beispielsweise Adressen, Telefonnummern oder Sozialversicherungsnummern enthält. Für eine verbesserte Effizienz und Benutzerfreundlichkeit verfügen Dokumentenspeicher über eine Abfragesprache, die das Abfragen von Dokumenten auf der Grundlage der Metadaten oder des Inhalts des Dokuments ermöglicht. So können Sie alle Dokumente abrufen, die innerhalb eines bestimmten Feldes denselben Wert enthalten.

Amazon hat den folgenden terminologischen Vergleich zwischen SQL und einer Dokumentendatenbank, MongoDB, bereitgestellt. Die folgende Liste unterstützt dabei, eine Parallele zwischen den beiden Datenbanktypen zu ziehen:

  • SQL: Tabelle, Zeile, Spalte, Primärschlüssel, Index, Ansicht, verschachtelte Tabelle oder verschachteltes Objekt, Array
  • MongoDB: Sammlung, Dokument, Feld, ObjectId, Index, Ansicht, eingebettetes Dokument, Array

Vorteile

Eine der obersten Prioritäten in jedem Unternehmen ist es, die zur Verfügung stehende Zeit und die Ressourcen optimal zu nutzen und so die Gesamteffizienz zu steigern. Die Auswahl der richtigen Datenbank auf der Grundlage ihres Zwecks und der Art der gesammelten Daten ist ein entscheidender Schritt. Die folgenden Merkmale eines Dokumentenspeichers könnten ihn zur richtigen Wahl für Sie machen:

  • Flexibilität. Dokumentenspeicher haben den berühmten Vorteil aller NoSQL-Datenbanken, nämlich eine flexible Struktur. Wie bereits erwähnt, ist bei Dokumenten einer Datenbank keine Konsistenz erforderlich. Sie müssen nicht vom gleichen Typ sein und auch nicht gleich strukturiert sein.
  • Einfache Aktualisierung. Jede neue Information, die einer relationalen Datenbank hinzugefügt wird, muss allen Datensätzen hinzugefügt werden, um die einheitliche Struktur innerhalb einer Tabelle einer relationalen Datenbank beizubehalten. Bei Dokumentenspeichern können Sie neue Informationen einfach hinzufügen, ohne sie zu allen vorhandenen Datensätzen hinzufügen zu müssen.
  • Verbesserte Leistung. Anstatt Daten aus mehreren verknüpften Tabellen abzurufen, finden Sie alles, was Sie benötigen, in einem Dokument. Da sich alles an einem einzigen Ort befindet, ist es viel schneller, auf die Daten zuzugreifen und sie abzurufen.

Nachteile

Unabhängig von der Größe einer Datenbank sind NoSQL-Datenbanken im Vergleich zu relationalen Datenbanken einfach, da sie nur semistrukturiert sind. Wenn Sie die Einfachheit eines Dokumentenspeichers gefährden, gefährden Sie auch die zuvor erwähnte verbesserte Leistung. Sie können Verweise zwischen Dokumenten eines Dokumentenspeichers erstellen, indem Sie sie miteinander verknüpfen. Dies kann jedoch zu komplexen Systemen führen und die Leistung beeinträchtigen.

Wenn Sie eine Datenbank mit großem Volumen haben und ein Netzwerk aus Daten erstellen möchten, die sich gegenseitig referenzieren, sollten Sie nach einer Möglichkeit suchen, diese abzubilden und in eine relationale Datenbank einzufügen.

Anwendungsfälle für dokumentenorientierte Datenbanken

Ein Dokumentenspeicher ist eine einfache Möglichkeit, Informationen, die in Dokumenten enthalten sind und sich auf ein einzelnes Objekt beziehen, zu speichern und abzurufen. Aus diesem Grund eignet sich diese Art von Datenbank für Benutzerprofile, bei denen Sie Informationen über einen einzelnen Benutzer haben und der Benutzer auswählt, was er bereitstellen möchte und wie er dies tun möchte.

Ähnlich wie bei bestimmten anderen NoSQL-Datenbanktypen eignet sie sich auch für die Verwaltung von Inhalten und benutzergenerierte Inhalte wie Blogs.

Die beliebtesten dokumentenorientierten Datenbanken

Einige der beliebtesten Dokumentenspeicher wurden bereits erwähnt. Andere sind MongoDB Atlas, Amazon DynamoDB, Google Cloud Firestore und Couchbase Server.

Alle NoSQL-Datenbanken haben etwas gemeinsam. Sie sind in der Regel für bestimmte Zwecke konzipiert und erfüllen Anforderungen, die eine relationale Datenbank nur schwer erfüllen könnte. Sie können Ihre Daten jetzt optimal nutzen, indem Sie keine Zeit damit verbringen müssen, sie in einer Tabelle einer relationalen Datenbank zu platzieren und die Beziehungen zwischen den Tabellen zuzuordnen. Speichern Sie sie einfach aus der vorhandenen Datenquelle und extrahieren Sie sie auf die effizienteste Weise.

Erfahren Sie mehr über Datenbanken