Google BigTable
Google BigTable ist ein verteiltes, spaltenorientiertes Datenspeichersystem von Google. Er ist dazu gedacht, die sehr großen Mengen von strukturierten Daten zu handhaben, die durch die Google-Suche und die Web-Dienste des Unternehmens anfallen.
BigTable wurde für Anwendungen entwickelt, die eine hohe Skalierbarkeit benötigen. Die Technologie wurde von Beginn für den Einsatz mit Petabytes an Daten konzipiert. Die Datenbank wird auf geclusterten Systemen eingesetzt und verwendet ein einfaches Datenmodell, das Google mit „unabhängige, verteilte, persistente, mehrdimensionale, geordnete Map“ beschreibt. Die Daten werden nach dem Zeilenschlüssel (row key) geordnet zusammengesetzt. Die Indexierung der Map erfolgt nach Zeilenschlüssel, Spaltenschlüssel (column key) und Zeitstempel (timestamp). Komprimierungsalgorithmen helfen hohe Kapazitäten zu erreichen.
Google BigTable dient als Datenbank für Anwendungen wie Google App Engine Datenspeicher, Personalisierte Suche, Google Earth und Google Analytics. Google wartet die Software als proprietäre, hauseigene Technologie. Dennoch hat BigTable einen großen Einfluss auf NoSQL-Datenbank-Design. Die Software-Entwickler veröffentlichten 2006 in einem technischen Papier Big-Table-Details auf dem USENIX-Symposium über Betriebssysteme und Design-Umsetzungen.
Googles detaillierte Beschreibung des Big-Data-Innenlebens erlaubt anderen Unternehmen und Open-Source-Entwicklungsteams, Big-Data-Derivate zu erstellen. Das trifft zum Beispiel auf die Apache-HBase-Datenbank zu, die auf dem Hadoop Distributed File System (HDFS) ausgeführt wird. Weitere Beispiele sind Cassandra, ursprünglich von Facebook entwickelt, und Hypertable, einer Open-Source-Technologie, die in einer kommerziellen Version als Alternative zu HBase vermarktet wird.