Daten
In der Informatik und im Computerbereich sind Daten Informationen, die in eine Form übersetzt wurden, die für das Kopieren oder Verarbeiten effizient ist. In heutigen Computern und Übertragungsmedien sind Daten Informationen, die in eine binäre digitale Form umgewandelt wurden. Der Begriff Rohdaten bezeichnet Daten in ihrem einfachsten digitalen Format.
Im Bereich der Informatik und Computertechnologie versteht man unter Daten Informationen, die in ein Format konvertiert wurden, das eine effiziente Verarbeitung und Vervielfältigung ermöglicht. Moderne Computer und Übertragungsmedien nutzen dafür eine binäre digitale Darstellung. Als Rohdaten bezeichnet man Daten in ihrer grundlegendsten digitalen Form.
Die Grundlagen des Datenkonzepts in der elektronischen Datenverarbeitung gehen auf Claude Shannon zurück, einen amerikanischen Mathematiker, der als Begründer der Informationstheorie gilt. Shannon entwickelte binäre digitale Konzepte, die auf der Anwendung der zweitwertigen Booleschen Logik in elektronischen Schaltkreisen basieren.
Das binäre Zahlensystem ist heute die Basis für zahlreiche Komponenten der Computertechnik, darunter Prozessoren, Halbleiterspeicher, Festplatten und viele andere Peripheriegeräte. In den Anfängen der Computertechnologie wurden Daten und Befehle zunächst über Lochkarten eingegeben, später folgten Magnetbänder und schließlich Festplatten.
Die wachsende Bedeutung von Daten in der Geschäftswelt spiegelte sich in der zunehmenden Verwendung von Begriffen wie Datenverarbeitung und elektronische Datenverarbeitung wider. Diese Begriffe umfassten zeitweise das gesamte Spektrum dessen, was heute unter Informationstechnologie verstanden wird. Mit der fortschreitenden Entwicklung der betrieblichen Datenverarbeitung kam es zu einer Ausdifferenzierung der Aufgabenbereiche, was zur Entstehung spezialisierter Berufe im Datenmanagement führte.
Verschiedene Optionen für die Datenspeicherung
Computer stellen Daten, einschließlich Video, Bilder, Töne und Text, als binäre Werte mit Mustern aus nur zwei Zahlen dar: 1 und 0. Ein Bit ist die kleinste Einheit von Daten und stellt nur einen einzigen Wert dar. Ein Byte ist acht Binärziffern lang. Speicherung und Speicher werden unter anderem in Megabyte und Gigabyte gemessen.
Die Maßeinheiten der Daten wachsen mit der Menge der gesammelten und gespeicherten Daten weiter. Der relativ neue Begriff Brontobyte zum Beispiel ist eine Datenspeicherung, die 10 hoch 27 Bytes entspricht.
Daten können in Dateiformaten gespeichert werden, wie in Großrechnersystemen mit ISAM und VSAM. Andere Dateiformate für die Datenspeicherung, -konvertierung und -verarbeitung enthalten durch Komma getrennte Werte. Diese Formate fanden Verwendung bei einer Vielzahl von Maschinentypen, als stärker strukturierte, datenorientierte Ansätze in der betrieblichen Datenverarbeitung Fuß fassten.
Eine größere Spezialisierung erfolgte mit Datenbanken, Datenbankmanagementsystemen (DBMS) und relationale Datenbanktechnologien zur Organisation von Informationen.
Verschiedene Datentypen
Das Wachstum des Internets und die wachsenende Zahl von Smartphones in den letzten zehn Jahren führte zu einem sprunghaften Anstieg digitaler Daten. Die Daten umfassen heute Text-, Audio- und Videoinformationen sowie Aufzeichnungen von Log- und Web-Aktivitäten. Ein Großteil davon sind unstrukturierte Daten.
Der Begriff Big Data wird verwendet, um Daten im Petabyte-Bereich oder größer zu beschreiben. Big Data kann dabei mit den 3Vs dargestellt werden – Volume, Variety und Velocity (Volumen, Vielfalt und Geschwindigkeit). Mit der Ausbreitung des webbasierten E-Commerce haben sich große datengesteuerte Geschäftsmodelle entwickelt, die Daten als einen Wert an sich behandeln. Solche Trends haben auch zu einer größeren Besorgnis über die gesellschaftliche Nutzung von Daten und den Datenschutz geführt.
Daten haben eine Bedeutung, die über ihre Verwendung in auf Datenverarbeitung ausgerichteten Computeranwendungen hinausgeht. So wird zum Beispiel bei der Verbindung elektronischer Komponenten und der Netzwerkkommunikation der Begriff Daten oft von Control Information, Control Bits und ähnlichen Begriffen unterschieden, um den Hauptinhalt einer Übertragungseinheit zu identifizieren.
Darüber hinaus wird der Begriff Daten in der Wissenschaft verwendet, um einen gesammelten Bestand an Fakten zu beschreiben. Dies ist auch in Bereichen wie Finanzen, Marketing, Demographie und Gesundheit der Fall.
Datenverwaltung und -verwendung
Mit der Verbreitung von Daten in Unternehmen und der Wissenschaft wurde zusätzliches Augenmerk auf die Sicherung der Datenqualität gelegt, indem Duplikate reduziert und die Verwendung der genauesten und aktuellsten Datensätze garantiert wird.
Zu den vielen Schritten, die mit modernem Datenmanagement verbunden sind, gehören Datenbereinigung sowie Extraktions-, Transformations- und Ladeprozesse (ETL) zur Integration von Daten. Die zu verarbeitenden Daten werden inzwischen durch Metadaten ergänzt, die Administratoren und Benutzern helfen, Datenbankinhalte und andere Daten zu verstehen.
Analyseverfahren, die strukturierte und unstrukturierte Daten kombinieren, sind nützlich geworden, da Organisationen versuchen, aus solchen Informationen Kapital zu schlagen. Systeme für diese Analysen streben zunehmend nach Echtzeit-Performance, so dass sie so aufgebaut sind, dass sie eingehende Daten verarbeiten können, die mit hohen Leseraten verarbeitet werden können.
Im Laufe der Zeit wurde die Idee der Datenbank für Operationen und Transaktionen auf die Datenbank für Berichte und prädiktive Datenanalysen (Predictive Analytics) ausgeweitet. Ein Beispiel ist das Data Warehouse, das für die Verarbeitung von Fragen zu Operationen für Geschäftsanalysten und Führungskräfte optimiert ist. Die zunehmende Betonung des Auffindens von Mustern und der Vorhersage von Geschäftsergebnissen hat zur Entwicklung von Data-Mining-Techniken geführt.
Fachpersonal für Daten
Der Beruf des Datenbank-Administrators (DBA) ist ein Ableger der IT. Diese Datenbankexperten arbeiten an der Gestaltung, Abstimmung und Wartung der Datenbank.
Der Beruf des Datenmanagers hat sich fest etabliert, als das relationale Datenbankmanagementsystem (RDBMS) ab den 1980er Jahren in Unternehmen breite Anwendung fand. Der Aufstieg der relationalen Datenbank wurde zum Teil durch die Structured Query Language (SQL) ermöglicht. Später entstanden NoSQL-Datenbanken als Alternative zu den etablierten RDBMS.
Heute beschäftigen Unternehmen Datenmanagementexperten oder weisen Mitarbeitern die Rolle der Datenverwaltung zu, was die Durchführung von Datenverwendungs- und Sicherheitsrichtlinien umfasst, wie sie in Data-Governance-Richtlinien beschrieben sind.
Der Titel Data Scientist beschreibt Spezialisten, die sich auf Data Mining und Analyse konzentrieren. Der Vorteil der anschaulichen Darstellung der Data Science (Datenwissenschaft) hat sogar den Data Artist (Datenkünstler) hervorgebracht. Dies sind Personen, die Daten auf kreative Weise grafisch darstellen und visualisieren.