Content Analytics in ECM-Systemen einsetzen

Content Analytics geht über bewährte Webanalysen hinaus und erweitert das IT-Arsenal von Unternehmen um Sprachverarbeitung sowie Bild- und Videoerkennung.

Wenn wir etwas wissen möchten, wenden wir uns mit einer ungenau formulierten Frage an Google. Wahrscheinlich finden wir nützliche Links, die zur Antwort führen. Der Inhalt ist da draußen. Google durchsucht die Ergebnisse, um die Nadel im Heuhaufen zu finden.

Doch wenn es um die Arbeit im Alltag geht, haben wir sehr unterschiedliche Erfahrungen gemacht. Ob in der Cloud oder lokal, die benötigten Inhalte werden in den bestehenden Servern und Systemen unseres Unternehmens gepflegt. Wir setzen auf verschiedene Anwendungen, Datenbanken und Content Repositories mit jeweils eigenen Methoden für den Zugriff und die Abfrage von Informationen. Dabei stellt sich heraus, dass es genauso wichtig ist zu wissen, was und wie man die Fragen stellt, um die Antworten zu finden.

Allerdings fehlt uns dabei die Fähigkeit, die Ergebnisse intuitiv und benutzerfreundlich zu „googeln“. Die zugrunde liegende Enterprise-Content-Management-Analyse, die aufzeigt, was wir wissen wollen, fehlt in der Regel in unserer Anwendungsumgebung.

Umfangreiche CMS-Analytik

Content Analytics umfasst ein ständig wachsendes Spektrum an Business-Intelligence- und Analyse-Tools, -Technologien und -Praktiken.

Im Kern fügt Enterprise Content Management Analytics unstrukturierten Daten Struktur hinzu, um die Verbindungen zwischen verschiedenen Quellen zu berechnen und Data Lakes und Informationsströmen einen Sinn zu geben. Analytics in Content-Management-Systemen (CMS) verbindet bewährte Techniken zur Organisation und Suche mit neuen Ansätzen, die gerade auf den Markt kommen.

Einmal in einem Unternehmen eingesetzt, verspricht Content Analytics, die Messlatte für die Betriebseffizienz zu erhöhen und innovative Lösungen zu entwickeln, die Machine Learning und künstliche Intelligenz umfassen. Die Entwicklung dieser Anwendungen der nächsten Generation erfordert jedoch technisches Geschick.

Textanalytik und Semantik

CMS Analytics hat seine Wurzeln in der Textanalytik. Denken Sie an die Wörter in einem Dokument, das mit einer Software wie Microsoft Word oder Google Docs erstellt wurde. Das Dokument enthält Textzeichenfolgen, also alphanumerische Zeichen, die in einer Datei gespeichert sind. Transparent für Endbenutzer und für Entwickler zugänglich, enthält es auch Tags zur Formatierung, die Zeichenattribute (fett, unterstrichen), Absätze (Umbrüche, Einrückungen) und Seitenlayouts (Ränder, Paginierung) festlegen. Algorithmen verwenden diese Tags, um die Textzeichenfolgen in etwas lesbares umzuwandeln, was auf Bildschirmen und Druckern dargestellt wird.

Und das Tag beschränkt sich nicht nur auf die Formatierung. Durch den Zyklus der Metadatenanreicherung, also das Einbetten von Begriffen und Konzepten direkt in eine Datei, ist es auch möglich, Textzeichenfolgen je nach Bedeutung zu kennzeichen. So können einzelne Einträge innerhalb eines Verzeichnisses Tags für „Nachname“, „Vorname“, „Firma“ und „E-Mail-Adresse“ enthalten. Endbenutzer fügen diese Tags automatisch hinzu, wenn sie vordefinierte Vorlagen bearbeiten. Algorithmen verarbeiten den markierten Inhalt, beantworten Anfragen und rendern Ergebnisse auf Bildschirmen und Druckern.

Einige Tag Sets betten semantisches Wissen über die Zusammenhänge zwischen verschiedenen Elementen ein. Zum Beispiel definiert Schema.org die webweiten Tag Sets für eine Reihe von allgemein anerkannten „Dingen“. Es wurde entwickelt, um die Erfahrung von Suchmaschinen zu verbessern und ist die Grundlage für Google Knowledge Graph.

Ein weiteres Beispiel ist die Financial Industry Business Ontology, die die Bedeutung von finanziellen Begriffen, Konzepten und verwandten betriebswirtschaftlichen Kenntnissen kodiert. Algorithmen können intelligente Finanzdienstleistungsanwendungen erstellen, wie zum Beispiel die automatische Bestimmung der Kreditwürdigkeit von Kreditnehmern.

Textanalyse ist allerdings nicht immer auf explizites Tagging angewiesen. Natural Language Processing (NLP) erkennt Muster im Text und sammelt Hinweise, um Rückschlüsse auf die Beziehungen zwischen Wörtern und Phrasen zu ziehen und so die Bedeutung zu bestimmen.

NLP stützt sich auf eine Reihe von linguistischen Techniken wie Text-Sentimentanalyse, Entity-Extraktion und -Verknüpfung, latente semantische Analyse und die Bayes'sche Textklassifikation, die jeweils für bestimmte Arten von Dokumentensammlungen und Geschäftssituationen relevant sind. Es überrascht nicht, dass es eine grundlegende Technologie ist, die viele kognitive Computerlösungen antreibt.

Digitale Muster ableiten

Aber Text ist nur ein Datentyp. Es gibt andere Techniken zur Ableitung von digitalen Mustern aus verschiedenen Arten von Inhalten, einschließlich Fotos, Bilder, Videos, Audiospuren und 3D-Objekten, und zur Extraktion der zugrunde liegenden Bedeutung der Dinge.

Nehmen wir zum Beispiel die Bildanalyse. Bilder im Rohdatenformat (Raw) sind Sammlungen von Bits, die als Pixel organisiert und üblicherweise in standardisierten, formatierten Dateien, wie zum Beispiel JPEG, gespeichert werden. Bildanalyse-Tools können eine Fotosammlung verarbeiten, um Gesichter zu erkennen, Emotionen hervorzuheben, Farben zu identifizieren und die wichtigsten Objekte, die Bilder enthalten, wie Hunde, wilde Tiere und Wolken, zu klassifizieren. Wenn die Dateien Geocodes enthalten, kann die Inhaltsanalyse Orte bestimmen.

Das Ergebnis kann eine Digital-Asset-Management-Plattform der nächsten Generation sein, die automatisch eine Sammlung von Artikeln organisiert, wobei Männer, Frauen und Kinder verschiedene Kleidungsstile tragen, auf Feldern und in Städten spazieren gehen und Hintergründe von verschiedenen Orten auf der ganzen Welt haben. Eine Marketing-Abteilung kann die Produktivität steigern, indem sie es sich einfach macht, die richtigen Fotos für personalisierte Marketing-Kampagnen zu finden.

Erste Schritte mit Enterprise Content Management Analytics

Für Geschäftsanwender liefern intelligente Anwendungen einen geschäftlichen Nutzen. CMS Analytics ist das Mittel zum Zweck und hängt davon ab, wie digitale Erlebnisse die Produktivität steigern, Kosten senken und Risiken minimieren.

Wie kann ein Unternehmen mit Enterprise Content Management Analytics beginnen? Man sollte folgendes beachten:

  • Man sollte wissen, wie man die richtigen Fragen stellt. Seien Sie aufgabenspezifisch und situationsbewusst. Je konzentrierter, desto besser. Verlassen Sie sich bei der Modellierung des Problembereichs auf Experten. CMS-Analytik sollte ein gut definiertes Modell umfassen.
  • Optimieren Sie für Transparenz. Stellen Sie sicher, dass Endbenutzer nichts außerhalb ihrer gewohnten, alltäglichen Aufgaben tun müssen. Vereinfachen Sie das Geschäftsumfeld, wo immer es möglich ist. Die Algorithmen hinter der Mustererkennung sollten einfach intuitiv und situationsgerecht funktionieren.

Denken Sie daran, dass Plattformen für Enterprise Content Management Analytics nichts für schwache Nerven sind. Wenn es richtig gemacht wird, kann es so konfiguriert werden, dass sie leistungsstarke und profitable Ergebnisse liefern.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Was ist der Unterschied zwischen ECM und WCM?

Checkliste für erfolgreiche ECM-Projekte.

Sieben Features, die jedes Enterprise-Content-Management-System haben sollte.

Erfahren Sie mehr über Big Data