Sergey Nivens - Fotolia
Cómo un tejido de datos lógicos puede mejorar la gestión de datos
Conforme los datos siguen creciendo a través de diferentes fuentes, los ponentes de la cumbre virtual Fast Data Strategy explicaron cómo puede ayudar un enfoque de tejido de datos lógico.
Con los datos repartidos entre diferentes aplicaciones, bases de datos y entornos tanto locales como en la nube, reunirlos todos no es tarea fácil.
La virtualización de datos ofrece una forma de ayudar a conectar fuentes de datos dispares, creando una abstracción virtual que permite a los usuarios hacer uso de los datos procedentes de diferentes lugares. Pero las organizaciones también necesitan un marco general por encima de la virtualización de datos para proporcionar un gobierno y una gestión de datos empresariales. El concepto emergente de tejido de datos lógicos responde a este requisito clave de la gestión de datos.
Una estructura de datos lógica es una arquitectura que utiliza la virtualización de datos para integrar y ayudar a gobernar los datos en las instalaciones locales y en la nube.
Entre las organizaciones que han adoptado una arquitectura de tejido de datos lógicos se encuentra la empresa de servicios financieros globales Prudential Financial Inc., que describió su enfoque en la Cumbre Virtual de Estrategia de Datos Rápida, organizada por el proveedor de virtualización de datos Denodo.
«En las empresas de hoy, las decisiones deben estar respaldadas por los datos en todos los niveles de la organización», dijo Alberto Pan, CTO de Denodo, durante una presentación transmitida en vivo. «Esto significa que ahora hay más personas que necesitan datos para hacer su trabajo».
Adoptar un enfoque prudente para el tejido de datos lógicos
Asimismo, en la cumbre virtual, Ralph Aloe, director de gestión de la información empresarial de Prudential Financial, expuso los retos a los que se enfrenta su organización, que se han aliviado gracias al uso de un tejido de datos lógico.
Aloe señaló que la gobernanza de los datos empresariales es una gran preocupación para su organización, ya que los datos no siempre se almacenan de forma coherente.
Cuando se unió a la compañía en 2018, la arquitectura de datos estaba muy fragmentada en un complejo entorno de TI, dijo Aloe. Prudential Financial también estaba utilizando muchas herramientas de extracción, transformación y carga (ETL) para traer conjuntos de datos de múltiples fuentes, lo que era otro desafío tanto en términos tanto de gestión de datos como de calidad de datos.
La empresa comenzó con un ejercicio de prueba de concepto con la virtualización de datos y desde entonces lo ha ampliado a una arquitectura de tejido de datos lógicos más amplia. En lugar de que los usuarios se enfrenten a la perspectiva de tratar de averiguar dónde obtener los datos, ahora existe un proceso de datos unificado.
«Una de las cosas que se nos ocurrió fue un tejido de datos en evolución que se produjo aprovechando la virtualización de datos», dijo Aloe.
Con la virtualización de datos en el centro, Prudential Financial no pudo contemplar el gobierno de los datos empresariales de todas las fuentes de datos como parte de un enfoque unificado. También fue posible habilitar un catálogo de datos para que los usuarios de Prudential Financial pudieran identificar y acceder a los datos más fácilmente.
El tejido lógico de datos como camino hacia la modernización
Además de ayudar a habilitar la gobernanza de datos y las capacidades del catálogo de datos, al adoptar el enfoque de la estructura lógica de datos, Prudential Financial ha podido acelerar sus esfuerzos de modernización.
«[El tejido de datos lógicos] también nos ha ayudado a adelantarnos a la modernización, ya que podemos aprovechar la virtualización como un componente provisional mientras modernizamos los sistemas de fondo», afirma Aloe.
Así, por ejemplo, si había un proceso empresarial que utilizaba hojas de cálculo de Excel, Prudential Financial podía utilizar la virtualización de datos para ayudar a pasar a algo más estable. Además, Aloe señaló que el tejido lógico de datos ha ayudado a permitir una arquitectura de datos menos compleja que hace que los datos sean más útiles para el negocio.
«Lo que estamos viendo con esta estructura de datos y los servicios creados en torno a ella es una mejor alineación entre nuestra estrategia de negocio y nuestra estrategia de datos», dijo Aloe.
Argumentar a favor del tejido de datos lógicos
En otro tema de la conferencia, David Stodder, director senior de investigación de inteligencia empresarial en el proveedor de investigación y educación de ciencia de datos TDWI, dijo que muchas organizaciones quieren ser impulsadas por los datos, basando muchas decisiones clave en el análisis de datos.
Durante su presentación, Stodder señaló que una parte clave del éxito de un modelo orientado a los datos es eliminar los retrasos que se producen entre los pasos de obtención de los datos desde su origen, hasta su utilización por parte de los usuarios y la analítica.
Con el rápido aumento del número de organizaciones que utilizan servicios en la nube, Stodder señaló que el número de silos de datos diferentes también está creciendo, citando la investigación de TDWI que muestra que el 51 % de las organizaciones encuestadas a principios de 2020 informaron de silos de datos desconectados como uno de sus mayores problemas.
«La virtualización de datos proporciona esa capa de abstracción lógica que protege a los usuarios de la complejidad de saber cómo acceder a las fuentes de datos subyacentes», dijo Stodder. La virtualización de datos «deja los datos y, por tanto, reduce los retrasos debidos al movimiento de datos», añadió.
En los últimos años, el concepto de virtualización de datos se ha ampliado para permitir los almacenes de datos lógicos, en los que los datos de diferentes entornos se conectan virtualmente en un único almacén de datos. El tejido de datos lógicos es el siguiente paso, y amplía la virtualización de datos para integrar, gestionar y gobernar los datos de la empresa en un entorno híbrido y multinube.
«Un tejido de datos lógicos está diseñado para ser un organismo en crecimiento flexible y adaptable que nos da una especie de capacidad universal para conectar cosas», dijo Stodder.