alex_aldo - Fotolia
Problemas de integración de datos son un obstáculo que las empresas deben superar
Los datos relevantes son difíciles de encontrar para las organizaciones, dice el CEO de Talend, Mike Tuchen. También es difícil extraer los datos correctos en medio de la complejidad que han creado los grandes almacenes de datos.
A medida que las organizaciones intentan analizar la gran cantidad de información que han recopilado, necesitan superar los problemas de integración de datos antes de poder extraer información significativa.
Las empresas que han resistido la prueba del tiempo cuentan con décadas de datos, y a menudo se almacenan en diferentes lugares y se extienden a través de sistemas dispares.
El alcance de la inteligencia empresarial que las empresas obtienen de esos datos en esa forma fortuita es limitado, mientras que intentar estandarizar los datos puede ser abrumador.
Observamos a algunos proveedores que se especializan en resolver problemas de integración de datos, cuyo servicio está ayudando a otras compañías a seleccionar la gran cantidad de información que poseen y colocarla en un lugar, y en un formato, donde se pueda acceder y usar para producir inteligencia empresarial, o Business Intelligence (BI) significativa.
El proveedor de integración de datos en la nube Talend, junto con otros como Informatica y MuleSoft, recientemente adquirido por Salesforce, es uno de esos proveedores.
En una sesión de preguntas y respuestas, el CEO de Talend, Mike Tuchen, analiza los diferentes problemas de integración de datos que enfrentan las grandes empresas en comparación con sus hermanos pequeños y medianos, así como la estrategia de Talend para ayudar a las empresas a abordar su repentina abundancia de datos.
En esta entrega, Tuchen habla sobre los desafíos masivos que se han desarrollado en los últimos 10 a 15 años a medida que las organizaciones han comenzado a digitalizar y agrupar sus datos.
¿Existen diferentes problemas de integración de datos que las pequeñas y medianas empresas podrían enfrentar en comparación con una gran organización en términos de extracción de datos de un vasto conjunto de información que han recopilado a lo largo de los años?
Mike Tuchen: Para una empresa pequeña o mediana, en su mayor parte saben dónde están sus sistemas. Hay un conjunto de fuentes mucho más comprensibles para el ser humano de donde obtendrán sus datos, por lo que, en su mayor parte, no es necesario catalogarlos por adelantado. Es algo que se puede elegir hacer más tarde y opcionalmente. Pueden decir: 'Voy a extraer datos del uso de Salesforce y NetSuite, y HubSpot y Salesforce y NetSuite, y Zendesk para obtener soporte'. Pueden extraer datos de todos esos sistemas, asegurarse de tener una definición coherente de quién es un cliente y qué están haciendo, y luego pueden comenzar a analizar cuáles son las campañas más efectivas, quiénes son los prospectos más probables a convertirse en clientes, quiénes son los clientes más probables de retener o venderles más, o lo que sea que estén tratando de hacer con el análisis central. Dado que se tiene una pequeña cantidad de sistemas, una pequeña cantidad de fuentes, es posible ir directamente allí y se convertirlo en un impulso al proceso de integración o de limpieza, y el proceso de limpieza inicial es un problema más simple.
Entonces, en esencia, aunque no tengan los medios financieros para invertir en un equipo de científicos de datos, ¿es el proceso de resolución de problemas de integración de datos más fácil para ellos?
Tuchen: Seguro. El tamaño crea complejidad. También crea una oportunidad, pero cuanto más grande se es, más fuentes se obtienen. Piensen que en un extremo del espectro hay una gran compañía multinacional que tiene un montón de divisiones diferentes repartidas por todo el mundo, algunas de ellas obtenidas a través de adquisiciones. Piensen en la gran cantidad de diferentes fuentes que tienen. Estamos trabajando con un cliente que tiene una docena de sistemas ERP diferentes y que ahora están tratando de reunir datos, y eso es solo en un tipo de datos: datos transaccionales en torno a transacciones financieras. Piensen en ese tipo de complejidad versus una pequeña empresa.
¿Cuál es el servicio principal que ofrece Talend?
Tuchen: Talend es una empresa de integración de datos, y nuestro enfoque principal es ayudar a las empresas a recopilar, gobernar, transformar y compartir sus datos. Lo que estamos viendo es que los datos, cada vez más, se están convirtiendo en un activo estratégico crítico. Observamos, en todo el mundo, que a medida que las empresas están cada vez más digitalizadas, están viendo que los datos administrados correctamente son una ventaja competitiva, y en el corazón de cada industria hay una batalla de datos estratégicos que, si se resuelve bien, dará una ventaja por sobre los competidores. Con ese reconocimiento, la importancia del problema que estamos resolviendo está aumentando en la mente de nuestros clientes, y eso crea una oportunidad para nosotros.
¿Cómo ayuda Talend a los clientes a superar los problemas de integración de datos?
Tuchen: Tenemos una oferta basada en la nube llamada Talend Data Fabric que integra varios componentes diferentes, incluidas muchas de las diferentes capacidades de las que hablamos. Hay un catálogo de datos que resuelve ese proceso de descubrimiento y el problema de definición de datos, asegurándose de que tengamos una definición coherente, un linaje de dónde comienzan y dónde terminan los datos, qué sucede a lo largo del camino, para que se pueda comprender el análisis de impacto, y así sucesivamente. Esa es una parte de nuestra oferta. Y tenemos una oferta de API [interfaz de programación de aplicaciones] que le permite compartirla con clientes, socios o proveedores.
Al observar hacia dónde se dirigen la integración de datos y la minería, ¿cuál es la hoja de ruta de Talend para los próximos uno a tres años?
Tuchen: En este momento estamos duplicando y triplicando en la nube. Nuestro negocio en la nube está explotando. Está creciendo más del 100% al año. Lo que estamos viendo es que todo el panorama de TI se está moviendo a la nube. En particular en el análisis de datos, almacenes de datos, en los últimos años hemos llegado al punto de inflexión. Ahora estamos en el punto en que los almacenes de datos en la nube son significativamente mejores que cualquier cosa que se pueda obtener en las instalaciones: son de mayor rendimiento, más flexibles, más escalables, es posible conectar el aprendizaje automático y flujos en tiempo real para ellos, no existe un compromiso inicial, siempre están actualizados. Llegamos al punto en que los beneficios son tan dramáticos que todas las empresas del mundo se han mudado o planean mudarse y hacer la mayor parte de su procesamiento analítico en la nube. Eso crea una enorme oportunidad para nosotros, y una en la que estamos enfocados de manera maníaca. Estamos poniendo un enorme esfuerzo en mantener y ampliar nuestro liderazgo en la integración y el gobierno de datos basados en la nube.