your123 - stock.adobe.com

Microsoft destapa impulso a IA para Power BI y el nuevo Fabric para datos

El gigante tecnológico presentó una herramienta que infundirá IA generativa en su principal plataforma de análisis, así como una nueva suite SaaS que combina las herramientas de datos y analítica de Microsoft.

Microsoft reveló hoy que Power BI recibirá una infusión de IA generativa. Además, el fabricante dio a conocer una serie de nuevas características de IA para su suite Azure de gestión de datos y herramientas de análisis. Se incluye Microsoft Fabric, una plataforma SaaS –actualmente en vista previa– que reúne Power BI, Data Factory y Azure Synapse Analytics.

El gigante tecnológico presentó Copilot en 2021, una función de IA diseñada para ayudar a los usuarios en su trabajo. La primera herramienta Copilot se creó para usuarios conjuntos de Microsoft y GitHub. Desde entonces, Microsoft ha lanzado Microsoft 365 Copilot y Microsoft Security Copilot, entre otras herramientas.

Ahora, es el turno de Power BI para integrar Copilot, que desde su lanzamiento inicial se ha enriquecido con IA generativa y grandes modelos de lenguaje (LLM) a través de la estrecha relación de Microsoft con OpenAI, desarrollador de LLM que incluyen ChatGPT y GPT-4.

Copilot en Power BI, ahora en vista previa, así como Microsoft Fabric y más de dos docenas de otras capacidades de gestión y análisis de datos fueron presentados durante Microsoft Build, una conferencia híbrida presencial y virtual para desarrolladores que utilizan la plataforma de Microsoft.

IA y Power BI

El procesamiento del lenguaje natural (PLN) lleva mucho tiempo prometiendo que permitirá a las organizaciones ampliar su uso de la analítica más allá de un pequeño grupo de científicos y analistas de datos formados. Sin embargo, aún no ha llegado a alcanzar ese potencial.

Aunque simplificaba la interacción con los datos al permitir a los usuarios modelarlos y explorarlos utilizando lenguaje natural en lugar de código, la tecnología seguía exigiendo que los usuarios tuvieran conocimientos básicos de datos y formularan sus consultas y comandos en un formato preciso.

Su principal limitación era la falta de vocabulario. Y el resultado fue que, a pesar de permitir a los usuarios empresariales interactuar más fácilmente con los datos, el PNL no amplió sustancialmente el número de usuarios dentro de las organizaciones, que ha permanecido estancado en torno a una cuarta parte durante más de una década.

Sin embargo, los LLM disponen de vocabularios mucho más amplios. Como resultado, cuando se combinan con herramientas analíticas, tienen el potencial de eliminar, o al menos reducir, los conocimientos de datos necesarios para utilizar las plataformas analíticas y generalizar su uso.

En los seis meses transcurridos desde que OpenAI lanzó ChatGPT –que supuso un salto en las capacidades de IA generativa y LLM–, Tableau, ThoughtSpot y Sisense se encuentran entre los proveedores de análisis que han desvelado planes para infundir IA generativa en sus plataformas.

Power BI se convierte en la más reciente plataforma de análisis que incorpora IA generativa desde el lanzamiento de ChatGPT, aunque todas las capacidades que combinan análisis e IA generativa, independientemente del proveedor de análisis, se encuentran en fase de vista previa y aún no están disponibles de forma general.

Independientemente de la fecha de lanzamiento de Copilot en Power BI y de las herramientas de IA generativa de otros proveedores, serán importantes para los consumidores de análisis, afirmó Doug Henschen, analista de Constellation Research.

"Es muy emocionante pensar en el potencial del lenguaje natural para convertirse en la nueva interfaz entre humanos y computadoras", dijo. "El potencial para ampliar las capacidades analíticas y de BI a un público realmente amplio es palpable".

Una vez que esté disponible de forma general, Copilot en Power BI permitirá a los clientes utilizar el lenguaje conversacional para hacer preguntas sobre sus datos, crear informes, generar y editar cálculos de Expresión de Análisis de Datos (DAX) y crear resúmenes narrativos.

Henschen advirtió, sin embargo, que el público de la analítica no se ampliará inmediatamente tras la disponibilidad general de Copilot en Power BI y las capacidades de IA generativa de otros proveedores.

Las organizaciones tendrán que implantar nuevas medidas de seguridad y gobernanza para garantizar que sus datos sean utilizados de forma segura por este aluvión de nuevos usuarios.

Además, señaló que, si bien la presentación de Microsoft de Copilot en Power BI se produce después de que algunos otros proveedores ya dieran a conocer integraciones con herramientas de IA generativa, Power BI no es un seguidor en la incorporación de LLM.

En 2021, Microsoft introdujo una función que utiliza GPT-3 para convertir el lenguaje natural a DAX, un lenguaje de codificación que desarrolló para permitir interacciones con datos. Sin embargo, al igual que Copilot en Power BI y las herramientas de IA generativa de otros proveedores, la función de conversión de lenguaje natural a DAX permanece en vista previa dos años después de su introducción.

"Yo diría que [Copilot en Power BI] no es más que el último desarrollo de LLM relacionado con Power BI", afirma Henschen. "Microsoft ha sido el pionero en llevar la IA generativa a la analítica y el BI".

Mientras que Power BI, Tableau y ThoughtSpot se encuentran entre las plataformas que integran la IA generativa, las preocupaciones sobre seguridad y precisión llevaron al veterano proveedor SAS a retrasar dicha integración.

SAS reveló recientemente sus planes de invertir 1.000 millones de dólares en IA en los próximos tres años, pero la IA generativa no forma parte de ellos.

ChatGPT ha sufrido recientemente una filtración de datos, lo que ha generado preocupación sobre si los datos de una organización podrían estar en peligro en caso de que se volviera a producir una filtración de este tipo. ChatGPT no siempre es preciso, y si una empresa tomara una decisión basándose en datos erróneos, podría resultar perjudicial.

Por eso, con Reggie Townsend, vicepresidente de ética de datos de SAS, como parte del Comité Asesor Nacional de Inteligencia Artificial del Departamento de Comercio de Estados Unidos, que colabora con la administración del presidente Joe Biden, SAS está tomando un acercamiento cauteloso a la IA generativa.

Sin embargo, los proveedores que están procediendo a integrar herramientas analíticas e IA generativa citan las capacidades de gobernanza de datos de sus plataformas para garantizar tanto la seguridad como la exactitud de los datos.

Microsoft no es diferente. El fabricante utiliza plug-ins para conectar sus Copilots con otros sistemas, y esos plug-ins están gobernados por humanos, según Frank Shaw, director de comunicaciones de Microsoft.

"Hemos puesto intencionadamente a los humanos en el centro de nuestro diseño de IA, y nuestros Copilots no crean contenido sin que un humano introduzca primero los datos que guían la respuesta de la IA", dijo el 18 de mayo durante una rueda de prensa.

Además de Copilot en Power BI, Microsoft presentó Power BI Direct Lake y Power BI Desktop Developer Mode. Ambos están en fase de vista previa.

Power BI Direct Lake es un modo de almacenamiento con conjuntos de datos de Power BI que eliminará la necesidad de que los usuarios repliquen los datos para desbloquearlos dentro de los lagos de datos. Power BI Desktop Developer Mode utiliza una integración Git para permitir a los desarrolladores crear conjuntos de datos y reportes.

El nuevo Fabric, y más

Además de la actualización de Power BI, Microsoft presentó Microsoft Fabric en vista previa, junto con una serie de nuevas capacidades de IA en Azure, la plataforma de computación en nube pública del gigante tecnológico.

Microsoft presenta Fabric como una plataforma analítica completa que aúna ingeniería de datos, integración de datos, almacenamiento de datos, ciencia de datos, análisis en tiempo real e inteligencia de negocios.

El gigante tecnológico señaló que muchas organizaciones reúnen su pila analítica incorporando capacidades de BI de un proveedor, herramientas de IA y aprendizaje automático de otro, y herramientas de ingestión e integración de datos de otro.

Incluso las empresas que utilizan únicamente Microsoft para sus operaciones de gestión de datos y análisis combinan diferentes herramientas. El resultado son sistemas complejos y costos elevados.

Fabric es el intento de Microsoft de cambiar este enfoque proporcionando a los usuarios una respuesta a todas sus necesidades analíticas en una plataforma SaaS que reduce la complejidad y ayuda a gestionar los costos. Una vez disponible, Fabric combinará siete cargas de trabajo analíticas básicas de Microsoft, como Power BI, Data Factory, Synapse Data Engineering, Synapse Data Science, Synapse Data Warehousing, Synapse Real-Time Analytics y Data Activator.

Además, la plataforma se incorporará en todo con Azure OpenAI Service, proporcionando capacidades Copilot que permiten a los clientes utilizar el lenguaje natural para gestionar secuencias de datos, construir modelos de IA y ML, y analizar datos.

"El mundo actual está inundado de datos, que fluyen constantemente desde los dispositivos que utilizamos, las aplicaciones que construimos y las interacciones que tenemos", dijo Shaw. "Ahora, a medida que entramos en una nueva era definida por la IA, estos datos se vuelven aún más importantes".

Para que las organizaciones obtengan valor de los datos, necesitan datos limpios gestionados por un sistema de análisis integrado, continuó. Microsoft dijo que diseñó Fabric para ser ese sistema integrado. Como resultado, Fabric podría ser el nuevo sistema de datos más importante que Microsoft presenta esta semana, según Henschen.

"[Es] la perspectiva de tener una única plataforma para datos con interfaces específicas, impulsadas por Azure OpenAI –incluyendo Power BI– para muchos tipos de usuarios", dijo.

Además de Fabric, entre las más de 20 nuevas funciones de gestión y análisis de datos de Azure se encuentran las siguientes:

  • Actualizaciones de Azure OpenAI Service en vista previa diseñadas para permitir mejor a las organizaciones añadir sus propios datos a su despliegue y simplificar la integración de fuentes externas.
  • Azure AI Content Safety, un servicio disponible en forma general que ayuda a las empresas a crear comunidades en línea más seguras con modelos diseñados para detectar el odio, la autolesión y el contenido sexual y violento tanto en imágenes como en texto.
  • Un panel de control de IA responsable en vista previa en Azure Machine Learning, diseñado para ayudar a los usuarios a evaluar grandes modelos construidos con datos no estructurados para que puedan identificar problemas de equidad de errores de modelos y explicaciones de modelos antes de que se desplieguen los modelos.
  • Monitoreo de modelos en vista previa para que los usuarios puedan realizar un seguimiento del desempeño de los modelos, recibir alertas oportunas y analizar problemas.
  • Actualizaciones de Azure Cosmos DB destinadas a aumentar la productividad de los desarrolladores y optimizar costos.
  • Y actualizaciones de Azure SQL Database para permitir a los usuarios crear y escalar rápidamente múltiples aplicaciones.

"El hilo conductor de todo esto es la inteligencia artificial", dijo Shaw, señalando que Microsoft amplió su asociación con OpenAI en enero (según los informes, Microsoft está invirtiendo un total de 10 mil millones de dólares en OpenAI) después de invertir inicialmente en el proveedor de IA generativa en 2019.

De cara al futuro

La introducción de Microsoft Fabric reconoce que las organizaciones utilizan más de un proveedor para sus necesidades de gestión y análisis de datos.

Sin embargo, en lugar de intentar permitir que los usuarios de Power BI construyan pilas que incluyan herramientas de otros proveedores sin problemas, Fabric solo reúne Power BI con las herramientas de gestión de datos y ciencia de datos de Microsoft.

Henschen, por tanto, dijo que Microsoft debería tratar de facilitar a los usuarios de Power BI la creación de su propio ecosistema para la gestión y el análisis de datos.

La mayoría de las organizaciones almacenan datos en más de una nube, y cada nube tiene sus relativos puntos fuertes y débiles.

"El anuncio de Microsoft Fabric reconoce que las empresas tienen datos en otros lugares además de Azure, incluyendo nubes rivales", dijo Henschen. "Mi deseo para Microsoft Power BI es que obtenga un acceso más amplio a los datos que solo los de Azure. Fabric parece una vía para ese acceso, dado que está integrado con Power BI".

Otra podría ser Direct Lake, continuó. Pero con la característica aún en vista previa, aún no está claro qué tipo de conectividad tendrá más allá del entorno de Microsoft.

"Me gustaría saber si Direct Lake u otras nuevas capacidades traerán acceso a datos de diferentes lagos directamente a Power BI", dijo Henschen.

Eric Avidon es redactor jefe de TechTarget Editorial y periodista con más de 25 años de experiencia. Cubre temas de análisis y gestión de datos.

Investigue más sobre Inteligencia artificial y automatización