OLAP o procesamiento analítico en línea
El procesamiento analítico en línea (online analytical processing, OLAP) es un método informático que permite a los usuarios extraer y consultar datos de manera fácil y selectiva para analizarlos desde diferentes puntos de vista. Las consultas de inteligencia empresarial OLAP a menudo ayudan en el análisis de tendencias, informes financieros, previsión de ventas, presupuestos y otros propósitos de planificación.
Por ejemplo, un usuario puede solicitar que se analicen los datos para mostrar una hoja de cálculo que muestre todos los productos de pelota de playa de una empresa vendidos en Florida en el mes de julio, comparar las cifras de ingresos con las de los mismos productos en septiembre y luego ver una comparación de otras ventas de productos en Florida en el mismo período de tiempo.
Cómo funcionan los sistemas OLAP
Para facilitar este tipo de análisis, los datos se recopilan de múltiples fuentes de datos y se almacenan en almacenes de datos, luego se limpian y organizan en cubos de datos. Cada cubo OLAP contiene datos categorizados por dimensiones (como clientes, región geográfica de ventas y período de tiempo) derivados de tablas dimensionales en los almacenes de datos. Luego, las dimensiones se completan con miembros (como nombres de clientes, países y meses) que están organizados jerárquicamente. Los cubos OLAP a menudo se resumen previamente en todas las dimensiones para mejorar drásticamente el tiempo de consulta en las bases de datos relacionales.
Luego, los analistas pueden realizar cinco tipos de operaciones analíticas OLAP contra estas bases de datos multidimensionales:
- Enrollar (roll-up). También conocida como consolidación o desglose, esta operación resume los datos a lo largo de la dimensión.
- Profundizar (drill-down). Esto permite a los analistas navegar más profundamente entre las dimensiones de los datos, por ejemplo, profundizando desde "período de tiempo" a "años" y "meses" para trazar el crecimiento de las ventas de un producto.
- Cortar (slice). Esto permite que un analista tome un nivel de información para mostrar, como, por ejemplo, "ventas en 2017".
- Cubo o dado (dice). Esto permite que un analista seleccione datos de múltiples dimensiones para analizar, como, por ejemplo, "ventas de pelotas de playa azules en Iowa en 2017".
- Pivotar (pivot). Los analistas pueden obtener una nueva vista de los datos girando los ejes de datos del cubo.
El software OLAP luego localiza la intersección de dimensiones, como todos los productos vendidos en la región oriental por encima de un precio determinado durante un período de tiempo determinado, y los muestra. El resultado es la "medida"; cada cubo OLAP tiene al menos una o quizás cientos de medidas, que se derivan de la información almacenada en tablas de hechos en el almacén de datos.
Tipos de sistemas OLAP
Los sistemas OLAP (procesamiento analítico en línea) generalmente se dividen en uno de tres tipos:
OLAP multidimensional (MOLAP) es OLAP que indexa directamente en una base de datos multidimensional.
OLAP relacional (ROLAP) es OLAP que realiza un análisis multidimensional dinámico de datos almacenados en una base de datos relacional.
OLAP híbrido (HOLAP) es una combinación de ROLAP y MOLAP. HOLAP fue desarrollado para combinar la mayor capacidad de datos de ROLAP con la capacidad de procesamiento superior de MOLAP.
OLTP vs. OLAP
Esta tabla muestra las diferencias entre el procesamiento analítico en línea (OLAP) y el procesamiento de transacciones en línea (OLTP).
OLTP |
OLAP |
Maneja datos operacionales recientes |
Maneja todos los datos históricos |
El tamaño es menor, generalmente entre los 100 Mb a los 10 Gb |
El tamaño es mayor, generalmente de 1 Tb a 100 Pb |
El objetivo es realizar las operaciones diarias |
El objetivo es tomar decisiones a partir de grandes fuentes de datos |
Usa consultas simples |
Usa consultas complejas |
Mayores velocidades de procesamiento |
Menores velocidades de procesamiento |
Requiere operaciones de lectura/escritura |
Solo requiere operaciones de lectura |
Usos de OLAP
OLAP se puede utilizar para la minería de datos o el descubrimiento de relaciones previamente desconocidas entre elementos de datos. Una base de datos OLAP no necesita ser tan grande como un almacén de datos, ya que no todos los datos transaccionales son necesarios para el análisis de tendencias. Con Open Database Connectivity (ODBC), los datos se pueden importar desde bases de datos relacionales existentes para crear una base de datos multidimensional para OLAP.
Los productos OLAP incluyen IBM Cognos, Oracle OLAP y Oracle Essbase. Las funciones OLAP también se incluyen en herramientas como Microsoft Excel y Analysis Services de Microsoft SQL Server. Los productos OLAP generalmente están diseñados para entornos de múltiples usuarios, y el costo del software se basa en la cantidad de usuarios.