Analítica predictiva o análisis predictivo
El análisis predictivo es una forma de análisis avanzado que utiliza datos nuevos e históricos para pronosticar la actividad, el comportamiento y las tendencias. Implica aplicar técnicas de análisis estadístico, consultas analíticas y algoritmos de aprendizaje automático automatizados a conjuntos de datos para crear modelos predictivos que otorguen un valor numérico —o puntuación— a la probabilidad de que ocurra un evento en particular.
Las aplicaciones de software de análisis predictivo utilizan variables que se pueden medir y analizar para predecir el comportamiento probable de las personas, la maquinaria u otras entidades. La analítica predictiva se puede utilizar para una variedad de casos de uso. Por ejemplo, es probable que una compañía de seguros tenga en cuenta las posibles variables de seguridad en la conducción, como la edad, el sexo, la ubicación, el tipo de vehículo y el historial de conducción, al fijar los precios y emitir pólizas de seguro de automóvil.
Se combinan múltiples variables en un modelo predictivo capaz de evaluar probabilidades futuras con un nivel aceptable de confiabilidad. El software se basa en gran medida en algoritmos y metodologías avanzados, como modelos de regresión logística, análisis de series de tiempo y árboles de decisión.
La analítica predictiva ha crecido junto con la aparición de sistemas de big data. A medida que las empresas han acumulado conjuntos de datos cada vez más grandes en clústeres de Hadoop y otras plataformas de big data, han creado mayores oportunidades de minería de datos para obtener información predictiva. El mayor desarrollo y comercialización de herramientas de aprendizaje automático por parte de los proveedores de TI también ha ayudado a expandir las capacidades de análisis predictivo.
Las compañías de marketing, servicios financieros y seguros han adoptado notablemente el análisis predictivo, al igual que los grandes motores de búsqueda y los proveedores de servicios en línea. El análisis predictivo también se usa comúnmente en industrias como la atención médica, el comercio minorista y la fabricación.
Las aplicaciones comerciales para el análisis predictivo incluyen la orientación de anuncios en línea, el análisis del comportamiento del cliente para determinar patrones de compra, la identificación de transacciones financieras potencialmente fraudulentas, la identificación de pacientes en riesgo de desarrollar afecciones médicas particulares y la detección de fallas inminentes de piezas en equipos industriales antes de que ocurran.
El proceso y las técnicas de análisis predictivo
El análisis predictivo requiere un alto nivel de experiencia con métodos estadísticos y la capacidad de crear modelos de datos predictivos. Como resultado, normalmente está en el dominio de científicos de datos, estadísticos y otros analistas de datos capacitados. Cuentan con el apoyo de ingenieros de datos, que ayudan a recopilar datos relevantes y prepararlos para el análisis, y de desarrolladores de software y analistas comerciales, que ayudan con la visualización de datos, paneles e informes.
Los científicos de datos utilizan modelos predictivos para buscar correlaciones entre diferentes elementos de datos en los datos del flujo de clics del sitio web, los registros de salud de los pacientes y otros tipos de conjuntos de datos. Una vez que se ha realizado la recopilación de datos, se formula, capacita y modifica un modelo estadístico según sea necesario para producir resultados precisos. Luego, el modelo se ejecuta contra los datos seleccionados para generar predicciones. En algunas aplicaciones se analizan conjuntos de datos completos, pero en otras, los equipos de análisis utilizan el muestreo de datos para agilizar el proceso. El modelado de datos se valida o revisa a medida que se dispone de información adicional.
El proceso de análisis predictivo comienza por comprender el negocio y preparar los datos. Luego, se crea, evalúa y despliega un modelo estadístico para manejar los datos y derivar predicciones.
El proceso de análisis predictivo no siempre es lineal, y las correlaciones a menudo se presentan donde los científicos de datos no miran. Por esa razón, algunas empresas están ocupando puestos de científicos de datos mediante la contratación de personas con formación académica en física y otras disciplinas científicas. De acuerdo con el método científico, estos trabajadores se sienten cómodos yendo donde los datos los llevan. Incluso si las empresas siguen el camino más convencional de contratar científicos de datos capacitados en matemáticas, estadística e informática, tener una mente abierta sobre la exploración de datos es un atributo clave para un análisis predictivo efectivo.
Una vez que el modelado predictivo produce resultados procesables, el equipo de análisis puede compartirlos con los ejecutivos comerciales, generalmente con la ayuda de paneles e informes que presentan la información y destacan las oportunidades comerciales futuras en función de los hallazgos. Los modelos funcionales también pueden integrarse en aplicaciones operativas y productos de datos para proporcionar capacidades de análisis en tiempo real, como un motor de recomendación en un sitio web minorista en línea que dirige a los clientes a productos particulares en función de su actividad de navegación y opciones de compra.
Más allá del modelado de datos, otras técnicas utilizadas por los científicos de datos y los expertos que participan en el análisis predictivo pueden incluir:
- software de análisis de texto para extraer contenido basado en texto, como documentos de Microsoft Word, correos electrónicos y publicaciones en redes sociales;
- modelos de clasificación que organizan los datos en categorías preestablecidas para facilitar su búsqueda y recuperación; y
- redes neuronales profundas, que pueden emular el aprendizaje humano y automatizar el análisis predictivo.
Aplicaciones de la analítica predictiva
El marketing online es un área en la que la analítica predictiva ha tenido un impacto comercial significativo. Los minoristas, los proveedores de servicios de marketing y otras organizaciones utilizan herramientas de análisis predictivo para identificar tendencias en el historial de navegación de un visitante del sitio web para personalizar los anuncios. Los minoristas también utilizan el análisis de clientes para tomar decisiones más informadas sobre qué tipos de productos debe almacenar el minorista.
El mantenimiento predictivo también está emergiendo como una aplicación valiosa para los fabricantes que buscan monitorear una pieza de equipo en busca de señales de que puede estar a punto de romperse. A medida que se desarrolla internet de las cosas (IoT), los fabricantes están conectando sensores a la maquinaria en el piso de la fábrica y a los productos mecatrónicos, como los automóviles. Los datos de los sensores se utilizan para pronosticar cuándo se deben realizar trabajos de mantenimiento y reparación para evitar problemas.
IoT también permite usos de análisis predictivos similares para monitorear oleoductos y gasoductos, plataformas de perforación, granjas de molinos de viento y varias otras instalaciones industriales de IoT. Los pronósticos meteorológicos localizados para agricultores basados en parte en datos recopilados de estaciones de datos meteorológicos equipados con sensores instalados en campos agrícolas es otra aplicación de modelado predictivo impulsada por IoT.
Herramientas analíticas
Se utiliza una amplia gama de herramientas en el modelado y análisis predictivo. IBM, Microsoft, SAS Institute y muchos otros proveedores de software ofrecen herramientas de análisis predictivo y tecnologías relacionadas que admiten el aprendizaje automático y las aplicaciones de aprendizaje profundo.
Además, el software de código abierto juega un papel importante en el mercado de análisis predictivo. El lenguaje de análisis de código abierto R se usa comúnmente en aplicaciones de análisis predictivo, al igual que los lenguajes de programación Python y Scala. También están disponibles varias plataformas de aprendizaje automático y análisis predictivo de código abierto, incluida una biblioteca de algoritmos integrados en el motor de procesamiento Spark.
Los equipos de análisis pueden usar las ediciones base de código abierto de R y otros lenguajes de análisis o pagar por las versiones comerciales ofrecidas por proveedores como Microsoft. Las herramientas comerciales pueden ser costosas, pero vienen con soporte técnico del proveedor, mientras que los usuarios de versiones de código abierto puro deben solucionar los problemas por su cuenta o buscar ayuda a través de los sitios de soporte de la comunidad de código abierto.