La IA en la gestión de operaciones alivia la presión sobre los equipos de TI
La IA, cuando se combina con las operaciones de TI y los equipos de DevOps, forma AIOps que pueden mejorar en gran medida la forma en que se desarrollan, producen y administran los activos de TI.
Así como surgen herramientas para que TI administre mejor sus operaciones, también lo hacen las herramientas y técnicas que ayudan a los desarrolladores a administrar el proceso de obtener aplicaciones de inteligencia artificial (IA) desde el desarrollo hasta la producción y la implementación.
A finales de la década de 2000, surgieron herramientas de DevOps que proporcionaban aspectos de las operaciones de TI combinados con actividades orientadas al desarrollador para permitir una iteración más rápida en las actividades de desarrollo, mejorar la calidad del código y ofrecer pruebas de código más consistentes. De la misma manera que las organizaciones modernas han llegado a depender de ITOps para mantener sus organizaciones de TI funcionando sin problemas, los talleres de desarrollo también han llegado a depender de DevOps para hacer lo mismo. Sin embargo, la IA planea revolucionar aún más ambos aspectos críticos de las operaciones relevantes de TI con la creación de las operaciones de IA (AIOps).
IA para ITOps: AIOps
Las organizaciones de TI consisten en una amplia gama de servicios, tecnologías y procedimientos. Además de mantener los sistemas funcionando sin problemas, ITOps también planea cambios continuos, se ocupa de las amenazas internas y externas a la seguridad y actualiza los sistemas a medida que se encuentran disponibles opciones más poderosas. Hacer todo esto sin causar interrupciones innecesarias es un desafío importante para muchas organizaciones de TI.
El personal de TI y los responsables de la toma de decisiones están abrumados por las demandas laborales. A medida que aumenta el trabajo, la capacidad de adelantarse a los problemas se vuelve más difícil, por lo que los problemas a corto plazo ocupan un lugar central. Como resultado, el equipo de TI no puede planificar lo suficiente con anticipación o actualizar a sistemas que podrían reducir o eliminar esos problemas.
Ha comenzado a surgir un lote de opciones de AIOps para abordar estos desafíos. AIOps puede ayudar a automatizar y mejorar ITOps mediante el uso de una variedad de algoritmos de aprendizaje automático. Desde chatbots que pueden proporcionar soporte de primera línea a usuarios que buscan ayuda de TI hasta análisis potentes, los AIOps basados en aprendizaje automático pueden reducir la carga de los departamentos de TI.
AIOps y sus casos de uso
AIOps se basa en macrodatos recopilados en toda la organización y de varios dispositivos de TI para detectar y reaccionar automáticamente ante problemas en tiempo real y proporcionar análisis profundos. AIOps puede abordar una amplia gama de funciones de ITOps, incluida la supervisión de la disponibilidad y el rendimiento, la correlación y el análisis de eventos, y la gestión y automatización de los servicios de TI.
Específicamente, AIOps puede recopilar una amplia gama de datos de fuentes dispares, incluidos archivos de registro, alertas, métricas de rendimiento, paneles y bases de datos, entre otras fuentes. Puede correlacionar estos datos e identificar patrones o anomalías que deben evaluarse más a fondo o proporcionar análisis predictivos para ayudar a identificar posibles errores o fallas en los sistemas.
Junto con la flexibilidad necesaria para encontrar y solucionar problemas más rápido, AIOps también puede proporcionar a los equipos de TI conocimientos predictivos para evitar que sucedan los problemas. Los casos de uso prácticos de la tecnología AIOps incluyen la planificación de la capacidad, la domesticación de la expansión de la nube y el modelo de degradación del servicio, la capacidad de gestión, la capacidad de diseño y la resolución de desafíos de rendimiento.
Estos sistemas habilitados para IA ayudan con el monitoreo proactivo al vigilar una amplia gama de métricas para monitorear la infraestructura de red, el flujo de tráfico, la congestión y los posibles problemas de seguridad. Y estas herramientas de supervisión más inteligentes también se pueden utilizar para la planificación de la capacidad mediante la implementación del aprendizaje automático (machine learning) para obtener información sobre los patrones de uso generales.
Estos sistemas AIOps pueden proporcionar un valor adicional al extraer el análisis de la causa raíz de las fallas. Los sistemas de inteligencia artificial más avanzados pueden incluso ayudar a las redes a recuperarse mediante el ajuste automático del enrutamiento, el escalado de las capacidades del servidor y la infraestructura hacia arriba o hacia abajo según sea necesario, y haciendo frente a los cambios de forma autónoma.
DevOps y aprendizaje automático: MLOps
De la misma manera que AIOps está impulsando ITOps a un nuevo nivel, la IA está impactando significativamente a DevOps. El aprendizaje automático está mejorando las capacidades de DevOps existentes, además de introducir nuevos flujos para administrar los ciclos de vida del aprendizaje automático.
Las herramientas de aprendizaje automático ayudan a detectar e identificar automáticamente posibles errores y problemas de integración antes de la integración general del código. Las herramientas de DevOps habilitadas por IA también están optimizando los procesos basados en Agile al ayudar a informar cómo deben organizarse los sprints ágiles y al brindar información analítica adicional a los gerentes de proyectos y programas.
El lado más grande e impactante de esta tecnología es el uso de prácticas de DevOps para administrar el ciclo de vida del aprendizaje automático. Según un informe reciente de la firma de investigación Cognilytica, los enfoques DevOps existentes para el aprendizaje automático son un desafío porque los modelos de aprendizaje automático difieren del desarrollo de aplicaciones tradicionales. Los modelos de aprendizaje automático se basan principalmente en datos, lo que hace que la gestión del ciclo de vida del modelo se centre más en la gestión del ciclo de vida de los datos que en la gestión del desarrollo y la implementación del código. Simplemente construir un modelo y ponerlo en funcionamiento no es suficiente para garantizar que el modelo funcione.
Del mismo modo, incluso un modelo que utiliza los mejores datos de entrenamiento tendrá un rendimiento deficiente en un entorno donde los datos del mundo real no coinciden con la forma en que se entrenó el modelo. Como tal, el área emergente de operaciones de aprendizaje automático (MLOps) se centra en las necesidades del ciclo de vida específicas del aprendizaje automático.
Casos de uso y enfoque de MLOps
Las herramientas de MLOps se centran en cinco cosas principales:
- gestionar los datos de formación y los datos de apoyo necesarios para crear de forma eficaz modelos de aprendizaje automático;
- manejar las múltiples iteraciones y versiones de los modelos de aprendizaje automático a medida que se ponen en funcionamiento;
- seguimiento y gestión de modelos a medida que se utilizan en el entorno del mundo real;
- abordar una amplia gama de requisitos de acceso y gobernanza de modelos; y
- el manejo de la seguridad del modelo debe proteger tanto los modelos de aprendizaje automático como sus datos de entrenamiento contra la manipulación.
Estos sistemas MLOps brindan soporte adicional para el control de versiones y la iteración de modelos al poner en producción diferentes versiones de modelos. También están diseñados para admitir múltiples versiones de modelos concurrentes, informar a los usuarios del modelo sobre los cambios de versión, aumentar la visibilidad en el historial de versiones del modelo y retirar modelos que ya no brindan valor o ya no se utilizan.
Las herramientas de MLOps ayudan a monitorear y administrar los modelos existentes para vigilar constantemente el rendimiento del modelo, identificando cómo los modelos ya no coinciden con los datos del mundo real o cómo los datos del mundo real difieren de los datos utilizados para el entrenamiento. Estas herramientas pueden incluso ayudar a proporcionar la procedencia de los datos que pueden rastrear cómo los datos específicos utilizados en la capacitación se corresponden con el mundo real.
Las herramientas avanzadas de MLOps incluso proporcionan un registro o catálogo de modelos donde los usuarios de modelos pueden identificar modelos potenciales para su uso en diferentes escenarios. El lote emergente de herramientas MLOps también proporciona un modelo de gobernanza, vigilando los crecientes requisitos de auditoría, cumplimiento, gobernanza y control de acceso.
Las herramientas de MLOps pueden proporcionar medios para el control de acceso al modelo, visibilidad de varias medidas de transparencia del modelo, ayudar a hacer cumplir la capacitación del modelo y los canales de reentrenamiento, y varias necesidades regulatorias o de cumplimiento para el uso del modelo. Las herramientas MLOps también brindan cada vez más funciones para ayudar a proteger los modelos y sus datos dependientes al prevenir ataques a los modelos y datos y brindar visibilidad de las vulnerabilidades generales del modelo.
Si bien el universo "Ops" parece abarrotado y cada vez más diverso, está claro que tanto las ITOps tradicionales como las DevOps, así como las nuevas herramientas y prácticas AIOps y MLOps, tienen un gran impacto en las formas en que se desarrollan, producen y administran los activos de TI. El futuro de las operaciones es, sin duda, más automatizado, más inteligente y más resistente que nunca.