Mitigue los riesgos de fallas de servicios en la nube

Las fallas de servicio en la nube pueden afectar las capacidades, los servicios y el portafolio del negocio. Aprenda a minimizar los riesgos de falla.

Aunque los servicios en la nube en general y en particular los Amazon Web Services (AWS) están creciendo a tasas sin precedentes, las fallas periódicas de servicio continúan perturbando las operaciones de los usuarios y planteando cuestionamientos sobre la mejor manera de mitigar los riesgos creados por las fallas.

Siempre he sido un gran defensor de los servicios en la nube desde antes de que la modalidad "a la carta" se convirtiera en una alternativa popular. A pesar de toda la publicidad que se les da a las fallas, los principales proveedores de servicios de nube de hoy (CSPs) aún ofrecen mayor disponibilidad y rendimiento que la mayoría de los centros de datos corporativos líderes en su clase –y eso es sin tomar en cuenta los ahorros y agilidad sin precedentes que los servicios de nube proporcionan contra los costosos centros de datos de mano de capacidades intensivas gestionados por la mayoría de las empresas grandes.

Sin embargo, parece que todos los veranos AWS sufre una interrupción del servicio que es lo suficientemente grave como para atraer la atención la prensa y generar una nueva ronda de debate sobre si los servicios en la nube están realmente listos para apoyar los procesos de negocio de misión crítica.

En agosto pasado, por ejemplo, AWS experimentó un apagón de una hora en su centro de datos del Este de EE.UU., en el norte de Virginia. El incidente creó elevadas tasas de error API en la zona y ofreció una "experiencia degradada" como resultado de un "pequeño número de instancias de EC2 [que fueron] inalcanzables debido a la pérdida de paquetes en una sola zona de disponibilidad", de acuerdo con AWS.

Aunque AWS consideró esto como un evento aislado, fue poco consuelo para las empresas impactadas por la disrupción del servicio, incluyendo a Vine, Instagram, IFTTT, Flipboard y Airbnb.

Irónicamente, AWS experimentó otros 25 minutos deinterrupción de servicio aproximadamente al mismo tiempo que no tuvo un impacto generalizado para sus clientes, pero impidió que los clientes accedieran al sitio web de Amazon.com en los EE.UU. y Canadá.

En el mundo on-demand de hoy, la lealtad del cliente es un concepto en declive. De la misma manera que las personas tienen poca tolerancia para un restaurante o una tienda que no cumpla con sus expectativas, los clientes son igualmente intolerantes a los CSPs que sufren problemáticas de disponibilidad del servicio y desempeño, lo que puede afectar negativamente los negocios de sus clientes. El costo de tiempo de inactividad puede ser medido en dólares reales, pero la confianza perdida y la reputación empañada pueden ser más costosas. Puede ser particularmente perjudicial sobre todo cuando llama la atención de las publicaciones más importantes, como BusinessWeek y The Wall Street Journal.

Como líder del mercado de nube, AWS se lleva su tajada de atención y críticas cuando los servicios fallan. Pero Google, Microsoft y otros CSPs tienen muchas probabilidades de interrupciones del servicio.

Mitigar los riesgos de fallas de servicio en la nube es engañosamente difícil debido a que los actuales servicios en la nube son particularmente atractivos debido a la percepción de su ahorro y a la facilidad de implementación. La continua guerra de precios en el segmento de mercado de nube de la infraestructura como servicio (IaaS) es impulsado por AWS, con Google haciendo todo lo posible para seguirle el paso. Mientras que la adquisición de servicios en la nube de AWS desde una perspectiva de costo es una obviedad, averiguar cómo configurar AWS adecuadamente para satisfacer sus necesidades de negocio y minimizar el tiempo de inactividad potencial requiere más conocimientos y experiencia de lo que la mayoría de empresas poseen o pueden permitirse.

A menos que su organización planee ser un gran cliente de AWS, usted puede esperar soporte al cliente limitado para ayudarle a planificar e implementar administrar sus recursos de AWS. En lugar de ello, AWS es capaz de promover los precios de los productos básicos, manteniendo sus servicios de soporte al mínimo. Por lo tanto, usted tiene que contratar o capacitar internamente a expertos de su personal, o recurrir a una empresa de consultoría de terceros con las habilidades y experiencia para ayudarle a montar una combinación correcta en la oferta de AWS.

Y montar la combinación correcta de ofertas con una variedad de soluciones de gestión de terceros en la nube es fundamental para salvaguardar contra posibles interrupciones del servicio. Requiere de los tipos adecuados de instancias en la nube, ubicaciones, equilibrio de carga, seguimiento, medición y manipulación para ajustar continuamente sus recursos de AWS para soportar sus necesidades. También requiere redundancia de servicio y servicios de respaldo para responder a cualquier problema que surja.

Por otra parte, tiene sentido aumentar su apuesta en la nube. En primer lugar, adquiera servicios en la nube de forma incremental para que pueda probar su fiabilidad y capacidad de recuperación antes de hacer una "gran apuesta" para soportar sus operaciones de negocio en curso. En segundo lugar, no descarte completamente sus operaciones de TI internas en caso de tener que utilizarlas como una solución de copia de seguridad cuando falle un servicio en la nube.

Recuerde, usted obtiene lo que paga. La compra de servicios baratos en la nube inevitablemente le costará. Así pues, asegúrese de que entiende completamente los riesgos y examine a profundidad el precio total de un enfoque más fiable para adquisición de servicios en la nube.

Investigue más sobre Computación en la nube