Fotolia

Monitoreo, principio básico para la disponibilidad de un centro de datos

El monitoreo puede ser fundamental para lograr la continuidad operativa de su centro de datos, ya que le permite prevenir fallas y mejorar las operaciones.

Hoy en día, la continuidad operativa de cualquier negocio es fundamental. La evolución constante hace que los centros de datos se encuentren en incesante movimiento para lograr cumplir con los requisitos de una operación eficiente y sin interrupciones. La realidad absoluta del costo que representa la “caída” de los sistemas de información, en la mayoría de los casos, es desconocida, e incluso incalculable. Sin embargo, es común que existan fallas y desastres que se presentan en diversos momentos y, a menudo, cuando no hay gente operativa en el sitio.

De acuerdo con estadísticas del Instituto Ponemon, la mayoría de las “caídas” de los centros de datos son ocasionadas por fallas en UPS, hackers, errores humanos, problemas en el aire acondicionado y sistemas climáticos, fallas en la planta de emergencia y fallas en los equipos de TI. Lo anterior muestra que la infraestructura es el principal punto débil, al igual que la parte humana –por desconocimiento, falta de capacitación, falta de tiempo o falta de herramientas adecuadas–, lo cual genera incertidumbre en la continuidad de un negocio. En muchos casos, el desconocimiento de los costos totales que representa la falta de continuidad lleva a invertir en nueva infraestructura, e impide invertir en estrategias y soluciones de prevención.

De acuerdo con la empresa de monitoreo ambiental y eléctrico de centros de datos TKmE Cloud, una de las principales inversiones que los centros de datos seguirán realizando será en herramientas de gestión de infraestructura del centro de datos (DCIM) para mejorar la parte de gestión y eficiencia, optimizar los recursos físicos, disminuir los impactos en los procesos del negocio y mantener los estándares de los acuerdos de nivel de servicio (SLA). "La elección correcta de una solución de este tipo y su implementación pueden ser un proceso tortuoso e inoperante. Este tipo de soluciones, que son complejas, requieren mantenerse actualizadas con un grupo de gente que las opera bajo ciertos lineamientos, y quienes deben estar permanentemente capacitados", comentan.

A falta de DCIM, una herramienta de monitoreo

Aunque no todas las empresas puedan contar con un DCIM en el corto o mediano plazo, es necesario para la continuidad operativa. Una investigación de mercado, desarrollada en 2016 por TKmE Cloud, encontró que más del 67 % de las empresas encuestadas no son proactivas ante eventualidades de TI, más del 70 % han tenido alguna falla y no cuentan con monitoreo de infraestructura, o no saben utilizarlo.

Una opción para las organizaciones es el uso de soluciones menos complejas y de costo accesible que resuelven gran parte de la problemática: monitorear, contar con información valiosa para tomar mejores decisiones de planificación, y aplicar la proactividad en el día a día. Recordemos que, para mejorar, es necesario medir.

Desde TKmE Cloud señalan la importancia de “vender” la herramienta o servicio de monitoreo internamente. "La pregunta básica será el retorno de la inversión (ROI), por lo que, mientras más se conozca la afectación económica y operativa que genera, y los beneficios que proporciona la herramienta de monitoreo elegida, será mucho más sencillo obtener los recursos para adquirirla. Adicionalmente, es muy útil si la herramientas incorpora reportes y análisis de información", afirman.

Entre las consideraciones generales mínimas que se debe medir están:

  • la temperatura (salida de aire, retorno de aire, servidores, equipos críticos), la humedad (el “cáncer de los equipos”),
  • el derrame de líquidos, la apertura de puertas,
  • la corriente y voltaje (CFE, entrada y salida de UPS, planta de emergencia, PDU) y
  • la planta de emergencia (nivel de diesel).

Todo esto debe poder verse en una sola pantalla, y se debe emitir alertas y notificaciones si algún umbral se sale de su parámetro establecido.

Monitoreo y procedimientos, dupla ganadora

Al seleccionar las herramientas o servicios de monitoreo, TKmE Cloud aconseja evaluar "que brinde visibilidad sobre el estado del centro de datos; que minimice la interrupción del servicio; que disminuya el tiempo de identificación de fallas; que opere 24x7 en línea; que reduzca el costo de operación del centro de datos; que vigile el consumo y estado de la parte energética; que sea escalable; y que proporcione información oportuna (gráficas y tendencias) para la toma de decisiones administrativas y operativas. Por supuesto, ninguna herramienta es suficiente si no se cuenta con los debidos procedimientos internos para resolver las situaciones que se presentan con la información obtenida".

El monitoreo de la infraestructura es una realidad que hay que adoptar para ser eficientes y  proactivos, sin importar el tamaño del centro de datos, ni el tamaño de la organización. "La prevención se debe adoptar como una cultura dentro de cualquier organización, y en todas y cada una de sus áreas y niveles. Las empresas seguirán invirtiendo en este mundo vertiginoso de la tecnología, pero les conviene considerar el monitoreo como parte fundamental de su inversión", concluyen.  

Investigue más sobre Gestión de centros de datos