alexskopje - stock.adobe.com
7 pasos que revisar en infraestructura de TI para el regreso a la oficina
Cuando los empleados regresen a la oficina, asegúrese de que su HCI pueda manejar los cambios. Siga estos pasos para verificar el hardware y el almacenamiento del sistema, así como para asegurar el software y el firmware.
Los empleados están regresando gradualmente a la oficina para trabajar, incluso si es solo de manera limitada. A medida que las organizaciones se preparan para el día en que la vida eventualmente vuelva a la normalidad, es importante que los profesionales de TI consideren cómo la transición podría afectar su infraestructura de TI y qué pueden hacer para prepararse, incluso mientras continúa la pandemia de COVID-19.
¿Sabe qué impacto tendrá este regreso a la oficina en sus sistemas informáticos? Una forma de averiguarlo y estar mejor preparado es seguir los pasos descritos en esta lista de verificación de la infraestructura hiperconvergente para el regreso al trabajo pandémico.
En respuesta a la pandemia de coronavirus, algunos departamentos de TI cerraron o redujeron en gran medida la carga de trabajo de sus sistemas hiperconvergentes debido a la falta de uso y para conservar recursos. Mientras tanto, muchos otros incorporaron nuevos sistemas hiperconvergentes o redirigieron los nodos hiperconvergentes existentes para aguantar el peso de soportar los nuevos requisitos de trabajo desde casa de este año. Trajeron nuevos sistemas hiperconvergentes para, por ejemplo, servir como el soporte principal del centro de datos para infraestructuras de escritorio virtual muy ampliadas o recientemente implementadas.
Para la infraestructura hiperconvergente (HCI) que ejecuta cargas de trabajo de misión crítica, el impacto en el rendimiento puede ser insignificante, suponiendo que esos sistemas continúen funcionando a su capacidad normal mientras los empleados trabajan de forma remota. Sin embargo, estos sistemas hiperconvergentes pueden haber sufrido negligencia debido a que tienen un mínimo de personal de TI en el sitio para mantenerlos durante un período prolongado. Otras plataformas de HCI, como las que se utilizan en sucursales o entornos de pruebas/DevOps, pueden no haber sido utilizadas durante varios meses.
Independientemente de la situación, es importante evaluar el estado de su infraestructura hiperconvergente y realizar una serie de tareas de mantenimiento preventivo en preparación para el regreso de los empleados a las oficinas. Esto es lo que debe hacer.
Paso 1. Compruebe si hay errores de hardware
Lo primero que debe hacer, especialmente si no se ha utilizado un sistema hiperconvergente durante un tiempo, es realizar una verificación del estado del hardware. Asegúrese de que el sistema no genere ninguna alerta relacionada con fallas de hardware o inminentes fallas de hardware.
Paso 2. Verifique el estado del almacenamiento
Como parte de la evaluación del estado del hardware de una plataforma HCI, verifique que el almacenamiento del sistema funcione correctamente. Específicamente, debe buscar cosas como matrices RAID que ya hayan sufrido una falla de disco o conjuntos espejo que no estén sincronizados.
Paso 3. Verifique la utilización del almacenamiento
También es importante verificar el almacenamiento de su infraestructura hiperconvergente como parte de su lista de verificación para el regreso a la oficina. Hacerlo ayudará a garantizar que ninguno de sus volúmenes se esté quedando sin espacio. Asegúrese de verificar los volúmenes del sistema y los volúmenes dedicados a aplicaciones, datos o máquinas virtuales.
Además, al verificar la utilización del almacenamiento, si no ha tenido la oportunidad de monitorear la utilización del almacenamiento por un tiempo, sería una buena idea verificar que la tasa de consumo de almacenamiento aún esté en línea con sus estimaciones de planificación de capacidad prepandémica.
Un sistema hiperconvergente que ha tenido poco uso durante unos meses o más probablemente mostrará una tasa de consumo de almacenamiento muy por debajo de la estimación inicial. Sin embargo, para algunos sistemas, el hecho de que casi todo se haga en línea ahora (en lugar de hacerlo en persona) podría resultar en un consumo de almacenamiento mucho mayor. En cualquier caso, averigüe qué tan rápido se consume su almacenamiento disponible.
Paso 4. Gestión de parches
Otra tarea clave en la inspección de HCI es verificar si sus nodos hiperconvergentes tienen instalados los parches adecuados. Obviamente, esto se refiere a los parches del sistema operativo, pero hay algunas otras cosas que verificar. Por ejemplo, asegúrese de que sus nodos HCI tengan instalados los controladores de hardware más recientes. Si su proveedor de HCI ha lanzado nuevas actualizaciones de firmware, aplíquelas también (tanto para hardware de computación como de almacenamiento).
Paso 5. Actualizaciones de software
Evaluar el estado de una plataforma de hiperconvergencia también significa confirmar que ha instalado las últimas versiones de cualquier software de gestión o de salud que se ejecute en la plataforma. Esto incluye cosas como software de monitoreo nativo, agentes de monitoreo, software antivirus, agentes de respaldo y cualquier software de seguridad que ejecute en los nodos de HCI.
Paso 6. Realice una auditoría de seguridad
Tómese el tiempo para evaluar la seguridad de la plataforma. Analice los registros de eventos para buscar elementos como creaciones de cuentas, intentos de inicio de sesión (especialmente en cuentas con privilegios) o cambios de configuración no autorizados.
Paso 7. Realice una prueba de esfuerzo
Si una plataforma de infraestructura hiperconvergente ha estado inactiva (o apagada) durante mucho tiempo, sería una buena idea realizar una prueba de esfuerzo de hardware solo para asegurarse de que el hardware esté listo para volver al servicio activo. Una prueba de esfuerzo implica el uso de una herramienta (hay innumerables opciones gratuitas disponibles) para someter su hardware hiperconvergente a una carga pesada. Al hacerlo, se validará que el hardware funcione como se espera. Si bien es raro que los componentes principales fallen como resultado de la inactividad, los ventiladores, por ejemplo, a veces dejan de funcionar. Como tal, es una buena idea monitorear los servidores durante la prueba de esfuerzo para asegurarse de que no se sobrecalienten.