El objetivo general es maximizar el tiempo disponible de los sistemas en línea, y en una sola frase, tolerantes a fallas.
En otras épocas había tiempo para podernos recuperar de un evento en el cual estuviéramos sin el sistema de información por un período prolongado, la velocidad de los negocios lo permitía. Hoy no hay espacio para estos lujos, por lo que la tecnología brinda hoy elementos de alta disponibilidad en sus componentes. Es responsabilidad de las personas encargadas de la plataforma tecnológica garantizar que estos elementos se cumplen.
El objetivo general es maximizar el tiempo disponible de los sistemas en línea, y en una sola frase, tolerantes a fallas. Restricciones fuera del ambiente de TI hace que este reto sea casi imposible de cumplir. Estas restricciones incluyen limitaciones de presupuesto, fallas en los componentes, código de software mal escrito, error humano, diseños erróneos, desastres naturales, y hasta cambios imprevisibles en los negocios como las compras, adquisiciones, fusiones, y hasta cambios políticos. Estos son los factores que trabajan en contra del ideal de 100% de disponibilidad.
Hay que determinar qué se entiende como alta disponibilidad, la cual cambia para cada empresa. Si es un negocio que solo está abierto al público de 8 de la mañana a 6 de la tarde, y en este horario puede cumplir con todo el procesamiento de la información, la disponibilidad durante este período se considera 100%. Por el contrario, una tienda web que debe estar disponible las 24 horas del día, 7 días a la semana, tendrá que disponer de los sistemas de información durante el mismo período para alcanzar el 100% de disponibilidad.
Hay varias estrategias que se pueden utilizar para maximizar la disponibilidad sin quebrar económicamente a la empresa.
Redundancia
Los fabricantes han estado diseñando redundancia en sus productos en forma de fuentes de poder redundantes, múltiples procesadores, memoria segmentada y discos redundantes. Esto también se puede referir a sistemas de servidores corriendo en modo de alerta en caliente en otra ubicación. Se puede también configurar de la misma manera los controladores de discos y de cintas con rutas paralelas, repartiendo la carga de la red en dos líneas y proporcionando consolas alternas de control. En pocas palabras, eliminando lo más que se pueda, cualquier punto único de falla que pueda interrumpir la disponibilidad del servicio.
Reputación
La reputación de los proveedores clave como servidores, almacenamiento, bases de datos y equipos de redes juegan un papel principal en la búsqueda de la alta disponibilidad. Hay varias maneras para verificar la reputación como porcentaje de participación en el mercado, comportamiento histórico en clientes, y reportes de analistas de industria.
Confiabilidad
La confiabilidad de los equipos y de los programas también se puede verificar por referencias de clientes y analistas de industria. Además se recomienda establecer un monitoreo permanente a través de la gente de operaciones, soporte y técnicos del proveedor, además de comparar con otros departamentos de TI. Aunque pudiera parecer que la información de los técnicos del proveedor podría estar sesgada, en mi experiencia conozco de la seriedad y franqueza de los técnicos que son consientes que al conocer esta información, mi plan de continuidad tiene mayor probabilidad de operar.
Facilidad de Reparación
Este factor califica la facilidad relativa con la cual los responsables del servicio técnico pueden arreglar la falla. Dos métricas comunes para medir esto es cuanto se demora en hacer el trabajo de reparación, y cad cuanto se debe repetir. En sistemas mas sofisticados, se pueden establecer centros de diagnóstico remoto que permite detectar fallas, y montar medidas que la eviten.
Restablecimiento
Se refiere a la habilidad para sobreponerse a una falla momentánea, de tal manera que no haya impacto en la disponibilidad para el usuario final. Puede ser tan pequeño como una pequeña porción de la memoria recuperándose de un error insignificante, o algo tan grande como un sistema de servidores que decida invernar sin razón alguna, sin perdida de información transaccional. El restablecimiento también incluye repetidos ensayos de escritura y/o lectura a un disco o a una cinta, al igual que la retransmisión a través de líneas de redes.
Robustez
Esta última característica de alta disponibilidad describe el diseño general del proceso de disponibilidad. Un proceso robusto resistirá una variedad de ataques, tanto internos como externos, que podrían fácilmente interrumpir y dañar la disponibilidad en un ambiente más débil. Robustez implica un alto nivel de documentación y entrenamiento para absorber cambios técnicos a las plataformas, productos, servicios y clientes; cambios de personal cuando hay rotación y expansión, y cambios en los negocios cuando hay nuevos objetivos, adquisiciones, y fusiones.
El entendimiento de estas características ayudará a mantener un alto nivel de disponibilidad de su infraestructura.
Consultoría
Consultoría especializada para construir el PETI para el cliente, buscando estrategias para avanzar hacia la empresa digital, y transferir la metodología a sus funcionarios.
Taller/Workshop - En Vivo
Taller/Workshop de 16 horas impartido en vivo, de manera virtual por el creador de la metodología. Altamente práctico para avanzar en la construcción de SU PETI durante el taller.
Taller/Workshop - Autoestudio
Taller/Workshop en formato de autoestudio. 37 lecciones en video con plantillas e instructivos para construir su PETI mientras cursa el Taller. Impartido por el creador de la metodología.
Libro
Este libro recoge la metodología que hemos desarrollado y aplicado por más de 25 años. Una guía completa para realizar su PETI.