Introducción
Actualmente los discos duros de las máquinas primarias de MySQL
y MongoDB
son respaldados cada 10 minutos. Para este procedimiento se realizan snapshots del disco duro completo en la plataforma de Google Cloud.
Intervalo de tiempo disponible para recuperación
Se mantienen simultáneamente las últimas 12 copias de seguridad realizadas a cada disco duro cada 10 minutos, teniendo posibilidad de recuperación respecto a las últimas 2 horas.
Además de lo anterior, se mantiene un snapshot por hora durante las últimas 12 horas previas a las copias cada 10 minutos y finalmente se mantiene una copia diaria los últimos 7 días previos a las copias por hora.
Lo anterior suma un total de 31 copias de seguridad simultáneas para cada base de datos, permitiendo levantar el servicio ante fallas catastróficas a puntos que van desde los últimos 10 minutos de ocurrida la falla hasta los últimos 7 días de operación.
Tabla resumen:
Intervalo | Cantidad | Cobertura | Tipo |
10 minutos | 12 | 2 horas | Disco Completo |
1 hora | 12 | 12 horas | Disco Completo |
1 día | 7 | 7 días | Disco Completo |
Asegurando la operación de los respaldos
La instrucción de copias de seguridad es ejecutada por una máquina automatizada en la nube dedicada a este propósito, distinta a las máquinas utilizadas para Adereso, de tal manera que siempre se encuentre operando.
Levantando la infraestructura ante fallas catastróficas
Gracias a que Adereso opera en la nube, el tiempo que toma recuperar la plataforma utilizando las copias de seguridad puede ser sumamente breve puesto que se crea una nueva máquina nueva utilizando una copia de disco completo que ya se encuentra preparado para iniciar el servicio.
En caso de un problema en alguna de las bases de datos, el equipo de desarrollo determinará el punto en el tiempo en el cual los datos se encuentran sin corrupción y utilizará esa copia para recrear toda la infraestructura.
Por norma general la recuperación puede tomar menos de 30 minutos ante un buen pronóstico.
Informando sobre fallas
Una falla de este tipo será notificada en nuestro sitio de Estado de Servicio, donde se especificará el tiempo estimado de solución y se dará a conocer el estado de avance de la solución en tiempo real.