Disfrazado de fallas por redundancia
En un sistema distribuido una falla puede afectar la operación de algunos componentes y otros no verse afectados.
En un sistema no distribuido, una falla afecta todos los componentes.
Un objetivo importante en el diseño de Sistemas Distribuidos es construirlos de manera que puedan recuperarse de fallas parciales sin que se afecte.
Siempre que ocurra una falla, el Sistema Distribuido debe continuar operando de modo aceptable mientras se soluciona, es decir, tolerar las fallas.
Un objetivo importante en el diseño de Sistemas Distribuidos es construirlos de manera que puedan recuperarse de fallas parciales sin que se afecte.
Siempre que ocurra una falla, el Sistema Distribuido debe continuar operando de modo aceptable mientras se soluciona, es decir, tolerar las fallas.
CONCEPTOS BÁSICOS
Ser tolerante a fallas está fuertemente relacionado a los sistemas fiables, y ello involucra lo siguiente:
- DISPONIBILIDAD
Propiedad por la cual, una sistema está listo para ser utilizado inmediatamente.
Probabilidad de que un sistema esté operando correctamente en cualquier momento dado y disponible a realizar sus funciones.
- CONFIABILIDAD
Propiedad por la cual, una sistema es capaz de funcionar de manera continua sin fallar.
A diferencia de la Disponibilidad, esta se define en función de un intervalo de tiempo en lugar de un instante de tiempo.
Este lapso de tiempo es relativamente largo.
- SEGURIDAD
Situación en la que no sucede nada catastrófico cuando un sistema deja de funcionar por algún tiempo.
- MANTENIMIENTO
Se refiere a cuan fácil pude ser reparado un sistema que fallo.
Un sistema altamente mantenible también puede ser altamente disponible, en especial si las fallas pueden ser detectadas y reparadas automáticamente.
Dicha recuperación automática es difícil de realizar.
LOS FALLOS
Un sistema falla cuando deja de proporcionar sus funcionalidades a sus usuarios.
Un error es una parte del estado del sistema que puede conducir a que dicha funcionalidad deje de proporcionarse.
La causa de un error se llama falla.
Indagar la causa de un error es importante para la solución.
CLASIFICACIÓN DE FALLOS
Existen 03 tipos de fallas:
- Transitorias
Falla una vez y luego funciona correctamente.
Si la operación se repite la falla desaparece.
- Intermitentes
La falla ocurre, luego desaparece por sí sola, después reaparece, y así sucesivamente.
- Permanentes
Una vez falla el elemento, ya no se recupera.
La falla continua existiendo hasta que el componente defectuoso es reemplazado.
Comentarios
Publicar un comentario