Большинство компаний предлагает интересные отказоустойчивые решения, а именно кластеры довольно высокой готовности (high-availability cluster). Также есть возможность географического разнесения серверов, чтобы достигать высокой надежности, так называемые катастрофические кластеры. Подобные системы имеют простую архитектуру, и они ориентированы на поддержку разного рода сервисов.
Есть два типа работы кластера: “активный/активный” и “активный/пассивный”.
В первой конфигурации “активный/пассивный” один сервер на себе несет всю нагрузку по выдаче сервисов, а другой (пассивный) сервер находится в постоянном режиме ожидания. Между серверами связь осуществляется посредством использования специального сервиса Manager of Cluster Synchronization (MCS). По данному сервису каждые сервер производит обмен служебной информацией и производит определение работоспособности всех прочих узлов в кластере.
Тогда, когда нормальная работа всего сервиса прерывается отказом сетевого интерфейса, диска, самого приложения, оперативной памяти и т. д., но сервер все-таки работает, то выполнение сервиса на протяжении пары секунд будет “переведено” на какой-то иной кластерный сервис. Под данным поводом понимается такая последовательность действий:
- останавливается приложение (если оно было активно) на сервере, на котором случился отказ;
- происходит размонтирование общих томов дисковых на “активном” и монтаж на “пассивном” сервере;
- производится перенос сетевого имени и IP-адреса на рабочий со сбойного сервера и производится запуск приложений на нем с такими же данными и настройками.
Если происходит так, что состояние сервера “активного” не дает возможности выполнять первые пункты, то все ресурсы и сервисы сразу начинают предоставляться пассивным сервером кластера. Тот, который сбойнул, отключается в принудительно порядке, а системному администратору приходит сообщение и код неисправности. Процесс перевода всех ресурсов на исправный сервер с неисправного называется failover.
Отказ от применения схемы построения кластера, у которого будет общий дисковый внешний массив, обуславливается достижением искомой цели – уменьшением стоимости системы при полном сохранении ее надежности. Также можно построить кластер с распределением нагрузки в конфигурации под названием “активный/активный”.