Backup
Резервное копирование
- Территориальный вынос бэкапа (пожар, форс-мажор)
- Инкрементальное накопление изменений (защита от незамеченной вовремя логической ошибки в ПО, которая может привести к искажению данных)
- Несколько уровней отката.
- Несколько уровней детализации и полноты бэкапа.
- Безопасность и конфиденциальность бэкапа (бэкап с важными данными должен быть зашифрован).
- Экономия дискового пространства за счет сжатия бэкапа.
- Легкость восстановления без необходимости доп. ПО, кроме архива бэкапа (открытый формат архива)
- Автономность, автоматическая работа без участия оператора
- Гибкость формирования бэкапа (маски файлов/директорий для помещения в бэкап и исключения из него)
Схема и планирование бэкапа
На критичные к времени простоя или содержащие ценные данные сервера, ставим RAID. Обязательно, hi-end SCSI диски, хороший SCSI RAID контроллер (сейчас используем LSI Logic SCSI 320-2 MegaRAID, RAID5 + hot-spare). Не стоит экономить при выборе контроллера, лучше без RAID, чем чувство ложной безопасности). Наличие BBU (аккумулятор для сохранения содержимого кеша в течении нескольких суток) крайне желательно, иначе при пропадании питания вероятен серьезный сбой (ОС считает что данные записались, а реально нет). Крайне рекомендуется иметь запасной hot-spare диск для автоматической горячей замены. Восстановление после сбоя производится автоматически (время простоя нулевое).
Дополнительно, даже если уже используется RAID, следует добавить на сервер SATA диск большого размера и еженощно зеркалировать туда всю информацию, желательно с сохранением изменений с момента прошлого зеркалирования, с сохранением 7-30 таких итераций. Рекомендуется, использовать двойное зеркало, каждое из которых обновляется через день. Подобная перестраховка необходима для предотвращения потери данных в ситуации краха во время бэкапа и защиты от синхронизации в бэкап не фатальных повреждений ФС ведущих к пропаданию файлов (сбой, fsck, случайное удаление) или их обнулению (следствие переполнения раздела). Для восстановления необходимо загрузить систему с бэкап диска (несколько минут)
Ежедневное инкрементальное резервное копирование уникальных для данного хоста данных и файлов конфигурации на территориально удаленный бэкап сервер (например, используя fsbackup, кредо данного проекта - ничего лишнего, все предельно просто и предельно надежно). Для восстановления следует установить операционную систему и восстановить конфигурацию и данные из бэкапа (простой - несколько часов). При организации сервера резервного копирования возможно два подхода - инициирование резервирования со стороны сервера бэкапа и инициирование со стороны хоста бэкапа которого мы выполняем (запуск ПО для бэкапа на стороне клиента), используя сервер бэкапа только как хранилище. Первый вариант имеет существенный недостаток - получив доступ к серверу бэкапа злоумышленник автоматически получает полный доступ ко всем резервируемым хостам. Во втором случае, при взломе клиента, злоумышленник сможет воздействовать только на директорию с бэкапом взломанного хоста. Поэтому для защиты бэкапа, можно организовать дополнительное, вторичное, резервное копирование директорий пользователей на стороне сервера бэкапа (самое простое копировать новые файлы на второй диск, скрытый для внешнего доступа).
Обязательным звеном бэкапа является проведение эксперимента по восстановлению системы. В ходе такого эксперимента всплывают не помещенные в бэкап важные файлы, отсутствие сведений о конфигурации системы (например, параметры дисковых разделов). Кроме того, благодаря четкому представлению шагов и уверенности в действиях, увеличивается скорость восстановления после реального сбоя, уменьшается вероятность человеческой ошибки.
Дополнительные системы отказоустойчивости
- разбалансировка на несколько серверов (самое простое - балансировка по DNS) или БД,
- использование RAID,
- системы бесперебойного питания,
- резервные сетевые линки,
- промежуточное оборудование повышенной надежности (маршрутизаторы, коммутаторы),
- размещение в спец. помещении (неприкосновенность оборудование, вентиляция, фильтрование пыли, а лучше герметичность и кондиционирование, температурный режим, защита от пожара и протечки систем водоснабжения).