J3qx

information archive

Итоги тестирования DRP 1S

Posted by j3qx на Январь 29, 2017

Итоги тестирования DRP

Коллеги, 25 марта 2015 года, мы провели тестирования плана DRP. Тестирования сценария физической потери кластера в случае, например, пожара, цифры в таблице ниже.

Название на SSD card на резервной полке
Проведение документов 68 секунд 495 секунд
Снижение скорости выполнения типовых задач пользователями. Субъективное мнение в 10 раз
Скорость восстановления базы около 20 минут около 100 минут
Скорость снятия diff копий около 3 минут около 15 минут
Скорость снятия full backup 40 минут более 480 минут
Копирование резервной копии с бекап сервера Около 40 минут Около 40 минут

Комментарии

По той обратной связи, что мы получили, работа в 1С была крайне затруднена, падение производительности самими сотрудниками оценивалась в 10 раз. Так же мы наблюдали значительный рост очередей обмена данными, задержки при формировании отчетов и т.п. Фактически высказывалось мнение, что работать в обще невозможно и многие просто в этот день не работали с программой

Во время переключения было выявлено, что мы не можем гарантировать снятие резервных копий с резервного сервера в разумные сроки.

Так же тестирование показало, что одной из самых длинных операций, является операция переноса данных с бекап сервера на сервера СУБД это около 40 минут. С учетом планов роста до 2.5 Тб, это время увеличится до 100-120 минут.

Выводы

На данный момент основное и резервное оборудование стоит внутри одной площадки, что в случае пожара не оставляет нам шанс в разумные сроки восстановится, так же мы сможем откатится к данным за прошедшую пятницу, то есть в неблагоприятном сценарии мы теряем почти неделю работы

Для оптимизации скорости работы бекапа в том числе перемещения между серверами, имеет смысл использовать внутри площадки полку с FC, подключенную сразу к кластеру и резервному серверу, что минимизирует затраты времени на бекап в рамках одной площадки

Во время тестирования был выявлен баг с невозможностью восстановления промежуточных копий из интерфейса Microsoft SQL management studio, восстановление через TSQL прошло удачно. Данный баг исправлен только в следующей версии SQL 2014, в SP2 и CU это не исправлено. Поэтому необходимо приступить к тестированию корректности работы 1С с MS SQL 2014.

Есть понимание, что в Балтике, организация резервной площадки на текущих мощностях для 1С невозможно, из-за размера базы

Рекомендации

Оценить стоимость реализации риска потери всей площадки – пожар, действия силовых структур и т.п., после этого принимать решения, на сколько и в каком объеме нам нужна вторая резервная площадка

Оценить, на сколько удовлетворила скорость операций во время учений, достаточно ли нам ее в критичной ситуации или нужно больше, с учетом что при реализации риска, такая скорость работы будет несколько дней/недель пока не появится новое оборудование

В случае принятие решения по резервной площадки, оценить вероятность перехода на АХ до конца года, так как от этого зависит какой размер базы мы должны будем восстанавливать и как следствия выбор технических решений

Рекомендовал бы настроить на постоянной основе репликацию данных бекапа уровня daily, diff, trn на вторую площадку (акадо или центральный офис). Но тут надо принять решение, какая площадка будет резервной, в зависимости от этого может потребоваться докупка оборудования

До момента принятия решения, вынести разработку 1С за пределы Даталайна, чтобы в случае реализации риска, у нас был сервер приложения и небольшое количество лицензий на другой площадке.

Если будет решение по организации резервной площадки в Москве, то я бы рекомендовал объединить требования к системе хранения со стороны прода 1С и со стороны разработки 1С, с учетом плановых значений по росту и остановится на системе хранения с SSD кэшами.

Реклама

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

 
%d такие блоггеры, как: