Project tardigrade защищает ваш VMS от ошибок хоста

Оглавление:

Видео: The Highs and Lows of Tardigrade Pregnancy 2024

Видео: The Highs and Lows of Tardigrade Pregnancy 2024
Anonim

После нескольких изменений Azure и улучшений безопасности за последние пару месяцев Microsoft представляет Project Tardigrade как новейшую попытку повысить надежность Azure.

Project Tardigrade предотвращает сбои платформы

Project Tardigrade - это новый сервис, направленный на повышение устойчивости Azure. Он включает в себя стратегии смягчения, защищающие виртуальные машины Azure от сбоев платформы.

Вот как Марк Руссинович, технический директор Microsoft Azure, описывает текущую работу над Azure:

Наша цель - предоставить организациям возможность надежно выполнять свои рабочие нагрузки на Azure. Исходя из этого в качестве нашего руководящего принципа, мы постоянно инвестируем средства в развитие платформы Azure, чтобы стать отказоустойчивой, не только для повышения производительности бизнеса, но и для обеспечения бесперебойного обслуживания клиентов.

Чтобы предотвратить воздействие на ваши рабочие нагрузки, служба позволяет компонентам самостоятельно восстанавливаться и быстро восстанавливаться после потенциальных сбоев даже при критических сбоях хоста.

Как работает проект Tardigrade?

Вот пример того, как работает рабочий процесс восстановления Tardigrade:

  • Этап 1. Этот этап не влияет на работу клиентских виртуальных машин. Он просто перезапускает все службы, работающие на хосте. В редких случаях, когда сбойная служба не перезапускается успешно, мы переходим к этапу 2.
  • Этап 2. Наша служба диагностики запускается на хосте для систематического сбора всех соответствующих журналов / дампов, чтобы гарантировать, что мы сможем тщательно диагностировать причину сбоя на этапе 1. Этот всесторонний анализ позволяет нам «устранить причину» проблемы и тем самым предотвратить повторные появления в будущем.
  • Этап 3. На высоком уровне мы переводим ОС в исправное состояние с минимальным воздействием на клиента, чтобы уменьшить проблему с хостом. На этом этапе мы сохраняем состояния каждой виртуальной машины в ОЗУ, после чего начинаем переустанавливать ОС в исправном состоянии. Хотя ОС быстро перезагружается, запущенные приложения на всех виртуальных машинах, размещенных на сервере, ненадолго «зависают», поскольку ЦП временно приостановлен. Это похоже на временную потерю сетевого подключения, но оно быстро восстанавливается из-за логики повторов. После успешного сброса ОС виртуальные машины потребляют свое сохраненное состояние и возобновляют нормальную работу, что позволяет обойти любые возможные перезагрузки виртуальных машин.

Учитывая это, Project Tardigrade гарантирует, что отказ любого отдельного компонента на хосте не повлияет на всю систему. Таким образом, клиентские виртуальные машины не будут затронуты сбоями хоста.

Microsoft усердно работает над улучшением и расширением различных сценариев отказа хоста, чтобы их платформа облачных вычислений была более надежной, чем когда-либо.

Ожидайте новые разработки и другие реализации надежности в ближайшем будущем.

Project tardigrade защищает ваш VMS от ошибок хоста