Сочинение на тему Отказоустойчивость при заходе на посадку

Опубликовано: 31.07.2020
Предмет: жизнь
Темы: Толерантность, эмоция

Сегодня требуется высоконадежная виртуальная сетка, в которой вы можете совместно использовать любой ресурс из любого кластера даже в случае сбоя в системе. Грид-вычисления нацелены на крупномасштабные системы, которые даже выходят за пределы организационной структуры и представляют собой парадигму распределенных вычислений, которая отличается от традиционных распределенных вычислений. Проблемы надежности возникают из-за ненадежного характера сетевой инфраструктуры в дополнение к проблемам управления и планирования этих приложений. Отказ может произойти из-за сбоя соединения, сбоя ресурса или по любой другой причине, которая должна допускаться для бесперебойной и точной работы системы без прерывания текущей работы. Многие методы используются соответственно для обнаружения и устранения этих неисправностей. Соответствующий детектор ошибок может избежать потери, которая происходит в системе из-за сбоя системы, а надежная техника отказоустойчивости может спасти от отказа системы. Для достижения надежности, доступности и качества обслуживания отказоустойчивость является важным свойством. Используемый здесь механизм отказоустойчивости устанавливает контрольные точки задания на основе частоты отказов ресурса. В случае сбоя ресурса задание перезапускается из своего последнего успешного состояния с использованием файла контрольных точек из другого ресурса сетки. Выбор оптимальных интервалов контрольной точки приложения важен для минимизации времени выполнения приложения при наличии системных сбоев. Алгоритм перепланирования на основе индекса сбоев перепланирует задание из отказавшего ресурса в какой-либо другой доступный ресурс с наименьшим значением индекса сбоя и выполняет задание с недавно сохраненной контрольной точки в случае сбоя ресурса. Это обеспечивает выполнение задания в установленные сроки с повышенной пропускной способностью и помогает повысить надежность сетевой среды.

Грид-вычисления – это термин, относящийся к объединению ресурсов компьютера из нескольких административных доменов для достижения общей цели. Сетка может рассматриваться как распределенная система с неинтерактивными рабочими нагрузками, которые содержат большое количество файлов. Это чаще, чем одна сетка будет использоваться для различных целей, хотя сетка может быть выделена для специализированного приложения. Сетки часто создаются с помощью библиотек программного обеспечения общего назначения, известных как промежуточное программное обеспечение. Совместное использование, выбор и объединение широкого спектра географически распределенных ресурсов, включая суперкомпьютеры, системы хранения, источники данных и специализированные устройства, принадлежащие различным организациям, обеспечиваются сеткой. Управление этими ресурсами является важной инфраструктурой в вычислительной среде.

Для достижения многообещающих потенциалов вычислительных сеток отказоустойчивость является фундаментально важной, поскольку ресурсы географически распределены для достижения многообещающих потенциалов вычислительной сетки. Более того, вероятность сбоя ресурса намного выше, чем в традиционных параллельных вычислениях, и сбой ресурсов пагубно влияет на выполнение задания. Отказоустойчивость – это способность системы правильно выполнять свои функции даже при наличии неисправностей, что делает систему более надежной. Служба отказоустойчивости необходима для удовлетворения требований QoS в сеточных вычислениях и имеет дело с различными типами сбоев ресурсов, включая сбои процессов, сбои процессора и сбои сети.

Интервал контрольных точек или период контрольных точек состояния приложения является одним из важных параметров в системе контрольных точек, которая обеспечивает отказоустойчивость. Меньшие интервалы контрольных точек приводят к увеличению накладных расходов на выполнение приложений из-за контрольных точек, в то время как большие интервалы контрольных точек приводят к увеличению времени восстановления в случае сбоев. Следовательно, при наличии отказа должны быть определены оптимальные интервалы проверки-указания, которые приводят к минимальному времени выполнения приложения.

ПРОБЛЕМЫ:

1. Если происходит сбой в сеточном ресурсе, задание переносится на другой ресурс, что в конечном итоге приводит к неспособности выполнить требование QOS пользователя, то есть срок. Причина проста. Поскольку задание выполняется повторно, оно занимает больше времени.

2. Существуют ресурсы, которые соответствуют критерию ограничения по срокам, но они имеют тенденцию к сбоям в вычислительных средах на основе вычислений. В таком сценарии планировщик сетки выбирает тот же ресурс по той простой причине, что ресурс сетки обещает удовлетворить требования пользователей к заданиям сетки. В конечном итоге это приводит к компрометации параметров QOS пользователя для выполнения задания.

3. Несмотря на наличие ошибки в системе, выполнение задачи должно быть завершено в срок. Нет смысла в такой задаче, которая не завершается раньше срока. Следовательно, крайний срок в реальном времени является основной проблемой.

4. В реальном времени распределенная система обеспечивает доступность сквозных сервисов и способность испытывать сбои или систематические атаки, не влияя на клиентов или операции.

5. Речь идет о способности справляться с растущим объемом работы и о способности системы увеличивать общую пропускную способность при увеличении нагрузки при добавлении ресурсов.

СРЕДСТВА:

Адаптивный подход, основанный на отказоустойчивости проверки, используется для преодоления вышеупомянутых недостатков в таком сценарии. При таком подходе каждый ресурс содержит информацию об отказоустойчивости. Когда происходит сбой, ресурс обновляет информацию о возникновении сбоя. При принятии решения о распределении ресурсов для работы используется информация об отказоустойчивости. Контрольно-пропускной пункт является одним из самых популярных методов. Для обеспечения отказоустойчивости в ненадежных системах контрольные точки являются одним из самых популярных методов. Это запись снимка состояния всей системы, чтобы перезапустить приложение после возникновения какого-либо сбоя. Контрольная точка может храниться как во временном, так и в стабильном хранилище. Однако эффективность механизма сильно зависит от длины контрольного пункта. Частые контрольные точки увеличивают накладные расходы, в то время как ленивые контрольные точки могут привести к потере значительных вычислений. Следовательно, решение о размере интервала контрольных точек и метода контрольных точек является сложной задачей и должно основываться на знаниях о системе, а также о ее применении.

Восстановление контрольной точки зависит от MTTR системы. Обычно жесткий диск периодически сохраняет состояние приложения в стабильном хранилище. После сбоя приложение перезапускается с последней контрольной точки, а не запускается снова. Есть три стратегии контрольных точек. Это скоординированные контрольные точки, нескоординированные контрольные точки и контрольные точки, вызванные коммуникацией. 1. В согласованных контрольных точках процессы синхронизируют контрольные точки, чтобы гарантировать, что их сохраненные состояния согласуются друг с другом, так что общее объединенное, сохраненное состояние также является согласованным. 2. В несогласованных контрольных точках контрольные точки расписания процессов независимы в разное время и не учитывают сообщения. Контрольная точка, вызванная связью, пытается координировать только выбранные критические контрольные точки.

МЕХАНИЗМ ПРОВЕРКИ:

Ресурс сетки является членом сетки и предлагает вычислительные услуги пользователям сетки. Пользователи Grid регистрируются на GIS Information Server (GIS) в сети, указывая требования QoS, такие как крайний срок завершения выполнения, количество процессоров, тип операционной системы и так далее.

Компоненты, используемые в архитектуре, описаны ниже:

Scheduler-Schedulers является важной сущностью сетки. Он получает задания от пользователей сетки. Он выбирает возможные ресурсы для этих работ в соответствии с полученной информацией от ГИС. Затем он генерирует сопоставления между заданиями и ресурсами. Когда диспетчер расписания получает задание сетки от пользователя, он получает сведения о доступных ресурсах сетки из ГИС. Затем он передает список доступных ресурсов объектам в стратегии планирования MTTR. Сущность Matchmaker выполняет сопоставление ресурсов и рабочих требований. Объект оценки времени отклика оценивает время отклика для задания на каждом сопоставленном ресурсе на основе времени передачи, времени ожидания очереди и времени обслуживания задания. Селектор ресурсов выбирает ресурс с минимальным временем отклика. Диспетчер заданий отправляет задания по одному диспетчеру контрольных точек.

ГИС-ГИС содержит информацию обо всех доступных ресурсах сетки. Он поддерживает детали ресурсов, такие как скорость процессора, доступная память, нагрузка и т. Д. Все ресурсы сетки, которые присоединяются и покидают сетку, контролируются ГИС. Планировщик консультируется с ГИС для получения информации о доступных ресурсах сетки, когда у него есть задания для выполнения.

Диспетчер контрольных точек. Он получает запланированное задание от планировщика и устанавливает контрольную точку в зависимости от частоты отказов ресурса, на который оно запланировано. Затем он отправляет работу на ресурс. Менеджер контрольных точек получает сообщение о завершении задания или сообщение о сбое задания от ресурса сетки и отвечает на него соответствующим образом. Если во время выполнения происходит сбой задания, задание переносится с последней контрольной точки, а не запускается с нуля.

Состояние задания сервера контрольных точек сообщается серверу контрольных точек на каждой контрольной точке, установленной менеджером контрольных точек. Сервер Checkpoint сохраняет статус задания и возвращает его по требованию, т. Е. При сбое задания / ресурса. Для определенного задания сервер контрольных точек отбрасывает результат предыдущей контрольной точки при получении нового значения результата контрольной точки.

Диспетчер индекса отказов – поддерживает значение индекса отказов каждого ресурса, которое указывает частоту отказов ресурса. Индекс сбоя ресурса увеличивается каждый раз, когда ресурс не выполняет задание, назначенное ему в срок, а также при сбое ресурса. Индекс сбоя ресурса уменьшается, когда ресурс завершает задание, назначенное ему в срок. Менеджер индексов ошибок обновляет индекс ошибок ресурса сетки, используя алгоритм обновления индекса ошибок.

Сервер репликации контрольных точек. Когда создается новая контрольная точка, сервер репликации Checkpoint инициализирует CRS, который реплицирует созданные контрольные точки в удаленные ресурсы, применяя RRSA. Детали хранятся на сервере Checkpoint после репликации. Чтобы получить информацию обо всех файлах контрольных точек, сервер репликации запрашивает Checkpoint Server. CRS контролирует сервер Checkpoint для обнаружения более новых версий контрольных точек в течение всего времени выполнения приложения. Информацию о доступных ресурсах, оборудовании, памяти и пропускной способности можно получить в ГИС. Необходимые детали периодически распространяются этими инструментами в ГИС. CRS выбирает подходящий ресурс с помощью RRSA для репликации файла контрольных точек в зависимости от размеров передачи, доступного хранилища ресурсов и текущей пропускной способности.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ:

Пропускная способность. Одним из наиболее важных стандартных показателей, который используется для измерения производительности отказоустойчивых систем, является пропускная способность. Пропускная способность определяется как:

Пропускная способность (n) = n / Tn

Где n – общее количество отправленных заданий, а Tn – общее время, необходимое для выполнения n заданий. Пропускная способность используется для измерения способности сетки приспосабливаться к заданиям. Как правило, пропускная способность двух систем уменьшается с увеличением процента отказов, введенных в сеть. Это связано с дополнительной задержкой, с которой они оба сталкиваются, чтобы завершить работу в случае сбоя некоторых ресурсов.

Тенденция отказов. Тенденция отказов – это процент склонности выбранных ресурсов сетки к сбою, который определяется как:

Сбой тенденции = * 100%

Где m – общее количество ресурсов сетки, а Pfj – частота отказов ресурса j. С помощью этого показателя можно ожидать ошибочного поведения системы.

Во всех распределенных средах отказоустойчивость является важной проблемой. Таким образом, путем динамической адаптации частоты контрольной точки на основе истории информации о сбое и времени выполнения задания, что снижает накладные расходы контрольной точки, а также увеличивает пропускную способность, благодаря которой предлагаемая работа достигает отказоустойчивости. Следовательно, ниже были предложены новые методы обнаружения ошибок, прозрачная архитектура отказоустойчивости клиента, отказоустойчивые методы по требованию, экономичная отказоустойчивая модель, оптимальная система прогнозирования отказов, модель множественных отказоустойчивых и самоадаптивная структура отказоустойчивости для создания сетевой среды. является более надежным и заслуживающим доверия.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Смеяться или не смеяться: понимание словесных шуток детьми

30.10.2020 Комментариев нет

РЕЗЮМЕ В этом исследовании делается попытка выяснить возраст, в котором дети интерпретируют словесные шутки. Использовалась выборка из 60 детей в возрасте 6-12 лет из 5

Читать полностью »

Личное заявление об участии в Национальном обществе чести

29.10.2020 Комментариев нет

Личное заявление NHS Для меня будет большой честью быть принятым в Национальное общество чести, и я думаю, что заслужил свое место. Пока я учился в

Читать полностью »

Успех народа и личная поддержка семьи

29.10.2020 Комментариев нет

Люди определяют успех обильными способами. Для некоторых людей речь может идти о деньгах и власти. Для других это может быть женитьба и создание семьи. Все

Читать полностью »