Диагностика GFS2
Примечание
Все IP-адреса, подсети, номера VLAN и наименования интерфейсов являются примерами. Необходимо производить настройку в соответствии с инфраструктурой.
Проверка состояния ФС
Групповой запрос
Указанные ниже команды можно выполнять групповым запросом, используя команду node nodes-cli <command>.
Проверка состояния ФС GFS2 производится с помощью команд CLI:
- 
Вывод состояния кластерного транспорта, кворума и службы блокировок: storage gfs2
- 
Конфигурация службы блокировок DLM: storage dlm-conf
- 
Вывод файла hostsдля сопоставления узлов с именем узла:hostsНа всех узлах, объединенных в Кластерный транспорт, в файле hostsдолжны быть внесены описания "ip имя узла" всех задействованных узлов Кластерного транспорта трафика управления и трафика данных.
- 
Вывод информации о подключенных и доступных LUNs: storage multipath
- 
Вывод доступных FC LUNs: storage fc-luns
- 
Сканирование доступных ФС и блочных хранилищ: storage discovery
Проверка состояния служб
Для проверки состояния служб, связанных с работой GFS2, необходимо перейти в командную строку подсистемы. Для этого необходимо выполнить команду CLI:
shell
Проверка служб осуществляется с помощью следующих команд:
systemctl status corosync.service
systemctl status dlm.service
systemctl status storage-gfs2-gfs2_<lockspace>.mount
Вывод команды systemctl status storage-gfs2-gfs2_<lockspace>.mount при корректно смонтированном LUN
Каждому примонтированному LUN соответствует одна служба. 
Для проверки всех LUNs необходимо последовательно выполнять указанную команду, поочередно указывая 
<lockspace> примонтированных LUNs.  
В некоторых случаях значение lockspace может не совпадать c именем директории точки монтирования.  
systemctl status sbd.service
Диагностика проблем и выявление инцидентов
Первичная диагностика состояния ФС GFS2 проводится в CLI с помощью команд, описанных в разделе Проверка состояния служб.
Ниже приведены возможные ошибки, причины их возникновения, а также действия, которые необходимо произвести для их исправления.
Возможные ошибки
Сбой в работе DLM, вызванный отсутствием/затиранием файла конфигурации
- 
Обнаружение ошибки: Зафиксирована ошибка в выводе команды shell: dmesg -T
- 
Причина возникновения ошибки: Отсутствие данных в файле конфигурации. 
- 
Исправление: - 
Внести изменение в файл конфигурации /etc/dlm/dlm.confсогласно эталону.
- 
Перезагрузить систему. 
 
- 
Сбой при установлении соединения corosync и отказа на узле
- 
Обнаружение ошибки: - 
Зафиксирована ошибка в статусе corosync.serviceили log-файле/var/log/corosync/corosync.log.
- 
Зафиксирована ошибка в выводе команды journalctl -u corosyncилиjournalctl --no-pager | grep corosync.
 
- 
- 
Диагностика ошибки на узлах: Информация на каждом из узлов должна содержать информацию о всех узлах для корректного функционирования GFS2. Команда CLI: node nodes-cli 'hosts'
- 
Причина возникновения ошибки: Несоответствие файла hosts. Отсутствие записей, необходимых для функционирования связи между узлами.
- 
Исправление: Внести изменение в файл /etc/hostsсогласно данным, расположенным на Контроллере. Для этого необходимо:- 
Перейти в shell: shell
- 
Открыть на редактирование файл /etc/hosts:nano /etc/hosts
- 
Внести изменения. 
 
- 
Сбой при монтировании ФС GFS2 в результате повреждения ФС, вызванного сбоем
Внимание
При срабатывании ограждения необходимо поочередно произвести размонтирование примонтированных ФС.
Не допускается использование кнопки Размонтировать. В случае ограждения все узлы, на которых была примонтирована ФС, будут немедленно перезагружены.
- 
Обнаружение ошибки: - 
Команда CLI для получения статусов кластерного хранилища GFS2 на любом из узлов: node nodes-cli 'storage gfs2'
 
- 
- 
Исправление: - 
Если сбой произошел не на всех узлах, необходимо остановить или перенести все ВМ и виртуальные диски, расположенные на данном хранилище. 
- 
Поочередно на каждом из узлов: - 
Остановить или перенести все ВМ и виртуальные диски, задействованные на узле на другие совместные пулы данных. 
- 
Удалить запись монтирования поврежденной ФС из /etc/fstabна узле.
- 
Размонтировать ФС на узле (не допускается использование кнопки Размонтировать). 
- 
В случае, если ограждение узла не произошло, необходимо произвести перезагрузку. 
 
- 
- 
После перезагрузки всех узлов необходимо запустить команду для исправления ФС, используя команду shell любого из узлов: fsck.gfs2 -y <lun_path>Пример вводаfsck.gfs2 -yfsck.gfs2 -y /dev/mapper/3600143801259dcf30000b00000220000
- 
После завершения исправления ФС необходимо поочередно примонтировать ФС на узлах, используя кнопки управления, расположенные напротив серверов в разделе основного меню Хранилища - LUNs - <LUN ФС GFS2>. 
 
- 











