Вопрос: Как часто я должен очищать свой RAID?


В общем, я хотел бы знать, как часто нужно массировать RAID-массив. Что способствует более частому очистке (чтение данных?, Запись данных?, Неожиданные остановки?, Возраст для дисков?, Размер диска?, Количество пользователей? И т. Д.)?

Я читал Archiki Вот и все, что он на самом деле говорит, заключается в том, что очистка должна проводиться регулярно. Мне просто интересно, как регулярно. Очевидно, это будет зависеть, но что такое разумный диапазон? Ежегодно? Ежемесячно? Еженедельно? Ежедневно? Большое спасибо за любую информацию.


11
2018-04-10 20:43


Источник


Насколько велик ваш массив? Сколько времени занимает скраб вашего массива? Большие массивы могут занимать часы или дни для полного скраба. Очевидно, вы не можете чистить более часто, чем требуется для завершения одного скраба. Пакет Debian включает скрипт cron, который запускает первое воскресенье каждого месяца. - Zoredache
Я зависим, насколько это грязно :) - metacom
@Zoredache: Это именно то, что я искал. Поскольку большие массивы занимают больше времени, это уменьшит частоту, которую вы должны скраб? Увеличит ли число пользователей эту частоту? Вам нужно скраб, если вы на самом деле не пишете много новых данных? - mrfred
Программный RAID? Аппаратный RAID? ZFS? - ewwhite


Ответы:


Как часто вы должны сканировать, зависит от многих вещей.

  • Возраст дисков. Чем старше они, тем больше вероятность того, что они содержать зло,
  • Оригинальное качество рассматриваемых дисков. Материал, продаваемый как «предприятие», скорее всего, будет без ошибок, а диски размером 1 + TB 2014 года намного надежнее, чем их эквиваленты 2009 года, когда они отправлялись.
  • Насколько чувствительны ваши производственные операции ввода-вывода для очистки ввода-вывода.
  • Сколько из вашего набора данных вы считаете своим рабочим набором.

Поставщики аппаратного RAID часто включают в себя процесс очистки среды по этой причине, некоторые даже позволяют настраивать приоритет ввода-вывода процесса очистки, что позволяет избежать (или значительно уменьшить) штраф за производительность ввода-вывода для скраба. Конечно, если ваш приоритет низкий, а ваш prod-I / O запускает диски в основном плоские, вы, вероятно, никогда не закончите скраб и даже не заметите его, пока не получите отказ.

К сожалению, я не знаю, дезинформирует ли ядро ​​Linux чистку ввода-вывода или нет. В любом случае, это хорошая идея, чтобы проверить его с вашими грузами prod, чтобы быть уверенным, что любые удары по производительности приемлемы. Если это приемлемо, хорошо! Если это не так, вы можете сделать выбор, добавлять или не добавлять шпиндели, чтобы разрешить ввод / вывод скребка + prod или просто принять риск возможных сбоев массива в будущем.

Еще одна вещь, которая влияет на частоту очистки, - это модель использования ввода-вывода. Если производственные нагрузки попадают только на меньшинство дисков, единственным вводом-выводом, который обычно будет обнаруживать плохой блок в режиме ожидания, будет ваш скраб; в этом случае вы хотите чаще вычищать. Если ваша производственная нагрузка регулярно читает весь набор дисков (например, ежедневные полные резервные копии), тогда производственные операции ввода-вывода будут сталкиваться с проблемами раньше, и вы можете счищать реже.

Хорошим планом действий будет:

  1. Запустите некоторые тесты, чтобы убедиться, что очистка будет мешать производству.
    1. Выясните, как долго длится полный скраб, пока вы на нем.
  2. Укажите, какой процент вашего дискового набора будет получать множественный доступ за определенную неделю (включая резервный ввод-вывод, если таковые имеются, в этом расчете).
  3. Основываясь на 1 и 2, решайте, находитесь ли вы в менее часто или чаще - чаще в лагерях.

Когда у вас есть эти данные ...

  • Если полное сканирование занимает менее одного дня и не влияет на производство заметно, вы можете ходить столько раз, сколько раз в неделю.
  • Если полное сканирование занимает менее одного дня и влияет на производство, выясните, какая часть вашей недели / месяца меньше всего затронута, и попытайтесь запустить его тогда.
  • Если полное сканирование занимает день, но в течение недели и не влияет на производство, запустите его так часто, как раз в две недели или раз в месяц.
  • Если полная проверка занимает более одного дня, но в течение недели и влияет на производство, подумайте над добавлением ресурсов, позволяющих запускать ее, потребовать, чтобы сканирование выполнялось во время организованных окон обслуживания или использовалось возможность простоя / проверки очистки он вписывается и начинается постоянно.
  • Если полное сканирование занимает неделю, один раз в месяц достаточно часто. Но если это повлияет на производство, вам нужно будет добавить ресурсы, которые позволят ему завершить.

13
2018-04-11 11:57



Именно то, что я искал. Большое спасибо! - mrfred