Вопрос: Устранение неполадок в энергопотреблении сервера. (Предполагаемые скачки мощности или всплески) [закрыто]


Мы столкнулись с очень странной проблемой в серверной комнате нашего нового офиса по всем розеткам.

В частности, когда все оборудование работает и работает (например, система кондиционирования воздуха, 2 стойки в стойке, 5-кратные 48-портовые коммутаторы PoE, а также система доступа к дверям, в которой имеются резервные батареи и основные схемы управления, расположенные в серверной комнате) мы иногда видим, что серверы самопроизвольно перезагружаются, система доступа к дверям перезагружается, а коммутаторы PoE одновременно выходят в нефункциональное состояние в течение 20 минут или более за раз. Когда это происходит, все три системы перезагружаются одновременно. Все три системы находятся в одной цепи.

Серверы и коммутаторы работают на устройстве ИБП, а система доступа к карте также имеет собственную резервную батарею - поэтому простая мгновенная потеря мощности не объяснит это, так как все должно просто продолжать работать от ИБП без перерывов. Мы отключили ИБП от стены и увидели, что серверы продолжают работать, как и ожидалось, - поэтому ИБП работает нормально, если речь идет об отключении электроэнергии.

Ни один из автоматических выключателей никогда не срабатывал или не нуждался в сбросе.

Система кондиционирования воздуха, по-видимому, находится на отдельной схеме для серверов и сетевого оборудования; однако его силовые кабели имеют кабельный канал с силовыми кабелями, которые подключаются к стенным выходам, используемым серверами и т. д. Возможно ли возникновение напряжения от одной цепи к другой при включении или выключении переменного тока, поскольку они параллельны друг на друга в течение нескольких метров?

Я поговорил с одним из электриков, которые пытались выяснить, что происходит, и сказал, что, хотя блок кондиционирования воздуха находится на отдельной схеме для серверов и других систем, эти две схемы фактически имеют общую нейтральную точку - то, что он думал может потенциально вызвать проблемы. Является ли это нормальной конфигурацией или считается плохой практикой, чтобы что-то вроде блока переменного тока делилось нейтральным с чувствительным оборудованием в серверной комнате?

В настоящее время проблема утихла сама по себе. Серверы перестали самопроизвольно перезагружаться, а коммутаторы снова подключены к сети, но никаких реальных изменений не было сделано, поэтому основная проблема все еще существует и, вероятно, рано или поздно появится.

Учитывая, что во время этих эпизодов мы наблюдаем несколько систем с отдельными блоками резервного питания, какие возможные объяснения могут возникнуть помимо скачков напряжения или всплесков?


6
2017-12-29 06:23


Источник


У блоков ИБП есть файлы журналов, которые вы можете проверить, чтобы проверить, зарегистрировали ли они какие-либо события, связанные с питанием, которые могут быть скоррелированы для этих спонтанных перезагрузок и остановок? - joeqwerty
Эта проблема возникает круглый год или это только недавняя вещь? Вполне возможно, что, будучи в зимние месяцы, нагреватели пинают и потребляют больше энергии, чем обычно. Если это так, то недавнее снижение проблем можно объяснить более теплой погодой, которую мы наблюдаем в последнее время - по крайней мере, для меня на восточном побережье США. - cutrightjm
@ekaj уверен. Из-за этой недели у нас был день около 50% простоя, но с тех пор все отлично работает. Я подожду некоторое время и отчитаюсь с любой новой информацией или подсказками, которые я нахожу в журналах ИБП. - Austin ''Danger'' Powers
Я бы предложил нанять кого-то, чтобы измерить качество электроэнергии, они могут, вероятно, принести оборудование, способное диагностировать и обнаруживать проблему, даже если этого недостаточно, чтобы перезагрузить комнату. - derobert
регистратор напряжения может стать отличным инструментом для диагностики. Я буду придерживаться его на стороне питания ИБП. - tedder42


Ответы:


В то время как не прямой ответ «вот ты», на который ты надеялся, вот мое предложение.

Похоже, что, хотя благородно, ваши поиски, чтобы выяснить, что не так, не будут быстро решены вами.

Вы можете делать то, что предложили другие, и попытаться записать все, что можете, и надеяться на появление шаблона.

Мне нравится предложение Дерберта о найме кого-то для измерения качества электроэнергии ...

ОДНАКО, вот мое фактическое предложение, которое вы уже сделали. Оставь это электрикам.

Шутки в сторону. Квалифицированный электрик (даже если вы должны передать его на аутсорсинг) должен быть в состоянии дать вам первопричину ЕСЛИ это электрическое в природе или нет. Они могут протестировать каждую цепь, чтобы убедиться, что они не перегружены (особенно на шипы / стартапы), они могут убедиться в правильности проводки и правильности размеров цепей для того, к чему вы прикреплены. и т.д.

В большинстве случаев ИТ не будет иметь собственного квалифицированного электрика, и мы часто любим просто «подключать материал» и не понимаем, используем ли мы правильные схемы, схемы балансировки и т. Д.

Если ваш ИБП поддерживает сбор журналов, я сделаю это, если не что-то другое, чтобы помочь доказать проблему. Хотя ваш ИБП может быть недостаточно высоким, чтобы компенсировать спайки / долины должным образом (быстро), это не значит, что это основная причина. Для меня это звучит как электрический вопрос. Если у вас работает хороший он-лайн ИБП, и, похоже, он правильно компенсирует входное напряжение (на основе его журналов), было бы странно, что все подключенное к нему ИТ-оборудование и система чтения карт памяти одновременно перезагружались ,

Поговорите со своим начальником и объясните проблему с точки зрения необходимости квалифицированного электрика для диагностики. Нечестно ожидать, что электрик настроит маршрутизацию BGP и, наоборот, не ожидает, что системный администратор будет квалифицированным электриком.


4
2018-01-02 14:03



И добавить, у меня были «соответствующие аналогичные переживания». Ваш электрик должен запрашивать у вас информацию, такую ​​как требования к электропитанию вашего оборудования, а затем определять нагрузку на каждую цепь, проверять наличие пиков / долей напряжения / силы тока и т. Д. Вы можете подавить их и своих боссов журналами / данными, если вы хотите cya , но это звучит так, как будто ваши электрики, скорее всего, являются собственными ребятами, которые не слишком глубже вникают в это, чем очевидные. - TheCleaner