Вопрос: Перемещение серверов внутри одного здания


Вот мой сценарий: я разработчик, который унаследовал (без ведома) три сервера, расположенных в моем офисе. Я также унаследовал работу администратора серверов с явно отсутствием знаний администрирования сервера и google / ServerFault в качестве контрольной точки. К счастью, мне никогда не приходилось физически вступать в контакт с машинами или решать любые проблемы, поскольку они всегда «просто работали».

Все три машины расположены в одной и той же комнате данных и выполняют следующие задачи:

Machine1 - IIS 8.0 с несколькими внутренними приложениями
Machine2 - хранилище данных SQL Server 2008 R2 для внутренних приложений
Machine3 - Зеркальное хранилище SQL Server 2008 R2 Machine2

У всех трех подключены внешние жесткие диски, которые часто поддерживают резервное копирование.

Мне сообщили, что все трое должны переходить из одной комнаты данных в другую в пределах одного помещения. Я не буду завершать физическое перемещение оборудования, которое будет обрабатывать компетентный движок.

Помимо завершения полного резервного копирования каждого из них, какие соображения мне нужно сделать, прежде чем гипотетически щелкнуть выключателем питания и посмотреть, как мой мир движется?

Я знаю, что это далеко не идеальный, если все три находятся в одной комнате / помещении, но это выходит за рамки этого вопроса.


60
2017-08-22 10:51


Источник


Даже не связанные с этим шагом, у вас уже есть план, что вы будете делать, если одна (или все) материнские платы / источники питания / диск погибнет? (потому что это в конечном итоге произойдет) - Dusan Bajic
@spuder, возможно, они нуждаются в приложении, доступном без Интернета (говорят, что это внутреннее приложение), или просто не хотят, чтобы NSA выглядывала. Облако - это не серебряная пуля. - André Borie
Этого недостаточно для ответа, но я предлагаю сделать мягкую подачу питания и включить питание перед движением, чтобы вы знали, что делают серверы, когда они работают успешно. Могут быть какие-то страшные звуковые сигналы или невежественные сообщения об ошибках, которые вы не знаете, чтобы игнорировать, если раньше у вас не было питания. Когда вы знаете, что такое плавное включение / выключение звука, и как долго это займет время, вы будете в лучшем положении, чтобы судить о том, что что-то не так после движения. - Stefan Mohr
Сделайте перезагрузку каждой машины по очереди и надейтесь, что она вернется к жизни без ошибок, прежде чем двигаться! - Matt
@Matt, по крайней мере, он признается невежественным и пытается узнать, что хорошо. Я видел слишком много случаев, когда администратор - полный идиот, но даже не осознавал этого. - André Borie


Ответы:


Действительно интересный вопрос, хорошо спрошенный :)

Есть несколько вещей, которые вам нужно проверить перед этим движением, некоторые простые, некоторые трудно.

Мощность - убедитесь, что новая комната имеет не только правильное количество выходов питания, но и то, что они являются правильным типом - как в физическом типе разъема, и если текущее местоположение позволяет различным фазам питания на один сервер защищать от однофазного отказа, d настоятельно рекомендуем повторить это также в новом месте.

охлаждение - вам нужно проверить, что не произойдет немедленного или постепенного нарастания тепла, что приведет к перегреву и прекращению работы сервера. Обычно вы можете найти максимальную мощность (в ваттах) или высокую температуру (в BTU), которую каждый сервер может использовать на веб-сайте производителей, - пусть ваш менеджер здания узнает об этом и получает от них письменное подтверждение, что охлаждение в этом месте справится ,

сетей - это тяжелый - не только реплицировать то же количество портов между старым и новым местоположением, но и их тип, скорость и, самое главное, конфигурацию. Этот последний момент является ключевым - было время, когда почти все порты в сети были в значительной степени равны - я достаточно взрослый, чтобы помнить те времена! но в наши дни количество конфигураций портов и место в сети, в которых может находиться любой один порт, являются астрономическими, вам нужно убедиться, что ваши сетевые пользователи реплицируются ВСЕ, чтобы быть идентичными от старого к новому, - снова получите это в письменной форме, поскольку это не просто. Если что-то пойдет не так с этим движением, я бы поместил деньги, которые будут в сетевых портах не одинаковыми, это происходит все время.

«Другие соединения» - Знаете ли вы, есть ли на ваших серверах какие-либо другие подключения, кроме питания и сетей? возможно, у них есть каналы Fibre Channel для общего хранилища, KVM-ссылки на общий экран управления - опять же, если вам это нужно, чтобы их повторить.

Помимо этого, не стесняйтесь возвращаться сюда с более конкретными вопросами, и я надеюсь, что это будет хорошо.


62
2017-08-22 11:24



+1 для Chopper3 - я бы также добавил, что в зависимости от конфигурации вашей сети существует небольшая вероятность того, что MAC-адреса ваших сетевых карт не будут освобождены от старого коммутатора, и Интернет может не работать в зависимости от того, как сеть построена. Я знаю, что это может не произойти, если коммутаторы настроены правильно, однако я работал в большой среде, и это происходило довольно часто, и сетевому инженеру пришлось вручную очистить запись MAC. - Mugurel
Сделайте снимок объединительной платы перед демонтажом. Экономит лад боли. - Sobrique
Все. Просто сделайте фотографии на своем телефоне камеры, где все кабели идут, и что подключено, а что нет. (Предполагая, что вам разрешено находиться в DC). Действительно хорошо повторить позже, как «все выглядит», если что-то странное происходит. - Sobrique
Ах, поэтому «порты» тогда - объединительная плата часто ссылается на нечто совершенно другое - Chopper3
@ Объединительная плата Chopper3 всегда относится к внутреннему аппаратным компонентам и никогда не относится к «задней части сервера». За исключением случаев, когда это означает неудачную социальную сеть. - Christopher Schultz


Другие ответы охватывают технические аспекты движения. Возможно, вам также придется рассмотреть некоторые другие вещи.

Убедитесь, что пользователи знают, что во время перемещения их приложения будут недоступны. Вы захотите запланировать переход, возможно, в нерабочее время, чтобы вы минимизировали количество затронутых людей.

Попросите знающего человека (или людей) проверить приложения после того, как вы поднимете серверы. Попросите их сделать некоторые проверки здравомыслия, чтобы убедиться, что приложения работают так, как ожидалось.

После тестирования сообщите своим пользователям, что этот шаг завершен, и сообщите им, есть ли у них какие-либо проблемы.


27
2017-08-22 16:36





Трудно сказать, и границы «слишком широки» для нашего формата. Самое главное, что вам нужно проверить, - это если вам нужно перенастроить свою сеть в любом случае, если они могут работать с одинаковыми адресами. Даже если они могут хранить одни и те же адреса, убедитесь, что они не настроены через DHCP и / или подтверждают, что сервер DHCP будет доступен в новом месте.

Замечание: Как вы уже сказали, наличие SQL-сервера и его зеркала далеко не идеальное. Однако наличие резервных дисков в одном и том же месте действительно опасно. Вам нужно иметь резервную копию в другом физическом месте.


18
2017-08-22 11:09



+1 резервное копирование. Они не должны находиться в одном и том же месте, а также на резервном сервере не должно быть доступа к резервному носителю, иначе ошибка / вредоносное ПО / саботаж / ransomware на одном из серверов также могут уничтожить резервные копии. Сейчас у вас может не быть бюджета, но поместите его в свой список обязательных условий. - sdkks


Другие ответы имеют хорошие предпосылки движения. Однако вы также должны планировать, как вы организуете фактический ход. Из того факта, что Machine3 является зеркалом machine2, похоже, что время безотказной работы является существенным фактором для базы данных SQL Server 2008 R2. Тот факт, что это зеркало, дает вам возможность. Причина существования зеркала должна быть доступна, когда основной сервер не является. Это включает в себя не доступность из-за технического обслуживания, которая включает в себя перемещение.

Составить план:
Вы должны составить письменный план того, как будет выполняться этот шаг. Возможно, вам нужно будет предоставить этот план или его части людям, занимающимся частью работы (например, движками). Этот план должен включать в себя все действия перед перемещением, действительное перемещение и действия после перемещения (например, проверка функциональности).

Основы передвижения: 

  1. Переехать Machine3 (зеркало SQL Server): получить его полностью работоспособным. Проверьте повторную синхронизацию.
  2. Переехать machine2: Получите его в полном объеме.
  3. Переехать Machine1: Получите его в полном объеме.

Более подробное описание хода:

Ниже приведены два метода (пути A и B) использования Machine3 для проверки соединений для Machine1 и / или machine2, Вы должны использовать только один метод. Какой способ сделать это, или даже использовать его, зависит от информации, не содержащейся в вопросе (например, физическое разделение конечных местоположений машины, физический размер машин, длина сетевых / шнуров питания, наличие расширений для одного и того же, сходство конфигураций сетевых портов, потребности в безотказной работе и т. д.). С помощью Machine3для проверки этих соединений потенциально позволяет увеличить время безотказной работы machine2, но особенно для Machine1, который не имеет зеркала. Вы можете использовать любой метод или ни один из них.

  1. Переехать Machine3 первый.

    • Оставлять Machine1 а также machine2 на данный момент.
    • Резервное копирование Machine3, затем выключите его
    • Получить Machine3 полностью переехал в новое место.
    • [Путь B: Не используется, если вы собираетесь использовать дополнительный шаг № 2.] Если сетевые и силовые конфигурации для всех машин идентичны: Put Machine3 где Machine1 планируется завершить использование соединений, предназначенных для Machine1,
    • Получить Machine3 резервное копирование и запуск. В новом месте убедитесь, что он нормально функционирует как зеркало machine2, Это обеспечит физическую проверку того, что конфигурация всех проблем (мощность, сеть и т. Д.) Функционирует в новом месте.
    • Решите все возникающие проблемы.
    • Подтвердите это Machine3 полностью синхронизирована с machine2 до начала работы.
  2. Путь A: (необязательно):

    • использование Machine3 проверить все объекты, предназначенные для machine2 а также Machine1,
    • закрыть Machine3 вниз и переместить / переключиться на использование положения / соединений для machine2, (проверьте повторную синхронизацию), затем Machine1 (проверьте повторную синхронизацию). Если вы планируете сделать это, то Machine3 должны были быть первоначально установлены с соединениями, предназначенными для конечного использования Machine1 или machine2, чтобы вы не настраивали его сначала в конце Machine3 а затем измените его 3 раза, но только 2, начиная с него, используя средства одной из других машин.
    • Подтвердите это Machine3 полностью синхронизирована с machine2 до начала работы.
  3. Переехать machine2,

    • Ваша практика с Machine3 должно сделать это намного более гладко.
    • Резервное копирование machine2, затем выключите его
    • Переехать machine2 на новое место; делать все соединения
    • Решите все возникающие проблемы.
    • Подтвердите это machine2 полностью синхронизирована с Machine3 до начала работы.
  4. [Путь B: Не требуется, если вы проверили все соединения с Machine3 в необязательном шаге # 2] Если теперь есть Machine3 где Machine1 должно закончиться:

    • Неисправность Machine3,
    • Переместите его туда, где он должен быть в конечном итоге (вне места, которое вы намереваетесь Machine1 быть расположенным).
    • Решите все возникающие проблемы.
    • Подтвердите это Machine3 полностью синхронизирована с machine2 до начала работы.
  5. Переехать Machine1,

    • Переместив оба machine2 а также Machine3 (и, мы надеемся, проверили фактические соединения Machine1 будет использоваться, если Machine3 используйте их временно), это должно быть самым плавным ходом.
    • Резервное копирование Machine1, затем выключите его
    • Переехать Machine1 на новое место; делать все соединения
    • Решите все возникающие проблемы.
    • Если что-то пойдет не так с объектами в положении, что Machine1 предполагается занять, у вас есть возможность использовать объекты, где Machine3 теперь находится. Надеюсь, вы уже смогли протестировать все объекты в Machine1 если он уже используется Machine3 на время (путь A или путь B).

16
2017-08-23 15:37





Если какой-либо из IP-адресов серверов изменится, и соединения будут сделаны в поле SQL через разрешение DNS, вам нужно будет запланировать изменение записей DNS одновременно с перемещением.

Вещи, которые вы должны знать о программном обеспечении и базах данных интрасети:

  • Подключается ли программное обеспечение интрасети к SQL Server через IP, NetBIOS или DNS?
  • У учетных записей пользователей SQL Server, используемых программным обеспечением интрасети, есть аутентификация, ограниченная трафиком, поступающим с IP-адреса?
  • Получают ли сотрудники вашей компании доступ к SQL Server непосредственно из любых электронных таблиц или средств отчетности, если да, то как они определяют DSN?

Если вы не получите точные IP-адреса, или если вы попадете в другую подсистему, вам понадобится доступ к исходному коду или файлам конфигурации для любых приложений, подключающихся к SQL-серверу. Люди могут полагаться на недокументированный и прямой доступ SQL для специальных отчетов.


7
2017-08-23 12:20





Используйте свои серверы «Аварийное восстановление». Переключайтесь к ним, чтобы обрабатывать нагрузку во время перемещения ваших производственных серверов. При правильно настроенном оборудовании DR вы можете совершать движение в середине дня, не видя большого количества простоя (до 15 минут). Поскольку серверы аварийного восстановления должны быть настроены так же, как и серверы производства. Если у вас нет оборудования DR, я настоятельно рекомендую их получить.

Подумайте об этом так: пока ваш корвет настраивается, используйте свой микроавтобус, чтобы пройти весь день.


2
2017-08-23 14:39



Вы принимаете много о компании, которая удивляет неопытного администратора тремя серверами. - RoadieRich
Абсолютно, я предполагаю, что полностью функционирует правильно настроенная серверная лаборатория. Или, по крайней мере, место, в котором есть несколько старых серверов (или даже шт.), Все еще укладывается вокруг сбора пыли. Переконфигурируйте их только для перемещения. - Software_Programineer


Одна вещь, о которой я не думаю упоминал, - это физическая безопасность нового дома серверов. Какую комнату раньше использовали и кто имеет ключи к ней? Есть ли достаточная безопасность (системы сигнализации, камеры и т. Д.).


1
2017-08-24 01:27





Некоторые соображения в дополнение к другим ответам:

  • Связаны ли приложения с другими по e. г. ночной обмен данными по файлам или с помощью веб-сервисов? Каковы последствия, когда приложения недоступны? Могут ли связанные с ними приложения справиться с этим или они терпят неудачу или даже создают неправильные результаты из-за отсутствия информации из ваших приложений?

  • Является ли время простоя приемлемым для ваших пользователей, компаний или даже клиентов? Как долго это может быть?

  • Я думаю, что неплохо иметь план откат. Вы можете использовать его в случае проблемы, которая не может быть быстро решена, e. г. сетевой проблемы. Вероятно, вам понадобится держать движок доступным для случая возврата оборудования.

  • Ваши приложения приводят к высокому сетевому трафику и должны ли быть подготовлены к этой сети (вероятно, гораздо более маловероятна проблема, чем проблемы с адресами и брандмауэрами)? Если у вас есть приложения реального времени (например, программное обеспечение для видеоконференций), это будет иметь важное значение.

  • Серверы должны вставляться в стойку сервера, если таковая имеется.


1
2017-08-27 09:11