Вопрос: Почему Enterprise Storage так дорого?


Это Канонический вопрос о стоимости корпоративного хранения.
  См. Также следующий вопрос:

В отношении общих вопросов, таких как:

  • Почему я должен платить 50 баксов в месяц за каждый дополнительный гигабайт памяти?
  • На нашем файловом сервере всегда заканчивается пространство, почему наш системный администратор просто не бросает лишний 1 ТБ диск?
  • Почему оборудование SAN так дорого?

Здесь мы постараемся дать лучшее представление о том, как работает хранилище на уровне предприятия и что влияет на цену. Если вы можете расширить вопрос или дать представление о ответе, отправьте сообщение.


106


Источник


Пожалуйста, закройте все вопросы «Почему так дорого стоит» и укажите их здесь. - Mark Henderson♦
Это не значит, что это рекламный форум для всех, кто нашел дешевых поставщиков, это очерчивание «скрытых» затрат на уровне корпоративного уровня. - Mark Henderson♦
Обязательная ссылка BOFH («Мне нужно больше места!»): bofh.ntk.net/BOFH/0000/bastard01.php - Massimo
Джим Солтер опубликовал сообщение об этом, предлагая сообщение в блоге Депрессия калькулятора хранения, Итог: вам необходимо предоставить где-то от 10 до 25 раз больше видимого хранилища конечного пользователя желательно, в зависимости от допущений и требований. - Michael Kjörling


Ответы:


  1. Объем жестких дисков сервера минимален по сравнению с емкостью жесткого диска на настольном ПК. 450 и 600 ГБ не являются необычными размерами для просмотра на новых серверах, и вы можете купить много настольных дисков на 4 Тб SATA по цене один 600 ГБ SAS (сервер).

  2. Ваш жесткий диск SATA на вашем настольном ПК дома похож на автомобиль с мышью от Ford, или GM, или Mercedes или любой другой производитель автомобилей для повседневных людей (большая емкость V8 или V12, 5 или 6 литров). Поскольку они должны управляться людьми, которые не имеют гоночной лицензии или понимают, как работает двигатель внутреннего сгорания, они имеют очень большие допуски. У них есть ограничители оборотов, они предназначены для работы на любом масле определенного рейтинга, у них есть интервалы обслуживания на расстоянии 10 000 км друг от друга, но если вы пропустите интервал обслуживания на несколько недель, он не будет взорваться на вашем лице. Они не загораются, когда вы едете на большие расстояния.

    Привод SAS на сервере более сродни двигателю Формулы 1. Они очень маленькие (2,4 литра), но имеют огромные мощности из-за их крошечных допусков. Они вернутся выше и часто не имеют ограничителя оборотов (что означает, что они подвергаются серьезному ущербу при неправильном использовании), и если вы пропустите интервал обслуживания (который каждый раз часов) они взрываются.

    Вы в основном сравниваете мел и сыр. Номера и полная разбивка обсуждаются в Технической документации Intel Жесткие диски корпоративного класса и настольного класса

  3. Давайте поговорим о некоторых трудных числах здесь. Допустим, вы запрашиваете 1MB дополнительных данных (хороший круглый номер). Сколько данных это действительно? Ну, ваши 1 МБ данных пойдут в RAID-массив. Предположим, что они безопасны и делают это в RAID1. Ваши 1 МБ данных зеркалируются, поэтому на самом деле это 2 МБ данных.

    Предположим, что ваши данные находятся внутри SAN. В случае сбоя узла SAN ваши данные синхронизируются на байтовом уровне со вторым узлом SAN. Таким образом, он дублируется, и ваш 2 МБ данных теперь составляет 4 МБ.

    Вы ожидаете, что ваш провайдер сохранит резервные копии на месте, поэтому ваши данные могут быть восстановлены в случае непредвиденной чрезвычайной ситуации? Любой достойный провайдер предоставит вам по крайней мере 1 резервную копию на месте, возможно, больше. Предположим, они снимают снимки один раз в неделю в течение трех недель на месте. Это дополнительные 3 МБ данных, поэтому теперь вы получаете до 7 МБ.

    Если есть критическая катастрофа, у вашего провайдера лучше иметь копию, находящуюся где-то на месте. Даже если это месяц, он должен существовать. Итак, теперь вы до 8 МБ.

    Если это действительно высокоуровневый провайдер, у них может даже быть сайт аварийного восстановления, синхронизированный в реальном времени. Эти диски также будут RAIDed, так что это дополнительный 2 МБ, и, таким образом, вы получите до 10 МБ данных.

    В конце концов вам придется переносить эти данные. Какие? Передайте его? Да, передача данных стоит денег. Это стоит денег, когда вы загружаете его, получаете доступ к нему через Интернет, даже стоит денег на его резервное копирование (кто-то должен извлечь эти записи из офиса, и может быть, что ваши 1MB данных означают, что им нужно приобрести дополнительный набор лент и перенос их где-нибудь).

  4. Когда ваш жесткий диск SATA выходит из строя, вы можете позвонить в службу технической поддержки и убедить их, что ваш диск мертв. Затем отправьте свой диск производителю (чаще всего на собственные деньги). Подождите неделю. Получите сменный диск обратно и переустановите его (это почти наверняка не является «горячей» заменой или уже в салазках).

    Когда этот диск SAS выходит из строя, вы вызываете техническую поддержку. Они почти никогда не ставят под сомнение ваше мнение о том, что диск нуждается в немедленной замене и опустить новый диск; обычно новый диск доставляется в тот же день, иначе на следующий день тоже очень распространено. Обычно производитель отправляет представителя для фактической установки накопителя, если вы не знаете, как это сделать (очень удобно, если вы планируете провести отпуск, когда вам нужно, чтобы все работало, пока вы отсутствуете).

  5. Приводы предприятия имеют жесткие допуски, см. № 2 выше и, как правило, в 10 раз дольше, чем приводы класса Consumer (MTBF). Приводы Enterprise почти всегда поддерживают расширенное обнаружение ошибок и сбоев, которое, по данным отчета Google, работает около 40% времени, но это то, что кто-то предпочел бы, чтобы компьютер внезапно умирал.

    Когда у вас есть один диск на вашем домашнем компьютере, его статистические возможности сбоя - это просто диск. Приводы, используемые для оценки в MTBF (где диски SAS по-прежнему пользуются более чем на 50% выше или выше), теперь чаще встречается частота ошибок. Типичный привод SAS в 10-1000 раз реже имеет неустранимую ошибку (с 100x наиболее распространенным я обнаружил недавно). (количество ошибок в соответствии с документацией производителя, поставляемой Seagate, Western Digital и Hitachi, без предубеждений, явно отказываются от компенсации).

    Частоты ошибок особенно важны, когда вы выполняете неустранимую ошибку на диске, но когда другой диск в том же массиве терпит неудачу, и вы не полагаетесь на все диски в массиве для чтения, чтобы восстановить неисправный диск.

  6. SAS является производным от SCSI, который является протоколом хранения. SATA основан на ATA, который сам базируется на шине ISA (это 8/16-битная шина на компьютерах с эпохи динозавров). Протокол хранения SCSI имеет более обширные команды для оптимизации способа передачи данных с дисков на контроллеры и обратно. Этот всплеск эффективности привел бы к тому, что в противном случае диск SAS был бы быстрее, особенно при экстремальных нагрузках, чем SATA-накопитель; это также увеличивает стоимость.

  7. Создано меньше дисков SAS, экономия на масштабе диктует, что они будут более дорогими, при прочих равных условиях.

  8. Приводы SAS обычно имеют скорость вращения 10k или 15k; в то время как SATA обычно входит в 5,4 тыс. или 7,2 тыс. SAS-накопители, в частности, 2,5-дюймовый размер, который становится все более популярным, имеют более быструю скорость поиска. Оба из них значительно увеличивают IOps, который может выполнять диск, обычно привод SAS ~ 3 раза быстрее. Когда несколько пользователей требуют разрозненных данных, IOps емкость привода / массива становится критическим показателем производительности.

  9. Приводы в центре обработки данных обычно включаются все время. Исследования показали, что на отказ накопителя влияет количество циклов нагревания / охлаждения, которое он проходит (от запуска или выключено). Сохранение их работы все время обычно увеличивает срок службы диска. Следствием этого является то, что накопители потребляют электроэнергию. Это электричество должно быть обеспечено чем-то (в случае большого DC только приводы могут потреблять больше энергии, чем небольшая часть домов). Они также должны рассеивать эту температуру где-то, требуя систем охлаждения (которые сами принимают больше энергии для работы).

  10. Инфраструктура и расходы на персонал. Эти диски находятся в высокопроизводительных устройствах NAS или SAN. Эти устройства дороги, даже без дорогостоящих дисков. Они требуют дорогостоящего персонала для развертывания и обслуживания. Здания, в которых находятся эти NAS и SAN-устройства, дорогие в работе (см. Пункт о охлаждении выше, но там гораздо больше происходит.) Программное обеспечение для резервного копирования, как правило, не бесплатно (и лицензии на такие вещи, как зеркалирование) , а персонал для развертывания и хранения резервных копий обычно тоже дорог. Стоимость аренды за пределами места доставки и хранения ленты - это еще одна из многих вещей, которые начинают накапливаться, когда вам нужно больше места для хранения.

Помня о том, что емкость их накопителей вполне может быть на 1/10 размера настольного компьютера, и в пять раз больше цены, ваши 1 МБ данных на самом деле 10, и все другие различия, вы не можете сделать сколько-нибудь значимых выводы между ценой вашего настольного хранилища и ценой хранения на уровне предприятия.


114



В эти дни 2-4TB SAS / SATA 7.2K диски используются для массового хранения, поэтому некоторые из них больше не применяются повсеместно. - Mircea Chirea
Приводы @MirceaChirea 2-4TB, используемые в корпоративном хранилище, являются NL или ML SAS и отличаются от дисков SATA 2-4 ТБ. Цена на ГБ по-прежнему сильно отличается между двумя платформами. - MDMarra
@MDMarra, большинство из них не намного больше, чем их варианты на рабочем столе: кроме SAS, они имеют лучшую гарантию и защищены от надежности. - Mircea Chirea
Они предназначены для использования 24x7, где большинство Приводы SATA нет. Они также изящно терпят неудачу и не будут повесить весь массив RAID, Только диски SATA, поддерживающие TLER, изящно потерпят неудачу и избегают этого. Также нет двухпортовых дисков SATA, в то время как двухпортовый SAS является общим и обеспечивает прозрачный переход на резервный контроллер. Опять же, если вы находитесь в тонком бюджете, то SATA может быть вашим единственным выбором, но существуют значительные различия, которые предприятия заботятся между NL-SAS и SATA. - MDMarra
Backblaze сказали в своем блоге что корпоративные диски не были менее вероятными, чем потребительские диски - Bert


Я не добавляю это в верхний ответ CW прежде всего потому, что это различие во мнениях. Не стесняйтесь сливать / редактировать это, если хотите.

Часто причиной того, что «хранилище на уровне предприятия» является настолько дорогостоящим, может быть то, что искатель не понимает этого требования, но иногда и системный администратор не понимает этого требования, не может передать требование кому-то с покупательным органом или просто получает игнорируется указанным органом.

Высокопроизводительные, высокодоступные, недорогие готовые массивы хранения дорогая, Часть работы системного дизайнера заключается в том, чтобы знать, где они подходят, и где подходит другой дизайн.

Я не думаю, что относительные затраты на различные типы дисковых накопителей действительно имеют отношение к любому из примеров вопросов.

Почему я должен платить 50 баксов в месяц   на дополнительный гигабайт памяти?

Это явно адресовано поставщику услуг. Два возможных ответа на мой взгляд:

  1. У вас есть 5 девяток времени безотказной работы, круглосуточная поддержка в Манхэттене / Лондоне / Гонконге. Вращающиеся пластинки - это лишь небольшая часть стопки, за которую вы платите.

  2. Вы слишком много платите. Переговорите, переведите поставщика или принесите его в дом.

На нашем файловом сервере всегда заканчивается пространство, почему наш системный администратор просто не бросает лишний 1 ТБ диск?

Это почти наверняка плохой дизайн (и, вероятно, по политическим причинам). Данные на этом файловом сервере попадают где-то в этом спектре:

  • Данные заслуживают хранения при высокой производительности, высокой доступности и высокой стоимости. Время простоя, вызванное нехваткой места, влияет на вашу высокую доступность и является неудачей проектирования или планирования.

  • Данные являются либо незначительными, либо медленными, или более длительными простоями. Приемлемы дешевые диски и дешевые решения для резервного копирования. Регулярное время простоя из-за нехватки дискового пространства по-прежнему кажется странным компромиссом, так как большая часть ваших затрат в этом случае, вероятно, будет вашим временем сисадмина, и в конечном итоге они потратят больше времени на поиск и устранение неисправностей на низком диске пространство.

Обратите внимание, что я сказал, что это спектр, и большинство требований приходит где-то между ними.


31



Стоит отметить, что то, что с точки зрения пользователя «иссякнет», вполне может быть «заполнением вашей квоты» с точки зрения sysadmin. - Richard Gadsden


Стоимость производства какого-либо предмета напрямую связана с объемом единицы, которую он будет продавать в контуре обратной связи.

В случае обычного жесткого диска, с вращающимся ржавым стеклом и электроникой, существует потенциальная значительная разница в стоимости механических и электронных компонентов - однако появились 2 четкие полосы качества / качества - Enterprise и Commodity.

Однако уменьшенный объем продаж корпоративного диска сильно сказывается на том, что вы получаете за свои деньги - то, что стоит в семь раз больше, не будет в семь раз лучше.

Единицы предприятия (для данной мощности) немного быстрее, чем товарные единицы, например. сравнивая Seagate Barracuda SATA (товар) и Cheetah SAS (предприятия):

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Но в контексте предприятия ни один системный администратор никогда не будет хранить важные данные на одном диске - использование нескольких дисков обеспечивает большую надежность и пропускную способность и эффективно уменьшает задержку; четыре диска Barracuda, настроенные как RAID10, будут намного быстрее, чем один диск Cheetah, с гораздо меньшим риском потери данных примерно на 60% от цены.

Конечно, вы получите лучшую гарантию с диска Enterprise, и поставщик, как правило, сможет получить его для вас в тот же день, но вы, вероятно, сможете быстрее экспортировать товарный диск у местного поставщика быстрее, чем ваш поставщик может курьерский сменный диск. С другой стороны, корпоративный диск, скорее всего, будет точной заменой отказавшего диска.

Так что, может быть, вы получаете гораздо большую надежность от корпоративных дисков? В то время как люди, производящие и продающие диски, часто говорят, что это так (Seagate довольно обманывает об этом на своем сайте), но даже запутанные номера, которые они публикуют, показывают, что это менее чем в 2 раза). Независимые исследования показывают, что нет существенных различий,

Набор команд SCSI имеет некоторые технические преимущества по сравнению с набором команд ATA, особенно в том, что позволяет ОС точно знать, что делается на диске, но опять же, это только делает эффективную разницу в отношении производительности и надежности файловой системы реализован на одном диске.

Если ваш поставщик услуг использует сеть Fibre Channel SAN, то стоимость одного гигабайта памяти будет по крайней мере в 8 раз выше, чем покупка диска с полки в ближайшем магазине. Но есть другие подходы что может значительно снизить стоимость.

Обратите внимание, что это все равно никогда не будет дешевле, чем покупка готового диска, поскольку вы также платите за избыточность, мощность, кондиционирование и поддержку, но эти затраты должны быть небольшими по сравнению с расходами на хранение.


6





Я согласен с другими сообщениями о качестве того, что предлагает хостинговая компания. Но мы недавно перешли на наш хостинг-контракт и купили его, и никто не был конкурентоспособным на складских площадках, и цены не были ниже нашего предыдущего 3-летнего контракта. Приводы SAS снижались, дисковые полки / массивы / SAN / FC / переключатели снижались, все снижалось в цене. Но не дисковое хранилище?

Коллега с гораздо большим опытом указал на тактику. ЦП, память, ширина полосы пропускания были ослепительными! Подпишите здесь! Зарегистрируйтесь сейчас и проигнорируйте это дисковое пространство! Вам не нужно столько места на диске. Посмотрите на процессор и память!

Как только вы соглашаетесь на их контракт, они действительно получили вас, и они составляют свой доход на диске. Да, это RAID-5 и высокая производительность и т. Д., Но резервные копии стоят дорого, а репликация вне компании стоит больше.

Для хостинговых компаний это бизнес-модель. Большинство предприятий делают что-то похожее с их ценами - снижают эту цену здесь, но увеличивают этот показатель, чтобы заработать в другом месте. Они также должны платить свою арендную плату и зарплату.

Для внутренних серверов у вас разные проблемы. Вы не можете просто зайти в серверную комнату с коробкой Fedex с новым жестким диском 3Tb. Если вы планируете расширять, это проще, но серверы / стойки / массивы уже могут быть в своем классе с точки зрения слотов, ввода / вывода, карт контроллера, питания.

Это как смотреть под скалой, вы будете удивлены тем, что можете найти.


5



Стоимость дисков может снизиться, но рабочая сила растет. CapEx не является самой большой частью TCO. - Chris S


Также важно отметить, что «локальное» хранилище может стоить дороже, чем вы думаете.

В рамках упражнения, направленного на перенос некоторых из наших «архивных» данных в облако, я недавно завершил процесс ценообразования, сравнивающий стоимость доступного (например, форматированного, а не необработанного) дискового пространства, доступного в нашей последней SAN, против стоимости хранения в службе данных облачных данных Amazon.

Просто учитывая цену, заплаченную за сам SAN, включая диски, предполагая, что для оборудования SAN потребуется 5 лет, и не «накладные» расходы на запуск серверной комнаты, наша цена за 150 ГБ локального хранилища составляет 31,88 долларов США в месяц против $ 28,41 Amazon (при условии, что скорость трафика в месяц составляет 20% вверх и вниз).

Теперь я не собираюсь бросаться и переносить все наше хранилище в облако, потому что есть другие преимущества в локальном хранилище, но я думаю, что такое упражнение по ценообразованию полезно: Если вы считаете, что облачное хранилище дорого, то сколько вы действительно платите за местное хранилище?


5





Я беру на себя этот вопрос - это простой IO ... файл, который сидит на одном жестком диске с товаром без рейда и, вероятно, без горячей замены, и к нему обычно обращается один человек и, вероятно, никогда не подкрепляется. Это дешевый и простой способ ввода-вывода ...

В нашем бизнесе я использовал один из самых дорогих методов рейда (рейд 10), который требует как минимум 4 приводов, мы используем 6 ... это дает нам высокую скорость ввода-вывода и отказоустойчивость.

Эта конфигурация значительно изменила мой a $$, и этот результат означал более высокую производительность и меньшее время простоя для конечных пользователей. Для простого ввода-вывода есть только один человек, который разочаровывается, и, вероятно, небольшая финансовая стоимость связана с временем простоя.

У нас также есть выделенный сервер iSCSI, который используется для виртуализации Xen, который также настроен для рейда 10 ...

Чем больше IO необходимо использовать и резервировать, тем более дорогостоящим является его реализация ... если ваше корпоративное требование будет принимать потери данных, очень медленные скорости и отсутствие избыточности - тогда хранение бизнес-класса может быть выполнено на дешево !!! Просто будьте готовы уволить ...


4