Вопрос: На сервере с двумя процессорами нормально ли один процессор работать быстрее, чем другой?


У меня есть двойной сервер Opteron с Linux с libvirt для размещения нескольких виртуальных машин. VM работают нормально, и сервер работает нормально, но я заметил, что один процессор всегда работает около 69C (дроссели при 70C), а другой работает около 15C.

Мне это не кажется нормальным? Разве они не должны быть немного ближе к температуре?

Я не уверен, как дианановать дальше. Может быть, на одном из процессоров недостаточно термопасты?

Изменить: материнская плата ASUS KGPE-D16 и охлаждается двойным Вентиляторы Noctua NH-U9DO,

Обратите внимание: я думаю, что температура может быть выше атмосферных, а не абсолютных значений? Когда сервер работает на холостом ходу, температура процессора падает до 2C и 13C. Я использую конфигурацию lmsensors из Вот


47
2017-11-27 12:28


Источник


Что такое сервер make / model? - ewwhite
Как распределяется загрузка процессора? mpstat -P ALL 1 на linux поможет - Christopher Perrin
звучит как сломанный температурный датчик - matcheek
15C, скорее всего, сломанный цензор .... - Reaces
Кажется, что это сломанный или плохо откалиброванный датчик, если вы можете перезагрузить сервер, посмотрите на BIOS, который должен отображать правильные значения.


Ответы:


Проблема оказалась плохой радиатор. Может быть, плохо подходит, это не правильное описание. Оказывается, вы должны нанести тепловую пасту на радиатор, а не на пластиковую крышку, которая проходит через радиатор.

enter image description here

После снятия пластиковой крышки, процессор хорош и крут, спасибо всем!


106
2017-11-28 00:18



+1 только потому, что это смешно - HBruijn♦
Вы имеете в виду, что кто-то оставил пластиковую крышку на месте, а затем наложил на нее пасту, а затем положил на нее радиатор? Эпическая. - TomTom
Baaaaaahaaahaaahahahaa !! - Craig
Мне нравится, как вы можете видеть условия и условия, ограниченную гарантию и политику возврата в фоновом режиме. :) - Lightness Races in Orbit
Если это заставляет вас чувствовать себя менее глупым (и это не так), я сделал аналогичную вещь с моим новым офисным кофеваркой. Кофе был слишком холодным, чтобы выпить, и я упаковывал его обратно для возвращения в магазин, прежде чем диск защитного картона упал с нагревательного элемента :) - Martin James


По моему опыту, для парных компонентов в корпусе нормально работать при разных температурах, поскольку воздушный поток не везде одинаковый. Вот график температуры жесткого диска в моем колоковом ящике. Диски зеркалированы, поэтому рабочие нагрузки на них близки к идентичным.

munin graph of HDD temps over past year

Как вы можете видеть, они отслеживают друг друга, но они не то же самое; они также, в среднем, всего на 6C друг от друга. Независимо от того, указывают ли ваши датчики абсолютную температуру или перегрев, разница в 55 ° C под нагрузкой кажется очень плохой ошибкой. Если у вас есть уверенность в правильности данных, то, учитывая, что разница в покоя падает до 10C, какая разница, которую я вижу из-за воздушного потока, я подозреваю, что плохо установленный радиатор.


23
2017-11-27 12:53



Используя mpstat (от Кристофера Перрина, спасибо!), Я подтвердил, что нагрузка распределена довольно равномерно. Сейчас на холостом ходу на + 3С и + 20С. Я собираюсь попытаться поиграть с радиатором, чтобы убедиться, что он свободен. Считаете ли вы, что это может быть проблема с термической пастой? - samoz
Это очень возможно (и тем более после того, как вы начнете его вилять). - MadHatter


Это не. Если у вас нет серьезных проблем с воздушным потоком. Или один из кулеров плох. Температура будет варьироваться - но не так много (70 против 15 градусов Цельсия).

Учитывая, насколько низкий уровень 15 градусов, я бы предположил, что (a) ваш датчик выключен (вы действительно храните сервер в этой прохладной комнате?).

Я бы также предположил, что по какой-то причине один из процессоров просто не работает.

Небольшие различия в норме. Некоторые маленькие большие могут быть (поток воздуха приходит мне в голову). но здесь мы говорим о том, что ХОЛДИ.


7
2017-11-27 12:31





Это может быть как охлаждение, так и неравномерная загрузка (учитывая временную разницу в вашей ситуации, вероятно, неравномерная загрузка). Вы должны использовать что-то вроде prime95, чтобы равномерно загрузить все ядра и посмотреть, не меняется ли темп. Если это не так, вам нужно сбалансировать виртуальные машины, убедитесь, что ваши приложения многопоточны и заняты. Как это сделать, зависит от вашего программного обеспечения и индивидуальной рабочей нагрузки, так что это действительно выходит за рамки вопроса. Имейте в виду, что нет реального преимущества для этого, если у вас недостаточно нагрузки для получения одного процессора / ядра, на самом деле ваша виртуальная машина может умышленно избежать использования второго процессора, чтобы он мог перейти в режимы энергосбережения на мульти -cpu.

Если вы сузили его до охлаждения. Небольшая разница до 10C может быть слишком малой (или слишком большой!) Термопастой. Большая разница указывает на значительную проблему или разницу между кулерами. Может быть, кто-то заблокировал воздушный поток, радиатор был сброшен и т. Д.


2
2017-11-27 12:38





Я должен согласиться, с дефектным временем. датчик, поскольку 15C - только 59F !!! Если бы компьютер не находился в чрезвычайно холодном центре данных, я бы предположил, что температура окружающего воздуха будет выше, чем 59F! Вы пытаетесь присвоить ВМ низкотемпературному ядру и посмотреть, нет ли каких-либо изменений; если нет, я бы очень сомневался, что датчик неисправен.

Вы также можете посмотреть результат dmesg (загрузочные сообщения) и посмотреть, нет ли там чего-то необычного.


0
2017-12-01 11:42