Вопрос: Чрезмерное количество спальных процессов в CentOS - как диагностировать? [закрыто]


У меня много спальных процессов, около 600, большинство из которых - процессы Apache.

Должен ли я убить все эти спальные процессы, или это сделает Apache полностью завершенным?

Почему эти процессы спасут в первую очередь?

Сервер работает с CentOS 6 с Apache 2.2.


5
2017-11-25 07:13


Источник


Вы, вероятно, не хотите этого делать. Какова фактическая проблема, которую вы пытаетесь решить? - Iain
apache перестает отвечать несколько раз в день. при перезапуске проблема не решена. Я меняю httpd.conf несколько раз, но проблема еще не решена. Я не знаю, что мне делать ... - mr.soroush
Имеются ли какие-либо релевантные сообщения в ваших файлах журналов? - Iain
Нет, ничего в файлах журналов - mr.soroush
Почему существует 600 процессов для Apache? У вас есть сервер Википедии? Или проблема в скрипте? - Dom


Ответы:


Уничтожение всех спальных процессов вашей системы не решит проблемы, не говоря уже о той проблеме, которую вы испытываете.


Быть структурированным и методичным в вашем подходе намного лучше, чем крутиться вокруг дико.

Лично я нахожу Научный метод (другие называют это что-то другое) замечательный инструмент для выхода из комплекта системного администрирования при диагностике проблем.

  1. Какова проблема, которую вы пытаетесь решить?

Служба перестает отвечать.1

  1. Итак, теперь мы знаем, какова фактическая проблема, которую мы решаем, мы имеем какое-то направление. Давайте соберем некоторую информацию, чтобы помочь нам найти решение.

    • Связана ли проблема с временем? Случается ли это регулярно или случайным образом.
    • Проверьте свои журналы, все они, а не только журналы конкретных служб, поскольку что-то еще может вызвать проблему. Записи журнала обычно имеют временные метки, это помогает вам сопоставлять события между несколькими приложениями и службами - используйте их. При необходимости увеличьте также многословность.
    • Посмотрите, что делает ваша система. Используйте инструменты, такие как top, vmstat, iostat, sar, ps, tcpdump или даже полномасштабные системы мониторинга,

  2. Проанализируйте собранную информацию. Что на самом деле происходит в системе, когда служба перестает отвечать? Каково состояние ресурсов системы?

  3. Принять соответствующие меры для исправления. Надеюсь, это довольно очевидно, что происходит, у вас заканчивается память, и убийца OOM выходит, чтобы играть, ваша активность подкачки слишком высока, ваша очередь запуска слишком длинная, вы iobound и т. Д. Если это не очевидно, вероятно, не собирать правильные данные - вы знаете, что делать, вернитесь к 2.

  4. Проследите, какие изменения внесены в 4. сделайте.

  5. Были ли изменения исправлены? Это лучше? Это хуже? Разве нет разницы? Откуда вы идете отсюда, зависит от того, что вы найдете. Возможно, вам придется вернуться к 2. и собрать более подходящие данные или 3. пересмотреть данные, которые у вас есть, или 4. потому что вы определили ряд потенциальных решений.

  6. Документируйте ваши выводы и сделанные вами изменения.

  7. Вернитесь в постель / дом с работы / в паб.

1 Это может быть что угодно, хотя «Мой сервер медленный», «Мой сервер использует слишком много памяти» ...


20
2017-11-25 09:59