Ноутбук работает на 30 ° больше, чем обычно; CPU / Load, как сообщается, нормальный. Что может вызвать это и как я могу его диагностировать?

Я использую последнюю версию Arch Linux на моем ноутбуке ThinkPad t420, и у меня проблема с прерывистой теплотой, когда мой темп повысится с типичного от 45 ° C до ~ 75-90 ° C и останется там до тех пор, пока я не перезагружу.

Я запустил несколько диагностических инструментов, в том числе очевидные htop и другие, которые предлагал googling, включая powertop , iostats и, конечно же, другие, о которых я не помню. Пока у меня нет очевидных проблем и, по-видимому, нет различий в показаниях, работает ли моя машина нормально или в этом горячем состоянии.

Я также убил большинство подозрительных процессов один за другим (базы данных и другие демоны), надеясь найти скрытого преступника, безрезультатно.

Помимо этих попыток я не знаю, с чего начать поиск неисправностей . Я надеюсь, что кто-то может указать мне в правильном направлении, чтобы начать искать более глубокую проблему.

Если быть точным, мой вопрос заключается не в том, как охладить мою машину, а в том, что может привести к постоянному изменению температуры в 30 градусов в системе, где (по сообщениям) CPU и нагрузка нормальные? И какие инструменты / методы я могу использовать для диагностики?

Некоторые примечания, которые могут быть полезны:

  • Я могу охладить систему (например, полностью отключив управление вентилятором), но сразу же нагревается, если оставить ее в покое. Это, по-видимому, свидетельствует о том, что удержание тепла не является проблемой, а что-то постоянно производит тепло.
  • Загрузка процессора и загрузка сообщаются htop как обычно после входа в это горячее состояние. Это включает в себя потоки ядра. Согласно htop , система по существу неактивна (использование процессора на 1-2% для системы, нагрузка 0,10).
  • Моя машина использует интегрированную графику Intel HD и не имеет другой видеокарты . Карточка nVidia была вариантом для этой модели, как отмечает @braiam; Я не выбрал это.
  • @terdon поднял настройки регулятора процессора. Мои процессоры настроены на powersave
  • Мой конкретный процессор – 2,7 ГГц Core i7-2620M.

Edit : На момент написания этого вопроса мой fancontrol функционировал неправильно и постоянно работал в среднем диапазоне оборотов (3900 об / мин) даже при высоких темпах. По предложению @Alex и @JustDanyul это исправлено. Однако основная проблема остается.

  • Как передать функциональные клавиши в htop в tty?
  • Создание суммарного обзора htop
  • Запустить Linux-процесс с очень низким приоритетом?
  • Включение htop в виджет
  • Как узнать, когда был убит процесс
  • Каковы значения ставок, связанных с IO?
  • В чем смысл задач и работы на экране htop?
  • htop показывает различное количество процессов для браузера Chromium в Linux и FreeBSD
  • 5 Solutions collect form web for “Ноутбук работает на 30 ° больше, чем обычно; CPU / Load, как сообщается, нормальный. Что может вызвать это и как я могу его диагностировать?”

    Веселье

    Моя тоже делает это, запуская Fedora 14. Попробуйте получить сжатую банку воздуха и выдувать вентиляционные отверстия на задней и боковой стороне корпуса.

    Также периодически вы можете удалить клавиатуру и продуть сжатый воздух прямо на лопастях вентилятора. Они засыпаются пылью и начинают влиять на ее эффективность, взвешивая ее.

    Самое лучшее в ThinkPad – это руководства по обслуживанию! Они показывают вам, как снести ноутбук и вернуть его вместе.

    Плохой процесс

    Другая вещь, которую я заметил, – это то, что у меня иногда будет процесс, который пойдет наперекосяк и будет потреблять 100% одного из ядер. Убить этот процесс обычно приводит к нормализации нормальной температуры.

    Вы можете использовать htop или top чтобы узнать, что это за процесс, и либо убить его, либо из терминала, используя его PID .

    что еще?

    См. Мой ответ на этот U & L Q & A для получения дополнительных советов о том, как читать температуру для различных компонентов вашего ноутбука. Вопросы и ответы озаглавлены: Как получить температуру ядра haswell i7 в i3status .

    Это скорее длинный комментарий, но вы должны взглянуть на thinkwiki.org, это ресурс для Linux на ThinkPad. Что касается температуры, у меня были подобные проблемы с моим t4500 и отсортированы, играя с

    1. Регулятор ЦП, который управляет масштабированием частоты процессора. Ваш выбор:

      • Производительность поддерживает процессор на максимально возможной частоте
      • Powersave сохраняет процессор на минимально возможной частоте
      • Пользовательское пространство экспортирует доступную частотную информацию на пользовательский уровень (через файловую систему / sys) и разрешает управление пространственным управлением частотой процессора
      • Ondemand масштабирует частоты процессора в соответствии с потреблением процессора (например, демоны для масштабирования частоты в пользовательском пространстве, но в ядре)
      • Консервативные действия, такие как ondemand, но постепенно увеличивают частоту

      С ondemand ваш процессор будет работать только с максимальной скоростью, когда это необходимо. В идеале, это будет полностью прозрачно для вас, машина будет работать так же быстро, как это необходимо для текущих задач. Чтобы активировать его,

       sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor 
    2. Управление вентилятором. Существует очень приятная утилита под названием « Simple ThinkPad Fan Control », которая позволяет вам точно настроить температуру запуска, изменяя скорость вентилятора. Также ознакомьтесь с информацией здесь .

    Я думаю, что есть проблема в том, что вы воспринимаете как «горячую». Для Thinkpad t420 (в соответствии с форумами ) составляет около 80-85 C и позволяет забыть карту nVidia, которая также может вызвать повышение температуры (на самом деле конфигурация Optimus может не работать, заставляя ваш процессор работать с GPU). Это говорит о том, что максимальная допустимая температура вашего процессора составляет 100 ° C (если он доберется до тех пор, пока система отключится), а окружающая среда составляет от 10,0 ° C до 35,0 ° C. Тем не менее, если ваш ноутбук находится в пределах диапазона, все в порядке (за исключением срока службы батареи и ноутбука).

    Теперь вы хотели указать на возможных подозреваемых. В этом аспекте я бы сказал, что плохая реализация nVidia с Linux может бросить работу на ваш процессор, который не будет отображаться в htop (или в любом месте) из-за их печально известной системы Optimus On-Demand Optimus, которая, похоже, соответствует вашему текущему затруднительному положению ( он работает нормально до момента, он просто начинает нагреваться без контроля). Вы должны обновить свою установку до тех пор, пока не будет полностью настроена Bumblebee. Вы можете использовать bbswitch для разворачивания карты nVidia по своему усмотрению и посмотреть, как это происходит.

    Чтобы установить Bumblebee for Arch, вы можете найти пакет в репозитории. Если вы все еще не установили его.

    датчики показывают мой вентилятор, жужжащий вдоль ~ 3900 об / мин

    Даже при температуре, например, ~ 75-90 ° C?

    как при ручном увеличении вентилятор охладит машину временно

    Таким образом, одна проблема заключается в том, что скорость вентилятора не работает автоматически?

    Забудьте об авто, вы можете правильно прочитать температуру, и вы можете вручную управлять скоростью вращения вентилятора, верно? Если это так, вам нужно всего лишь найти сценарий управления рабочим вентилятором или опрокинуть свой собственный (опросить температуру и установить скорость в соответствии с табличной temp[i]=speed[i] , когда вы установите более высокую скорость, сохраните ее на какое-то время, даже если температура опустится, когда вам нужно замедлить скорость, сделайте это медленно и шаг за шагом).

    Об опросе лучше всего будет иметь демон монитора температуры, который запускает события теплового изменения, а скрипт управления вентилятором, слушающий / ожидающий эти события, хотя (возможно, ошибочно), когда он был acpid но в настоящее время я не знаю.

    В обоих случаях (ваш собственный / существующий скрипт), в то время как вы не уверены в решении, всегда следите за температурой и скоростью вращения, вентилятор не должен останавливаться.

    Сначала разрешите эту проблему, и если перегрев сохранится, вы можете сосредоточиться на причине.

    редактировать

    Возможно, вы захотите попробовать инструмент, такой как lttng для сбора статистики всей системы за время, но может быть нелегко настроить и может быть дорогостоящим с точки зрения хранения, если вам нужно собирать в течение длительного времени.

    Поскольку ручное увеличение вентилятора решает проблему, это будет отличное место для начала устранения неполадок, так как это, по-видимому, говорит о том, что автоматическое управление вентилятором не работает.

    Теперь вы запускаете arch linux, который является блестящим дистрибутивом (да, я тоже его запускаю) с потрясающей вики. Итак, я должен спросить, ты сделал RTFM? ;п

    https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

    Насколько я вижу, вам необходимо:

    1. включить модуль ядра thinkpad_acpi
    2. установить и настроить приложение thinkfan из AUR
    3. включить службу системы thinkfan

    Все это сделано?

    ОБНОВЛЕНИЕ Я рад слышать, что ваш поклонник теперь работает правильно, а не просто вращается на счастливой среде. (Я полагаю, это разрешило проблему работы вашей машины при температуре более 80 градусов?)

    Что касается ответа на вопрос о том, что является основной причиной изменения температуры на 30 градусов, ну, у меня возникает соблазн спросить: не могло ли это быть из-за того, что ваш вентилятор работал неправильно?

    Давайте постулируем, что,

    • процессор не работает больше, чем обычно
    • колебания температуры теперь заменяются флуктуациями скорости вращения вентилятора

    Не было бы безопасным предположить, что вообще не может быть проблемы, и что проблема была просто в том, что вы поклонник бежал на том уровне, где он едва справлялся? И небольшие изменения температуры окружающей среды и т. Д., Ограничивают его возможности?

    Например, у меня был ноутбук Acer, и в теплые дни поклонник «постоянно» вращался вверх и вниз. Бьюсь об заклад, если бы мой поклонник не смог сам настроить его, я бы тоже видел довольно большие колебания температуры 🙂

    Linux и Unix - лучшая ОС в мире.