<НА ГЛАВНУЮ

NVIDIA выпустила срочный хотфикс для решения проблемы перегрева и некорректного мониторинга температуры GPU

NVIDIA выпустила срочный хотфикс для устранения проблем с перегревом и некорректным мониторингом температуры, вызванных последним обновлением драйвера 576.02, затронувшим пользователей AI и игр.

Срочный хотфикс для исправления ошибок в отображении температуры GPU

NVIDIA оперативно выпустила хотфикс после релиза драйвера версии 576.02, который вызвал обеспокоенность среди сообществ AI и геймеров. Обновление драйвера заставляло системы неверно показывать безопасные температуры GPU, в то время как нагрузка на систему охлаждения увеличивалась до потенциально опасных уровней.

Суть проблемы

В официальном сообщении о хотфиксе NVIDIA указала данную проблему как третью по списку исправлений, описав её так: «Утилиты мониторинга GPU могут перестать отображать температуру GPU после выхода компьютера из спящего режима.»

После выхода драйвера 576.02 пользователи на платформах, таких как сабреддит Stable Diffusion и форумы NVIDIA, сообщали, что инструменты вроде MSI Afterburner и внутриигровые мониторы перестали обновлять данные о температуре GPU, застывая на отметках около 35-36°C. Для восстановления корректных показаний требовалась полная перезагрузка системы, при этом некоторые программы, такие как HWInfo и собственное приложение NVIDIA, продолжали работать правильно.

Отчёты пользователей о рисках перегрева

Пользователи отмечали аномальное поведение вентиляторов и сбои в терморегуляции: GPU простаивали при более высоких температурах, чем ожидалось, и перегревались при обычных нагрузках. Один из пользователей рассказал, что вентиляторы работали на максимальной скорости, несмотря на низкую температуру воздуха в комнате, а изначально нормальные показания температуры позже оказались неверными.

Причина связана с поведением систем Optimus

Обновление драйвера 576.02 внесло изменения, влияющие на отображение температуры, особенно в системах NVIDIA Optimus. Эта технология переключает графику между интегрированной и дискретной для оптимизации энергопотребления, переводя GPU в режим пониженного энергопотребления при отсутствии нагрузки. Этот режим заставляет утилиты мониторинга показывать некорректные значения температуры, часто нулевые.

Обновление расширило такое поведение и на системы без Optimus, позволяя GPU переходить в режим пониженного энергопотребления при простое и нарушая корректность данных температуры в сторонних инструментах.

Аппаратные защиты и сохраняющиеся риски

Хотя прошивка VBIOS контролирует тепловые и энергетические лимиты для защиты GPU, неправильная работа вентиляторов и ложные показания температуры могут привести к длительному перегреву и постепенному ухудшению работы оборудования. Отсутствие корректных данных о температуре также может ввести пользователей в заблуждение, заставляя применять ненужные или вредные меры.

Влияние на AI и игровые нагрузки

Ошибка драйвера особенно критична для AI-специалистов, использующих GPU при высоких нагрузках длительное время, что увеличивает риск перегрева. Несмотря на жалобы, драйвер 576.02 оставался доступен для скачивания, однако NVIDIA выпустила хотфикс для устранения проблемы.

Отзывы пользователей после обновления

Некоторые пользователи столкнулись с аварийными перезагрузками GPU из-за перегрева и решали проблему снижением напряжения и заменой термопасты. Другие сообщили, что из-за некорректных показаний температуры их пользовательские кривые вентиляторов не срабатывали, что также приводило к перегреву, который исчезал после отката на предыдущую версию драйвера.

NVIDIA продолжает выпускать хотфиксы для различных игр и платформ, но данный случай подчёркивает важность точного мониторинга температуры, особенно для пользователей, максимально нагружающих свои GPU в AI или играх.

🇬🇧

Switch Language

Read this article in English

Switch to English