Всем доброго времени суток.
Пару дней назад возникла непонятна ситуация с двумя серверами на Windows server 2012 r2, проблема заключается в следующем:
Есть два сервера:
Server1 — AD, DNS, DHCP, SQL, общая папка
Server2 — RemouteApp, 1C-сервер (SQL работает на третьем сервере)
Файловый антивирус Dr.web.
1) В подключенной rdp сессии на Server1 перестают открываться приложения, ранее запущенные приложения работают но постепенно начинают отваливаться, причем окно программы становится серым с обозначением «не отвечает».
Если закрыть rdp сессию, то повторно подключиться не получится процесс застопорится на «Подготовка удаленного компьютера»
2) При локальном входе на сервер Server1 процесс подключения зависает на «Работает клиент групповой политики» и дальше не двигается
3) При всем при этом службы AD, DNS, DHCP и общая папка продолжают функционировать (доменных пользователей на компы пускает, интернет работает, адреса раздаются, на общую папку файлы записываются и считываются).
4) В журнале Windows ошибок нет.
Все эти проблемы можно было бы списать на железо но вчера такие же симптомы вылезли на Server2 + через некоторое время отваливается RemouteApp.
В логах Server2 появились две группы сообщений в следующей последовательности:
——
1) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «iphlpsvc».
2) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «Appinfo».
3) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «NlaSvc».
4) Служба «Служба регистрации ошибок Windows» перешла в состояние Остановлена.
5) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «Schedule».
6) Запись кэша входа в систему для пользователя user1@MYDOMEN.LOCAL оказалась самой старой и была удалена. Отметка времени записи: 11/12/2015 10:02:31.
7) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «iphlpsvc».
Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «NlaSvc».
9) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «ShellHWDetection».
——-
1) Запись кэша входа в систему для пользователя user2@MYDOMEN.LOCAL оказалась самой старой и была удалена. Отметка времени записи: 11/12/2015 9:53:02.
2) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «iphlpsvc».
3) Служба «Служба регистрации ошибок Windows» перешла в состояние Остановлена.
4) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «NlaSvc».
5) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «ShellHWDetection».
6) Превышение времени ожидания (30000 мс) при ожидании ответа транзакции от службы «Schedule».
7) Служба «Диспетчер настройки устройств» перешла в состояние Работает.
других ошибок в журнале нет.
Подскажите в чем может быть проблема и куда капать? Или чем можно про диагностировать сервер чтоб определить проблему?
В данной статье рассказано о средствах Windows, помогающих установить причину почему тормозит сервер. В статье рассмотрена операционная система Windows Server 2012 R2 — одна из самых популярных у VDS / VPS хостинг провайдеров.
При поиске причины тормозов сервера очень важно найти непосредственно процесс который создает наибольшую нагрузку на систему. В этом может оказать неоценимую помощь приложение perfmon которое входит в состав ОС Windows. Наибольший интерес для новичков будет представлять окно Resource Monitor.
Запуск Resource Monitor под Windows Server
Наиболее простой способ запуска это в окне Run (команда Win + R) набрать комманду perfmon /res.
Альтернативный вариант — в окне Task Manager (открывается комбинацией клавиш Ctrl-Shift-Esc) перейти на вкладку Peformance и внизу вкладки нажать на ссылку Open Resource Monitor.
Вкладка Performance дает общую информацию о системе, которая может быть также полезна. Можно понять загрузка какого ресурса близка к 100%: памяти, CPU или локальной сети.
Использование Resource Monitor для поиска причины почему тормозит сервер.
Очень часто поиск причины тормозов сервера начинают с проверки загруженности дисковой системы. Ниже представлено окно Resource Monitor на вкладе Disk.
На вкладке Disk Activity показана загруженность в процентах. Если загрузка, близка к 100%, то скорее всего дисковая система является причиной низкой производительности системы. Щелкая по заголовку Total (B / Sec) можно отсортировать файлы с которыми в данный момент роботает система по объему чтетния и записи на диск. Наиболее загруженный файл и будет причиной тормозов системы. Зная какой файл создает высокую нагрузку гораздо легче понять, какой процесс нагружает систему. Если это какой-то системный файл начинающийся с C:/Windows, то есть смысл воспользоваться поисковой системой, чтобы понять, какой системной службе принадлежит данный файл.
Следущей причиной может стать Сетевая нагрузка. Особенно это актуально для VPS серверов. В случае если вы подключаетесь по RDP то сетевый задержки могут ощущаться как тормоза сервера. Переходим на вкладку Network:
В первую очередь обращаем внимание на общую нагрузку сети. Если она близка к 100% процентам, то скорее всего проблема в сети. На вкладке Processes with Network Activity и TCP Connections мы можем найти название процесса, который нагружает сеть. К сожалению, системные и серверный службы запускаются при помощи системного файла svchost.exe, и часто непонятно какая именно служба загружает сеть. Но если, вы видите, что причина в svchost.exe, то причину нужно искать в службах Windows.
Бывает так, что вы запустили слишком много программ и у вас банально не хватает оперативной памяти. В этом случае нам может помочь вклада Memory. Иформация по процессам аналогична вкладке Network:
Самый простой случаей это загрузка CPU. Ее можно посмотреть на вкладке как на вкладке CPU так и в обычном Task Manager:
Таким образом, Resource Monitor предоставляет нам мощное средство для анализа текущей загруженности системы. Технической описание Resource Monitor на сайте https://msdn.microsoft.com/ru-ru/library/windows/desktop/aa372266(v=vs.85).aspx
Windows Server
Windows Server 2012 R2 Datacenter Windows Server 2012 R2 Standard Еще…Меньше
Симптомы
Рассмотрим следующий сценарий:
-
У вас установлена на сервере Windows Server 2012 R2 обновления 2927901 .
-
У пользователей, которые часто вход и завершите работу с сервером через удаленный рабочий стол.
В этом сценарии сервер становится медленным и в конечном итоге не отвечает.
Причина
Эта проблема возникает при вызове функции SetDefaultPrinter() , которая задает используемый по умолчанию принтер, реестр дескриптор остается открытым. В результате утечки.
Решение
Сведения об исправлении
Доступно исправление от службы поддержки Майкрософт. Однако данное исправление предназначено для устранения только проблемы, описанной в этой статье. Применяйте это исправление только в тех случаях, когда наблюдается проблема, описанная в данной статье. Это исправление может проходить дополнительное тестирование. Таким образом если вы не подвержены серьезно этой проблеме, рекомендуется дождаться следующего пакета обновления, содержащего это исправление.
Если исправление доступно для скачивания, имеется раздел «Пакет исправлений доступен для скачивания» в верхней части этой статьи базы знаний. Если этот раздел не отображается, обратитесь в службу поддержки для получения исправления.
Примечание. Если наблюдаются другие проблемы или необходимо устранить неполадки, вам может понадобиться создать отдельный запрос на обслуживание. Стандартная оплата за поддержку будет взиматься только за дополнительные вопросы и проблемы, которые не соответствуют требованиям конкретного исправления. Чтобы просмотреть полный список телефонов поддержки и обслуживания клиентов корпорации Майкрософт или создать отдельный запрос на обслуживание, посетите следующий веб-сайт корпорации Майкрософт:
http://support.microsoft.com/contactus/?ws=supportПримечание. В форме «Пакет исправлений доступен для скачивания» отображаются языки, для которых доступно исправление. Если нужный язык не отображается, значит исправление для данного языка отсутствует.
Предварительные условия
Для установки этого обновления в Windows Server 2012 R2, сначала необходимо установить обновление 2919355 .
Необходимость перезагрузки
После установки исправления компьютер необходимо перезагрузить.
Сведения о замене исправлений
Это исправление не заменяет все ранее выпущенные исправления.
Английский (США) версия данного исправления устанавливает файлы с атрибутами, указанными в приведенных ниже таблицах. Дата и время для файлов указаны в формате UTC. Дата и время для файлов на локальном компьютере отображаются в местном времени с вашим текущим смещением летнего времени (DST). Кроме того, при выполнении определенных операций с файлами, даты и время могут изменяться.
Сведения о файлах для Windows Server 2012 R2 и заметкиВажно. Windows 8.1 и Windows Server 2012 R2 исправления включены в те же пакеты. Однако только «Windows 8.1» отображается на странице запрос исправления. Для получения пакета исправлений, который применяется к одной или обеих операционных систем, установите исправления, перечисленные в разделе «Windows 8.1» на странице. Всегда обращайтесь к разделу «Применяется к» в статьи для определения фактических операционной системы, к которому применяется каждое исправление.
-
Файлы, относящиеся к определенному продукту, этапу разработки (RTM, SPn) и направлению (поддержки LDR, GDR) можно определить по номерам версий, как показано в следующей таблице.
Версия
Продукт
Контрольная точка
Направление поддержки
6.3.960 0.17xxx
Windows Server 2012 R2
RTM
GDR
-
Файлы МАНИФЕСТА (.manifest) и MUM (.mum), устанавливаемые для каждой среды, указаны отдельно в разделе Дополнительные сведения о файлах» для Windows 8.1 и Windows Server 2012 R2». Файлы MUM и MANIFEST, а также связанные файлы каталога безопасности (CAT) чрезвычайно важны для поддержания состояния обновленных компонентов. Файлы каталога безопасности, для которых не перечислены атрибуты, подписаны цифровой подписью корпорации Майкрософт.
Для всех поддерживаемых версий Windows Server 2012 R2 для систем на базе x64
Имя файла |
Версия файла |
Размер файла |
Дата |
Время |
Платформа |
---|---|---|---|---|---|
Pmcsnap.dll |
6.3.9600.17795 |
825,856 |
10-Apr-2015 |
01:07 |
x64 |
Ppcsnap.dll |
6.3.9600.17415 |
260,096 |
29-Oct-2014 |
01:45 |
x64 |
Печать management.lnk |
Неприменимо |
1,118 |
22-Aug-2013 |
06:44 |
Неприменимо |
Printmanagement.msc |
Неприменимо |
146,389 |
18-Jun-2013 |
15:10 |
Неприменимо |
Compstui.dll |
6.3.9600.17795 |
309,760 |
10-Apr-2015 |
01:55 |
x64 |
Dafprintprovider.dll |
6.3.9600.17415 |
269,312 |
29-Oct-2014 |
00:41 |
x64 |
Findnetprinters.dll |
6.3.9600.17415 |
66,048 |
29-Oct-2014 |
02:04 |
x64 |
Printui.exe |
6.3.9600.17415 |
62,976 |
29-Oct-2014 |
02:43 |
x64 |
Puiapi.dll |
6.3.9600.17415 |
192,512 |
29-Oct-2014 |
00:55 |
x64 |
Puiobj.dll |
6.3.9600.17795 |
477,184 |
10-Apr-2015 |
01:11 |
x64 |
Localspl.dll |
6.3.9600.17796 |
1,091,072 |
13-Apr-2015 |
22:48 |
x64 |
Winprint.dll |
6.3.9600.17415 |
45,568 |
29-Oct-2014 |
01:24 |
x64 |
Win32spl.dll |
6.3.9600.17669 |
864,256 |
29-Jan-2015 |
01:04 |
x64 |
Prnntfy.dll |
6.3.9600.17415 |
221,184 |
29-Oct-2014 |
01:45 |
x64 |
Windows.systemtoast.print.notification.lnk |
Неприменимо |
1,515 |
22-Aug-2013 |
06:44 |
Неприменимо |
Winspool.drv |
6.3.9600.17796 |
512,512 |
13-Apr-2015 |
22:47 |
Неприменимо |
Splwow64.exe |
6.3.9600.17480 |
128,512 |
04-Nov-2014 |
06:27 |
x64 |
Spoolsv.exe |
6.3.9600.17796 |
827,392 |
13-Apr-2015 |
22:47 |
x64 |
Compstui.dll |
6.3.9600.17415 |
289,280 |
29-Oct-2014 |
01:52 |
x86 |
Dafprintprovider.dll |
6.3.9600.17415 |
203,776 |
29-Oct-2014 |
00:35 |
x86 |
Findnetprinters.dll |
6.3.9600.17415 |
55 808 |
29-Oct-2014 |
01:28 |
x86 |
Printui.exe |
6.3.9600.17415 |
61,952 |
29-Oct-2014 |
01:58 |
x86 |
Puiapi.dll |
6.3.9600.17415 |
167,424 |
29-Oct-2014 |
00:44 |
x86 |
Puiobj.dll |
6.3.9600.17415 |
367,104 |
29-Oct-2014 |
01:20 |
x86 |
Prnntfy.dll |
6.3.9600.17415 |
199,168 |
29-Oct-2014 |
01:15 |
x86 |
Winspool.drv |
6.3.9600.17796 |
397,824 |
13-Apr-2015 |
22:42 |
Неприменимо |
Сведения о дополнительных файлах для Windows Server 2012 R2
Дополнительные файлы для всех поддерживаемых версий Windows Server 2012 R2 для систем на базе x64
Имя файла |
Amd64_1931ab4e75aec455cc41bca0f725e9b8_31bf3856ad364e35_6.3.9600.17797_none_c941430d2186b666.manifest |
Версия файла |
Неприменимо |
Размер файла |
733 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_264e4068facf310aebf7e1a7f601c099_31bf3856ad364e35_6.3.9600.17797_none_d4d0f1d957e92d24.manifest |
Версия файла |
Неприменимо |
Размер файла |
732 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_387605f1609042bde6bc39e87d613dfe_31bf3856ad364e35_6.3.9600.17797_none_4be2674c2aec9e5c.manifest |
Версия файла |
Неприменимо |
Размер файла |
713 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_4f9830b733c10be5a6a8afd55a4488c0_31bf3856ad364e35_6.3.9600.17797_none_3f5947990e1c8fb2.manifest |
Версия файла |
Неприменимо |
Размер файла |
715 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_5a682078d3278c9752896f5c885ad193_31bf3856ad364e35_6.3.9600.17797_none_b20657a3e0839f4b.manifest |
Версия файла |
Неприменимо |
Размер файла |
713 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_81d0882cf7546cfdfd99e5f3662da67e_31bf3856ad364e35_6.3.9600.17797_none_0539bc9d5e178701.manifest |
Версия файла |
Неприменимо |
Размер файла |
1,453 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_ccdd6a12475fad457aff97aa77c6dd9e_31bf3856ad364e35_6.3.9600.17797_none_4498ee66b960e9bb.manifest |
Версия файла |
Неприменимо |
Размер файла |
733 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_d738af7998de4d102b4c8903680eb460_31bf3856ad364e35_6.3.9600.17797_none_ed5489553c0e3452.manifest |
Версия файла |
Неприменимо |
Размер файла |
1,089 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Amd64_microsoft-windows-p..erandprintui-pmcppc_31bf3856ad364e35_6.3.9600.17797_none_fc1ec3b954ae222f.manifest |
Версия файла |
Неприменимо |
Размер файла |
24,611 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Amd64_microsoft-windows-p..installerandprintui_31bf3856ad364e35_6.3.9600.17797_none_c70ac16cc9e8c793.manifest |
Версия файла |
Неприменимо |
Размер файла |
23,376 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Amd64_microsoft-windows-p..ooler-core-localspl_31bf3856ad364e35_6.3.9600.17797_none_20d1dfc866aa9582.manifest |
Версия файла |
Неприменимо |
Размер файла |
5,181 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Amd64_microsoft-windows-p..ooler-networkclient_31bf3856ad364e35_6.3.9600.17797_none_2a29bc8644e68099.manifest |
Версия файла |
Неприменимо |
Размер файла |
10,348 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Amd64_microsoft-windows-p..randprintui-asyncui_31bf3856ad364e35_6.3.9600.17797_none_6c97d3e8c622a1f4.manifest |
Версия файла |
Неприменимо |
Размер файла |
6,621 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Amd64_microsoft-windows-p..ting-spooler-client_31bf3856ad364e35_6.3.9600.17797_none_83e477ebecaa4d2d.manifest |
Версия файла |
Неприменимо |
Размер файла |
2,813 |
Дата (UTC) |
14-Apr-2015 |
Время (UTC) |
23:12 |
Имя файла |
Amd64_microsoft-windows-printing-spooler-core_31bf3856ad364e35_6.3.9600.17797_none_c70224ee958541bd.manifest |
Версия файла |
Неприменимо |
Размер файла |
244,450 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Package_1_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
1,839 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_2_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,089 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_3_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
3,240 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_4_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,304 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_5_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,069 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_6_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,095 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_7_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,328 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_8_for_kb3055615~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
2,305 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_for_kb3055615_rtm_gm~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
3,367 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Package_for_kb3055615_rtm~31bf3856ad364e35~amd64~~6.3.2.0.mum |
Версия файла |
Неприменимо |
Размер файла |
3,904 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
17:58 |
Имя файла |
Wow64_microsoft-windows-p..installerandprintui_31bf3856ad364e35_6.3.9600.17797_none_d15f6bbefe49898e.manifest |
Версия файла |
Неприменимо |
Размер файла |
22,630 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
Wow64_microsoft-windows-p..ooler-networkclient_31bf3856ad364e35_6.3.9600.17797_none_347e66d879474294.manifest |
Версия файла |
Неприменимо |
Размер файла |
9,132 |
Дата (UTC) |
14-Apr-2015 |
Время (UTC) |
23:03 |
Имя файла |
Wow64_microsoft-windows-p..randprintui-asyncui_31bf3856ad364e35_6.3.9600.17797_none_76ec7e3afa8363ef.manifest |
Версия файла |
Неприменимо |
Размер файла |
3,837 |
Дата (UTC) |
15-Apr-2015 |
Время (UTC) |
18:06 |
Имя файла |
X86_microsoft-windows-p..ting-spooler-client_31bf3856ad364e35_6.3.9600.17797_none_27c5dc68344cdbf7.manifest |
Версия файла |
Неприменимо |
Размер файла |
2,809 |
Дата (UTC) |
14-Apr-2015 |
Время (UTC) |
23:03 |
Статус
Корпорация Майкрософт подтверждает, что это проблема продуктов Майкрософт, перечисленных в разделе «Относится к».
Ссылки
Дополнительные сведения о терминологии , которую корпорация Майкрософт использует для описания обновлений программного обеспечения.
Нужна дополнительная помощь?
-
Question
-
Hello
Sometimes, Windows 2012 R2 servers hangs at splash screen (spinning dots) and never boot. They are virtual machine, installed on ESXi 5.5. To resolve this issue, we just have to reset the VM, then Windows boot normally.
All of our servers are affected. No memory dump is generated and there nothing is wrong in event viewer. Any ideas?
All replies
-
Hi,
where you have checked event? whether in physical machine or guest? better you have a check on physical machine events. and make sure that in physical machine all the drivers are installed properly…
Zia
-
Hello,
exact same situation over here.
Fully up to date vSphere 5.5 infrastructure. Only Windows 2012 R2 VMs affected. 2012 R2 running on physical hardware never showed this behavior. This happens after a reboot initiated after installing patches once a month (using LANdesk patch manager).
Regards,
Andreas
-
We are currently experiencing the same issue with our Server 2012 R2 VMs. The VM’s will be struck at the windows splash screen and the only way to fix them as of right now is to power them off completely and power them back on. We are running
vSphere 5.5 with Update 1 and all of our VM’s are running the latest guest tools. -
Unfortunately I have the issue too. We use System Center 2012 to deploy the patches. We are also on VMware 5.5.
-
I just created a case with Microsoft this afternoon and I am waiting to hear back from them. We use SC 2012 also for patch deployment. In most of our cases, this happens after a patch deployment however, I can’t duplicated this issue so far with
a reboot of the VM itself. The most recent event was when a DBA was installing additional SQL Roles on a Windows Server 2012 VM and a reboot was required to finished the install. The VM had to be powered off and powered back on again.I have also created a case with VMware and so far, they have turned up nothing.
-
We have the exact same issue. VMWare ESXi 5.5 Update 1 and Update 2 servers. The windows VM servers are patched by WSUS with 4 different patching times/groups. We have over 160 VMs, of which 25+ are now Windows 2012 R2 Servers.
All VMs patch correctly, but a RANDOM PORTON of the Windows 2012 R2 servers fail to complete their boot after patching (6 last patching cycle). They hang at the spinning circle of dots on the boot screen.I have so far not been able to track this one down. They seem to be hanging very early in the boot cycle — early enough that the volumes (drives) are not marked as dirty when you ‘reset’ the VM (i.e. Data Protection Manager does not need to run
a consistency check over the volumes at next boot-up).I ‘suspected’ this is to do with heavy I/O on the underlying datastores, but have not been able to prove it. I have moved a Windows 2012 R2 VM to a separate LUN that I then generated lots of I/Os against the LUN whilst I rebooted the VM. The
datastore latency went up to 160ms+ but the VM still rebooted just fine… It doesn’t rule out latency but I just can’t prove it…Another option I have considered, but haven’t tried yet, is to replace the virtual LSI controller with VMware ParaVirtual. Its not my standard, but if it is a bug in the LSI driver it would get around it. ParaVirtual driver comes with caveats
for MS Clustered VMs.Will be watching this thread with interest… There is definitely something wrong here. And I know I will be battling more and more Windows 2012 R2 that fail their late night patching cycles as the weeks go by. So much for ‘automated’
patching… -
I have a Class C ticket with Microsoft and VMware. VMware is still looking into all of the logs that I sent to them. I hate to say it but, the Microsoft engineer isn’t much of help. He states that there is very little that he can do since it isn’t consistent.
I been busy fighting other things at work and haven’t had the time to argue with him about gathering more data. That is interesting about the VMware parascsi controller and the data store. I will check into that on Monday. Maybe there is a correlation with
were the vm are located at within all of the data stores. I check the vm having this issue and I was thinking that maybe they are using the wrong hardware profile assignment. That isn’t the case. So far I haven’t been able to duplicate the issue at all. -
I also have opened a premier support call with Microsoft and they recommended I turn on boot logging and capture the memory through VMware snapshots when the failures happens. They will then analyze it. Hopefully next patch cycle we will have some more
failures and they can find something. -
We have the same issue — I have been researching this since April. I thought it might be related to the Automatic updates Microsoft saw fit to turn on — however I have been unable to find any common thread among the configurations of the settings.
Thanks for all the postings — will be watching with interest. -
GJMFL could you tell us a little about your environment, is it Vmware 5.5 or something else? Maybe we can find the common thread.
-
VMWare ESXi 5.5 Update 1 — Server 2012 R2. I am looking at everything — other users who never logged off — automatic update settings (we use a WSUS server) — although it happens sometimes when I go out to Microsoft update site. I have been trying
to test various scenarios to find something. -
I have been on PTO this weekend where I work so I haven’t been checking my email until this morning. VMware finally has gotten back to me. There is a bug with ESXi and their engineers are working on a fix. VMware suggests making one of
the changes below. If anyone implements any of these changes, please let me know if it does or doesn’t work.Starting with Windows 8 / Windows 2012 Server, during its boot process the operating system will reset the TSC (TimeStampCounter, which increments by 1 for each passed cycle) on CPU0. It does not reset the TSC of the other vCPUs and the resulting
discrepancy between two vCPUs’ TSC can result in the OS not booting past the Windows splash screen, and a full power off and on will fix it.Our engineering team here are currently working on a code change to accommodate this.
There is a workaround suggested from engineering to add a line of code to the vmx (configuration) file of the VM to prevent this from reoccurring.
This will basically tell the vmx file that the TSC for all vCPUs should be reset to zero on a soft reset of the machine, and not just CPU0.Please note that this has not been tested extensively by engineering, and should be run at your own risk as it is just a workaround which has not been fully QE tested.
This can be done a few ways:
First method: Manually editing the VM’s vmx file one VM at a time.
1. Power off the VM
2. Add the following line to the vmx file:
monitor_control.enable_softResetClearTSC = «TRUE»
3. Reload the VM
4. Power on the VM again.Second method: Doing this to every VM on a host at one time.
1. SSH to the ESX host
2. Run the following command:echo ‘monitor_control.enable_softResetClearTSC = «TRUE»‘ >> /etc/vmware/config
3. Run the following command to do a suspend-resume in order to apply the setting so that affected guests won’t hang during the next reboot:
vim-cmd vmsvc/getallvms | sed -n ‘s/(^[0-9]+).* windows8.*Guest.*$/1/p’ | while read vmid; do state=$(vim-cmd vmsvc/power.getstate ${vmid} | sed -n ‘s/^.*(Powered on).*$/1/p’); if [
«$state» ]; then vim-cmd vmsvc/power.suspendResume ${vmid} && sleep 5; fi; done;Last method: Using PowerCLI to do this to every VM in the environment.
Open PowerCLI, connect to vCenter server and run the following command:
ForEach ($vm in (Get-VM)){
$vmv = Get-VM $vm | Get-View
$name = $vmv.Name
$guestid = $vmv.Summary.Config.GuestId
$state = $vmv.Summary.Runtime.PowerState
$vmx = New-Object VMware.Vim.VirtualMachineConfigSpec
$vmx.extraConfig += New-Object VMware.Vim.OptionValue
$vmx.extraConfig[0].key = «monitor_control.enable_softResetClearTSC»
$vmx.extraConfig[0].value = «TRUE»
if ($guestid -like «windows8*Guest») {
($vmv).ReconfigVM_Task($vmx)
if ($state -eq «poweredOn») {
$vmv.MigrateVM_Task($null, $_.Runtime.Host, ‘highPriority’, $null)
}
}
}Note:
If you are using Solaris VMs in the environment, do not run this against those Solaris VMs as they could potentially hang with that setting in the vmx.
Also, when the script is running, do not do a vmotion, suspend, clone, or snapshot operation at the same time — this is very important, as it could cause the script to fail.From looking at the logs, it seems like you are not running Solaris as an OS anyway, at least on these 2 hosts:
rhayden@scripts-prod-3 HostLogs29thOct $ find esx*/vmfs/volumes/ -maxdepth 3 -name «*.vmx» -exec grep ‘guestOS’ {} ; | awk ‘{print $NF }’ | sort | uniq -c
5 «longhorn»
1 «longhorn-64»
1 «rhel6-64»
1 «sles11-64»
54 «windows7srv-64»
19 «windows8srv-64»
1 «winnetenterprise-64»
7 «winnetstandard»
1 «winNetStandardIf after applying these settings to the VMs this does not work after the next patching / updating (you are still seeing the issue), what we would need to do at that point is get the suspended state file for the VM to send to engineering, as we cannot
reproduce this issue in-house.If this occurs, this is how to gather the information we would need to send to engineering:
(Do not reboot the VM’s until this is done)1. SSH to the host and run the following command:
vm-support —listvms
2. Now run this command:
vm-support —performance —manifests=»HungVM:Coredump_VM HungVM:Suspend_VM» —groups=»Fault Hardware Logs Network Storage System Userworld VirtualMachines»
—vm=»</vmfs/volumes/path/to/virtualmachine.vmx>»(Change the path of the VM in the command above to the actual path).
That will put a tgz file in /var/tmp. The file name is displayed when complete. Copy this file off the host manually.-
Edited by
Friday, November 7, 2014 10:06 AM
-
Proposed as answer by
MJMorris
Thursday, May 14, 2015 1:33 PM
-
Edited by
-
Chirs,
Do you have any update from VMWare on this? We have a bunch of servers experiencing this problem.
-
Nathaniel, Other than the 3 workarounds that they suggested I make, no. I have inquired about when a real fix will be created and I haven’t heard back as of yet.
-
Chris,
Have you implemented any of the workarounds or are you waiting for an update? Please keep us posted on VMWare response please.
-
I plan on making these changes to 8-12 VM’s tomorrow and wait to see what happens. We will be patching our QA environment over the weekend.
As of right now, there isn’t a time frame if or when a VMware will create a patch for this.
-
Sorry for the delay in posting my results.
I have updated 10 2012 R2 VMs with the changes in the .vmx file. None of them experienced any issues upon rebooting when they were patched. I am going to expand my sample in our QA environment to 20 — 30 VMs however, I am going to say that making
those modifications did help.There isn’t a public KB article from VMware about this issue other than this one:
http://kb.vmware.com/kb/2082042
There is no ETA on a patch from VMware. I hope that this information helps.
-
Edited by
Chris Bonsted
Wednesday, November 26, 2014 3:01 PM
-
Edited by
-
We had this issue several months ago and Microsoft pointed us to clock time mismatch. They suggested we go to our Hypervisor vendor. VMware did minor investigations and found nothing of course. We are currently back to the same issue again
like your post. Finding your post here has made VMware release the internal document stating what you found, to us. It is still internal only to VMware and Microsoft.We have applied the PowerCLI script to all of our servers and it does modify the VMX without any issue. The problem is you still need to do a reset or power off/on via the virtual power buttons in VMware. OS reboots do not work. So we are
in the middle of scheduling outages for our 400+ 2012 servers.Thanks again for the post. I will post what VMware gave me on the symptoms for this issue to happen.
Symptoms:
Under the following conditions, you are:
Running Windows 8 or 2012 Server or later as the guest operating system on the virtual machine
Running on ESXi 5.5 or later with virtual machine hardware version 10 (vmx-10)
The virtual machine has not experienced a full power cycle (powered off / powered on) for more than two months.
The virtual machine is configured with more than one vCPU.
You might see the following symptoms:
After rebooting, Windows 8 or 2012 Server virtual machines might hang during the Microsoft Windows boot splash screenAfter resetting or power cycling the virtual machine, it will boot successfully.
The virtual machine might resume booting after multiple hours or days
A memory dump analysis might reveal thread blocking on a timer expiry hours or days in the future
The blocking thread might be stuck in KeDelayExecutionThread() during PciStallForPowerChange()Cause:
Starting with Windows 8 / Windows 2012 Server, during the boot process the operating -
Thanks for all the info in this thread. I have the same problem using ESXi 5.1 and 2012 R2 servers. Has anyone experienced this problem using 5.1?
-
Has anyone received any updates from VMware on this? We are experiencing the same issues after Windows updates. Any issues reported with the proposed workarounds?
Thanks,
Derek
-
Most likely this is low on VMware’s radar. I have not heard on when a fix will be issued. We have implemented this work around in our QA/Dev VM’s (about 100 of them) and we have not had any issues since the .vmx modifications where made.
-
I discussed this with VMware Support yesterday. Here’s an official KB article, hot off the press:
http://kb.vmware.com/kb/2092807
It has a few details not yet discussed on this thread, so definitely check it out if you’re affected by the problem.
Joe.
-
I’ve also been told that the fix/workaround is proposed to be included with ESXi 5.5 Update 3 and ESXi 6.0 Update 1.
-
Does anyone see this working in their environment? We have a few VMs that still hung on reboot with this applied. When comparing the Advanced configuration properties we noticed the script set the parameter as «monitor_control.enable_softResetClearTSC
= TRUE» while other parameters show their values as «true». Not sure if the «TRUE» vs «true» makes a difference. -
Machines in our environment also still hanging on with specified «monitor_control.enable_softResetClearTSC = TRUE» parameter. Maybe it requires server reboot to start applying this setting? In this case upcoming patching will show is it true
or not.
Also think that there no difference between «TRUE» and «true».-
Edited by
Andrej Trusevic
Wednesday, March 4, 2015 1:28 PM -
Proposed as answer by
MiliusXP
Friday, March 13, 2015 1:36 PM -
Unproposed as answer by
MiliusXP
Friday, March 13, 2015 1:36 PM
-
Edited by
-
I’ve applied the workaround, restarted hosts and still have the issue.
Lets wait and see what 5.5 U3 brings, no chance I’m touching ESXi 6 until U1 comes out, and when that does hopefully the fix will be in there too.
There is every chance it won’t be though; when I previously looked in to this issue (maybe 3 or 4 months ago now); I was lead to believe it was a Microsoft fault rather than VMware, the argument for this was a good one and I am yet to see Microsoft admitting
to anything. -
Requiert complete shutdown and restart
parameters are not case sensitive.
-
Has anyone heard anything more on this issue? I have applied the setting change and it does not make a difference…
I have to reboot multple times to get my VMs to come up.
-
Hi all,
Can someone please summarize this?
Doesn’t the VMware KB 2092807 have the resolution? It doesnt solve this bug?
If i use the PS script, do i still need to restart my VMs?(The scripts seems to do a «localhost» vmotion which should create a new vmx file?)
IF 9 2807
-
Has anyone opened a case with Microsoft on this issue? Is anyone seeing this in Hyper-V, Stand Alone, Xen? VMware has reported this to be a Microsoft issue and are unable to find any problems on the vmware side on our system.
-
I can confirm that VMware provided solution in KB 2092807 does not solve bug. Required parameter was set to all win2012 and win 2012R2 machines in our environment. All servers rebooted after that, but during this month’s patching some of them still
hangs -
@andriktr
Did you use the ps script?
//Johan
-
Yes, script was used for setting parameter
To set parameter without script you will be required turn off VM. It’s not possible manually editing VM config and set this param when VM is turned on. Using script you can set param without turning off VM.-
Edited by
Andrej Trusevic
Friday, March 20, 2015 10:30 AM
-
Edited by
-
Yep, but I don’t want to run the script on my production VMs if it doesn’t solve anything…..
//Johan
-
Can now confirm that I also experience the same problem even though I applied the «fix» ……
//Johan
-
Can also confirm that we are seeing this issue, have been for months and finally know why. Going to be opening cases regarding this issue. Same behavior, after being online for about a month 2012 R2 servers will get hung during automatic patch reboot.
-
I also created a ticket for VMWare support. Let’s wait for the answer.
-
Already get feedback from vmware support. They said that the fix described in KB2092807 should work if not we need to collect logs from host where VM is in hang status and provide for them. Also they provided another workaround — downgrade VM HW
to version 9.The good news is that they also confirmed this problem will be fixed in 5.5 U3 which will be released between 2nd and 3rd quartal.
-
Hello everybody,
kind of late to the party. We are running 2012 R2 on a physical machine using the Hyper-V role. This is a no-HA lab machine. We are having the same issues as described here, just with Hyper-V. Again, the HOST system is the Hyper-V server, guests are a mix
of XP to Server 2012 R2.I have no idea how I could apply any of the fixes described here to a physical machine.
Is there any news from Microsoft on this issue?
Regards,
Michael -
For those that say the «fix» using the powershell script did not work….you did read in the KB that «The virtual machine(s) need
to be shutdown and powered on for the changes to take affect.».Was that done…or do you simply do a reboot of the VMs (which would not fix), or some say they rebooted the ESX Host (which is not the fix).
-
What about reloading the VMX settings while the VM is running (Reference:
http://kb.vmware.com/kb/1026043), and then restarting normally? Has anyone tried that? It seems to work for other settings that normally don’t take effect without a full shutdown and poweron.—
Also, we’ve seen this same exact behavior since we installed Patch 4 for McAfee VirusScan Enterprise 8.8. It’s a known issue with Patch 4 (Reference:
https://kc.mcafee.com/corporate/index?page=content&id=KB78495 — issue 1020874). Patch 5 is supposed to be released to the general public next week.-
Edited by
Random Anonymous Name
Thursday, May 14, 2015 5:27 PM
-
Edited by
-
I don’t think this is all the problem
it seems this case only happens after installed a(sepcial one maybe) update, normal reboot just fine
-
pulling my hair out with this patch cycle and 2012 r2/5.5….found this thread, sorry that we are all having this problem but good to see I’m not the only one and going crazy. Found a workaround for all of the small environments. If you shut
down the server and start it from vmware there is no problem. I find that better than «crashing» it everytime it won’t boot…makes me a little nervous. I guess I’ll just do this until u3 comes out.Hope this helps someone out….have a good weekend.
-
Just got bit by this. Also a VM on 5.5. I’m thinking of changing to the PVSCSI driver to mitigate, as we don’t use this with any clusters. My fix was to RESET this VM in vCenter, and it came back. A bit nerve racking, as this is
a FS with a lot of data. -
ESXi 5.5 Update 3 is now available, which should fix the issue.
http://pubs.vmware.com/Release_Notes/en/vsphere/55/vsphere-esxi-55u3-release-notes.html
«Attempts to reboot Windows 8 and Windows 2012 server on ESXi host virtual machines might fail
After you reboot, the Windows 8 and Windows 2012 Server virtual machines might become unresponsive when the Microsoft Windows boot splash screen appears. For more information refer,
Knowledge Base article 2092807.This issue is resolved in this release.»
-
Proposed as answer by
Stiwa
Monday, September 21, 2015 9:36 AM
-
Proposed as answer by
-
hello
we having also this problem.
i updates all my esxi servers to the 5.5u3a and the problem didn’t solved.
what can i do??
thanks
-
I wonder why do people complicate their life with heterogeneous solution (with VMware). Hyper-V in R2 allows for better VM management, namely memory use during boot. I would focus attention on memory use in start of VMs. Extension of Powershell capabilities
for Hyper-V is another reason for this type of virtualization.It is better to create new thread instead of adding the same problem at the end of old thread.
M
-
Hi,
Pls find the below step to troubleshoot.
Are you using veeam or symantec backup application for backup.
When did you taken last backup of virtual machine.
Windows Security patches required…
-
Hi,
Pls find the below step to troubleshoot.
Are you using veeam or symantec backup application for backup.
When did you taken last backup of virtual machine.
Windows Security patches required…
Are there know issues with Veeam backing up 2012 R2 VMs? What windows security patches are you referring to?
I have a similar issue where, in my VMware 5.1 U3 environment, only on 2012 R2 servers, the Windows login screen freezes and does not allow console or RDP access. You can ping the server and even UNC browse to shares on the server, but you cannot login
or run remote commands. When you look at the VM console, it shows the login screen and the time on the login screen is stuck at some time in the past. -
Not sure why you even bothered to take the time to type such a smart arsed piece of nonsense. If you don’t have anything to add to the discussion then don’t bother. People on this thread will have been tearing their hair out to fix a problem and very few
of them will be the IT directors who decided whether to use Hyper-V or VMware.I would focus your attention on doing your own job or being helpful rather than commenting on a thread that apparently has nothing to do with you. Not sure how you built up so many points if all your input is of the same standard.
-
Amen brother. HyperV must not have any issues of its own. ;-P
Thanks to all, planning patching now.
-
Been a while since updates on this thread, has anyone been able to find a permanent fix for this?
-
Is there any update to this?
-
I’m also having this problem running esxi5.5 u2 but with hardware version 9.
Vmware support could not help me.
any updates
-
Issue also seen with Windows Server 2012 R2 installed on Cisco UCS C-Series physical server. Windows will hang at logon screen, unable to Ctrl + Alt + Delete via CIMC integrated KVM Console. Awaiting any update on this issue.
-
The information in the article fixed it for me! Thanks a million! I was on my way to opening a sev 1 with VMware when I stumbled across your article.
Note that in the article, the value is set to lowercase «true,» which worked for me. I mention this because the code at the top of the post uses uppercase «TRUE.» I know VMware can be finicky with case sensitivity sometimes
and I did not have time to verify if the uppercase «TRUE» also works.THANKS AGAIN! YOU SAVED MY ARSE!
-
FYI, we have this same issue post patching via SCCM on physical T130’s with Windows 2012 R2. I don’t think VMware has anything to do with it. Just hangs on reboot. We have 2008 Hyper Guests running on the Hyper hosts at remote locations.
-
We have this issue since today on a recently installed Windows Server 2012 R2 on IBM xSystem 3650 M2 server. It seems to happened after the installation of a bigger windows rollup packet via WSUS. First we’ve noticed the server wasn’t reachable via RDP
anymore after windows update reboot. On server console we found it at login screen, but not responding on CTRL+ALT+Del. After switching power off and on again server now hangs at «Restarting» screen with the spinning dots for more than two
hours now. -
Of course we shut them down.
How the hell would we do a reboot if we can’t get them to ACTUALLY boot in the first place?
-
We’re noticing this now on several of our VM’s we applied the March rollup to. And we’re running a fully patched ESXi 5.5 Update 3 environment…
As this thread is over 3 years old — this is inexcusable. I don’t care whose ‘fault’ it is — this needs to be fixed!
-
Having the same error.
I think it has got to do with Windows updates.
We have Hyper-V host 2012 R2, and VM’s 2012 r2. After patching them (windows update) they become very nonresponsive after the reboot.
Waiting for 25 minutes to Hyperv circle stop spinning and eventually it will start VM.
Very strange, but like other commented, it has nothing to do with either having VM on ESXI or HYPER-v, this must we windows update related for sure!
So, has anyone find other fix then forcely shutting down the VM and powering it off?
bostjanc
-
I confirm this issue.
It is happened to me, with same WmWare Vsphere 5.5 version.
I had to reset all my Windows 2012 r2 vm’s and then they boot normaly. -
I have a vSphere 5.5 update 3 environment and the funny thing is I do NOT see this problem with my Server 2012 R2 servers but I DO see this with several of my Windows 2016 servers. The funny thing is I do not allways see this problem however that might
have to do with the fact that one of the conditions seems to be:The virtual machine has not experienced a full power cycle (powered off / powered on) for more than two months.
I will investigate and have a look if setting the enable_softResetClearTSC will help here as well.
-
Question
-
Hello
Sometimes, Windows 2012 R2 servers hangs at splash screen (spinning dots) and never boot. They are virtual machine, installed on ESXi 5.5. To resolve this issue, we just have to reset the VM, then Windows boot normally.
All of our servers are affected. No memory dump is generated and there nothing is wrong in event viewer. Any ideas?
All replies
-
Hi,
where you have checked event? whether in physical machine or guest? better you have a check on physical machine events. and make sure that in physical machine all the drivers are installed properly…
Zia
-
Hello,
exact same situation over here.
Fully up to date vSphere 5.5 infrastructure. Only Windows 2012 R2 VMs affected. 2012 R2 running on physical hardware never showed this behavior. This happens after a reboot initiated after installing patches once a month (using LANdesk patch manager).
Regards,
Andreas
-
We are currently experiencing the same issue with our Server 2012 R2 VMs. The VM’s will be struck at the windows splash screen and the only way to fix them as of right now is to power them off completely and power them back on. We are running
vSphere 5.5 with Update 1 and all of our VM’s are running the latest guest tools. -
Unfortunately I have the issue too. We use System Center 2012 to deploy the patches. We are also on VMware 5.5.
-
I just created a case with Microsoft this afternoon and I am waiting to hear back from them. We use SC 2012 also for patch deployment. In most of our cases, this happens after a patch deployment however, I can’t duplicated this issue so far with
a reboot of the VM itself. The most recent event was when a DBA was installing additional SQL Roles on a Windows Server 2012 VM and a reboot was required to finished the install. The VM had to be powered off and powered back on again.I have also created a case with VMware and so far, they have turned up nothing.
-
We have the exact same issue. VMWare ESXi 5.5 Update 1 and Update 2 servers. The windows VM servers are patched by WSUS with 4 different patching times/groups. We have over 160 VMs, of which 25+ are now Windows 2012 R2 Servers.
All VMs patch correctly, but a RANDOM PORTON of the Windows 2012 R2 servers fail to complete their boot after patching (6 last patching cycle). They hang at the spinning circle of dots on the boot screen.I have so far not been able to track this one down. They seem to be hanging very early in the boot cycle — early enough that the volumes (drives) are not marked as dirty when you ‘reset’ the VM (i.e. Data Protection Manager does not need to run
a consistency check over the volumes at next boot-up).I ‘suspected’ this is to do with heavy I/O on the underlying datastores, but have not been able to prove it. I have moved a Windows 2012 R2 VM to a separate LUN that I then generated lots of I/Os against the LUN whilst I rebooted the VM. The
datastore latency went up to 160ms+ but the VM still rebooted just fine… It doesn’t rule out latency but I just can’t prove it…Another option I have considered, but haven’t tried yet, is to replace the virtual LSI controller with VMware ParaVirtual. Its not my standard, but if it is a bug in the LSI driver it would get around it. ParaVirtual driver comes with caveats
for MS Clustered VMs.Will be watching this thread with interest… There is definitely something wrong here. And I know I will be battling more and more Windows 2012 R2 that fail their late night patching cycles as the weeks go by. So much for ‘automated’
patching… -
I have a Class C ticket with Microsoft and VMware. VMware is still looking into all of the logs that I sent to them. I hate to say it but, the Microsoft engineer isn’t much of help. He states that there is very little that he can do since it isn’t consistent.
I been busy fighting other things at work and haven’t had the time to argue with him about gathering more data. That is interesting about the VMware parascsi controller and the data store. I will check into that on Monday. Maybe there is a correlation with
were the vm are located at within all of the data stores. I check the vm having this issue and I was thinking that maybe they are using the wrong hardware profile assignment. That isn’t the case. So far I haven’t been able to duplicate the issue at all. -
I also have opened a premier support call with Microsoft and they recommended I turn on boot logging and capture the memory through VMware snapshots when the failures happens. They will then analyze it. Hopefully next patch cycle we will have some more
failures and they can find something. -
We have the same issue — I have been researching this since April. I thought it might be related to the Automatic updates Microsoft saw fit to turn on — however I have been unable to find any common thread among the configurations of the settings.
Thanks for all the postings — will be watching with interest. -
GJMFL could you tell us a little about your environment, is it Vmware 5.5 or something else? Maybe we can find the common thread.
-
VMWare ESXi 5.5 Update 1 — Server 2012 R2. I am looking at everything — other users who never logged off — automatic update settings (we use a WSUS server) — although it happens sometimes when I go out to Microsoft update site. I have been trying
to test various scenarios to find something. -
I have been on PTO this weekend where I work so I haven’t been checking my email until this morning. VMware finally has gotten back to me. There is a bug with ESXi and their engineers are working on a fix. VMware suggests making one of
the changes below. If anyone implements any of these changes, please let me know if it does or doesn’t work.Starting with Windows 8 / Windows 2012 Server, during its boot process the operating system will reset the TSC (TimeStampCounter, which increments by 1 for each passed cycle) on CPU0. It does not reset the TSC of the other vCPUs and the resulting
discrepancy between two vCPUs’ TSC can result in the OS not booting past the Windows splash screen, and a full power off and on will fix it.Our engineering team here are currently working on a code change to accommodate this.
There is a workaround suggested from engineering to add a line of code to the vmx (configuration) file of the VM to prevent this from reoccurring.
This will basically tell the vmx file that the TSC for all vCPUs should be reset to zero on a soft reset of the machine, and not just CPU0.Please note that this has not been tested extensively by engineering, and should be run at your own risk as it is just a workaround which has not been fully QE tested.
This can be done a few ways:
First method: Manually editing the VM’s vmx file one VM at a time.
1. Power off the VM
2. Add the following line to the vmx file:
monitor_control.enable_softResetClearTSC = «TRUE»
3. Reload the VM
4. Power on the VM again.Second method: Doing this to every VM on a host at one time.
1. SSH to the ESX host
2. Run the following command:echo ‘monitor_control.enable_softResetClearTSC = «TRUE»‘ >> /etc/vmware/config
3. Run the following command to do a suspend-resume in order to apply the setting so that affected guests won’t hang during the next reboot:
vim-cmd vmsvc/getallvms | sed -n ‘s/(^[0-9]+).* windows8.*Guest.*$/1/p’ | while read vmid; do state=$(vim-cmd vmsvc/power.getstate ${vmid} | sed -n ‘s/^.*(Powered on).*$/1/p’); if [
«$state» ]; then vim-cmd vmsvc/power.suspendResume ${vmid} && sleep 5; fi; done;Last method: Using PowerCLI to do this to every VM in the environment.
Open PowerCLI, connect to vCenter server and run the following command:
ForEach ($vm in (Get-VM)){
$vmv = Get-VM $vm | Get-View
$name = $vmv.Name
$guestid = $vmv.Summary.Config.GuestId
$state = $vmv.Summary.Runtime.PowerState
$vmx = New-Object VMware.Vim.VirtualMachineConfigSpec
$vmx.extraConfig += New-Object VMware.Vim.OptionValue
$vmx.extraConfig[0].key = «monitor_control.enable_softResetClearTSC»
$vmx.extraConfig[0].value = «TRUE»
if ($guestid -like «windows8*Guest») {
($vmv).ReconfigVM_Task($vmx)
if ($state -eq «poweredOn») {
$vmv.MigrateVM_Task($null, $_.Runtime.Host, ‘highPriority’, $null)
}
}
}Note:
If you are using Solaris VMs in the environment, do not run this against those Solaris VMs as they could potentially hang with that setting in the vmx.
Also, when the script is running, do not do a vmotion, suspend, clone, or snapshot operation at the same time — this is very important, as it could cause the script to fail.From looking at the logs, it seems like you are not running Solaris as an OS anyway, at least on these 2 hosts:
rhayden@scripts-prod-3 HostLogs29thOct $ find esx*/vmfs/volumes/ -maxdepth 3 -name «*.vmx» -exec grep ‘guestOS’ {} ; | awk ‘{print $NF }’ | sort | uniq -c
5 «longhorn»
1 «longhorn-64»
1 «rhel6-64»
1 «sles11-64»
54 «windows7srv-64»
19 «windows8srv-64»
1 «winnetenterprise-64»
7 «winnetstandard»
1 «winNetStandardIf after applying these settings to the VMs this does not work after the next patching / updating (you are still seeing the issue), what we would need to do at that point is get the suspended state file for the VM to send to engineering, as we cannot
reproduce this issue in-house.If this occurs, this is how to gather the information we would need to send to engineering:
(Do not reboot the VM’s until this is done)1. SSH to the host and run the following command:
vm-support —listvms
2. Now run this command:
vm-support —performance —manifests=»HungVM:Coredump_VM HungVM:Suspend_VM» —groups=»Fault Hardware Logs Network Storage System Userworld VirtualMachines»
—vm=»</vmfs/volumes/path/to/virtualmachine.vmx>»(Change the path of the VM in the command above to the actual path).
That will put a tgz file in /var/tmp. The file name is displayed when complete. Copy this file off the host manually.-
Edited by
Friday, November 7, 2014 10:06 AM
-
Proposed as answer by
MJMorris
Thursday, May 14, 2015 1:33 PM
-
Edited by
-
Chirs,
Do you have any update from VMWare on this? We have a bunch of servers experiencing this problem.
-
Nathaniel, Other than the 3 workarounds that they suggested I make, no. I have inquired about when a real fix will be created and I haven’t heard back as of yet.
-
Chris,
Have you implemented any of the workarounds or are you waiting for an update? Please keep us posted on VMWare response please.
-
I plan on making these changes to 8-12 VM’s tomorrow and wait to see what happens. We will be patching our QA environment over the weekend.
As of right now, there isn’t a time frame if or when a VMware will create a patch for this.
-
Sorry for the delay in posting my results.
I have updated 10 2012 R2 VMs with the changes in the .vmx file. None of them experienced any issues upon rebooting when they were patched. I am going to expand my sample in our QA environment to 20 — 30 VMs however, I am going to say that making
those modifications did help.There isn’t a public KB article from VMware about this issue other than this one:
http://kb.vmware.com/kb/2082042
There is no ETA on a patch from VMware. I hope that this information helps.
-
Edited by
Chris Bonsted
Wednesday, November 26, 2014 3:01 PM
-
Edited by
-
We had this issue several months ago and Microsoft pointed us to clock time mismatch. They suggested we go to our Hypervisor vendor. VMware did minor investigations and found nothing of course. We are currently back to the same issue again
like your post. Finding your post here has made VMware release the internal document stating what you found, to us. It is still internal only to VMware and Microsoft.We have applied the PowerCLI script to all of our servers and it does modify the VMX without any issue. The problem is you still need to do a reset or power off/on via the virtual power buttons in VMware. OS reboots do not work. So we are
in the middle of scheduling outages for our 400+ 2012 servers.Thanks again for the post. I will post what VMware gave me on the symptoms for this issue to happen.
Symptoms:
Under the following conditions, you are:
Running Windows 8 or 2012 Server or later as the guest operating system on the virtual machine
Running on ESXi 5.5 or later with virtual machine hardware version 10 (vmx-10)
The virtual machine has not experienced a full power cycle (powered off / powered on) for more than two months.
The virtual machine is configured with more than one vCPU.
You might see the following symptoms:
After rebooting, Windows 8 or 2012 Server virtual machines might hang during the Microsoft Windows boot splash screenAfter resetting or power cycling the virtual machine, it will boot successfully.
The virtual machine might resume booting after multiple hours or days
A memory dump analysis might reveal thread blocking on a timer expiry hours or days in the future
The blocking thread might be stuck in KeDelayExecutionThread() during PciStallForPowerChange()Cause:
Starting with Windows 8 / Windows 2012 Server, during the boot process the operating -
Thanks for all the info in this thread. I have the same problem using ESXi 5.1 and 2012 R2 servers. Has anyone experienced this problem using 5.1?
-
Has anyone received any updates from VMware on this? We are experiencing the same issues after Windows updates. Any issues reported with the proposed workarounds?
Thanks,
Derek
-
Most likely this is low on VMware’s radar. I have not heard on when a fix will be issued. We have implemented this work around in our QA/Dev VM’s (about 100 of them) and we have not had any issues since the .vmx modifications where made.
-
I discussed this with VMware Support yesterday. Here’s an official KB article, hot off the press:
http://kb.vmware.com/kb/2092807
It has a few details not yet discussed on this thread, so definitely check it out if you’re affected by the problem.
Joe.
-
I’ve also been told that the fix/workaround is proposed to be included with ESXi 5.5 Update 3 and ESXi 6.0 Update 1.
-
Does anyone see this working in their environment? We have a few VMs that still hung on reboot with this applied. When comparing the Advanced configuration properties we noticed the script set the parameter as «monitor_control.enable_softResetClearTSC
= TRUE» while other parameters show their values as «true». Not sure if the «TRUE» vs «true» makes a difference. -
Machines in our environment also still hanging on with specified «monitor_control.enable_softResetClearTSC = TRUE» parameter. Maybe it requires server reboot to start applying this setting? In this case upcoming patching will show is it true
or not.
Also think that there no difference between «TRUE» and «true».-
Edited by
Andrej Trusevic
Wednesday, March 4, 2015 1:28 PM -
Proposed as answer by
MiliusXP
Friday, March 13, 2015 1:36 PM -
Unproposed as answer by
MiliusXP
Friday, March 13, 2015 1:36 PM
-
Edited by
-
I’ve applied the workaround, restarted hosts and still have the issue.
Lets wait and see what 5.5 U3 brings, no chance I’m touching ESXi 6 until U1 comes out, and when that does hopefully the fix will be in there too.
There is every chance it won’t be though; when I previously looked in to this issue (maybe 3 or 4 months ago now); I was lead to believe it was a Microsoft fault rather than VMware, the argument for this was a good one and I am yet to see Microsoft admitting
to anything. -
Requiert complete shutdown and restart
parameters are not case sensitive.
-
Has anyone heard anything more on this issue? I have applied the setting change and it does not make a difference…
I have to reboot multple times to get my VMs to come up.
-
Hi all,
Can someone please summarize this?
Doesn’t the VMware KB 2092807 have the resolution? It doesnt solve this bug?
If i use the PS script, do i still need to restart my VMs?(The scripts seems to do a «localhost» vmotion which should create a new vmx file?)
IF 9 2807
-
Has anyone opened a case with Microsoft on this issue? Is anyone seeing this in Hyper-V, Stand Alone, Xen? VMware has reported this to be a Microsoft issue and are unable to find any problems on the vmware side on our system.
-
I can confirm that VMware provided solution in KB 2092807 does not solve bug. Required parameter was set to all win2012 and win 2012R2 machines in our environment. All servers rebooted after that, but during this month’s patching some of them still
hangs -
@andriktr
Did you use the ps script?
//Johan
-
Yes, script was used for setting parameter
To set parameter without script you will be required turn off VM. It’s not possible manually editing VM config and set this param when VM is turned on. Using script you can set param without turning off VM.-
Edited by
Andrej Trusevic
Friday, March 20, 2015 10:30 AM
-
Edited by
-
Yep, but I don’t want to run the script on my production VMs if it doesn’t solve anything…..
//Johan
-
Can now confirm that I also experience the same problem even though I applied the «fix» ……
//Johan
-
Can also confirm that we are seeing this issue, have been for months and finally know why. Going to be opening cases regarding this issue. Same behavior, after being online for about a month 2012 R2 servers will get hung during automatic patch reboot.
-
I also created a ticket for VMWare support. Let’s wait for the answer.
-
Already get feedback from vmware support. They said that the fix described in KB2092807 should work if not we need to collect logs from host where VM is in hang status and provide for them. Also they provided another workaround — downgrade VM HW
to version 9.The good news is that they also confirmed this problem will be fixed in 5.5 U3 which will be released between 2nd and 3rd quartal.
-
Hello everybody,
kind of late to the party. We are running 2012 R2 on a physical machine using the Hyper-V role. This is a no-HA lab machine. We are having the same issues as described here, just with Hyper-V. Again, the HOST system is the Hyper-V server, guests are a mix
of XP to Server 2012 R2.I have no idea how I could apply any of the fixes described here to a physical machine.
Is there any news from Microsoft on this issue?
Regards,
Michael -
For those that say the «fix» using the powershell script did not work….you did read in the KB that «The virtual machine(s) need
to be shutdown and powered on for the changes to take affect.».Was that done…or do you simply do a reboot of the VMs (which would not fix), or some say they rebooted the ESX Host (which is not the fix).
-
What about reloading the VMX settings while the VM is running (Reference:
http://kb.vmware.com/kb/1026043), and then restarting normally? Has anyone tried that? It seems to work for other settings that normally don’t take effect without a full shutdown and poweron.—
Also, we’ve seen this same exact behavior since we installed Patch 4 for McAfee VirusScan Enterprise 8.8. It’s a known issue with Patch 4 (Reference:
https://kc.mcafee.com/corporate/index?page=content&id=KB78495 — issue 1020874). Patch 5 is supposed to be released to the general public next week.-
Edited by
Random Anonymous Name
Thursday, May 14, 2015 5:27 PM
-
Edited by
-
I don’t think this is all the problem
it seems this case only happens after installed a(sepcial one maybe) update, normal reboot just fine
-
pulling my hair out with this patch cycle and 2012 r2/5.5….found this thread, sorry that we are all having this problem but good to see I’m not the only one and going crazy. Found a workaround for all of the small environments. If you shut
down the server and start it from vmware there is no problem. I find that better than «crashing» it everytime it won’t boot…makes me a little nervous. I guess I’ll just do this until u3 comes out.Hope this helps someone out….have a good weekend.
-
Just got bit by this. Also a VM on 5.5. I’m thinking of changing to the PVSCSI driver to mitigate, as we don’t use this with any clusters. My fix was to RESET this VM in vCenter, and it came back. A bit nerve racking, as this is
a FS with a lot of data. -
ESXi 5.5 Update 3 is now available, which should fix the issue.
http://pubs.vmware.com/Release_Notes/en/vsphere/55/vsphere-esxi-55u3-release-notes.html
«Attempts to reboot Windows 8 and Windows 2012 server on ESXi host virtual machines might fail
After you reboot, the Windows 8 and Windows 2012 Server virtual machines might become unresponsive when the Microsoft Windows boot splash screen appears. For more information refer,
Knowledge Base article 2092807.This issue is resolved in this release.»
-
Proposed as answer by
Stiwa
Monday, September 21, 2015 9:36 AM
-
Proposed as answer by
-
hello
we having also this problem.
i updates all my esxi servers to the 5.5u3a and the problem didn’t solved.
what can i do??
thanks
-
I wonder why do people complicate their life with heterogeneous solution (with VMware). Hyper-V in R2 allows for better VM management, namely memory use during boot. I would focus attention on memory use in start of VMs. Extension of Powershell capabilities
for Hyper-V is another reason for this type of virtualization.It is better to create new thread instead of adding the same problem at the end of old thread.
M
-
Hi,
Pls find the below step to troubleshoot.
Are you using veeam or symantec backup application for backup.
When did you taken last backup of virtual machine.
Windows Security patches required…
-
Hi,
Pls find the below step to troubleshoot.
Are you using veeam or symantec backup application for backup.
When did you taken last backup of virtual machine.
Windows Security patches required…
Are there know issues with Veeam backing up 2012 R2 VMs? What windows security patches are you referring to?
I have a similar issue where, in my VMware 5.1 U3 environment, only on 2012 R2 servers, the Windows login screen freezes and does not allow console or RDP access. You can ping the server and even UNC browse to shares on the server, but you cannot login
or run remote commands. When you look at the VM console, it shows the login screen and the time on the login screen is stuck at some time in the past. -
Not sure why you even bothered to take the time to type such a smart arsed piece of nonsense. If you don’t have anything to add to the discussion then don’t bother. People on this thread will have been tearing their hair out to fix a problem and very few
of them will be the IT directors who decided whether to use Hyper-V or VMware.I would focus your attention on doing your own job or being helpful rather than commenting on a thread that apparently has nothing to do with you. Not sure how you built up so many points if all your input is of the same standard.
-
Amen brother. HyperV must not have any issues of its own. ;-P
Thanks to all, planning patching now.
-
Been a while since updates on this thread, has anyone been able to find a permanent fix for this?
-
Is there any update to this?
-
I’m also having this problem running esxi5.5 u2 but with hardware version 9.
Vmware support could not help me.
any updates
-
Issue also seen with Windows Server 2012 R2 installed on Cisco UCS C-Series physical server. Windows will hang at logon screen, unable to Ctrl + Alt + Delete via CIMC integrated KVM Console. Awaiting any update on this issue.
-
The information in the article fixed it for me! Thanks a million! I was on my way to opening a sev 1 with VMware when I stumbled across your article.
Note that in the article, the value is set to lowercase «true,» which worked for me. I mention this because the code at the top of the post uses uppercase «TRUE.» I know VMware can be finicky with case sensitivity sometimes
and I did not have time to verify if the uppercase «TRUE» also works.THANKS AGAIN! YOU SAVED MY ARSE!
-
FYI, we have this same issue post patching via SCCM on physical T130’s with Windows 2012 R2. I don’t think VMware has anything to do with it. Just hangs on reboot. We have 2008 Hyper Guests running on the Hyper hosts at remote locations.
-
We have this issue since today on a recently installed Windows Server 2012 R2 on IBM xSystem 3650 M2 server. It seems to happened after the installation of a bigger windows rollup packet via WSUS. First we’ve noticed the server wasn’t reachable via RDP
anymore after windows update reboot. On server console we found it at login screen, but not responding on CTRL+ALT+Del. After switching power off and on again server now hangs at «Restarting» screen with the spinning dots for more than two
hours now. -
Of course we shut them down.
How the hell would we do a reboot if we can’t get them to ACTUALLY boot in the first place?
-
We’re noticing this now on several of our VM’s we applied the March rollup to. And we’re running a fully patched ESXi 5.5 Update 3 environment…
As this thread is over 3 years old — this is inexcusable. I don’t care whose ‘fault’ it is — this needs to be fixed!
-
Having the same error.
I think it has got to do with Windows updates.
We have Hyper-V host 2012 R2, and VM’s 2012 r2. After patching them (windows update) they become very nonresponsive after the reboot.
Waiting for 25 minutes to Hyperv circle stop spinning and eventually it will start VM.
Very strange, but like other commented, it has nothing to do with either having VM on ESXI or HYPER-v, this must we windows update related for sure!
So, has anyone find other fix then forcely shutting down the VM and powering it off?
bostjanc
-
I confirm this issue.
It is happened to me, with same WmWare Vsphere 5.5 version.
I had to reset all my Windows 2012 r2 vm’s and then they boot normaly. -
I have a vSphere 5.5 update 3 environment and the funny thing is I do NOT see this problem with my Server 2012 R2 servers but I DO see this with several of my Windows 2016 servers. The funny thing is I do not allways see this problem however that might
have to do with the fact that one of the conditions seems to be:The virtual machine has not experienced a full power cycle (powered off / powered on) for more than two months.
I will investigate and have a look if setting the enable_softResetClearTSC will help here as well.
Тормозит сервер Windows как найти и локализовать причину?
В данной статье рассказано о средствах Windows, помогающих установить причину почему тормозит сервер. В статье рассмотрена операционная система Windows Server 2012 R2 — одна из самых популярных у VDS / VPS хостинг провайдеров.
При поиске причины тормозов сервера очень важно найти непосредственно процесс который создает наибольшую нагрузку на систему. В этом может оказать неоценимую помощь приложение perfmon которое входит в состав ОС Windows. Наибольший интерес для новичков будет представлять окно Resource Monitor.
Запуск Resource Monitor под Windows Server
Наиболее простой способ запуска это в окне Run (команда Win + R) набрать комманду perfmon /res.
Альтернативный вариант — в окне Task Manager (открывается комбинацией клавиш Ctrl-Shift-Esc) перейти на вкладку Peformance и внизу вкладки нажать на ссылку Open Resource Monitor.
Вкладка Performance дает общую информацию о системе, которая может быть также полезна. Можно понять загрузка какого ресурса близка к 100%: памяти, CPU или локальной сети.
Использование Resource Monitor для поиска причины почему тормозит сервер.
Очень часто поиск причины тормозов сервера начинают с проверки загруженности дисковой системы. Ниже представлено окно Resource Monitor на вкладе Disk.
На вкладке Disk Activity показана загруженность в процентах. Если загрузка, близка к 100%, то скорее всего дисковая система является причиной низкой производительности системы. Щелкая по заголовку Total (B / Sec) можно отсортировать файлы с которыми в данный момент роботает система по объему чтетния и записи на диск. Наиболее загруженный файл и будет причиной тормозов системы. Зная какой файл создает высокую нагрузку гораздо легче понять, какой процесс нагружает систему. Если это какой-то системный файл начинающийся с C:/Windows, то есть смысл воспользоваться поисковой системой, чтобы понять, какой системной службе принадлежит данный файл.
Следущей причиной может стать Сетевая нагрузка. Особенно это актуально для VPS серверов. В случае если вы подключаетесь по RDP то сетевый задержки могут ощущаться как тормоза сервера. Переходим на вкладку Network:
В первую очередь обращаем внимание на общую нагрузку сети. Если она близка к 100% процентам, то скорее всего проблема в сети. На вкладке Processes with Network Activity и TCP Connections мы можем найти название процесса, который нагружает сеть. К сожалению, системные и серверный службы запускаются при помощи системного файла svchost.exe, и часто непонятно какая именно служба загружает сеть. Но если, вы видите, что причина в svchost.exe, то причину нужно искать в службах Windows.
Бывает так, что вы запустили слишком много программ и у вас банально не хватает оперативной памяти. В этом случае нам может помочь вклада Memory. Иформация по процессам аналогична вкладке Network:
Самый простой случаей это загрузка CPU. Ее можно посмотреть на вкладке как на вкладке CPU так и в обычном Task Manager:
Источник
Как определить причину зависания windows server 2012 r2
Вопрос
Есть контроллер домена (он один всего). Windows Server 2012 R2. На нем же стоит SQL Server 2012 SP2. Проработал безпроблемно почти полгода, а вчера вдруг начал три раза в день зависать напрочь. Отрубает все сетевые ресурсы, при попытке подключения по RDP висит черный экран, локаль на Ctrl+Alt+Del не реагирует никак — даже не убирает экран блокировки. Но, между тем, любой интрефейс прекрасно пигнуется по сети.
В логах сервера нет ничего интересного на эту тему, такой ощущение, что он просто застывает. Единственное, прямо перед зависанием в логах появляется такая ошибка:
Такая ошибка появляется раз 5 в течении 10 минут, как потом видно из логов, после чего сервер встает. Помогает только перезагрузка кнопкой. После загрузки в логах только эти сообщения, пара незначительных предупреждений и куча информационных сообщений о запуске сервисов. И все.
Не подскажите, как можно попробовать отловить виновника ситуации?
Кстати, запустил тут dcdiag и появились вопросы, не все проходит без ошибок:
Какая-то ошибка DFS. Кстати, а какая репликация DFS может быть, если у меня один единственный контроллер домена?
Ответы
По памяти всё выглядит хорошо.
Что касается ошибок, то почему-то у вас там происходит сбой связи при высокой нагрузке на запись (при бэкапе). Причина может быть и в хранилище, и в сети, и в сервере, где именно — сказать просто так трудно.
Так как это выглядит сейчас — это не критично.
Все ответы
Одна из возможных причин — исчерпание доступной физической оперативной памяти.
Рекомендую проследить, нет ли у вас утечки памяти: понаблюдайте (с помощью Performance Monitor или Task Manager) динамику изменения объемов выделенной процесам виртуальной памяти и пулов памяти ядра. Наиболее подозрителен в данном случае неподкачиваемый пул памяти — его содержимое не может быть сброшено в страничный файл, но если у вас ограничен размер страничного файла (или мало места на диске, где он находится), то и утечка памяти из подкачиваемого пула или в каком-либо процессе тоже может стать источником проблемы.
А ещё подобная проблема может возникнуть из-за сбоя системного диска или его контроллера. Характерный признак, в данном случае — отсутствие каких-либо записей в журнале событий непосредственно с момента зависания (при том, что если ухитриться просмотреть журнал событий до перезагрузки, то там будут записи о сбоях диска — но на диск они записаны уже никогда не будут и при перезагрузке потеряются).
PS А что касается репликации DFS, то, вероятнее всего, в журнале событий зафиксировано, что репликация диска C: остановлена из-за проблем с базой DFS (это — частый результат внезапного пропадания питания или перезапуска кнопкой «Сброс»).
Источник
Как определить причину зависания windows server 2012 r2
Общие обсуждения
Имеется лицензионный Windows Server 2012 R2. Раз в неделю случается сбой. RDP отключается, перестает реагировать на любые команды, ALT+CTRL+DEL не реагирует, WIN+R не реагирует. Ни одно приложение не открывается. При этом мышь двигается и отзывается «Мой компьютер», т.е. папки открываются. И самое СТРАННОЕ. Установленные две виртуальные машины превосходно работают, RDP работает, все приложения запускаются, т.е. все как обычно. А «главная» машина молчит. HYPER-V разумеется тоже не отвечает. Помогает только перезагрузка физически «с кнопки». В журналах ничего странного нет. Когда началось сказать не могу, досталось «по наследству», но говорят такая проблема продолжается давно.
Подскажите, пожалуйста, в какую сторону копать. Спасибо!
Все ответы
Это может в принципе вызвать и программное какое-то обеспечение.
А дальше по шаблону, sfc /scannow, dism
А вообще hyper-v можно легко переустановить(цело переустановить ОС) и подключить обратно виртуальные машины.
Похоже, что система перестает взаимодействовать с железом. Попробуйте обновить дрова на физ сервере, установить обновы.
Какой софт на физ сервере стоит?
Ну hyper-v же не на рэйду у Вас. Перебить винду и собрать виртуалки полчаса времени грубо говоря. Правда нужно уточнить насчет рейда, что с ним будет, распадется он или нет, тут я не знаю.
Ну а команды то пробовали ? Пробовали выключить антивирь ? Я не уверен, что на хосте он вообще нужен.
попробуйте запустить «монитор прозводительности» на сервере и посмотреть счётчики во время «зависания».
на диске С места свободного достаточно?
Die Meinung, die von mir geäußert wurde, ist keine offizielle Position von Microsoft.
Почти никакого, антивирус DrWeb, LSI RAID, управление мини АТС Panasonic. В принципе всё.
Проверьте пожалуйста в логах антивируса имеются какие-то ошибки или дампы? Могли бы уточнить версию вашего антивируса и проверить события приложения(Application) и системы(System).
P.S. В некоторых случаях может быть виновник антивирусное ПО.
Предоставите лог сторонней антивирусной утилиты FRST согласно следующей инструкции:
Важно: обратите внимание, что указанная утилита, может показать возможное использование средств обхода лицензионного соглашения.
— Скачайте Farbar Recovery Scan Toolи сохраните на Рабочем столе.
Примечание: необходимо выбрать версию, совместимую с Вашей операционной системой. Если Вы не уверены, какая версия подойдет для Вашей системы, скачайте обе и попробуйте запустить. Только одна из них запустится на Вашей системе.
- Запустите программу двойным щелчком. Когда программа запустится, нажмите Yes для соглашения с предупреждением.
- Убедитесь, что в окне Optional Scan отмечены «List BCD» и «Driver MD5«.
- Нажмите кнопку Scan.
- После окончания сканирования будет создан отчет (FRST.txt) в той же папке, откуда была запущена программа. Пожалуйста, прикрепите отчет в следующем сообщении в качестве ссылки на скачивания с файлового хранилища (например onedrive).
- Если программа была запущена в первый раз, будет создан отчет (Addition.txt). Пожалуйста, прикрепите его в следующем сообщении в качестве ссылки на скачивания с файлового хранилища (например onedrive).
Avis de non-responsabilité:
Mon opinion ne peut pas coïncider avec la position officielle de Microsoft.Bien cordialement, Andrei .
MCPИсточник
Сегодня мы бы хотели поделиться с вами некоторыми размышлениями на тему того, как решить достаточно распространенную проблему, связанную с зависаниями доменного контроллера. Для примера рассмотрим один типичный случай, который наиболее точно описывает аналогичную ситуацию
Изначально имелся Windows Server 2012 R2, на котором был установлен SQL-Server 2012. Достаточно продолжительное время (примерно год) сервер работал, как надо, но в последнюю неделю начались непонятные зависания. При этом все сетевые ресурсы отключались, а при совершении попыток подключиться по RDP админ мог видеть перед собой только черный экран.
Local не подавал признаков жизни при нажатии комбинации Ctrl+Alt+Delete. При этом невозможно было даже убрать экран блокировки. Если же просмотреть интерфейсы по сети, то они прекрасно пингуются.
Были перепроверены все логи, в которых найти что-то интересное по данной проблеме не представлялось возможным. Сложилось впечатление, что Server наглухо застывал. Перед самим же его «застыванием» в логах можно было увидеть сообщение о том, что лимит по времени ожидания был превышен (30К мс) в процессе ожидания подключенной службы, регистрирующей системные ошибки Windows.
Подобную ошибку можно было встретить до трех раз в течение 10-15 минут (что следует из просмотренных после логов). После этого сервер замирал. Единственным решением данной проблемы казалась кнопочная перезагрузка, после которой в логах можно было видеть только вышеобозначенные сообщения, несколько сообщений о серверном запуска и только.
Возможная утечка памяти
Одной из наиболее вероятных причин в этом отношении могла стать исчерпанная оперативная память на физическом уровне. Для того чтобы определить, так это или нет, в аналогичных ситуациях рекомендуется отследить утечки, связанные с ресурсами физической памяти.
Для этих целей можно использовать такие утилиты, как Task Manager либо Performance Monitor. Кроме того не лишним в данном контексте будет отслеживание динамику, с которой изменяются объемы выделенной виртуальной памяти процессорами наряду с пулами памяти ядра.
Основным подозрительным сигналом в этом случае может служить Memory Pool не подкачиваемый, содержимое которого может сбрасываться в страничные файлы. Однако если страничные файлы ограничены в размерах, либо на диске, где они размещены, слишком мало свободного пространства, то любая утечка памяти из пула подкачки либо в каких-то других процессах вполне могут являться источниками рассматриваемой проблемы.
Возможный сбой в работе системного диска
Вследствие сбоя работы системного диска либо дискового контроллера подобные зависания на сервере также могут иметь место. Если имеется подозрение на наличие такой проблемы, то лучшим решением будет выявить основной характерный для данной ситуации признак, а именно отсутствие в журналах событий каких-либо записей с того момента, как произошло зависание.
При этом если админу каким-то образом удастся просмотреть журнал событий, прежде чем он осуществит перезагрузку, то он обнаружит в логах ряд записей о дисковых сбоях. Стоит учесть, что эти записи не сохранятся на диск и будут утрачены сразу после перезагрузки.
Напоследок хотелось бы отметить один нюанс по поводу DFS-репликации. В событийном журнале фиксируется информация об остановке репликации диска C: вследствие проблем с DFS-базой. Такой исход зачастую является следствием того, что питание компьютера внезапно пропадает, либо пользователь осуществляет перезапуск системы посредством кнопки «Reset».