Önce panik duygusu kontrolü ele almadan sırayla tekrar sunucuları kapatıp açtım. Ancak işe yaramadı. 1 saat kadar süren kontroller sonrasında cluster'ı kaybettiğime karar verdim ve logları tekrar incelemeye başladım. Sırayla aşağıdaki hatalar oluşmuştu.
Event ID : 1136 Cluster node EX01 failed a critical operation. It will be removed from the active server cluster membership. Check that the node is functioning properly and that it can communicate with the other active server cluster nodes.
Event ID : 1123 The node lost communication with cluster node 'EXC01' on network 'Public'.
Event ID : 1135 Cluster node EXC01 was removed from the active server cluster membership. Cluster service may have been stopped on the node, the node may have failed, or the node may have lost communication with the other active server cluster nodes.
Event ID : 1069 Cluster resource 'First Storage Group/ Mailbox Store (Excls01)' in Resource Group 'Excls01' failed.
Event ID : 1000 Cluster service suffered an unexpected fatal error at line 565 of source module d:\nt\base\cluster\service\gum\receive.c. The error code was 5013.
Event ID : 1118 Cluster service was terminated as requested by Node 2.
Çözüm ise çok ilginç (en azından bana öyle geldi)
Her cluster group için aşağıda göreceğiniz "Contains" anahtarı içinde "Resources" bilgileri tutuluyor.
Bu bilgiler aynı zamanda aşağıdaki alanda da tutuluyor. Aşağıda gördüğünüz hex hivelerin hepsinin içi dolu. Ancak sizin yalnızca hive adlarına ihtiyacınız var.
Yukarıdaki hive başlıklarını aşağıdaki alana kopyalayıp ardından sunucuyu yeniden başlattığınızda cluster servisi geri dönüyor.
Bu bilgiyi gece yarısı bir vakitte gelen ilham sayesinde keşfederek bizimle paylaşan Cemal Dur'a teşekkürler :)