久々に技術的な話を。
vCenter Server 4.0のサービスがある日突然起動しなくなった。
アンインストールも上書きインストールも出来ない。
そのときの対応方法についてです。
あるお客さんから連絡があった。
VMware vSphere 4の仮想環境を半年以上運用しているのだが、あるとき突然、
vCenter Serverにログインできなくなったらしい。
管理サーバ
・Windows Server 2008 Standard SP2 x86
・Oracle Database 11g R1 Standard Edition One 11.1
・
VMware vSphere Client 4.0 Update 1
・
VMware vCenter Server 4.0 Update 1
ESXホスト3台
・
VMware ESX 4.0 Update 1
管理サーバ上の
vSphere Clientから自分自身の
vCenter Serverにログインしようとすると、このメッセージが出てログインできない。
接続できませんでした
vSphere Client は vCenter Server「XXXXXXXX」と接続できません。
詳細:接続障害が発生しました。 (リモート サーバーに接続できません。)
VMware ESXホストに直接ログインは問題なく出来る。
コンピュータの管理でサービスの管理画面を表示すると、
vCenter Serverのサービスである「VMware
VirtualCenter Server」が開始中のままで止まっている。
vCenter ServerのデータベースであるOracle 11.1は正常に起動しているのに。
何でだろう。
半年以上何も問題なく動作していたのに。
試しにコマンドプロンプトからnet startでサービスを開始してみる。
(写真1)net startでVMware
VirtualCenter Serverを起動してみる

Microsoft Windows [Version 6.0.6002]
Copyright (c) 2006 Microsoft Corporation. All rights reserved.
C:\Users\Administrator>net start "VMware VirtualCenter Server"
VMware VirtualCenter Server サービスを開始します...
VMware VirtualCenter Server サービスを開始できませんでした。
サービス固有のエラーが発生しました: 2
NET HELPMSG 3547 と入力すると、より詳しい説明が得られます。
それならと、NET HELPMSG 3547を打ってみるても参考にならない。
C:\Users\Administrator>NET HELPMSG 3547
サービス固有のエラーが発生しました: ***
ここで
vSphere Client 4.0 Update 1をアンインストール。
そして
vSphere Client 4.0 Update 2をインストール。
これは問題ない。
この日はvCenter Serverは再インストールするつもりでお客さんのところに行ったので、ここでvCenter Serverをアンインストールしてみる。
ところが以下のメッセージでアンインストールが出来ない。
Windows インストーラにより製品が削除されました。製品名: VMware vCenter Server、製品バージョン: 4.0.0.10021、製品の言語: 1041、削除の成功またはエラーの状態: 1603
ならば、次はvCenter Server 4.0 Update 1に対して同Update 2を上書きインストールしてみると、このメッセージで失敗してしまう。
VMware vCenter Server のインストールが完了する前に、ウィザードが中断されました。
システムは変更されませんでした。あとでインストールを完了するには、もう一度セットアップを実行してください。
「終了」をクリックして、ウィザードを終了してください。
(写真2)vCenter Server 4.0上書きインストール中に表示されたポート番号

vCenter Server 4.0 Update 1を同Update 2で上書きしようとすると、途中でこの画面が表示された。
そこでnetstat -a -n |find /i "443"」などで他のアプリケーションとポート番号が競合していないか確認したが、重なっているポート番号も無し。
※上記画像は一部のポート番号をvCenter Serverの規定値から変更している。
(HTTPポート80 → 8000、WebサービスHTTPポート8080 → 8081)
うーん、にっちもさっちも行かない。
お客さんが
VMware ESXのOEMメーカーのサポートに対して「vCenter Serverに接続できない」で問い合わせて返ってきた回答では、
(1)C:\Program Files\VMware\Infrastructure\jreフォルダ
このフォルダが空になっている場合、別のパソコンにvCenter Serverをインストールして、jreフォルダ内のファイルを管理サーバの同フォルダにコピーする。
(2)データベースのバックアップ
vCenter Serverのデータベースをバックアップする
(3)レジストリキーを削除
「HKEY_LOCAL_MACHINE\SOFTWARE\VMware, Inc.\VMware Infrastructure」を削除
(4)vCenter Serverをインストール
この手順でやってみるとの事なので、素直にやってみた。
確かにC:\Program Files\VMware\Infrastructure\jreは、フォルダは存在するが中身は空だった。
別のパソコンにvCenter Server 4.0 Update 1をインストールしてみる。
C:\Program Files\VMware\Infrastructure\jreフォルダ内にはJREのファイルが存在しているので、それを管理サーバの同フォルダにコピーする。
手間がかかる上にリスクが少ないため、データベースのバックアップは省略。
そしてvCenter Serverをアンインストールすると。。。
あら不思議、何事も無かったかのようにvCenter Serverがアンインストールできた☆
そこでサポートから指示されたとおり、Regeditで「HKEY_LOCAL_MACHINE\SOFTWARE\VMware, Inc.\VMware Infrastructure」のレジストリエントリを削除。
その後は普通にvCenter Server 4.0 Update 2をインストール。
問題なくインストールできる。
ああ、すばらしい。
(写真3)vCenter Server 4.0のVMware関連サービス

net start |find /i "VMware"でVMware関連のサービス起動を確認。
当然ながら、今度はVMware VirtualCenter Serverサービスも正常に起動している。
この2つは無償版のVMware vCenter
Converter Standalone関連のサービス。
・VMware vCenter
Converter Agent
・VMware vCenter
Converter Server
この2つはVMware vCenter Server 4.0のサービス。
・VMware VirtualCenter Server
・VMwareVCMSDS
vSphere ClientからvCenter Serverへのログインも問題無し。
vMotionの動作確認もOK。
vcbMounterによるVCBのテストコマンドもOK。
ARCserve Backup 12.5でのVCBによる仮想マシンバックアップもOK。
これで一件落着。
半年以上も正常に稼動したvCenter Serverが突然起動しなくなる原因まではわかりませんが、正常に稼動するように戻りました。
これが頻発するようだったら原因を調べる必要があるかもしれません。
そのときはまた考えます。