よろづやアンテナ

ITから生活の参考になる情報を備忘録代わりに残していきます

vDSでLACP環境下にESXiでservice.sh restartコマンドを実行するとネットワーク接続を失う

VMware環境で、NICチーミングを構成している場合に、帯域を有効活用したい場合、Link Aggregation Control Protocol (LACP) LAGを構成することになると思います。


その際に、vDS上でLink Aggregation Control Protocol (LACP) LAGを構成している場合に、ESXiでservice.sh restartコマンドを実行すると仮想マシンの通信が失われることがあるようです。これ、結構、イタイ事象なので、憶えておくといいかもしれません。特に通信断が起こると困るサーバーがいる場合は注意ですね。

>>vSphere Distributed Switch で Link Aggregation Control Protocol (LACP) LAG を使用している場合に ESXi ホストで service.sh restart コマンドを実行すると仮想マシンがネットワーク接続を失う (2123991) 


事象として、Vmware vSphere Distributed Switch (vDS) で Link Aggregation Control Protocol (LACP) Link Aggregation Group (LAG) を使用している場合に、以下のような症状が発生します。


・service.sh restart コマンドを使用して VMware ESXi ホスト管理エージェントを再起動した後に仮想マシンがネットワーク接続を失う。
VMware vSphere Distributed Switch (vDS) で Link Aggregation Control Protocol (LACP) Link Aggregation Groups (LAG) を使用している。


普段、 service.sh restartコマンドって実行する事はないと思いますが、上記構成の場合、ネットワーク接続を失うとあるので、注意が必要です。


また、この問題は、他のすべての管理サービスと共に再起動される ESXi ホストの LACP モジュールが原因で発生するそうです。vDSでLACP LAG のアクティブ モードとパッシブ モードの両方を使用して LACP モジュールが再起動されると、仮想マシンはネットワーク接続を失います。 


この問題は現在、解決方法がないようなので、対処法としてはservices.sh restart コマンドを使用せずに、特定の ESXi ホスト管理エージェントを別個に再起動します。
注:特定の ESXi ホスト管理エージェントを別個に再起動することができます。

①特定の ESXi ホスト管理エージェントを別個に再起動するには、次のようにします。
SSH を使用して ESXi ホストに root としてログインします。
③特定のエージェントを再起動するには、次のコマンドを実行します。

/etc/init.d/Agent_Name restart

例:

/etc/init.d/ntpd restart

注:使用方法:<Agent> {start|stop|status|restart}

 
この構成って当たり前に使われていると思いますので、ESXi ホスト管理エージェントを再起動する場合には注意が必要ですね。