RHEL5.4でKVMのゲストが固まる現象(解決済)

RHEL5.4でKVMを導入した当初、KVM上のゲスト(ゲストもRHEL5.4)ゲストが固まる現象が発生していた。ゲストを起動してから数日(1〜4日くらい)で固る。固まるとKVMのホスト側ではゲストに割り当てたCPUをいっぱいに使った状態になり、 virsh console や virt-manager では操作不能。virsh shutdown でも停止できず、virsh destroy で強制終了せざるを得ない状態だった。障害が発生すると監視システムがアラートを出すので、寝ている間もしょっちゅう起こされていた。

そのゲストはx86版、インストールしているパッケージはいわゆるLAMPという構成で、たいしてアクセスもないので普段の負荷はきわめて低い。ディスクはLVMで割り当てていた。新規インストールではなく、Xen環境からディスクイメージをddでコピーしてからKernelとinitrdイメージを差し替えるような方法で構築していたので、その辺も疑っていた。そこで、新たな仮想マシンにRHEL5.4を新規にインストールしてみるものの、同じ構成で動かしてみると、同じく数日で固まる。NICやディスクのvirtioを使うのをやめてみても変化なし。

Virtualization Guide の KVM guest timing management の章に気になることがかかれていた。不正確な時計とカウンタによってゲストが停止したり、クラッシュしたりするかもしれないと。。

KVM uses the constant Time Stamp Counter (TSC) feature of many modern CPUs. Some CPUs do not have a constant Time Stamp Counter which will affect the way guests running on KVM keep time. Guest’s running without accurate timekeeping can have serious affects on some networked applications as your guest will run faster or slower than the actual time.

Guests can have several problems caused by inaccurate clocks and counters:

↑の後にはCPUが対応しているかの確認方法やコンスタントTSC非対応のCPUの場合はゲストでNTPDを動かすようにかかれている。

最近のCPUのコンスタントTSC機能により、ゲストはホスト側に合わせて時計の維持を行うらしい。確かに、完全仮想化ながらKVMのゲストでは時計が狂わない。このコンスタントTSCに対応しているかどうかは次のように確認できる。

$ grep constant_tsc /proc/cpuinfo
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca
cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm
constant_tsc pni monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr lahf_lm
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca
cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm syscall nx lm
constant_tsc pni monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr lahf_lm

注)適当に改行を入れております

私の環境では対応しているので、不正確な時計により固まるのは該当しないような気がするのだけれど、同じページにゲストでコンスタントTSCを無効にする起動パラメタもかかれており、試しに無効にしてみた。ゲストのGRUBの /kernel のオプションを追加して起動。そして、ゲストではNTPDを動かすことにした。このオプションはアーキテクチャやRHELのバージョンによって異なるので注意!

divider=10 clocksource=acpi_pm lpj=n

この状態起動して1ヶ月近くたつが、あれだけ固まっていたのが嘘のように全く固まらない。ちょっと納得がいかないけれども。。

このエントリへのトラックバック

spamが増えたためトラックバック機能は停止中です。

このエントリへのコメント

spamが増えたためコメント機能は停止中です。

Information

サイト内検索

けんども日記

直近 10 件
RSS
RSS 1.0
Home@けんどもネット
diary.php(v2): 2005-06-11
Copyright © 2003-2005 Kendomo.net.