富士通

PRIMEPOWER本体装置は、(2008年5月に)販売終息いたしました。
なお、本製品の後継製品は、SPARC Enterpriseとなります。

各モデルの販売終息時期の詳細につきましては、「今までに発表した製品」をご参照ください。

PRIMEPOWERとPRIMECLUSTERが織り成す高信頼・高可用ソリューション
2005年1月11日号
部品、装置、システムそれぞれのレベルにおいて、信頼性を積上げています。

PRIMEPOWERは多くのお客様の基幹業務に採用されています。ビジネスの心臓であるITシステムをいかに止めずにサービスを提供し続けるか、PRIMEPOWERはミッションクリティカルな要件に対応するために、部品、装置、システムそれぞれのレベルにおいて信頼性を追求しています。
例えば、部品レベルではメインフレームの設計思想を引き継いで開発したプロセッサによるデータインテグリティ保証、装置レベルでは主要コンポーネントの冗長化などによる耐故障性の追求、そしてシステムレベルではクラスタシステムによる業務無停止を追求しています。

ここではPRIMEPOWERとPRIMECLUSTERによるシステムレベルの信頼性向上について紹介します。さらにOracle Real Application Clusters(RAC)を組み合わせたソリューションについても紹介します。


■PRIMEPOWERの独自機能とPRIMECLUSTERを連携して、他社より高い信頼性を提供

PRIMECLUSTERは、富士通の高信頼、高可用技術と先進のクラスタリング技術を結集した高信頼基盤ソフトウェアです。例えば、2台以上のPRIMEPOWERを組み合わせた冗長構成のシステムを構築する際、PRIMECLUSTERを利用します。システムのうちある1台のサーバが故障しても、他のサーバに業務を自動的に引き継ぐことで、業務の継続性を追求しています。
また、ストレージやネットワークの冗長化により、データアクセスの継続性および通信の継続性を実現しています。

サーバ間はプライベートLANで接続します。PRIMECLUSTERはプライベートLANを利用して定期的に通信を行い、お互いのサーバのOSやアプリケーションの状態を監視します(定周期監視)。
定周期監視により、相手サーバの処理性能低下やハングアップなどの異常を確実に検出して、待機していたサーバへ切り替えます。


図1:PRIMECLUSTERによる高速フェイルオーバ

また、PRIMECLUSTERはPRIMEPOWERのシステム監視機構(SCF)と連携しています。SCFはRCI(Remote Control Interface)により相手サーバのSCFと通信します。
例えば、運用サーバのSCFは自分の筐体において異常を検出すると、RCIを通じて他のサーバに運用サーバで異常が起きたことを通知します。待機サーバのSCFは異常通知を受け取ると、PRIMECLUSTERに運用サーバで異常が発生したことを通知します。
定周期監視よりも早くハードウェア異常が検出できるため、サーバダウン時もスムースに待機サーバに切り替えられます。

定周期監視により、OSの処理性能が落ちたりハングアップしたことを検出すると待機サーバに業務を引き継ぎますが、異常なサーバが存在したままでは業務が確実に引き継ぐことができなかったり、共用データを破壊したりする恐れがあります。
PRIMECLUSTERはSCF、RCIを通じて異常サーバを強制停止させるので異常サーバがシステムに影響をおよぼすことなく共用データの保全を実現します。


図2:PRIMECLUSTERとSCF, RCIの連携による確実なサーバダウン検出

このように、通常のクラスタシステムで持っているプライベートLANによる定周期監視以外にも独自の障害検出ルートを持っているPRIMEPOWERだからこそ、万一の時にも迅速に対応できるので、他社より高い信頼性、可用性を提供することが可能です。

■PRIMECLUSTER+Oracle RAC連携による、業務無停止の追求

Oracle RACは、1つのデータベースを複数のサーバで共有するテクノロジーです。従来の共有ディスク・クラスタ・システムにおいては、メモリ・キャッシュ上の該当するデータ・ブロックを一度ディスクに書き込むことにより、ノード間のデータ同期が実現されていました。そのためディスクへの書き込みが頻繁に発生し、サーバの負荷が大きくなり性能劣化につながっていました。
Oracle RACでは、各サーバのメモリ上にあるデータをディスク上のデータと比較して、サーバ間のプライベートLANを介してデータの同期をとるCache Fusion(キャッシュ・フュージョン)という仕組みが採用されています。ディスクアクセスによるオーバーヘッドが解消され、サーバ数に比例して性能が向上します。
またOracle RACは1つのサーバがダウンしても他のサーバで瞬時に業務を再開するため、業務の継続が可能です(注1) 。
PRIMECLUSTERの強みである強力な障害検出機構とアプリケーションや他のミドルウェアと連携した切替え、および、Oracle RACの強みである業務継続性を組み合わせることで、より高可用なシステムを構築することができます。


図3:PRIMEPOWER、PRIMECLUSTERとOracle RACによる業務継続性

注1:PRIMECLUSTERによる切り替え時間は、動作しているアプリケーションやシステム環境により異なります。また、Oracle RACによる切り替え時間は、データベースの大きさなど条件により異なります。

掲載されている内容は発行日時点のものです。