富士通

コンポーネントレベルでの高信頼設計

PRIMEPOWER本体装置は、(2008年5月に)販売終息いたしました。
なお、本製品の後継製品は、SPARC Enterpriseとなります。

各モデルの販売終息時期の詳細につきましては、「今までに発表した製品」をご参照ください。

システムの主要コンポーネント(ディスク、電源、ファン等)は、冗長化、活性交換機能に対応しています。また、CPUモジュールは動的縮退機能をサポートしており、万が一の障害発生時にもシステムは継続して稼働します。

[機能索引]  冗長化 |  活性交換 |  縮退機能 |  二系統受電 

部品の冗長化

ディスク、電源、ファンなど、システム内の主要コンポーネントは冗長化されています。冗長化により一方でトラブルが発生しても、もう一方で対応が可能ですので、継続的にシステムを運用することができます。

活性交換 ・活性増設(ホットスワップ・ホットプラグ)

24時間365日の連続稼働に対応するため、システム稼働中に業務に影響を与えずに故障部品を交換したり、システムリソースが不足したときに部品を増設できる「活性交換・活性増設」をサポートしています。本機能により、保守によるシステム停止時間の最小化を実現します。

主要コンポーネントの活性交換

システム内の主要コンポーネント(ファン、電源、ディスク等)は、活性交換をサポートしています。

CPU、メモリの活性交換・増設

パーティショニング機能やDynamic Reconfiguration機能を利用して、CPUやメモリを含めたコンポーネント交換・増設を、業務を継続したまま行うことが可能です。本機能は、PRIMEPOWER 900以上のモデルで採用しています。

PCIカードの活性交換

ファイバーチャネルカードやLANカードなどの活性交換(PCI Hot Plug)(注)をサポートしています。 本機能は、PRIMEPOWER 900以上のモデルで採用しています。

注:PCIカードの種類等により、活性交換に対応していない場合があります。

縮退機能

CPU、メモリ、PCIバスなどで故障が発生した場合、システムは自動的に障害部位を切り離して再起動します。さらにCPUを構成するキャッシュメモリで1bitエラーが頻発した場合は、OSをリブートすることなく、障害箇所を動的に切り離すことができます。このような縮退機能により、万が一の故障に対しても高い耐故障性を実現しています。

動的縮退

SPARC64 Vでは、障害時に、システムを止めることなくCPUを切り離し、業務の連続稼働を実現する動的縮退機能を実装しています。

技術解説:動的縮退の仕組み

CPUを構成する回路の中でも、間欠故障が起きやすいキャッシュメモリでは、1bitエラーが多発すると、way単位で動的に段階的に縮退します。例えばSPARC64 Vの2次キャッシュメモリは、4way構造なので、1wayでエラーが発生して縮退しても、残りの3wayで動作し続けます。全てのwayが縮退する場合は、CPU単位で動的縮退します。

そのため、万一の際でもシステムの継続運用が可能であり、さらに性能劣化を最小限に抑えられます。他社のCPUの場合、キャッシュメモリでエラーが起きると、リブートして縮退するか、CPU単位での動的縮退が一般的なので、キャッシュメモリのエラーがシステムの可用性や性能に大きく影響します。

システム起動時に縮退

電源投入時、OSをブートする前に初期診断を行います。初期診断では、システムボードやクロスバーボードなどが正しく接続されているかのチェックを行い、接続確認終了後に実際にSPARC64 Vを動作させて、メモリ・PCIバス等の診断を行います。初期診断中に故障を検出した場合、故障箇所を切り離します。

本機能により、故障を抱えたコンポーネントを切り離し、正常なコンポーネントのみで運用を行うことができます。検出した故障は、システムコンソールを経由して、システム管理者に通知されます。

二系統受電

サーバの電源を異なる二系統の電源から受電することができる機能です。
データセンターなど、二系統から電源を引ける場合、異なる系統の電源から受電することが可能です。もし一方の電源系統に故障・停電が発生しても、もう一系統から受電できるので、サーバを継続して運用することができます。

本機能は、PRIMEPOWER 650以上のモデルで採用しています。