富士通

  1. ホーム >
  2. コンピュータプラットフォーム >
  3. サーバ >
  4. UNIXサーバ >
  5. SPARC Enterprise >
  6. 徹底解説 >
  7. メモリミラー、メモリパトロールによるメモリの信頼性向上

メモリミラー、メモリパトロールによるメモリの信頼性向上

関連製品:SPARC Enterprise M9000, M8000, M5000, M4000, T5240, T5140, T5220, T5120, T2000, T1000

[機能索引]  ECC、拡張ECC |  メモリミラー |  メモリパトロール 

ECC、拡張ECCによるデータ保護

メモリは、ECCおよび拡張ECCにより、データが保護されています。

ECC(Error Checking and Correction)

ECCは、データにECCコードを付加することで、1bitエラーから確実にデータを保護する機能です。

拡張ECC(注1)

DIMMに搭載されたメモリ素子(DRAM)で故障が発生した際に、ECCの仕組みを応用してデータを救済する機能です。(注2)

注1:IBM社のChipkill機能に相当します。
注2:SPARC Enterprise T5240、T5140のメモリ、および、T5220、T5120の一部メモリを除く。

メモリの二重化を実現するメモリミラー

SPARC Enterpriseは、メモリの二重化によりデータを保護するメモリミラーに対応しています。メモリミラーにより、メモリにおけるマルチビットエラーのようなECCでは訂正不可能なエラーからデータを保護します。そのため、単一システムとしての信頼性を向上できます。
本機能はSPARC Enterprise M4000以上のモデルでサポートしています。

メモリミラーを設定した場合

メモリにデータを書き込む際は、メモリAとメモリBに同時に書き込みます。

メモリからデータを読み出す際は、ECCによりデータエラーが発生してないか確認します。エラーが発生していない場合、さらにメモリアクセスコントローラがメモリAとメモリBの両方のデータを比較して、値が同じであることを確認します。もしメモリAで訂正不可能なエラーが検出された場合、メモリBのデータを使用して業務を継続することが可能です。

エラーを事前に検出するメモリパトロール

メモリパトロール(注3)は、メモリでエラーが発生していないか事前に検査を行う機能です。メモリパトロールにより、 OS やアプリケーションがメモリを使用する前にエラー発生を検出し、エラー訂正や縮退を行うことができます。

SPARC Enterpriseの場合、メモリアクセスコントローラがメモリパトロールを行います。OSやCPUリソースを使わずにメモリパトロールを実行できるので、業務に影響をおよぼすことなく、高速にメモリのエラーチェックを行えます。

注3:「メモリスクラバ」と呼ぶ場合があります。