第2部 グリッドを実現する要素技術

 グリッドの耐故障性を実現する機能の代表は、チェックポインティングという機能です。この機能は、ジョブの実行中に定期的に途中経過を保存します。ジョブの実行中にコンピュータがダウンしてしまったときなどに、実行中だったジョブを別のコンピュータに移動して、ダウンの直前に保存した状態からジョブの実行を再開します。
 グリッドには様々なコンピュータがネットワークを経由して接続されているため、全体としての安定性を考えると、コンピュータや通信などに障害が発生する可能性が、単一のコンピュータよりも高いといえます。グリッドの規模が大きくなるほど、このリスクは高まります。グリッド上でのジョブの実行を中断させないためには、チェックポインティングなどの耐故障性の機能が大切です。

fig2-1-5