*ブランド名・製品名変更のお知らせ*
 
新ブランド名 Maxava HA ( 旧:*noMAX )
 
新製品名 DATA STREAM ( 旧:セントリー )
    SMB ( 旧:ディフェンダー )
    ENTERPRISE+ ( 旧:ギャリソン )
HA(ハイ・アベイラビリティー)製品を選ぶ6つの法則
*ジョン・エーマンズ(中型コンピュータ・IBMi(AS/400)の登場以来、そのサポートに携わっている人物)が、今日のHAの状況を分析し、正しいソリューションを購入するための6つの黄金律を提供します。

 IBMi(AS/400)の平均的なHAツールはローカルジャーナルとリモートジャーナルのそれぞれ、もしくはその組み合わせのルーチンで、DBやオブジェクトの登録や変更を本番機からバックアップ機にほぼリアルタイムに反映します。HAツールを比較する場合のキーとなる指標は処理時間です。本番機とバックアップ機という2つのサーバーはお互いすぐ隣にあることも世界の両端にあることもあり得ますが、HAのインフラが低コストのネットワークによって接続されていることを考慮して、それぞれのサーバー間のトラフィックが最小限になるように設計されています。

オブジェクトやデータの複製は正確でなければなりませんが、遠隔地にバックアップ機がある場合は、スピードが遅すぎると、ダウンした本番機のオブジェクトがバックアップ機に到達するまでに、何時間も(文字どおり何時間も)かかる場合もあります。 ダウンした場合、5分以下で確実に切り替えを完了できることが望ましいのですが、実際、いくつかのHAツールは、この点について不安なものがあります。

 要するに、HAの世界では、全てのツールが同じ機能というわけではなく、異なる技術が採用されているので、他よりスピードの速いHAツールであれば、本番機のダウン時間を最小限にすることができます。

 私は、これまで何年にもわたり障害エンジニアリングの調査をしてきましたので、名のあるHAソリューション全てをよく知っています。多分汎用的なアプローチでHAツールの選択をするほうが道理にかなっていると思いますので、機能という観点からこの問題をみようと思います。私が重要だと確信している機能や考慮事項はたくさんありますが、ご参考までに以下の各問題点に関する簡単な説明とHAソリューション選択に関する一連の簡単な法則を紹介します。
HAの選択法則 1: データの整合性

これは当然確実にできていなければいけないことです。もしデータが正確に合っていなかったら、処理はうまくいかず、エラーの発生は確実で、ビジネスも損害を受けてしまいます。当たり前の様ですが、数あるHAツールの中にはデータのリプリケーションという機能に着目しても、良いものもあれば劣るものもあります。データの整合性という意味では、不完全なデータやオブジェクトの反映は最悪のケースです。もしバックアップ機のオブジェクトが瞬間的なエラー等で、何らかの問題によって生成されてしまった不完全なコピーであったなら、深刻な問題になることは間違いありません。

同期エラーを自動修正するオートノミクス・システムを提案しているHAツールメーカーもあります。私はこのモデルには不安を覚えます。もし、オートノミクス(自律)が本来あるべき効果をあげられなかったとしたら、どうなるでしょうか?不完全なレプリケーション(複製)に誰が満足するというのでしょう?システマチックにデータエラーを作り出すようなシステムをあなたは購入されますか?

いいえ、私なら購入しないでしょう。HA製品は、まず、第一にエラーの発生を減らすか、なくすようなエンジニアリングモデルを採用すべきです。HAツールがリプリケーション時、データやオブジェクトのエラーを生成してしまうのは、致命的な機能上の問題であり、勿論お客様は「なぜそんな事が起きるのか」をよく理解する必要があります。

HAの選択法則 2: リプリケーション(複製)のスピード

処理スピードはHAにおいて最も重要です。理想としては、本番機でレコードやオブジェクトの変更があり次第、瞬間(0秒)でバックアップ機に正確な変更のリプリケーションが反映されることです。しかしながら、私たちの世界は完璧ではないので、実際のHAツールでは、オブジェクトの変更とリプリケーション完了との間にはある程度の時間差があります。処理量とともに待ち時間を増加させるHAツールもあります。量が多い場合、効率の悪い「リプリケーションエンジン」では作業に何時間もかかってしまうことがあります。これは冗談ではなく、私は同期をとるのに20時間の差を生じたHAツールの実例を知っています。

もし、そんな膨大な待ち時間を必要とするツールであるなら、バックアップ機が本番機に追従するのに何時間もかかることになるでしょう。つまりこれは、復元時、切り替えを行う設定のために何時間もかかるということを意味します。そうなると、もう実際にはリアルタイムではありません。従ってリプリケーションのスピードは、重要な性能上のキーポイントであるということがわかります。許容できる範囲の目標値を知る方法として、他のユーザーに聞いてみるという手段もあります。
HA選択の法則 3: 自分で調べてみることも大切
「うちのシステムはHAエンジンの『フェラーリ』だ」と語るセールスマンの言うことだけを聞いていてはいけません。その製品のユーザーと話す機会を作ることや、問い合わせサイトを使い自分で調べてみることも大切です。そのツールがどのようにリプリケーション(複製)を作り、パフォーマンスにどんな影響を与えるかということを必ず理解しましょう。

パフォーマンスを測定するために、無料で試用できるかどうかを確かめて下さい。もしベンダーが自分の製品に自信を持っていれば、もちろん購入前に試用させてくれるはずです。無料で試用することで、「何を期待でき」、「自分の業務アプリケーションでどのように動くか」、「どの程度正確にデータの複製ができるのか」を理解することができるからです。
HA選択の法則 4:ツールのオーバーヘッド

検討製品のHAツールのパフォーマンスをよく理解しましょう。製品を購入する前に、そのツールのパフォーマンスについて必ず確証を得ておくことが重要です。なぜなら、私の経験では、HAソリューションは資源の消費量という点では、CPU使用率2%や3%程度から30%までと様々に存在するからです。

古いテクノロジーのHAツールはシステム資源を大量に消費するソフトウェアであるため、サーバーが多くの処理をこなすことができません。そのため、最上位のHAソリューションといえども大して役に立ちません。IBMi(AS/400) は、より強力なサーバーを必要とすればするほど、それだけハード費用がかさみます。もし、もっと効率の良いツールを使ってハードウェアへの負荷を減らすことができれば、ハードウェアへの投資を減らすことのできる魅力的な手段となるに違いないでしょう。

HA選択の法則 5: オブジェクト管理は、しっかり考慮しているものを選ぶこと

販売されている多くのHAソリューションは設計のコンセプトがそれぞれ異なるということを、私は強調したい。過去の遺産による設計を継承し、妥協を強いられているものもあれば、RPGとかCLで作られているものもあります。その一方C++等の様にハードウェアにより近いところで動作する高水準プログラム言語を使って書かれているものもあります。

優れたHAツールは、オブジェクトが生成されたり変更されたりしたときに複製を作る仕組みをいくつかもっています。これはどんな環境においてもかなり重要ですし、オブジェクト変更管理を取り扱う手法は様々なものがあって、それらの中にも優劣があります。一般的に、実行環境にあるオブジェクトはほとんどテスト後に稼動しているので、オブジェクト置き換えのタイミングは緊急性の低い機能拡張時に行われます。従ってオブジェクトの変更はデータ変更より問題点は少ないということを理解はできますが必ずしもそうだとは思いません。勿論これは日常頻繁に発生するケースではありませんが、効率の良いオブジェクト管理はどんなHAツールにも不可欠の機能であると思います。

一般的にHAベンダーはIBMi(AS/400) の監査ジャーナルを新しいオブジェクトや変更されたオブジェクトを見つけるために使用するようです。しかしこのアプローチを選択するのは彼らだけではありません。監査ジャーナルへのアクセスを利用する技術は他にもあります。オートノミクス(自律)セキュリティシステム、SOX監査システム、パフォーマンス管理システムや他の多くのものが、システムのオブジェクト・スペースに起きた変更を把握する簡易な方法として、監査ジャーナルに目を向けています。

このアプローチは確かにうまく動作しますが、それは健全だとは思えません。なぜなら、このように監査ジャーナルを使用することは遅延の問題を発生させます。ご存知のように、多くの競合するソリューションによる監査ジャーナルの需要がどんどん増大し、それに対応してジャーナルレシーバーが大きくなるにつれて、監査ジャーナルをリアルタイムで利用する必要のあるシステムにとっては、待ち時間が大きな問題となります。確かにSOX法関連の内部監査にとっては、ある事象発生後1時間たってもジャーナルが使用できなかったとしても、最終的に使用できれば気にはしないでしょうが、HAシステムはそれとは全く違います。リアルタイムの必要性とはリアルタイムに処理されないと意味がないのです。

さて、他のアプリケーションによる監査ジャーナルの使用が増えた場合、監査ジャーナルのパフォーマンスがどの程度低下するかについては厳密に説明できませんが、それは結局いくつかのアプリケーションにとって問題点となると思います。また、このことはバックアップ機の状況が不確定の時間分、遅滞するということです。私が最も良い方法だと思うのは、一度オブジェクトが生成されたり変更されたりすれば、直ちに他のアプリケーションがロックをかける前に、その変更を反映させることです。

より良い成果を出すためには合理的で且つ効果的なテクノロジーを使用し、データ管理と同じくらい確実にオブジェクト管理を行える事が良いHAソリューションといえます。正直、私は(技術者としての見地から)、リアルタイム性を必要とするビジネス・クリティカルなアプリケーションに監査ジャーナルを使用することの有効性についてまだ納得がいきません。他の条件が同じならば、不安定なパフォーマンスを発生させない他の方法を取るべきであると思います。

HA選択の法則 6:全ての問題点に目を向ける全体的な視野を持ってください
   ・ デザイン
   ・ 技術
   ・ 信頼性
   ・ スピード
   ・ データ整合性
   ・ コスト
   ・ サポート

HAソリューションの選択は、その情報を良く調べそして常にご自分で判断して下さい。 最後に、HAソリューションは総合的なフォールトレラントを提供するものではなく、正しい選択と導入をすればダウンタイムの許容時間、または、予測時間程度に減らせるものだということを理解してください。


(出展:iSeries NEWS UK JUNE 2006 の“THE iSERIES INSIDER”に掲載されたものです)