「ストレージ2.0」いよいよ発進――ストレージもWebベースの時代に

 「ストレージ2.0」が単なる概念の域を脱し、いよいよ実用に供され始めた。最大の売りは、その安さと手軽さで、バックアップやアーカイブ用のセカンダリ・ストレージとしては、今後最も有望な選択肢となっていくことも十分に考えられる。本稿では、そんなストレージ2.0を支える技術と、そのメリット/デメリットについて詳しく解説してみることにしたい。

ロバート・シャイアー
Computerworld米国版

 米国Forrester Researchのアナリスト、アンドリュー・ライヒマン氏によれば、通常、株取引や航空券予約といった基幹業務アプリケーション向けのプライマリ・ストレージにかかるコストは、ハードウェアとソフトウェアの購入費用だけで1GB当たり50ドル以上にもなるという。バックアップやアーカイブ用のセカンダリ・ストレージのコストはそれよりはかなり安いが、それでも1GB当たり15~25ドルにはなる。

 ところが、オープンソース・ソフトウェア、低価格ハードウェアを使った分散ストレージ、それにWebを組み合わせた場合の(つまり、いわゆる「ストレージ 2.0」のサービスを利用する場合の)月額ストレージ・コストは、1GB当たりわずか15セントにすぎない。また、それを使ってデータをアップロード/ダウンロードする場合の料金も、1GB当たり10~20セント程度でしかない。

 こうしたコストを見るだけでも、ストレージ2.0の優位性は明らかだ。

 だが、それだけをもってして、現状のFibre Channelストレージ・エリア・ネットワーク(SAN)が直ちに不要になると結論づけるのは、いささか早計に過ぎる。というのも、Webベースのストレージ・サービスには、オンライン・トランザクション対応アプリケーションや膨大なデータベース・クエリに必要なパフォーマンスが得られないという弱点があるからだ。それに、ストレージ2.0には、セキュリティに関する懸念もある。インターネットという雲海に漂うノードに、自分たちのデータを預けることに対して不安を感じる企業も少なくないのだ。

 それでも、そうした不安を払拭するような有望な新技術が登場すれば、既存のストレージ・ベンダーが提供しているプロプライエタリで高価なストレージ・ハードウェア/ソフトウェア製品に対する企業の依存度は、急激に低下することになるかもしれない。

ストレージ2.0時代を切り開くテクノロジー

 新しい時代のストレージ・プラットフォームを支える「第1のテクノロジー」は、「オープンソース・ストレージ・ソフトウェア」である。この技術は、オープンソースのバックアップ・ソフトウェア「Amanda」やハードディスク消去ユーティリティ「Darik’s Boot and Nuke (DBAN) 」などのような、特定のストレージ機能を実現するツールとして提供されている。ストレージ・インフラの基本構造を構成するオープンソースのネットワーク・ファイル・システムである「Lustre」、「OpenAFS」、「SAMBA」なども、この第1のテクノロジーに含まれる。

 「第2のテクノロジー」は、「分散グリッド/クラスタ・ベースのストレージ・アーキテクチャ」と「洗練されたサービス」である。前者は米国の新興企業Cleversafeが提案する技術であり、後者は、すでに確固としたユーザー基盤を築いているBerkeley Data Systemsのオンライン・バックアップ・サービス「MozyPro」などで採用されている。

 「第3のテクノロジー」は、こうしたアーキテクチャで、ハイエンド・ストレージ・アレイの代わりに「業界標準のサーバとディスク・ドライブを採用すること」である。

 ここで、この3つのテクノロジーを使った「ストレージ2.0システム」をいくつか見てみよう。

 まず最初に紹介するのは、Berkeley Data SystemsのMozyProだ。このサービスは、同社データ・センターに設置された「ホワイト・ボックス」(ノーブランド)サーバで稼働するストレージ・クラスタリングとファイル・サービング・ソフトウェアによって構成されており、データはサーバの内部ディスク・ドライブに保管されるようになっている。同サービスの利用料金は、デスクトップまたはサーバ1台当たり4ドル/月、データ保管料は1GB当たり50セント/月である。

 なお、オンライン・ストレージ・プロバイダーの多くは顧客のデータを保護するために2重にコピーを取っているが、Berkeleyの製品担当副社長、バンス・チェケッツ氏によれば、同社のソフトウェアは、オリジナル・データの33%をコピーしておくだけで、必要に応じて全オリジナル・データをリストアできるようになっているという。つまり、ほかのプロバイダーが稼働中のアプリケーションの分も含めてオリジナル・データの300%を保管しておかなければならないのに対し、Berkeleyの場合は133%を保管しておくだけで済むわけだ。

 従業員29名の新興企業、Cleversafeの場合は、さらに保管量をセーブできるという。というのも、同社が現在アルファ・テスト中のソフトウェア(Cleversafe)では、独自のアルゴリズムを使って暗号化されたデータを11の「スライス」に切り分けて分散サーバに保管するようになっているからだ。また、同じアルゴリズムを通せば、スライスからオリジナル・データを再生することも可能だし、スライスを組み合わせることによって、さまざまな有用情報を生み出すことも可能である。

 CleversafeのCEO、クリス・グラッドウィン氏によれば、このように、ファイル全体をバックアップ/アーカイブ/リストアする必要がなくなるので、基幹情報を保護するために保管するデータの量を、オリジナル・データの130%に抑えることができるという。

 また、このデータ・スライシングの手法を使えば、ファイルのコピーを丸ごと保管することがなくなるため、データが盗まれたり破壊されたりといった危険性が薄まる。つまり、この手法は「本質的にセキュアな技術」(グラッドウィン氏)だというわけだ。さらに、Cleversafeでは、11ノードのうち5ノードに障害が発生してもデータを復旧することが可能であり、可用性にも優れている。

 米国テキサス州ヒューストンに本拠を構えるホスティング会社、プラネット・ドットコムは、旧式サーバを使って低コストのストレージ・グリッドを構築するために、 Cleversafeを導入することを検討しているという。「ディスク・ドライブを適切にアップグレードしても、3~4年のライフサイクルを保つのが精一杯だ。だったら、Cleversafeを導入したほうがよい。そうすれば、5~6年のライフサイクルが得られるだけでなく、(スライシングで)節約できたストレージを、顧客に提供することもできる」(同社のCEO、ダグ・エドウィン氏)というのが、その理由だ。

 もっとも、Cleversafeのメリットは「低コスト」だけではない。イリノイ州シカゴにあるネットワーク・コンサルティング会社、オンショア・ネットワークスの創業者兼社長であるステリオス・バラバニス氏は、同社の顧客の間では、「低コスト」よりも「高セキュリティ」というCleversafeのメリットほうが魅力的に映るだろうと見る。

 なお、クレバーセーフは、グリッドに保管する「余分な」コードをさらに少なくする機能や、ユーザーとアプリケーションがグリッドを「ネットワーク・ドライブ」としてとらえる機能を今年末にも提供する予定であり、オンショア・ネットワークスとプラネット・ドットコムはこれらの新機能の登場を待って今後の方向性を決めることにしている。

 現在、世界で最大のオンライン・ストレージ・サービス・プロバイダーは、おそらくAmazon.comであろう。Amazon Web Servicesの製品管理/ディベロッパー・リレーションズ担当副社長アダム・セリプスキー氏によれば、同社のストレージ・サービス「Amazon S3」は、「複数の場所に点在する複数のアレイによって構成されているストレージ・サーバに、顧客データのコピーを複数保管している」という。ちなみに、利用料金をかなり低めに設定している同サービスの顧客ターゲットは、「革新的なアプリケーションを実験的に構築しているディベロッパー」(同氏)である。

 なお、S3のストレージ利用料金は1GB当たり月額15セント。また、アップロード料金は1GB当たり10セント、ダウンロード料金は同13~18セントとなっている。

ストレージ2.0とは?

  • 定義:「オープンソース・ソフトウェア」、「グリッドまたはクラスタ・ストレージ・アーキテクチャ」、さらには「低価格の標準ハードウェア」を使ってWeb経由で提供されるストレージ・サービス。
  • メリット:非常に低コストで、管理がしやすく、高度なスケーラビリティが得られる。
  • デメリット:ハイエンド・アプリケーションに必要なパフォーマンスと信頼性を得ることができない。顧客によってはセキュリティ上の懸念が生じる可能性もある。
  • 結論:少なくとも、バックアップやアーカイブなどのセカンダリ・アプリケーション用として検討する価値はある。また、将来的には企業のファイアウォール内への導入も考えられる。

主要ストレージ・ベンダーは
ストレージ2.0時代にどう対応するのか

 米国の市場調査会社イルミナータのアナリスト、ジョン・ウェブスター氏は、オープンソース・ソフトウェアとグリッド・ストレージ技術の組み合わせは、コピー、バックアップ、障害復旧ソフトウェアを手がけるベンダーにとって重大な脅威になるおそれがあると警告する。

 「このアプローチがうまく機能するようになれば、ストレージ管理のあり方が根本的に単純化され、(ストレージ市場の)競争環境に一大変革が生じる」(同氏)というのである。

 他方、観測筋の中には、「基幹アプリケーションについては今後もプロプライエタリ製品が主力であり続ける」と予測する向きもある。

 その理由としてまず挙げられるのが、インターネットが本質的に有している「レイテンシー(待ち時間)と予測不可能性」の問題だ。これがあるため、ストレージ・マネジャーはストレージ2.0サービスにおいて、確固たる信頼性と予測可能なレスポンス・タイムを得ることができず、Webサービス(ストレージ 2.0)への移行をためらうというのである。

 さらにもう1つ、「セキュリティ」の問題もある。米国カリフォルニア州トーランスにあるマーケティング・デザイン会社、ピーパー・アンド・アソシエイツが、オンライン・ストレージ・ベンダーから猛烈な売り込みを受けているにもかかわらずストレージ2.0サービスの利用に踏み切ろうとしないのも、まさにそのためである。

 同社社長のジェフ・ピーパー氏は、「顧客と秘密保持契約を交わしているため、顧客データの安全性は絶対に確保しなければならない。よって、今後も日立の4テラバイトSANを使い続けていくことになる」と断言する。

 もっとも、イルミナータのウェブスター氏が指摘するように、社内にグリッド環境を構築しているような企業であれば、自分たちで独自にネットワークをコントロールすることもできる。

 つまり、セキュリティを確保することが可能なのだ。したがって、そんな企業では、プライマリ・ストレージとして分散ストレージ(ストレージ2.0)を導入することも可能なわけである。ただし、当然のことながらベンダーのサービスは受けられないため、それなりの手間はかかることになるが。

 ところで、分散ストレージ(ストレージ2.0)にすれば、ユーザー企業はどれくらいのコストを削減することができるのだろうか。

 Forresterのライヒマン氏によれば、分散ストレージにかかるコストに関しては、初期費用はストレージ・ハードウェアを自前で購入する場合に比べるとはるかに少なくて済むことがわかっているが、長期的な管理コストがどうなるかについてはまだ明確な答えが出ていないという。

 Cleversafeのグラッドウィン氏は、コストについて議論をするのはまだ時期尚早であるとしながらも、削減額は、基本的に同社のソフトウェアを使った分散ストレージによって削減されることになるディスク・スペース、消費電力、設置床面積、管理作業に「見合ったものになるはずだ」としている。

 いずれにしろ、これまでストレージ・ハードウェアを社内に設置していた顧客がWebベース・プロバイダーのサービスに移行するようになれば、ストレージ・ハードウェア・ベンダーのビジネスに影響が出ることは避けられない。もっとも、サーバも手がけているようなベンダーであれば、分散ストレージを構成する低価格サーバや「グリッドの構築要素」を販売することによって、「多少の穴埋め」はできるかもしれないが……。 

 一方、オンショア・ネットワークスのバラバニス氏は、ストレージ2.0はストレージ・ハードウェア・ベンダーにとって追い風になるとの見方を示す。

 「たとえCleversafeによって低価格ハードウェアが利用できるようになったとしても、現実問題として、自社でグリッドを構築するような大手企業が安価なディスクを購入するようになるとは考えにくい。EMCのディスクを採用している企業が、グリッド・モデルに移行するからといって、果たしてEMC以外のベンダーからディスクを購入しようとするだろうか」というのが、同氏の論拠である。

 他方、Berkeley Data Systemsの創業者兼CEO、ジョシュ・コーツ氏は、ほかのオンライン・ベンダー同様、MozyProなどのオンライン・ストレージ・サービスを、テープ・ベースのバックアップ・システムをリプレースする技術だと見ている。

 Berkeleyや競合のカーボナイトなどが提供するオンライン・ストレージ・サービスは、スピード、信頼性、使いやすさなどさまざまな点でテープ・システムに勝っており、顧客の「テープ・システム離れ」はとめることができないというわけだ。

 コーツ氏が「急進派」であるとするなら、Cleversafeのグラッドウィン氏は、はるかに「穏健派」である。実際、同氏はCleversafeを、現行のストレージ製品を「代替」するものではなく「補完」するものとだと位置づけている。

 例えば、Cleversafeにも独特なバックアップ機能が組み込まれているが、だからといって、特定時間におけるデータの状態を把握するためのスナップショットを取らなくなるような顧客はあまりいないだろう──というのがグラッドウィン氏の見方なのである。

 ところで、「置き換わる」にしろ「補完する」にしろ、オンライン・ストレージ・サービス(ストレージ2.0)は、どういった層から普及することになるのだろうか。

 まずは「困難極まる」ストレージの管理作業から逃れたいと願う中小企業層から普及することになるはずだと予測するのは、Forresterのライヒマン氏だ。そして、そこでこのテクノロジーのメリットが実証されれば、次に、より規模の大きな企業がセカンダリ・ストレージをサード・パーティ・ベンダーに移行し始めることになるだろうと、同氏は見る。

 さらに、管理を他人の手にゆだねるのには抵抗があるがコストは削減したいというような大企業では、サード・ベンダーのサービスを導入するのではなく、ストレージ2.0の技術を社内導入するようなところも出てくるだろうという。

 Amazonのセリプスキー氏も、ライヒマン氏と同じような意見の持ち主であり、Amazon S3がエンタープライズ分野に参入できる可能性は十分にあると主張する。その主張の裏づけとして、「小規模企業は、可能な限りシンプルで、対話しやすく、統合も簡単で、信頼性が高いサービスを求めている」(同氏)という理由を挙げるところも、ライヒマン氏とそっくりだ。

 セリプスキー氏はまた、大企業──本体ではなく、その部門や部署──も、有望なユーザーだと見なしている。大企業の部門や部署には、大型インフラ構築プロジェクトを立ち上げるほどの予算やパワーはないかもしれないが、「四半期当たり500ドルから5万ドル程度なら、コンセプトを証明したり新しい技術を試用したりする費用として使えるはずだ」(同氏)と見ているのである。

あせらず、時間をかけて

 こうやって見てくると、とりあえず中小企業中心かもしれないが、近い将来、ストレージ2.0の波がユーザー企業に押し寄せることになるのは間違いなさそうだ。

 だとすれば、導入に当たって、ユーザー企業は何に注意すべきなのだろうか。

 「グリッド・ストレージへの移行は短期間で成し遂げられるものではないし、またそうする必要もない。特に、Cleversafeのような斬新なアプローチを採用する際は、周囲の理解を得るとともにテクノロジーをある程度知るため、十分に時間をかける必要がある」とアドバイスを贈るのは、オンショア・ネットワークスのバラバニス氏だ。

 また、普及の時期については、Cleversafeのグラッドウィン氏の次のような見解が参考になろう。

 「一般的にIT部門がハードウェアをリプレースするサイクルは4年とされる。つまり、つい最近新しいアーキテクチャを導入したばかりの組織が、半年後にそれを入れ替えるということはまずないと考えてよい。しかしながら、今から2~3年後ともなれば、大規模なアーカイブ・アプリケーションに分散アーキテクチャを採用することも、さほど珍しくなくなっているに違いない」

 そしてそのころには、ユーザー側とディベロッパー側の「ストレージ革命の先駆者たち」も、自分たちが起こした変革がどれほど大きいものであったかに気づいているはずだ。

提供:Computerworld.jp