ハイパースケールストレージの本当の意味

明確にしましょう:ハイパースケールはあなたがどれだけ大きいかではありません。

ハイパースケールソリューションを活用するために、組織が巨大である必要はありません。しかし、それはまさに、多くのITインフラストラクチャ、運用、およびDevOpsのプロがハイパースケールについて最初に学んだときに考えていることです。

ハイパースケールアーキテクチャは、数千のインスタンスとペタバイトのデータに拡張できるため、LinkedIn、Amazon、Netflixなどの非常に大規模なインフラストラクチャを対象としているというのが一般的な信念です。結局のところ、ハイパースケールはサイズではなくアプローチを説明するものと考える方がよいでしょう。それは、自動化、オーケストレーション、およびビジネスが必要とするときにインテリジェントに拡張できるITの構築に関するものです。ハイパースケール展開は、小規模から開始して、無期限に拡張することができます。また、インフラストラクチャの必要な部分のみを個別にスケーリングできるようにする必要があります。これは、別の新しいエンタープライズデータセンターのトレンドであるハイパーコンバージェンスに対抗するものです。

まだ混乱していますか?もしそうなら、あなたは一人ではありません。もう少し深く掘り下げてみましょう。

ハイパースケールの定義

ハイパースケールアーキテクチャを構築するという概念は、多くの接線の用語によって混乱しています。特に、ハイパーコンバージド、ハイパースケール(またはWebスケール)、コンバージド、ソフトウェア定義、およびコモディティベースのインフラストラクチャについて顧客が混乱していることがわかります。

これらの成分用語の定義を明確にするために少し時間を取ってみましょう:

  • ソフトウェア定義:機能が基盤となるハードウェアから完全に分離され、拡張可能でプログラム可能なインフラストラクチャ。特にソフトウェアデファインドストレージの詳細については、この投稿をお読みください。
  • コモディティベース:コモディティまたは業界標準のインフラストラクチャ上に構築されたインフラストラクチャ、通常はx86ラックマウントまたはブレードサーバー。過去に書いたように、商品を安いものと混同しないでください。
  • コンバージド:サーバー、ストレージ、ネットワーク、仮想化/コンテナ化のコンポーネントが、事前にテストされ、事前に統合されたソリューションとして結び付けられているスケールアウトアーキテクチャ。このアーキテクチャでは、コンポーネントは依然として異なります。
  • ハイパーコンバージド:単一のソリューション(多くの場合、単一のアプライアンス)としてパッケージ化されたコモディティハードウェア上にソフトウェア定義コンポーネントを組み合わせることにより、コンバージドインフラストラクチャをさらに一歩進めるスケールアウトアーキテクチャ。コンポーネントはもはや区別されません。
  • ハイパースケールソフトウェア定義でコモディティベースのスケールアウトアーキテクチャですが、サーバー、ストレージ、ネットワーク、仮想化/コンテナ化のリソースは分離されたままです。各コンポーネントは個別であり、個別にスケーリングできます。

要約すると、ハイパーコンバージドインフラストラクチャは、コンバージドシステムの最新の論理的な極限と考えてください。一方、ハイパースケールは、30年間データセンターを構築してきた方法の最新の論理的な極限です。以下に示すように、どちらも特定の環境に適しています。

ハイパースケールおよびハイパーコンバージド

Hedvigでは、DockerやOpenStackなどのプライベートクラウドから、HadoopまたはNoSQLを実行するビッグデータのデプロイ、従来のサーバー仮想化、ディザスタリカバリ、バックアップ、アーカイブまで、あらゆるワークロードに柔軟に対応できるストレージソリューションの提供に努めています。Hedvig Distributed Storage Platformは、サーバークラスターまたはクラウド内のフラッシュディスクと回転ディスクを仮想化および集約し、ファイル、ブロック、またはオブジェクトインターフェイスからアクセスできる単一の弾力性のあるストレージシステムとして提供します。

Hedvig分散ストレージプラットフォームは、次の3つのコンポーネントで構成されています。

  • Hedvig Storage Service:既製のx86サーバーとARMサーバーでストレージのパフォーマンスと容量を拡張する特許取得済みの分散システムエンジン。Hedvig Storage Serviceは、オンプレミスまたはAWS、Azure、Googleなどのパブリッククラウドで実行できます。インライン重複排除、インライン圧縮、スナップショット、クローン、シンプロビジョニング、自動階層化、キャッシュなど、エンタープライズ展開に必要なすべてのストレージオプションと機能を提供します。
  • Hedvig Storage Proxy:業界標準のプロトコルを介してHedvig StorageServiceにアクセスできるようにする軽量のVMまたはコンテナー。Hedvigは現在、ファイル用のNFSとブロック用のiSCSI、およびOpenStackCinderとDockerドライバーをサポートしています。Hedvig Storage Proxyは、ローカルSSDおよびPCIeフラッシュリソースを使用したクライアント側のキャッシュと重複排除も可能にし、高速なローカル読み取りと効率的なデータ転送を実現します。
  • Hedvig API:オブジェクトストレージとHedvig操作の両方に対応するRESTおよびRPCベースのAPI。Hedvigは現在、オブジェクトストレージとしてAmazonS3とSwiftをサポートしています。開発者とIT運用管理者は、管理APIを使用して、すべてのHedvigストレージ機能にアクセスできるようにし、セルフサービスポータル、アプリケーション、およびクラウドを使用してプロビジョニングと管理を自動化できます。

Hedvigは、Hedvig StorageProxyとHedvigStorage Serviceを、ハイパーバイザーまたはコンテナーOSを備えたコモディティサーバー上で実行される仮想アプライアンスとしてバンドルすることにより、ハイパーコンバージェンスをサポートします。ハイパースケールの場合、Hedvig Storage Serviceはベアメタルサーバーにデプロイされて専用のストレージ層を形成し、Hedvig StorageProxyはコンピューティング層の各サーバーにVMまたはコンテナーとしてデプロイされます。

ストレージにハイパースケールを選択する理由

データはストレージの予算よりもはるかに速く成長しています。アマゾン、グーグル、フェイスブックのようなインターネットゴリアテスのリソースを持たない企業にとって、経済は不自由になっています。したがって、企業は、ソフトウェア定義のコモディティベースのストレージを採用して、コストを削減し、ビジネス要件に対応するために必要な柔軟性とスケーラビリティを維持する必要があります。

Hedvigでは、両方をサポートしているにもかかわらず、約80%の確率で、顧客がハイパーコンバージドではなくハイパースケールアーキテクチャを選択していることに気づきました。さらに興味深いのは、多くのお客様が正反対のことを考えて私たちのところにやってくるということです。約80%が最初にハイパーコンバージドソリューションを要求しますが、宿題をした後、ハイパースケールアプローチを選択します。

どうして?一言で言えば、インフラストラクチャを設計する際に、何よりも柔軟性(またはその用語を使用する必要がある場合は敏捷性)を優先するためです。次のことを考慮してください。

  • ハイパーコンバージドシステムは、ITへの簡素化された「ビルディングブロック」アプローチを提供します。クラウドのようなインフラストラクチャの展開と拡張のオーバーヘッドを削減しようとしている無駄のないIT組織にとって、ハイパーコンバージェンスは優れたソリューションを提供します。ただし、「データの局所性」が最優先事項である、比較的予測可能な一連のワークロードが必要です。つまり、アプリケーションまたはVMをデータのできるだけ近くに配置する必要があります。これが、VDIがハイパーコンバージェンスのポスターチャイルドである理由です。ユーザーは「仮想C:ドライブ」をローカルにしたいと考えています。ただし、ロックステップですべての要素をスケーリングする必要があるため、柔軟性はありません。
  • ハイパースケールシステムは、ストレージをコンピューティングから独立させ、企業のITがビジネスの必要に応じて容量を拡張できるようにします。データセンターとクラウドインフラストラクチャへのハイパースケールアプローチは、高レベルの弾力性を提供し、組織が変化するアプリケーションとデータストレージのニーズに迅速に対応するのに役立ちます。また、HadoopやNoSQLなどの最新のワークロードや、OpenStackやDockerなどのクラウドプラットフォームで設計されたワークロードによりよく一致するアーキテクチャでもあります。これらはすべて、独立してスケーリングされた共有ストレージの恩恵を受ける分散システムの例です。

私たちは、お客様との経験したことは、我々はしばらくの間、今注目していたものの集まりの確認です:hyperconvergedであることを答えない現代のストレージアーキテクチャを探索するときの答え。確かに、業界では、その単純さのために、ハイパーコンバージドへの大きな振り子の揺れが見られます。ただし、データが指数関数的に増加し、コンピューティングニーズが増加していない場合は、ハイパーコンバージェンスにはあまり適していないインピーダンスの不一致があります。

ハイパースケールまたはハイパーコンバージド?

ハイパーコンバージドは、より単純で費用効果の高いアプローチです。ただし、Hedvigでお客様が発見したのは、ハイパースケールをほぼすべてのワークロードに適したものにする機能、つまりクライアント側のキャッシュをサポートしていることです。 Hedvigは、コンピューティング層のローカルSSDおよびPCIeデバイスを利用して、ライトスルーキャッシュを構築できます。これにより、読み取りパフォーマンスが大幅に向上し、さらに重要なことに、データの局所性の課題が解決されます。ストレージは引き続き分離され、専用のハイパースケール層で実行されますが、アプリケーション、VM、およびコンテナーは、コンピューティング層でローカルにキャッシュされたデータの恩恵を受けることができます。これにより、キャッシュ層を拡大する方法の問題も解決されますが、それは別の記事のトピックです。

この利点の例として、ある顧客は、VDIに対してHedvigのハイパースケールアプローチを選択しました。これは、前述のように、従来はハイパーコンバージドソリューション用に予約されていたワークロードです。この例では、お客様には、ホストされている各デスクトップ専用に16個のvCPUと32GBのメモリを必要とする「パワーユーザー」がいました。その結果、同社は、処理とメモリの要件をサポートするために多数のハイパーコンバージドノードを展開することを余儀なくされましたが、ロックステップでストレージ容量を不必要に増やしていました。

Hedvigプラットフォームを使用すると、お客様は、適切なCPUとRAMを備えた頑丈なブレードサーバーでCitrixXenDesktopファームを実行するための専用ノードを作成することができました。データはラックマウントサーバー上の別のハイパースケールHedvigクラスターに保持され、データはローカルSSDのXenDesktopサーバーにキャッシュバックされました。結果?劇的に安価なソリューション(60%少ない)。さらに重要なことは、会社がムーアの法則に乗り、ストレージサーバーをアップグレードせずにデスクトップパフォーマンスをアップグレードするために必要な最も強力なサーバーを購入できる、より柔軟な環境も提供したことです。

私たちの経験に基づいて、どのアーキテクチャがあなたに適しているかを判断するための簡単な経験則がいくつかあります。

  • ハイパースケールを選択するのは、組織に5,000人以上の従業員、500テラバイトを超えるデータ、500を超えるアプリケーション、または1,000を超えるVMがある場合です。
  • ハイパーコンバージドを選択するのは、これらのウォーターマーク数を下回っている場合、仮想インフラストラクチャを管理するスタッフが5人以下の場合、またはリモートオフィスやブランチオフィスにいる場合です。

良いニュースは、それがどちらかまたは両方の決定である必要はないということです。ハイパーコンバージド環境で開始してからハイパースケールに切り替えるか、2つを組み合わせて組み合わせることができます。私たちの哲学は、アプリケーションによってどちらを使用するかが決まるということです。また、アプリケーションのニーズは時間の経過とともに変化するため、デプロイメントも変化するはずです。

現代のビジネスでは、変化と成長が必須です。ますます、Webの巨人が開拓したハイパースケールアーキテクチャなしでは、この難問を解決する方法はありません。変更されたのは、どの企業もハイパースケールアプローチの恩恵を受けることができるということです。

Rob Whiteleyは、Hedvigのマーケティング担当副社長です。

New Tech Forumは、前例のない深さと幅で新しいエンタープライズテクノロジーを探索して議論する場を提供します。選択は主観的であり、読者にとって重要で最も興味深いと思われるテクノロジーの選択に基づいています。出版用のマーケティング資料を受け入れず、寄稿されたすべてのコンテンツを編集する権利を留保します。すべてのお問い合わせは[email protected]までお送りください。