Cephを利用した初心者向けオープンソースストレージ

by Canonical on 16 September 2022

現代の組織はIT技術に依存しています。そしてインフラにおいて何より重要なのがデータの保存です。トランザクションデータベース、ファイル共有、ビジネス分析用の膨大なデータレイクなど、すべてのデータを保存する必要があります。

従来、ストレージのニーズを満たすのは大手ハードウェアベンダーでしたが、この10年で多くの組織がコモディティハードウェア上で動作するCephのようなオープンソースソリューションに移行しています。この記事ではCephを紹介し、組織がCephを選ぶ理由も解説します。

ストレージソリューションの選択

Canonicalでは、データをどこに保存すべきかとよく尋ねられます。概してその答えを決めるのは、以下のいくつかの要因です。

  • パフォーマンスとレイテンシの要件 – 汎用VMブートイメージ、サイズの大きなファイル共有用ストレージ、巨大なデータレイクには、いずれ性能や容量を拡大できるスケールアウト型のシステムが適しています。ただし、特にミリ秒未満のレイテンシ(ビジネスサービスレベル目標 [SLO] による)が求められる、あるいはIO密度(IO/GB)が非常に高いワークロードがある場合は、独自システムのほうが良いかもしれません。
  • 予算 – 予算が無制限ならあらゆるニーズを満たすストレージシステムを設計できますが、現実的にそのようなことはありません。パフォーマンスと予算のバランスに応じて、スケールアウト型システムと独自のスケールアップ型システムを比較してどちらかを選択するほうが適切でしょう。
  • スケーリング – ストレージシステムを設計する場合、現時点で必要な容量だけでなく、今後6カ月から36カ月の必要量についても考慮すべきです。成長の程度が予想できるデータセットなら比較的簡単であり、スケールアップ型システムが最適です。その他のデータセットの場合は推測に頼るしかありません。拡張の容易なスケールアウト型システムのほうが安全です。
  • 設置場所 – プライベートクラウドを構築するならハイパーコンバージドシステムを検討しましょう。ここではストレージとコンピューターが同じノードを共有し、一緒に拡張します。あるいは、コンピューターリソースとは別にストレージを拡張できる専用ストレージノードでも対応できます。1つまたは複数のパブリッククラウドからコンピューティングを使用しているが、クラウド隣接ストレージシステムをコロケーション施設内に構築することによってデータストレージのコストを制御したい場合も当てはまります。

最後に現実的に考えて、運用寿命が(技術的にも経済的にも)十分に残っている既存システムがあればプライベートクラウドに統合します。

最新のソリューションとは?

今日の企業のダイナミックなニーズを考慮し、Canonicalは多くの場合、オープンソースのスケールアウト型ストレージソリューションであるCephをお勧めします。Cephは、単一の統合クラスターからのブロック、ファイル、オブジェクトのストレージニーズに対処できるように設計されています。Cephは、プライベートクラウドインフラストラクチャ(ハイパーコンバージドでもディスアグリゲーテッドでも)、ビッグデータ分析、リッチメディア、あるいはパブリッククラウドストレージの代替としても広く使用されています。

Cephの拡張性の高いアーキテクチャは、高成長のブロックストレージ、オブジェクトストア、データレイクに広く採用されています。物理ハードウェアはコモディティのように扱われ、データを拡張および保護するすべてのインテリジェンスは完全にソフトウェア次第です。このためCephは大容量のデータ保存に効果的に対応でき、クラウド、Openstack、Kubernetes、その他のマイクロサービスやコンテナベースのワークロードに最適です。

Cephの仕組み

Cephの主な利点は、単一クラスター内に複数のストレージタイプ用のインターフェイスを提供し、複数のストレージソリューションや特殊なハードウェアの必要性を除去して管理コストを削減できることです。一般的なクラスターは、標準サーバーと2つのイーサネットネットワーク(1つはクライアントアクセス用で、もう1つはクラスターへの内部用)で構築されています。

Cephストレージクラスターを構成するコンポーネント

  • クラスターモニター(ceph-mon)は、クラスターのマップとその状態の管理、アクティブなノードとエラー状態のノード、構成、データ配置に関する情報の追跡、認証の管理を行います。
  • マネージャー(ceph-mgr)は、クラスターランタイムメトリクスの収集、ダッシュボード機能の有効化、外部監視システムへのインターフェイスの提供を行います。
  • オブジェクトストレージデーモン(ceph-osd)は、Cephクラスターにデータを格納し、複製、イレージャーコーディング、リカバリ、およびリバランスを処理します。概念としては、オブジェクトストレージデーモンは、CPU/RAMとベースであるSSDまたはHDDのスライスと考えることができます。
  • Radosゲートウェイ(ceph-rgw)は、http/httpsを介してオブジェクトストレージAPI(S3およびswift)を提供します。
  • メタデータサーバー(ceph-mds)は、Cephファイルシステムのメタデータを格納し、ファイルシステムのファイル名とディレクトリをRADOSオブジェクトにマッピングし、POSIXセマンティクスを使用してファイルにアクセスできるようにします。
  • iSCSIゲートウェイ(ceph-iscsi)は、VMwareやWindows Serverなどの従来型のブロックストレージワークロードにiSCSIターゲットを提供します。

Cephでは、データを論理ストレージプール内にオブジェクトとして格納します。Cephクラスターには複数のプールを保有でき、それぞれのプールは異なるパフォーマンスや容量の用途に合わせて調整されています。リバランスやリカバリを効率的にスケーリングして処理するために、Cephではプールをプレイスメントグループ(PG)にシャーディングします。CRUSHアルゴリズムは、オブジェクトを格納するためのプレイスメントグループを定義し、その後に、どのCephオブジェクトストレージデーモンがプレイスメントグループを格納するかを計算します。

初めて使用する方へ

Cephは簡単に使用できます。少数のノード(またはテスト専用のVM)を持つ小さなクラスターを作り、試してみましょう。詳細はインストールガイドをご覧ください

結論

Cephはスケールアウト型オープンソースストレージを実現するソフトウェアであり、プライベートクラウドやパブリッククラウド、メディアコンテンツ保存、データレイクなどの変化するビジネスニーズに対応します。マルチプロトコルのため、複数のストレージシステムを別々に設置しなくても、すべてのブロック、ファイル、オブジェクトのストレージ要件に対応します。Cephクラスターは、あらゆるワークロードや予算に合わせて設計でき、何よりもダウンタイムなしで簡単にアップグレードや拡張が可能です。

このブログシリーズでは、今後もMAAS、Juju、Charmed Cephを使ってCephを簡単に運用する方法を解説します。

参考情報

UbuntuでのCephストレージについて読む

ウェビナーを見る – 企業向けCeph

ウェビナーを見る – Cephでストレージコストを削減

ウェビナーを見る – コスト効率の高いオープンソースクラウド運用の構築

ニュースレターのサインアップ

Ubuntuニュースレターの配信登録

お客様が購読登録を行われる場合、以下の条件に同意されたことになります。Canonicalのプライバシーに関するお知らせ個人情報保護ポリシー

関連記事

2022年クラウド価格レポート

クラウドインフラストラクチャの選択におけるクラウド価格の影響 さまざまなクラウドプラットフォームのコストの見積もりや比較は、決して簡単ではありません。パブリッククラウドプロバイダーはリソース単価の形でサービスの定価を提示しますが、プライベートクラウドの分野で同じことをするのは至難の業です。リソース単価が明確でも総所有コスト(TCO)の完全な把握にはなりません。多くの企業は、あらゆる種類のクラウドリソースの需要を自社で計算できないからです。この結果、大手クラウドプロバイダーはTCO計算機能を用意し、顧客によるコストの見積もりやデータに基づいた決定をサポートしています。 本レポートは3部構成です。まず、2022年7月時点の大手パブリック/プライベートクラウドプロバイダーのクラ […]

ハイブリッドクラウドのインフラストラクチャを最新化するためのプレイブック

CTO(最高技術責任者)向けの利用事例と戦略的ガイダンス パブリッククラウドは前例のないスピードでデジタルトランスフォーメーション を実現しました。しかし、拡張性に対するニーズが増えると、その長期的な運用 コストは厳しいものになります。ハイブリッドクラウドは、運用面の支出の抑制 や厳密な管理を可能にするプライベートインフラストラクチャと、簡単に拡張で きるパブリッククラウドという2つの環境の両方からメリットを得るための代替策 として浮かび上がりました。 ハイブリッドクラウドアーキテクチャの採用を検討している組織や企業は、プライベートクラウドベンダーの選択肢や、アプリケーションの設計と開発に対する影響、ワークロードの調整、長期メンテナンスについて慎重に考える必要があります。 […]

Firmus Supercloud が Canonicalのオープンインフラで持続可能なクラウドコンピューティングの新基準を確立

Ubuntuの提供元であるCanonicalは、オーストラリアのクラウドインフラストラクチャプロバイダーで革新的なデータセンターテクノロジーを提供するFirmusが、CanonicalのCharmed OpenStackとCharmed Kubernetesを使用して超高効率かつ持続可能なパブリッククラウドを開発したと発表しました。 データセンターは全世界の温室効果ガス放出の2%を占め、さらに増え続けています。これは主に、従来のデータセンターの設計が非効率的なためです。全世界におけるデータセンターのエネルギー効率の平均値は1.59 PUE(Power Usage Effectiveness、電力使用効率)です。つまりコンピューターを駆動する電力1MWにつき冷却システムにも […]


© 2023 Canonical Ltd. Ubuntu および Canonical は、Canonical Ltd の登録商標です。