Cephを利用した初心者向けオープンソースストレージ

by Canonical on 16 September 2022

現代の組織はIT技術に依存しています。そしてインフラにおいて何より重要なのがデータの保存です。トランザクションデータベース、ファイル共有、ビジネス分析用の膨大なデータレイクなど、すべてのデータを保存する必要があります。

従来、ストレージのニーズを満たすのは大手ハードウェアベンダーでしたが、この10年で多くの組織がコモディティハードウェア上で動作するCephのようなオープンソースソリューションに移行しています。この記事ではCephを紹介し、組織がCephを選ぶ理由も解説します。

ストレージソリューションの選択

Canonicalでは、データをどこに保存すべきかとよく尋ねられます。概してその答えを決めるのは、以下のいくつかの要因です。

  • パフォーマンスとレイテンシの要件 – 汎用VMブートイメージ、サイズの大きなファイル共有用ストレージ、巨大なデータレイクには、いずれ性能や容量を拡大できるスケールアウト型のシステムが適しています。ただし、特にミリ秒未満のレイテンシ(ビジネスサービスレベル目標 [SLO] による)が求められる、あるいはIO密度(IO/GB)が非常に高いワークロードがある場合は、独自システムのほうが良いかもしれません。
  • 予算 – 予算が無制限ならあらゆるニーズを満たすストレージシステムを設計できますが、現実的にそのようなことはありません。パフォーマンスと予算のバランスに応じて、スケールアウト型システムと独自のスケールアップ型システムを比較してどちらかを選択するほうが適切でしょう。
  • スケーリング – ストレージシステムを設計する場合、現時点で必要な容量だけでなく、今後6カ月から36カ月の必要量についても考慮すべきです。成長の程度が予想できるデータセットなら比較的簡単であり、スケールアップ型システムが最適です。その他のデータセットの場合は推測に頼るしかありません。拡張の容易なスケールアウト型システムのほうが安全です。
  • 設置場所 – プライベートクラウドを構築するならハイパーコンバージドシステムを検討しましょう。ここではストレージとコンピューターが同じノードを共有し、一緒に拡張します。あるいは、コンピューターリソースとは別にストレージを拡張できる専用ストレージノードでも対応できます。1つまたは複数のパブリッククラウドからコンピューティングを使用しているが、クラウド隣接ストレージシステムをコロケーション施設内に構築することによってデータストレージのコストを制御したい場合も当てはまります。

最後に現実的に考えて、運用寿命が(技術的にも経済的にも)十分に残っている既存システムがあればプライベートクラウドに統合します。

最新のソリューションとは?

今日の企業のダイナミックなニーズを考慮し、Canonicalは多くの場合、オープンソースのスケールアウト型ストレージソリューションであるCephをお勧めします。Cephは、単一の統合クラスターからのブロック、ファイル、オブジェクトのストレージニーズに対処できるように設計されています。Cephは、プライベートクラウドインフラストラクチャ(ハイパーコンバージドでもディスアグリゲーテッドでも)、ビッグデータ分析、リッチメディア、あるいはパブリッククラウドストレージの代替としても広く使用されています。

Cephの拡張性の高いアーキテクチャは、高成長のブロックストレージ、オブジェクトストア、データレイクに広く採用されています。物理ハードウェアはコモディティのように扱われ、データを拡張および保護するすべてのインテリジェンスは完全にソフトウェア次第です。このためCephは大容量のデータ保存に効果的に対応でき、クラウド、Openstack、Kubernetes、その他のマイクロサービスやコンテナベースのワークロードに最適です。

Cephの仕組み

Cephの主な利点は、単一クラスター内に複数のストレージタイプ用のインターフェイスを提供し、複数のストレージソリューションや特殊なハードウェアの必要性を除去して管理コストを削減できることです。一般的なクラスターは、標準サーバーと2つのイーサネットネットワーク(1つはクライアントアクセス用で、もう1つはクラスターへの内部用)で構築されています。

Cephストレージクラスターを構成するコンポーネント

  • クラスターモニター(ceph-mon)は、クラスターのマップとその状態の管理、アクティブなノードとエラー状態のノード、構成、データ配置に関する情報の追跡、認証の管理を行います。
  • マネージャー(ceph-mgr)は、クラスターランタイムメトリクスの収集、ダッシュボード機能の有効化、外部監視システムへのインターフェイスの提供を行います。
  • オブジェクトストレージデーモン(ceph-osd)は、Cephクラスターにデータを格納し、複製、イレージャーコーディング、リカバリ、およびリバランスを処理します。概念としては、オブジェクトストレージデーモンは、CPU/RAMとベースであるSSDまたはHDDのスライスと考えることができます。
  • Radosゲートウェイ(ceph-rgw)は、http/httpsを介してオブジェクトストレージAPI(S3およびswift)を提供します。
  • メタデータサーバー(ceph-mds)は、Cephファイルシステムのメタデータを格納し、ファイルシステムのファイル名とディレクトリをRADOSオブジェクトにマッピングし、POSIXセマンティクスを使用してファイルにアクセスできるようにします。
  • iSCSIゲートウェイ(ceph-iscsi)は、VMwareやWindows Serverなどの従来型のブロックストレージワークロードにiSCSIターゲットを提供します。

Cephでは、データを論理ストレージプール内にオブジェクトとして格納します。Cephクラスターには複数のプールを保有でき、それぞれのプールは異なるパフォーマンスや容量の用途に合わせて調整されています。リバランスやリカバリを効率的にスケーリングして処理するために、Cephではプールをプレイスメントグループ(PG)にシャーディングします。CRUSHアルゴリズムは、オブジェクトを格納するためのプレイスメントグループを定義し、その後に、どのCephオブジェクトストレージデーモンがプレイスメントグループを格納するかを計算します。

初めて使用する方へ

Cephは簡単に使用できます。少数のノード(またはテスト専用のVM)を持つ小さなクラスターを作り、試してみましょう。詳細はインストールガイドをご覧ください

結論

Cephはスケールアウト型オープンソースストレージを実現するソフトウェアであり、プライベートクラウドやパブリッククラウド、メディアコンテンツ保存、データレイクなどの変化するビジネスニーズに対応します。マルチプロトコルのため、複数のストレージシステムを別々に設置しなくても、すべてのブロック、ファイル、オブジェクトのストレージ要件に対応します。Cephクラスターは、あらゆるワークロードや予算に合わせて設計でき、何よりもダウンタイムなしで簡単にアップグレードや拡張が可能です。

このブログシリーズでは、今後もMAAS、Juju、Charmed Cephを使ってCephを簡単に運用する方法を解説します。

参考情報

UbuntuでのCephストレージについて読む

ウェビナーを見る – 企業向けCeph

ウェビナーを見る – Cephでストレージコストを削減

ウェビナーを見る – コスト効率の高いオープンソースクラウド運用の構築

ニュースレターのサインアップ

Ubuntuニュースレターの配信登録

お客様が購読登録を行われる場合、以下の条件に同意されたことになります。Canonicalのプライバシーに関するお知らせ個人情報保護ポリシー

関連記事

コンテナ化されたセキュアなCephとUbuntuのコンテナイメージ

Cephalocon 2023(オランダ・アムステルダム)で発表したように、CanonicalはCephのコンテナイメージを公開しました。これによってUbuntuでCephを使用している、またはCephをデプロイしたい平均的なCephユーザーにどんな影響があるのか、ブースには多くの質問が寄せられました。 このブログ記事では、CephのコンテナイメージをUbuntuで実行するユーザーのメリットと、それらが具体的にどのようにセキュリティを改善するかを解説します。 OCIとは OCIイメージ(Open Container Initiative)とは、対応する各種のホスト環境で使用可能な標準化されたソフトウェアコンテナです。長年、ソフトウェアの配布には通常のパッケージが使用されて […]

Canonical プレゼンツ:Dell Technologies Forum 2023 – イノベーションと成長の力を解放する

Dell Technologies Forum 2023は、イノベーションと組織の成長を目指すビジネスリーダーやスペシャリストに向けた、デル・テクノロジーズの日本における最大のイベントです。今年も会場とオンラインで同時に開催され、最新のITトレンドや最先端テクノロジーのご紹介のほか、実際に変革を成し遂げた企業の事例、様々なセッションをご用意しています。 Canonicalの参加 Canonicalはパートナーとして、デルプラットフォームとの共同ソリューションの成功事例をいくつか紹介します。さらに、最新のAIプラットフォームソリューションを展示します。信頼できるAI/MLオープンソースプラットフォーム、Ubuntuは、開発者からエッジまで、AIの構想を支援するプラットフォー […]

ハイブリッドクラウドの導入

パブリッククラウドは前例のないスピードでデジタルトランスフォーメーション を実現しました。しかし、拡張性に対するニーズが増えると、その長期的な運用 コストは厳しいものになります。ハイブリッドクラウドは、運用面の支出の抑制 や厳密な管理を可能にするプライベートインフラストラクチャと、簡単に拡張で きるパブリッククラウドという2つの環境の両方からメリットを得るための代替策 として浮かび上がりました。 ハイブリッドクラウドアーキテクチャの採用を検討している組織や企業は、プライベートクラウドベンダーの選択肢や、アプリケーションの設計と開発に対する影響、ワークロードの調整、長期メンテナンスについて慎重に考える必要があります。このガイドは、十分な情報を得た上で意思決定を行おうとしてい […]


© 2023 Canonical Ltd. Ubuntu および Canonical は、Canonical Ltd の登録商標です。