Cephを利用した初心者向けオープンソースストレージ

by Canonical on 16 September 2022

現代の組織はIT技術に依存しています。そしてインフラにおいて何より重要なのがデータの保存です。トランザクションデータベース、ファイル共有、ビジネス分析用の膨大なデータレイクなど、すべてのデータを保存する必要があります。

従来、ストレージのニーズを満たすのは大手ハードウェアベンダーでしたが、この10年で多くの組織がコモディティハードウェア上で動作するCephのようなオープンソースソリューションに移行しています。この記事ではCephを紹介し、組織がCephを選ぶ理由も解説します。

ストレージソリューションの選択

Canonicalでは、データをどこに保存すべきかとよく尋ねられます。概してその答えを決めるのは、以下のいくつかの要因です。

  • パフォーマンスとレイテンシの要件 – 汎用VMブートイメージ、サイズの大きなファイル共有用ストレージ、巨大なデータレイクには、いずれ性能や容量を拡大できるスケールアウト型のシステムが適しています。ただし、特にミリ秒未満のレイテンシ(ビジネスサービスレベル目標 [SLO] による)が求められる、あるいはIO密度(IO/GB)が非常に高いワークロードがある場合は、独自システムのほうが良いかもしれません。
  • 予算 – 予算が無制限ならあらゆるニーズを満たすストレージシステムを設計できますが、現実的にそのようなことはありません。パフォーマンスと予算のバランスに応じて、スケールアウト型システムと独自のスケールアップ型システムを比較してどちらかを選択するほうが適切でしょう。
  • スケーリング – ストレージシステムを設計する場合、現時点で必要な容量だけでなく、今後6カ月から36カ月の必要量についても考慮すべきです。成長の程度が予想できるデータセットなら比較的簡単であり、スケールアップ型システムが最適です。その他のデータセットの場合は推測に頼るしかありません。拡張の容易なスケールアウト型システムのほうが安全です。
  • 設置場所 – プライベートクラウドを構築するならハイパーコンバージドシステムを検討しましょう。ここではストレージとコンピューターが同じノードを共有し、一緒に拡張します。あるいは、コンピューターリソースとは別にストレージを拡張できる専用ストレージノードでも対応できます。1つまたは複数のパブリッククラウドからコンピューティングを使用しているが、クラウド隣接ストレージシステムをコロケーション施設内に構築することによってデータストレージのコストを制御したい場合も当てはまります。

最後に現実的に考えて、運用寿命が(技術的にも経済的にも)十分に残っている既存システムがあればプライベートクラウドに統合します。

最新のソリューションとは?

今日の企業のダイナミックなニーズを考慮し、Canonicalは多くの場合、オープンソースのスケールアウト型ストレージソリューションであるCephをお勧めします。Cephは、単一の統合クラスターからのブロック、ファイル、オブジェクトのストレージニーズに対処できるように設計されています。Cephは、プライベートクラウドインフラストラクチャ(ハイパーコンバージドでもディスアグリゲーテッドでも)、ビッグデータ分析、リッチメディア、あるいはパブリッククラウドストレージの代替としても広く使用されています。

Cephの拡張性の高いアーキテクチャは、高成長のブロックストレージ、オブジェクトストア、データレイクに広く採用されています。物理ハードウェアはコモディティのように扱われ、データを拡張および保護するすべてのインテリジェンスは完全にソフトウェア次第です。このためCephは大容量のデータ保存に効果的に対応でき、クラウド、Openstack、Kubernetes、その他のマイクロサービスやコンテナベースのワークロードに最適です。

Cephの仕組み

Cephの主な利点は、単一クラスター内に複数のストレージタイプ用のインターフェイスを提供し、複数のストレージソリューションや特殊なハードウェアの必要性を除去して管理コストを削減できることです。一般的なクラスターは、標準サーバーと2つのイーサネットネットワーク(1つはクライアントアクセス用で、もう1つはクラスターへの内部用)で構築されています。

Cephストレージクラスターを構成するコンポーネント

  • クラスターモニター(ceph-mon)は、クラスターのマップとその状態の管理、アクティブなノードとエラー状態のノード、構成、データ配置に関する情報の追跡、認証の管理を行います。
  • マネージャー(ceph-mgr)は、クラスターランタイムメトリクスの収集、ダッシュボード機能の有効化、外部監視システムへのインターフェイスの提供を行います。
  • オブジェクトストレージデーモン(ceph-osd)は、Cephクラスターにデータを格納し、複製、イレージャーコーディング、リカバリ、およびリバランスを処理します。概念としては、オブジェクトストレージデーモンは、CPU/RAMとベースであるSSDまたはHDDのスライスと考えることができます。
  • Radosゲートウェイ(ceph-rgw)は、http/httpsを介してオブジェクトストレージAPI(S3およびswift)を提供します。
  • メタデータサーバー(ceph-mds)は、Cephファイルシステムのメタデータを格納し、ファイルシステムのファイル名とディレクトリをRADOSオブジェクトにマッピングし、POSIXセマンティクスを使用してファイルにアクセスできるようにします。
  • iSCSIゲートウェイ(ceph-iscsi)は、VMwareやWindows Serverなどの従来型のブロックストレージワークロードにiSCSIターゲットを提供します。

Cephでは、データを論理ストレージプール内にオブジェクトとして格納します。Cephクラスターには複数のプールを保有でき、それぞれのプールは異なるパフォーマンスや容量の用途に合わせて調整されています。リバランスやリカバリを効率的にスケーリングして処理するために、Cephではプールをプレイスメントグループ(PG)にシャーディングします。CRUSHアルゴリズムは、オブジェクトを格納するためのプレイスメントグループを定義し、その後に、どのCephオブジェクトストレージデーモンがプレイスメントグループを格納するかを計算します。

初めて使用する方へ

Cephは簡単に使用できます。少数のノード(またはテスト専用のVM)を持つ小さなクラスターを作り、試してみましょう。詳細はインストールガイドをご覧ください

結論

Cephはスケールアウト型オープンソースストレージを実現するソフトウェアであり、プライベートクラウドやパブリッククラウド、メディアコンテンツ保存、データレイクなどの変化するビジネスニーズに対応します。マルチプロトコルのため、複数のストレージシステムを別々に設置しなくても、すべてのブロック、ファイル、オブジェクトのストレージ要件に対応します。Cephクラスターは、あらゆるワークロードや予算に合わせて設計でき、何よりもダウンタイムなしで簡単にアップグレードや拡張が可能です。

このブログシリーズでは、今後もMAAS、Juju、Charmed Cephを使ってCephを簡単に運用する方法を解説します。

参考情報

UbuntuでのCephストレージについて読む

ウェビナーを見る – 企業向けCeph

ウェビナーを見る – Cephでストレージコストを削減

ウェビナーを見る – コスト効率の高いオープンソースクラウド運用の構築

ニュースレターのサインアップ

Ubuntuニュースレターの配信登録

お客様が購読登録を行われる場合、以下の条件に同意されたことになります。Canonicalのプライバシーに関するお知らせ個人情報保護ポリシー

関連記事

CentOSのサポート終了(EOL)– Cephストレージへの影響は?

暗闇から光の中へ、新たな前進 2020年に、CentOS ProjectはCentOS Streamのみに注力することを発表しました。つまりCentOS 7がRed Hat Enterprise Linuxと共通性を持つ最後のリリースです。2024年6月30日のCentOS 7のサポート終了(EOL)により、OSのセキュリティ更新、パッチ、新機能のリリースがなくなります。 このバージョンのCentOSにCephをデプロイすると、将来の困難は見えています。EOLの課題を切り抜ける方法はいくつかありますが、それぞれに短所があります。 リスク 何もしなければ、デプロイメントが古くなるにつれてCephの新しいバージョンにアップグレードする道がなくなり、新しい機能を得られなくなりま […]

AI対応のCephストレージ

オープンソースのCephストレージでAIビジョンを強化 今やあらゆる企業がAIの活用に関心を持っています。既存のデータから業務の分析情報や利益を引き出し、コストを削減できることから、AI技術は変化に消極的な企業にさえ驚くほどの速度で広がっています。 しかしこのような情報、節約、利益をもたらすAIシステムは大量のデータへのアクセスに依存します。性能と信頼性の高いストレージシステムがなければ、たとえ最先端のAIソリューションでも速やかに結果は出せません。しかも新しいAI関連のワークロードが既存のビジネスアプリケーションに影響を与えてはなりません。どちらも協調して動作する必要があります。 このブログ記事では、AIソリューションが必要とするストレージシステムおよび使用するデータの […]

CentOSからUbuntuへの移行:システム管理者とDevOpsのためのガイド

CentOS 7は2024年6月30日に提供終了(EoL)を迎えます。この日以降、CentOS Projectは重要なセキュリティパッチを含む更新やサポートを提供しません。RHELベースのエコシステムから離れることは困難に見えるかもしれませんが、Ubuntuなら切り替えは簡単かつ経済的です。 自動セキュリティ検証の最先端を走るPenteraは、この移行の容易性について説得力のあるケーススタディを紹介しています。同社は、どのように自社のコンテナベースのセットアップが最小限の調整でUbuntuに移行され、セキュリティ対策の強化につながったかについて詳しく説明しています。この移行は同社のクライアントからも好意的に受け止められており、広範なコミュニティサポートに支えられて過去20 […]