はじめに
前回に引き続きNutanixバイブルを読み進めていきます。前回の記事はこちら。 cloudshopper.hatenadiary.com
※個人的な勉強メモとなりますので、記載内容について一切の責任は持ちません。
※また、個人的に感じたことは網掛け部分に記載しています。
今日のトピックス
・Nutanix Cloud バイブル(日本語版)を読んで内容をまとめてみる。
・本記事の対象は、「AOS (Storage for Compute VMs)」-「10.3 ストレージ」の下記2項目。
・「10.3.5 可用性ドメイン」
・「10.3.6 データパスの回復性能」
可用性ドメイン
- ノード/ブロック/ラックの障害に備えて、データや構成情報を分散配置する仕組み。
- Nutanixでは以下の階層での可用性(アウェアネス)をサポートしている。
- ディスク
- ノード(定義:1台のサーバー)
- ブロック(定義:1~4ノードを含むシャーシ筐体)
- ラック(定義:1つ以上のラックを含む物理ユニット)
※アウェアネスとは、Nutanixクラスタ内の各コンポーネントの配置に関する概念のことで、ストレージやVMのデータ配置の可用性を高めるために、物理的なブロックやラック単位の冗長性を意識する仕組み。
アウェアネスを持つべき(保護すべき、と理解)要素として、データ(VMデータ) / メタデータ(Cassandra) / 設定データ(Zookeeper)の3種類があります。
- データ(VMデータ)に対するアウェアネス
- 意味:仮想マシンのデータ(vDisk)がどのノードに存在しているか?どのディスクに保存されているか?を意識。
- 目的:
- データ冗長性(RF)を維持
- 障害時に迅速な復旧
- パフォーマンス最適化(ホットノード回避)
- メタデータ(Cassandra)に対するアウェアネス
- 設定データ(Zookeeper)に対するアウェアネス
データパスの回復性能
Nutanixではハードウェアは壊れることを前提として設計されており、障害時でも稼働を維持しながら自動的に回復できるようになっている。データやメタデータは、クラスタのRF(レプリケーションファクター)やFT(フォールトトレランス)によって保護されている。
通常時のデータ配置は、VMのデータ(vDisk)はクラスタ内の複数ノードやディスクに2~3重に分散保存される。書き込み時には、プライマリとセカンダリのコピーがローカルおよびリモートノードに配置され、ホットスポットを防止している。
- 障害発生時の回復
- AOSは、ディスク障害 / ノード障害 / CVM障害に対応できるように設計されている。
- ディスク障害
- ノード障害
- CVM障害
- AOSは、ディスク障害 / ノード障害 / CVM障害に対応できるように設計されている。
- レジリエンスキャパシティ
おわりに
今回もデータ保護に関する話がメインでした。Nutanixの「ハードウェアは壊れること」を前提とした設計は良いですね。IT分野で働いていると、「壊れないものは無いよな…」としみじみ思うことが多々あります。利用者目線に立った設計を行った製品を提供してくれるNutanixがより好きになりました。
「Nutanixバイブル読んでみた」シリーズのリンク集はこちら!よろしければ別の章もご覧ください! cloudshopper.hatenadiary.com