データセンターの余剰容量を発見し、リソースを有効活用するためのヒント
データセンターの容量計画(キャパシティ・プランニング)は、最大の課題の1つです。容量計画を適切に行うことで、適切なサイズのデータセンター、リソースの効率的な利用、そしてコストの削減が可能になりますが、「言うは易く行うは難し」です。しかし、多くのデータセンターでは、正確な容量計画に苦労し、余剰となった容量が蔓延しているのが現状です。
余剰容量とは?
余剰容量(ストランデッド・キャパシティ)とは、利用可能かどうかが不明なデータセンター内のリソースを指します。実際には、余剰容量がどの程度あるのかさえわかっていないケースが大半です。
データセンター内で容量管理が必要な項目は、電力、スペース、冷却、ネットワーク/電源ポートなどです。リソースのアンバランスが発生すると、余剰容量が発生することになります。キャパシティを正確に把握するためには、すべてのリソースが相互依存しているものとしてとらえ、現在のバランスを理解する必要があります。
なぜ余剰容量が重要なの?
余剰容量は、リソースと資金の無駄遣いに繋がります。データセンターの効率を低下させ、運用コストの上昇や、本来は不必要であった無駄な拡張工事を招くことになります。
サーバーラック1台を導入するには、関連作業も含めて、(米国基準で)およそ100~200万円ものコストがかかると言われています。新たなリソースを追加する代わりに、余っている既存リソースを無駄なく使うことができれば、多くのコストを削減することができます。
もう一つ、データセンターでは冷却に多大なコストがかかりますが、既存の冷却能力を最大限に活用することができれば、大幅なコスト削減が実現できます。
余剰容量が発生する原因は?
データセンターにおける一般的な慣行や間違った運用は、余剰容量の発生につながる可能性があります。
- 設備リソースの過剰導入:将来の成長や不測の事態に備えるのは賢明なことですが、過剰な導入は無駄が多くなります。
- 従来の計画手法:サーバーの導入計画の際、計画電力を定格の60~70%程度に設定して計算することがあります。これは、実効値よりも余剰な設計となる可能性があります。
- 情報不足:実測値を元にした正確な分析データを持たず、ExcelやVisioのようなレガシーなツールを使った、手計算による容量計画は、時間が無駄に掛かるだけでなく、入力・計算ミスも発生しやすくなります。
- ゴーストサーバー:多いところでは全体の30%も存在すると言われているゴースト・サーバー(またはゾンビ・サーバー)は、スペース、電力、冷却、ケーブルのリソースを無駄に消費します。
- 高密度実装:高密度実装のラックでは、従来の冷却方法では対応できないほどの熱が発生します。
- 非効率的なエアフロー:グレーチングパネルの配置ミス、また、ケーブル開口部の密閉不足やラック内に隙間などがあると、冷気が暖気と混ざり合い、冷却能力が低下します。
- 過冷却:平均的なデータセンターでは、IT負荷が必要とする冷却能力の3.9倍が使用されているといわれます。過冷却はエネルギーとコストの無駄であり、本来は不要であったはずの冷却装置の追加導入につながります。
- 高い相対湿度:湿度の高いデータセンターでは、冷却ユニットのコイルに結露が発生することがあります。これは、冷却能力の何割かを消費する熱を放出する可能性があります。
余剰容量を発見する7つのベストプラクティス
- 最新のデータセンター管理ツールを使用する:測定できないものを管理することはできません。インテリジェント・ラックPDUや電力計測機器、環境センサー(温度、湿度、圧力など)、データセンターインフラ管理(DCIM)ソフトウェアを導入し、計測データの自動収集や傾向分析を行います。
- デバイスの計画電力計算を自動化する:各IT機器の正確な計画電力(パワーバジェット)を自動的に算出してくれるオートパワーバジェット機能を持つDCIMを活用します。これは一度ポリシーを設定するだけで、機械学習アルゴリズムが毎週自動的にパワーバジェット値を更新してくれます。
- ゴーストサーバーを発見する:ゴーストサーバーを撤去・集約することで、電力、スペース、冷却のムダを排除できます。DCIMソフトウェアを使用すると、潜在的なゴーストサーバーを特定するレポートを簡単に実行できます。
- what-if分析を実行する:What-if分析により、プロジェクトごとに、計画されている機器の追加と撤去がスペースと電力容量に与える影響を判断することができます。また、この情報により、将来のプロジェクトに既存リソースを使用して、キャパシティの追加導入を遅らせることが可能かどうかを知ることができます。
- インテリジェントなキャパシティ検索を行う:DCIMソフトウェアのインテリジェントなキャパシティ検索機能では、追加導入したい機器に対する電力・スペース・NW/電源空きポートなどの横断的なキャパシティを数秒で検索することができ、導入可能なラックの場所が表示されます。
- 最適なエアフローを確保する:エアフローを可能な限り効率的にすることで、データセンター内の冷却能力の無駄を省くことができます。ホットアイル/コールドアイルコンテインメントを導入したり、未使用のラックスペースにブランクパネルを設置するなど、データセンターのエアフロー管理のベストプラクティスに従います。
- 温度を上げる:データセンターを必要以上に冷やしすぎてしまうことがあります。メーカーやASHRAEなどの業界団体のガイドラインを超えないようにDCIMでしっかりモニタリングしつつ、設定温度を上げることで、冷却にかかわるコストを削減することができます。
今回のブログはSunbird社のブログ「How to Find Stranded Capacity in Your Data Center」を抄訳,、一部編集したものです。
データセンターインフラ運用課題解決に向けたご相談は、DCIMのスペシャリストベンダーである弊社までご相談ください。
弊社のDCIMソリューションページはこちら