データセンターインフラ運用管理の成熟へのステップ
私たちは「DCIMツールを使いデータセンターインフラや運用を効率化しましょう!」と日々啓蒙活動を続けていますが、まだまだDCIMの導入メリットが分からない方もいらっしゃるかもしれません。
そこで今回はDCIM成熟レベルを用いて簡単にそのメリットを説明したいと思います。
まずデータセンター物理インフラを管理する意味から考えてみましょう。例えば30年位前、オフィスの片隅にファイルサーバーやスイッチなどが収容されている1台のラックがあったとします。機器の入れ替えも配線変更もほとんどありませんし、当時のサーバーはスペックも低く熱問題もあまり気にする必要がありませんでした。
管理と言ってもエクセルで機器の一覧表をまとめる程度で十分で、IT管理者さえ把握できていれば管理すること自体必要なかったのかもしれません。しかし現在はそうではありません。管理をしなければならないのは、人間の頭脳や単なる台帳管理レベルでは賄いきれないくらい複雑になり、管理をしない事によってさまざまな問題が起きてしまうことにあります。
では物理インフラ管理の成熟へのステップを順にみてみましょう。
【レベル1】監視を行う
DCIM成熟レベルのレベル1は「監視」です。現在のデータセンターインフラにおいて最も重要な事のひとつはITの可用性維持です。そのためには電源状況や温湿度状態を把握する必要があります。今ではすべてのデータセンターでは設備側でBMS(ビル管理システム)による監視が行われています。DCIMではその監視範囲を各ラックに拡張し、各ラック単位で電力や温湿度を管理できるセンサーが設けられます。
ちなみにかなり以前はスタンドアロンタイプの「おんどとり」などのデータロガーがポピュラーでしたが、現在はネットワーク経由でアクセスできるセンサー(インテリジェントPDU、分岐回路監視、環境監視など)が主流で、これによりDC管理者はデータセンターの状態を遠隔監視できるようになりました。これがデータセンターインフラ運用の成熟レベルの最初のステップ(レベル1)です。
【レベル2】監視を統合する。データを蓄積する
ネットワーク経由でアクセスできるセンサーはウェブブラウザで直接IPアドレスを叩いてアクセスできます。しかしその数が増えてくると運用が煩雑になります。また、センサー自体はデータを蓄積するバッファ領域を持っていなかったり、もし持っていたとしても僅かしかありませんので、現在の瞬時値は見れても過去のデータを参照する事はできません。
そこで、それら複数センサーからの計測データを一手に引き受けて、そのデータをデータベースに蓄積する必要が出てきます。データを蓄積すると、チャートで傾向分析や過去データを参照して障害切り分けなどができるようになります。これがデータセンターインフラ運用の成熟レベルの2番目のステップ(レベル2)です。
【レベル3】アセット情報を統合する。運用に活用する
データセンターの物理インフラ管理は単に電流値や温度を把握する事だけではありません。電源の使用状況や温湿度状態の把握に加え、ラックの配置や各ラックへの配線経路、またIT利用のユーザー目線で見ると、ラック内機器の資産情報やその搭載位置、機器間の配線情報、あるいはIPアドレスやVLANなどのネットワーク系情報や仮想マシンに至るまで様々です。
今でもこれらの情報管理にエクセル台帳を使われるケースがあるようですが、更新が煩雑であったり、ファイルが分散したり、検索性が低かったりといった多くの問題があります。また、これらの情報を全て手動でメンテナンスするには多大な工数がかかります。
これらの多岐にわたる情報をひとつにまとめるシステムがあれば、運用工数を削減でき、かつ可視性や検索性が向上し、運用効率は向上します。これがデータセンターインフラ運用の成熟レベルの3番目のステップ(レベル3)です。
【レベル4】外部システムと統合する。全体最適する
レベル1+2+3を加えるとデータセンターの物理インフラで必要な管理項目はほぼ網羅されます。しかし実はそれでもまだ完全ではありません。データセンターインフラの運用は電源設備を増強したり、ラックに機器をマウントしたり、配線をしたりといった作業だけではありません。サーバーOSのアップグレードやセキュリティパッチの適用などなどITサービスに対する変更管理はIT担当者にとって日常業務です。ITSM(ITサービスマネジメント)システムがこれら業務を管理しますが、物理インフラの変更管理がこれに関係ないわけではなく、むしろ密接に関係します。
そこでDCIMとITSMを連携させる必要性が生まれます。そうすることで、より広範なITインフラ全体の包括管理が実現します。これがデータセンターインフラ運用の成熟レベルの4番目のステップ(レベル4)です。
【レベル5】自動化する。自律制御…
どのようなツールを利用してもデータセンター運用は結局人間が操作し、手足を動かさなくてはなりません。そこで、データセンターの行動やリソース利用をルールやデータやサービス要件に基づき、AIなどを使い自動的に調整し、自動化できる部分は自動化していければ運用の最適化は更に進みます。一部のDCIMでは機械学習により分析した結果のデータをユーザーに提供したりして、自動化レベルを一歩でも高めようとしています。現時点では完全自律制御は不可能のように思えますが、遠い未来にはもしかしたら実現しているのかもしれませんね。
これがデータセンターインフラ運用の成熟レベルの最後のステップ(レベル5)です。
まとめ
このように5段階のデータセンター物理インフラ運用管理の成熟ステップを見てきましたが、一気にハイジャンプはとても難しいです。皆様のデータセンターで現在おかれているレベルがどこなのか?を理解し、そしてまずはその一歩次のステップへ踏み出すことをご検討してみてはいかがでしょうか?
弊社取り扱いのDCIMツールの詳細についてはこちら
DCIMのご検討に関するご相談はこちらからお気軽にお問い合わせください