SEの走り書き

社内システムエンジニアの思い付きブログです。

モニタリングツール(監視ソフトウェア)について調べてみた

きっかけ

結論

上手く組み合わせて使うのがベスト

大手ベンダーが提供している商用ツールをベースとし、補完的にOSS統合管理ツールを使いつつ、クイックな監視項目の追加・廃止のためにシンプルなOSS特化型ツールを使うのがベストではないか。
例として、ベースはTivoli、補完的にNagios、アプリケーション視点で可視化したい値の傾向分析用にMuninを使うイメージ。
ベース部分は標準化し、その他はある程度の自由度を持って運用できるようにすることで、「安心・安全」でありつつ、変化対応力が高い運用になるだろう。
大手ベンダーの商用ツールを変えるのはリスクが高く、時間もかかるため、今後は機能特化型のOSS活用についての深堀り検討とクラウドベースの監視ソリューションの調査を行っていこうと思う。

調査(っていってもググッただけだからねッ!)結果メモ

ちょっと調べると、ThinkITの一連の連載がよくまとまっていることに気付いた。

定期的にアップデートいただきたい良記事である。

大手ベンダー商用ツール

規模が大きく、高い信頼性が求められる環境の監視には、大手ベンダーが提供しており、有償サポートがある以下のどれかをベースにすると良さそう。

ソフトウェア名称 開発元 オフィシャルサイト
JP1 株式会社日立製作所 ミドルで賢く:統合システム運用管理 JP1:ソフトウェア:日立
Systemwalker 富士通株式会社 統合運用管理 Systemwalker : 富士通
Tivoli IBM IBM Tivoli - Japan

(参考: 第1回 監視ソフトウエアをどう選ぶか | Think IT)

これらは、単なるモニタリングツールのレベルを超え、企業の資産管理の可視化、各種オペレーションの自動化にまで踏み込んだものになっている。これらのツールを組み合わせ、監視はAツール、JOBスケジューラーはBツールといった使い分けもあり得る。
グローバルに運用を標準化することを考えた場合、海外でも受け入れられる可能性が高いTivoliが第一候補になるのではないか。
また、これらのツールはパブリッククラウドを含んだ統合監視の分野にも踏み込み始めているため、今後も引き続きトレンドをウォッチしていきたい。

OSS統合管理型

ソフトウェア名称 オフィシャルサイト 特徴
Nagios Nagios - The Industry Standard in IT Infrastructure Monitoring Web上に日本語の情報が多い、ロゴがダサい
ZABBIX Homepage of Zabbix :: An Enterprise-Class Open Source Distributed Monitoring Solution エンタープライズ狙い、一企業が開発
Hinemos Hinemos:コンピュータ、システム、ネットワークの運用管理を実現するオープンソースソフトウェア(OSS) 日本初、クライアントはEclipseベース(Windows PC)
Xymon yellow : Xymon - Status @ Sun Dec 04 15:11:43 2011 Hobbitが名称変更、癖のあるUI

比較は「[ThinkIT] 第1回:「Nagios」「Hobbit」「ZABBIX」「Hinemos」を徹底比較 (1/3)」をご確認いただきたい。
実際のところ、Nagiosデファクトスタンダードになってしまっているように思う。
Hinemosを応援したいところだが、Windows PCからしか閲覧できない点が残念過ぎる…。

OSS機能特化型

たいていはRRDToolのフロントエンドである。以下にリストがあるが、多い。実に多い。

ちなみに、RRDToolとは Round Robin Database Tool の略であり、オフィシャルサイトでの紹介は以下の通り。

RRDtool is the OpenSource industry standard, high performance data logging and graphing system for time series data. RRDtool can be easily integrated in shell scripts, perl, python, ruby, lua or tcl applications.

勝手な思い込みで「グラフ化ツール」ぐらいのイメージを抱いていたが、本質は時を経るごとに変化する時系列の数値データの記録、管理にあるようだ。延々とデータを記録し続けていく中で、一定の基準に基づき、古い部分が再利用され、それにより、データの総量が一定になる仕組みらしい。

これらのツールをググッていくとCactiとMuninの情報量が圧倒的に多い。

ソフトウェア名称 オフィシャルサイト 主な特徴
Cacti Cacti: The Complete RRDTool-based Graphing Solution snmpd利用
Munin Munin - Trac 導入簡単、プラグイン作成簡単、詳細設定不可、munin-node必要

大手ベンダーのツールとの併用を前提とする場合、導入・設定が簡単であり、なおかつプラグイン作成も簡単なMuninが向いていると言えよう。

クラウド型

クラウドベースの監視ソリューションとして、Monitisなどが出てきている。
実際に外部から監視していることの強みに加え、セットアップの容易さ、スケーラビリティなどのメリットがある。

これらのツールについてのまとまった情報は少ないが、紹介レベルの記事としては以下が参考になった。

  1. Cloudkick
  2. Zenoss
  3. Amazon CloudWatch
  4. Hyperic/Cloud Status
  5. LogicMonitor
  6. Monitis
  7. Nimsoft

ちなみにきっかけとなったInstagramの例では、死活監視にはpingdomというソリューションを使っているらしい。

参考

ネットワーク監視ツールの比較がWikipediaにあり、こまめにメンテナンスされている。(2011年12月4日現在、クラウド型のものは含まれていない。)