ログ監視やプロセス監視など、チェック監視の実行時間がタイムアウト値(デフォルト30秒)を超過する場合に、タイムアウトエラーが発生します。
主な原因として以下のようなことが考えられます。
- サーバーの一時的な負荷によりプラグインの実行に遅延が生じた
- 監視対象のログが大量に出力されていることで処理に時間がかかるなど、各プラグインの特性による要因で遅延が生じた
一時的な負荷などによるタイムアウトを抑止するには、タイムアウト値(timeout_seconds)をチェック監視項目ごとに指定することで抑止いただける場合がございます。またtimeout_secondsに指定する値は、実行間隔(check_interval:デフォルト1分)を超えて指定しないようにご注意ください。
各プラグインごとの特性による要因が考えられる場合、以下のような点をご確認ください。
- ログ監視のプラグイン(check-logなど)で発生する場合
- 1回のチェック監視の対象となるログが大量に出力されている可能性があります。監視不要なログを大量に含む場合、不要なログが出力されないようにログ量の抑制をご検討ください
(例えばデバッグログの出力を抑止する、監視が必要な内容を出力するログを分割するなど)
- 1回のチェック監視の対象となるログが大量に出力されている可能性があります。監視不要なログを大量に含む場合、不要なログが出力されないようにログ量の抑制をご検討ください
- ネットワーク監視のプラグイン(check-tcp, check-httpなど)で発生する場合
- 通信にかかる時間をあらかじめ計測し、30秒を超過する場合はタイムアウト値を調整してください
タイムアウト値などチェック監視に設定いただけるオプションに関しては、以下をご確認ください。