informatique:logiciels:nagios
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
informatique:logiciels:nagios [2010/05/19 14:30] – check_multi exemples pteu | informatique:logiciels:nagios [2021/01/15 15:47] (current) – [Contrôler Nagios en CLI] nagios_downtime_w_childs.sh pteu | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | {{tag> | + | ======Nagios====== |
- | ====== | + | Nagios |
- | Nagios est un programme de supervision libre composé d'un scheduler, de greffons (plugins) et d'une interface web de management. Il est couramment utilisé pour faire des PING sur des équipements ou tester des services (HTTP, SMTP) via ses greffons. | ||
- | =====Installation | + | ======Généralités====== |
+ | |||
+ | Le principe de base est simple : on configure différents plugins pour qu'ils interrogent certains équipements ; et ces plugins sont ordonnancés par le moteur Nagios. Comme tous les processus, les plugins retournent : | ||
+ | * un code d' | ||
+ | * une ligne de résultat affichée sur la sortie standard (qu'on appelle données de performance, | ||
+ | |||
+ | Les codes d' | ||
+ | |||
+ | |||
+ | ======Installation====== | ||
+ | |||
+ | =====sous | ||
Installation classique sous Ubuntu avec résolution automatique des dépendances : | Installation classique sous Ubuntu avec résolution automatique des dépendances : | ||
- | < | + | < |
+ | aptitude install nagios3 | ||
+ | </ | ||
Puis il faut créer un utilisateur et lui attribuer un mot de passe (si ce n'est pas déjà fait lors de l' | Puis il faut créer un utilisateur et lui attribuer un mot de passe (si ce n'est pas déjà fait lors de l' | ||
- | < | + | < |
+ | htpasswd -c / | ||
New password: | New password: | ||
| | ||
Line 22: | Line 35: | ||
* utiliser l' | * utiliser l' | ||
... alors il faut le compiler à partir des sources. | ... alors il faut le compiler à partir des sources. | ||
+ | |||
+ | =====sous Ubuntu 9.10 (OLD)===== | ||
+ | |||
+ | Sous Ubuntu (9.10) il y a(vait) 2 problèmes avec l' | ||
+ | * problème avec le plugin **check_ssh** : en fait il n'y a pas de serveur SSH installé sous Ubuntu par défaut. Pour l' | ||
+ | * problème de droit d' | ||
+ | |||
+ | Pour ignorer le fichier qui pose ce problème de droit d' | ||
+ | <code bash> | ||
+ | sudo vi / | ||
+ | # ' | ||
+ | define command{ | ||
+ | | ||
+ | # | ||
+ | # | ||
+ | # | ||
+ | | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Puis il faut recharger la conf dans Nagios : | ||
+ | <code bash> | ||
+ | sudo service nagios3 stop | ||
+ | * Stopping nagios3 monitoring daemon nagios3 | ||
+ | |||
+ | sudo service nagios3 start [ OK ] | ||
+ | * Starting nagios3 monitoring daemon nagios3 | ||
+ | kill: 1: No such process | ||
+ | </ | ||
+ | |||
+ | //source : https:// | ||
Line 31: | Line 75: | ||
* Il faut disposer d'un serveur web (Apache2 par exemple) avec PHP (5 par exemple), la librairie GD et des outils de compilation (gcc & co) : | * Il faut disposer d'un serveur web (Apache2 par exemple) avec PHP (5 par exemple), la librairie GD et des outils de compilation (gcc & co) : | ||
- | < | + | < |
yum install httpd | yum install httpd | ||
yum install gd gd-devel | yum install gd gd-devel | ||
Line 38: | Line 82: | ||
Vérifier que le serveur web se lance bien au démarrage classique : | Vérifier que le serveur web se lance bien au démarrage classique : | ||
- | < | + | < |
chkconfig --list | grep httpd | chkconfig --list | grep httpd | ||
</ | </ | ||
Si le service n'est pas listé, l' | Si le service n'est pas listé, l' | ||
- | < | + | < |
chkconfig --add httpd | chkconfig --add httpd | ||
chkconfig --list | grep httpd | chkconfig --list | grep httpd | ||
Line 50: | Line 94: | ||
S'il n'est pas chargé au démarrage, l'y ajouter (runlevels de 2 à 5 par défaut) : | S'il n'est pas chargé au démarrage, l'y ajouter (runlevels de 2 à 5 par défaut) : | ||
- | < | + | < |
chkconfig httpd on | chkconfig httpd on | ||
chkconfig --list | grep httpd | chkconfig --list | grep httpd | ||
Line 57: | Line 101: | ||
* création des utilisateurs et groupes qui seront utilisés par Nagios | * création des utilisateurs et groupes qui seront utilisés par Nagios | ||
- | < | + | < |
- | # groupadd nagios | + | groupadd nagios |
- | # groupadd nagcmd | + | groupadd nagcmd |
- | # useradd -g nagios -G nagcmd -c " | + | useradd -g nagios -G nagcmd -c " |
</ | </ | ||
Line 69: | Line 113: | ||
* téléchargement + décompression | * téléchargement + décompression | ||
- | < | + | < |
- | $ wget http:// | + | wget http:// |
- | $ tar -zxf nagios-3.2.1.tar.gz | + | tar -zxf nagios-3.2.1.tar.gz |
- | $ cd nagios-3.2.1 | + | cd nagios-3.2.1 |
</ | </ | ||
* configurer les options de compilation : | * configurer les options de compilation : | ||
- | < | + | < |
- | $ ./configure --enable-event-broker --enable-embedded-perl --with-command-group=nagcmd | + | ./configure --enable-event-broker --enable-embedded-perl --with-command-group=nagcmd |
</ | </ | ||
* L' | * L' | ||
Line 84: | Line 128: | ||
* lancer la compilation | * lancer la compilation | ||
- | < | + | < |
- | $ make all | + | make all |
</ | </ | ||
Line 96: | Line 140: | ||
* make install-webconf : installation du fichier de configuration d' | * make install-webconf : installation du fichier de configuration d' | ||
- | < | + | < |
- | # make install | + | make install |
- | # make install-init | + | make install-init |
- | # make install-commandmode | + | make install-commandmode |
- | # make install-config | + | make install-config |
- | # make install-webconf | + | make install-webconf |
</ | </ | ||
Line 112: | Line 156: | ||
On ajoute l' | On ajoute l' | ||
- | < | + | < |
- | # htpasswd | + | htpasswd / |
- | # chown nagios: | + | chown nagios: |
- | # usermod -a -G nagios, | + | usermod -a -G nagios, |
</ | </ | ||
* lancement de Nagios au démarrage du système | * lancement de Nagios au démarrage du système | ||
Configuration pour que Nagios se lance automatiquement au démarrage du système : | Configuration pour que Nagios se lance automatiquement au démarrage du système : | ||
- | < | + | < |
- | # chkconfig --add nagios | + | chkconfig --add nagios |
- | # chkconfig nagios on | + | chkconfig nagios on |
</ | </ | ||
* redémarrage du serveur web pour qu'il prenne en compte sa nouvelle configuration | * redémarrage du serveur web pour qu'il prenne en compte sa nouvelle configuration | ||
- | < | + | < |
service httpd restart | service httpd restart | ||
</ | </ | ||
Line 144: | Line 188: | ||
Pour compilation du module check_snmp : | Pour compilation du module check_snmp : | ||
- | < | + | < |
yum install net-snmp net-snmp-utils | yum install net-snmp net-snmp-utils | ||
</ | </ | ||
Line 150: | Line 194: | ||
* téléchargement et décompression | * téléchargement et décompression | ||
- | < | + | < |
- | $ wget http:// | + | wget http:// |
- | $ tar zxf nagios-plugins-1.4.14.tar.gz | + | tar zxf nagios-plugins-1.4.14.tar.gz |
- | $ cd nagios-plugins-1.4.14 | + | cd nagios-plugins-1.4.14 |
</ | </ | ||
* configuration des options de compilation | * configuration des options de compilation | ||
- | < | + | < |
- | $ ./configure --with-command-group=nagcmd --enable-perl-modules | + | ./configure --with-command-group=nagcmd --enable-perl-modules |
</ | </ | ||
Les options suivent la logique de compilation de Nagios. | Les options suivent la logique de compilation de Nagios. | ||
* compilation | * compilation | ||
- | < | + | < |
- | $ make | + | make |
</ | </ | ||
* installation | * installation | ||
- | < | + | < |
- | # make install | + | make install |
</ | </ | ||
* vérification de la configuration de Nagios | * vérification de la configuration de Nagios | ||
- | < | + | < |
/ | / | ||
</ | </ | ||
* enfin, on lance Nagios | * enfin, on lance Nagios | ||
- | < | + | < |
service nagios start | service nagios start | ||
</ | </ | ||
- | ===== Configuration ===== | + | ======Configuration====== |
- | Les fichiers principaux se trouvent dans ''/ | + | Les fichiers principaux se trouvent dans ''/ |
- | ==== Contacts et groupes de contacts ==== | + | =====Contacts et groupes de contacts===== |
On renseigne les personnes de contact (qui seront notifiées lors d'un problème) dans le fichier ''/ | On renseigne les personnes de contact (qui seront notifiées lors d'un problème) dans le fichier ''/ | ||
- | < | + | < |
define contact{ | define contact{ | ||
contact_name | contact_name | ||
Line 218: | Line 262: | ||
On définit dans ce même fichier les groupes de contact : | On définit dans ce même fichier les groupes de contact : | ||
- | < | + | < |
define contactgroup{ | define contactgroup{ | ||
contactgroup_name | contactgroup_name | ||
Line 226: | Line 270: | ||
</ | </ | ||
- | ==== Droits des contacts ==== | + | =====Droits des contacts===== |
Pour attribuer des droits à un utilisateur, | Pour attribuer des droits à un utilisateur, | ||
- | < | + | < |
+ | authorized_for_system_information=nagiosadmin, | ||
+ | </ | ||
- | ==== Périodes de temps ==== | + | =====Périodes de temps===== |
On peut consulter ou définir des périodes de temps dans le fichier ''/ | On peut consulter ou définir des périodes de temps dans le fichier ''/ | ||
- | < | + | < |
define timeperiod{ | define timeperiod{ | ||
timeperiod_name 24x7 | timeperiod_name 24x7 | ||
Line 248: | Line 294: | ||
</ | </ | ||
- | ==== Déclaration d'un host ==== | + | =====Déclaration d'un host===== |
Ça se passe dans le fichier **/ | Ça se passe dans le fichier **/ | ||
- | < | + | < |
+ | define host{ | ||
use | use | ||
host_name | host_name | ||
Line 261: | Line 308: | ||
Cet host utilise le template generic-host qui définit tous les paramètres nécessaires par défaut. On peut surcharger l' | Cet host utilise le template generic-host qui définit tous les paramètres nécessaires par défaut. On peut surcharger l' | ||
- | ==== Création de hostgroup ==== | + | =====Création de hostgroup===== |
On doit mettre chaque host dans un hostgroup, défini dans le fichier **/ | On doit mettre chaque host dans un hostgroup, défini dans le fichier **/ | ||
- | < | + | < |
+ | define hostgroup { | ||
hostgroup_name | hostgroup_name | ||
alias | alias | ||
Line 272: | Line 320: | ||
</ | </ | ||
- | ==== Création d'un service ==== | + | =====Création d'un service===== |
Ils sont déclarés dans le fichier **/ | Ils sont déclarés dans le fichier **/ | ||
- | < | + | < |
+ | define service { | ||
hostgroup_name | hostgroup_name | ||
service_description | service_description | ||
Line 293: | Line 342: | ||
* '' | * '' | ||
- | ===== Vérifications ===== | + | =====Vérifications===== |
Pour vérifier la validité de la configuration de Nagios sans relancer le démon : | Pour vérifier la validité de la configuration de Nagios sans relancer le démon : | ||
- | < | + | < |
+ | nagios3 -v / | ||
+ | </ | ||
//(très utile quand on travaille sur de la prod !)// | //(très utile quand on travaille sur de la prod !)// | ||
- | =====Installation de Nagvis===== | + | ======Installation de Nagvis====== |
Nagvis est un addon pour Nagios qui permet d' | Nagvis est un addon pour Nagios qui permet d' | ||
Line 306: | Line 357: | ||
- | ====MySQL==== | + | =====MySQL===== |
MySQL est un prérequis de notre installation de NDOUtils. | MySQL est un prérequis de notre installation de NDOUtils. | ||
- | < | + | < |
# Installation du serveur, du client des librairies de développement. | # Installation du serveur, du client des librairies de développement. | ||
yum install mysql-server mysql-devel | yum install mysql-server mysql-devel | ||
Line 326: | Line 377: | ||
</ | </ | ||
- | ====NDOUtils==== | + | =====NDOUtils===== |
// | // | ||
NDOUtils est un addon qui récupère les états, la configuration, | NDOUtils est un addon qui récupère les états, la configuration, | ||
- | < | + | < |
wget http:// | wget http:// | ||
tar zxf ndoutils-1.4b9.tar.gz | tar zxf ndoutils-1.4b9.tar.gz | ||
Line 341: | Line 392: | ||
Configuration de la base de donnée : | Configuration de la base de donnée : | ||
Se connecter avec | Se connecter avec | ||
- | < | + | < |
mysql -u root -p | mysql -u root -p | ||
Line 352: | Line 403: | ||
Création de la structure de la base avec le script fourni : | Création de la structure de la base avec le script fourni : | ||
- | < | + | < |
cd db/ | cd db/ | ||
./installdb -u ndouser -p ndopassword -h localhost -d ndoutils | ./installdb -u ndouser -p ndopassword -h localhost -d ndoutils | ||
Line 364: | Line 415: | ||
Installation du module : | Installation du module : | ||
- | < | + | < |
# binaires | # binaires | ||
cp src/ | cp src/ | ||
Line 389: | Line 440: | ||
| | ||
- | # création du script de démarrage | + | # création du script de démarrage |
- | # idée de script (conçu pour ubuntu) : http:// | + | cp vi / |
- | vi / | + | cp daemon-init |
- | #!/bin/sh | + | chmod 755 /etc/init.d/ndo2db |
- | /usr/local/ | + | chkconfig |
- | chmod +x /etc/rc.d/init.d/ndoutils | + | # attention le démon ndo2db doit être démarré avant nagios (modifier sa priorité le cas échéant) |
+ | # exemple pour le runlevel 3 : j'ai du passer la priorité de ndo2db à 98 | ||
+ | /etc/rc3.d/S98ndo2db -> ../init.d/ndo2db | ||
+ | /etc/rc3.d/S99nagios -> ../init.d/nagios | ||
# lancer le service NDOUtils et redémarrer nagios | # lancer le service NDOUtils et redémarrer nagios | ||
- | / | + | service |
service nagios restart | service nagios restart | ||
- | # vérif | + | # vérification de bon fonctionnement : les logs de Nagios |
tail -f / | tail -f / | ||
</ | </ | ||
- | ====Graphviz==== | + | =====Graphviz===== |
[[http:// | [[http:// | ||
- | < | + | < |
# ajout du repository yum | # ajout du repository yum | ||
wget http:// | wget http:// | ||
Line 484: | Line 538: | ||
</ | </ | ||
- | ====Nagvis==== | + | |
+ | =====Nagvis===== | ||
Nagvis est un scripts PHP qui récupère les états Nagios pour générer une carte interactive. | Nagvis est un scripts PHP qui récupère les états Nagios pour générer une carte interactive. | ||
Paquets à installer : | Paquets à installer : | ||
- | < | + | < |
yum install php-gd php-mbstring php-xml php-mysql | yum install php-gd php-mbstring php-xml php-mysql | ||
</ | </ | ||
Redémarrage du serveur HTTP pour prise en compte des paquets PHP | Redémarrage du serveur HTTP pour prise en compte des paquets PHP | ||
- | < | + | < |
service httpd restart | service httpd restart | ||
</ | </ | ||
- | < | + | < |
- | wget http:// | + | wget http:// |
tar zxf nagvis-1.4.7.tar.gz | tar zxf nagvis-1.4.7.tar.gz | ||
cd nagvis-1.4.7 | cd nagvis-1.4.7 | ||
Line 554: | Line 609: | ||
- | =====Installation | + | ====Exemple |
- | [[http://fr.wikipedia.org/ | + | ===Map=== |
+ | FIXME : template, service, line, etc... | ||
- | Son fonctionnement est simple : le serveur distant fait tourner le démon NRPE qui écoute sur le port tcp/5666 (par défaut). Le serveur nagios émet une requête vers le serveur distant grâce au plugin check_nrpe ; il lui demande d' | + | < |
+ | Prendre garde de bien laisser | ||
+ | </ | ||
- | ====Sur | + | Pour désactiver l' |
+ | <code bash> | ||
+ | < | ||
+ | # desactiver l' | ||
+ | | ||
+ | Allow from all | ||
- | ===Prérequis=== | + | # forcer un nom d' |
+ | | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | Pour simplifier l'URL l' | ||
+ | <code bash> | ||
+ | < | ||
+ | | ||
+ | | ||
+ | | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||
+ | ======Installation de l' | ||
+ | |||
+ | [[http:// | ||
+ | |||
+ | Son fonctionnement est simple : le serveur distant fait tourner le démon NRPE qui écoute sur le port tcp/5666 (par défaut). Le serveur nagios émet une requête vers ce serveur distant grâce au plugin **check_nrpe** ; il lui demande d' | ||
+ | |||
+ | =====Sur le serveur Nagios===== | ||
+ | |||
+ | ====Prérequis==== | ||
NRPE utilise par défaut SSL pour échanger les données ; pour le compiler on doit installer le support SSL : | NRPE utilise par défaut SSL pour échanger les données ; pour le compiler on doit installer le support SSL : | ||
- | < | + | < |
yum install openssl openssl-devel | yum install openssl openssl-devel | ||
</ | </ | ||
- | ===Compilation et installation=== | + | ====Compilation et installation==== |
L' | L' | ||
- | < | + | < |
wget http:// | wget http:// | ||
tar zxf nrpe-2.12.tar.gz | tar zxf nrpe-2.12.tar.gz | ||
Line 580: | Line 666: | ||
Normalement on obtient le nouveau plugin : **check_nrpe** | Normalement on obtient le nouveau plugin : **check_nrpe** | ||
- | < | + | < |
ll / | ll / | ||
| | ||
</ | </ | ||
- | ===Vérification=== | + | ====Vérification==== |
Le protocole NRPE utilise par défaut le port tcp/5666 qu'il faudra donc ouvrir sur les serveurs et les éventuels pare-feux intermédiaires. | Le protocole NRPE utilise par défaut le port tcp/5666 qu'il faudra donc ouvrir sur les serveurs et les éventuels pare-feux intermédiaires. | ||
- | < | + | < |
serveur nagios, port tcp>1023 -----> serveur distant, port tcp/5666 | serveur nagios, port tcp>1023 -----> serveur distant, port tcp/5666 | ||
</ | </ | ||
- | ====Sur le serveur distant==== | + | =====Sur le serveur distant===== |
(Pour les prérequis, voir partie précédente : //sur le serveur nagios//) | (Pour les prérequis, voir partie précédente : //sur le serveur nagios//) | ||
Si l' | Si l' | ||
- | < | + | < |
groupadd nagios | groupadd nagios | ||
useradd -g nagios nagios | useradd -g nagios nagios | ||
</ | </ | ||
- | ===Installation des nagios-plugins=== | + | ====Installation des nagios-plugins==== |
Installer les nagios-plugins qui seront lancés sur le serveur distant (cf partie plus haut). | Installer les nagios-plugins qui seront lancés sur le serveur distant (cf partie plus haut). | ||
- | ===Compilation et installation=== | + | ====Compilation et installation==== |
Même chose que sur le serveur nagios : | Même chose que sur le serveur nagios : | ||
- | < | + | < |
wget http:// | wget http:// | ||
tar zxf nrpe-2.12.tar.gz | tar zxf nrpe-2.12.tar.gz | ||
Line 617: | Line 703: | ||
</ | </ | ||
- | ===Configuration=== | + | ====Configuration==== |
Comme pour le serveur nagios, on s' | Comme pour le serveur nagios, on s' | ||
- | < | + | < |
mkdir / | mkdir / | ||
cp sample-config/ | cp sample-config/ | ||
Line 625: | Line 711: | ||
Configuration du contrôle d' | Configuration du contrôle d' | ||
- | < | + | < |
vi nrpe.cfg | vi nrpe.cfg | ||
| | ||
Line 631: | Line 717: | ||
On remarque au passage que le fichier contient certains services pré-configurés : | On remarque au passage que le fichier contient certains services pré-configurés : | ||
- | < | + | < |
# The following examples use hardcoded command arguments... | # The following examples use hardcoded command arguments... | ||
Line 639: | Line 725: | ||
command[check_zombie_procs]=/ | command[check_zombie_procs]=/ | ||
command[check_total_procs]=/ | command[check_total_procs]=/ | ||
+ | </ | ||
+ | |||
+ | Ajout au démarrage de la machine : | ||
+ | <code bash> | ||
+ | cp init-script / | ||
+ | chmod 755 / | ||
+ | chkconfig --add nrpe | ||
+ | </ | ||
+ | |||
+ | Pour désactiver le SSL, modifier la ligne suivante en rajoutant l' | ||
+ | <code bash> | ||
+ | echo -n " | ||
+ | daemon $NrpeBin -c $NrpeCfg -d -n | ||
</ | </ | ||
Lancement du démon : | Lancement du démon : | ||
- | < | + | < |
- | / | + | /etc/init.d/nrpe start |
</ | </ | ||
+ | |||
+ | Pour information, | ||
Explication des paramètres : | Explication des paramètres : | ||
* -c < | * -c < | ||
Line 651: | Line 752: | ||
- | ====Configuration==== | + | =====Configuration===== |
Pour vérifier la connectivité NRPE entre les 2 serveurs, lancer sur le serveur nagios : | Pour vérifier la connectivité NRPE entre les 2 serveurs, lancer sur le serveur nagios : | ||
- | < | + | < |
/ | / | ||
NRPE v2.12 | NRPE v2.12 | ||
Line 662: | Line 763: | ||
Bien ; maintenant il faut créer le service associé ! Je vous laisse placer les lignes suivantes dans les fichiers de conf correspondants à votre installation (command.cfg, | Bien ; maintenant il faut créer le service associé ! Je vous laisse placer les lignes suivantes dans les fichiers de conf correspondants à votre installation (command.cfg, | ||
- | < | + | < |
# -n = pas de SSL (le demon doit etre lance avec la meme option | # -n = pas de SSL (le demon doit etre lance avec la meme option | ||
# -H <IP> = adresse IP du serveur distant | # -H <IP> = adresse IP du serveur distant | ||
Line 691: | Line 792: | ||
- | =====Ajout de plugins===== | + | ======Ajout de plugins====== |
- | Les plugins sont des programmes/ | + | Les plugins sont des programmes/ |
- | ====Check_multi==== | + | =====Check_multi===== |
[[http:// | [[http:// | ||
Line 702: | Line 803: | ||
- | ===Compilation=== | + | ====Compilation==== |
<note important> | <note important> | ||
Il est conseillé (par la doc officielle) de changer les buffers MAX_PLUGIN_OUTPUT_LENGTH et MAX_INPUT_BUFFER ; ceci dit je n'en ai pas vu l' | Il est conseillé (par la doc officielle) de changer les buffers MAX_PLUGIN_OUTPUT_LENGTH et MAX_INPUT_BUFFER ; ceci dit je n'en ai pas vu l' | ||
</ | </ | ||
- | < | + | Dans le modop suivant j' |
+ | < | ||
wget http:// | wget http:// | ||
tar zxf check_multi-0.20.current.tgz | tar zxf check_multi-0.20.current.tgz | ||
Line 784: | Line 886: | ||
| | ||
| | ||
- | make: *** [test] Error 2</ | + | make: *** [test] Error 2 |
+ | </ | ||
Le '' | Le '' | ||
+ | |||
+ | Comme j' | ||
+ | <code bash> | ||
+ | make test-statusdat | ||
+ | cd ./ | ||
+ | / | ||
+ | 1..6 | ||
+ | ok 1 - check_multi skips unknown service in status.dat - RC3 - passed | ||
+ | ok 2 - output correct - passed | ||
+ | ok 3 - check_multi finds numerous services in status.dat - RC3 - passed | ||
+ | ok 4 - services output correct - passed | ||
+ | ok 5 - check_multi finds numerous hosts in status.dat - RC1 - passed | ||
+ | ok 6 - hosts output correct - passed | ||
+ | </ | ||
Le plugin fonctionne tout de même, alors on poursuit. | Le plugin fonctionne tout de même, alors on poursuit. | ||
- | ===Installation=== | + | ====Installation==== |
- | < | + | < |
make install | make install | ||
make install-config | make install-config | ||
Line 798: | Line 915: | ||
Le plugin s' | Le plugin s' | ||
- | ===Configuration=== | + | ====Configuration==== |
Le concept est le suivant : on créer un fichier **.cmd** correspondant, | Le concept est le suivant : on créer un fichier **.cmd** correspondant, | ||
* les état nagios à récupérer (directive **statusdat**) ou les commandes à lancer (directive **command**) | * les état nagios à récupérer (directive **statusdat**) ou les commandes à lancer (directive **command**) | ||
Line 804: | Line 922: | ||
Ce fichier sera appelé par un service déclaré dans Nagios, sous la forme : '' | Ce fichier sera appelé par un service déclaré dans Nagios, sous la forme : '' | ||
- | ==Création de http.cmd== | + | ===Création de http.cmd=== |
Les états de Nagios sont récupérés via le fichier ''< | Les états de Nagios sont récupérés via le fichier ''< | ||
Line 820: | Line 938: | ||
Les états peuvent être écris en toute lettre ou avec leur code retour Nagios (OK=0 ; WARNING=1 ; CRITICAL=2 ; UNKNOWN=3 et plus). | Les états peuvent être écris en toute lettre ou avec leur code retour Nagios (OK=0 ; WARNING=1 ; CRITICAL=2 ; UNKNOWN=3 et plus). | ||
- | < | + | < |
# format : statusdat [ <tag> ] = < | # format : statusdat [ <tag> ] = < | ||
# ou <tag> est un identifiant local | # ou <tag> est un identifiant local | ||
Line 837: | Line 955: | ||
On peut utiliser des commandes : par exemple on peut re-checker l' | On peut utiliser des commandes : par exemple on peut re-checker l' | ||
- | < | + | < |
# format : command [ <tag> ] = <plugin command line> | # format : command [ <tag> ] = <plugin command line> | ||
command [ serveur1 ] = check_http -H www-princi | command [ serveur1 ] = check_http -H www-princi | ||
Line 851: | Line 969: | ||
* on peut utiliser les macros Nagios avec les commandes ($HOSTNAME$, | * on peut utiliser les macros Nagios avec les commandes ($HOSTNAME$, | ||
- | ==Création du service Nagios== | + | ===Création du service Nagios=== |
Dans la conf de Nagios : | Dans la conf de Nagios : | ||
- | < | + | < |
define command{ | define command{ | ||
command_name | command_name | ||
Line 871: | Line 989: | ||
Pour aller plus loin je vous recommande fortement le wiki officiel : http:// | Pour aller plus loin je vous recommande fortement le wiki officiel : http:// | ||
- | ===Passage de paramètres=== | + | ====Passage de paramètres==== |
* on ne peut passer de paramètres qu' | * on ne peut passer de paramètres qu' | ||
Exemple : déclaration dans nagios | Exemple : déclaration dans nagios | ||
- | < | + | < |
define command{ | define command{ | ||
command_name | command_name | ||
Line 889: | Line 1007: | ||
http.cmd | http.cmd | ||
- | < | + | < |
# $ARG1$ = www | # $ARG1$ = www | ||
command [ serveur1 ] = check_http -H $ARG1$-princi | command [ serveur1 ] = check_http -H $ARG1$-princi | ||
Line 901: | Line 1019: | ||
+ | ======Installation de PNP4Nagios====== | ||
- | =====Problèmes et solutions===== | + | [[http:// |
- | ====Installation du paquet Ubuntu | + | Les perfdata sont les données qui suivent le retour d'une commande de check ; par exemple un check_host_alive retourne : |
+ | <code bash> | ||
+ | PING OK - Paquets perdus | ||
+ | rta=22.872999ms; | ||
+ | </ | ||
- | Sous Ubuntu (9.10) il y a 2 problèmes avec l' | + | Je vais décrire ici l' |
- | * problème avec le plugin **check_ssh** : en fait il n'y a pas de serveur SSH installé | + | |
- | * problème de droit d' | + | |
- | Pour ignorer | + | * Installation du paquet |
- | < | + | <code bash> |
- | sudo vi / | + | aptitude install pnp4nagios |
- | # 'check_all_disks' command | + | |
+ | # avec, au passage : | ||
+ | 0 paquets mis à jour, 100 nouvellement installés, 0 à enlever et 0 non mis à jour. | ||
+ | Il est nécessaire de télécharger 32,2 Mo d' | ||
+ | Les paquets suivants ont des dépendances non satisfaites : | ||
+ | | ||
+ | Est en conflit avec: libgd2-noxpm mais 2.0.36~rc1~dfsg-6.1 est installé. | ||
+ | | ||
+ | Est en conflit avec: libgd2-xpm mais 2.0.36~rc1~dfsg-6.1 doit être installé. | ||
+ | Les actions suivantes permettront de résoudre ces dépendances : | ||
+ | |||
+ | | ||
+ | 1) | ||
+ | |||
+ | Accepter cette solution ? [Y/n/q/?] y | ||
+ | </ | ||
+ | |||
+ | * Choisir | ||
+ | <WRAP center round info 60%> | ||
+ | Note : ce mode semble buggué sur Debian 9 / Nagios 4.3.4 / PNP 0.6.26, utiliser plutôt | ||
+ | </ | ||
+ | |||
+ | * Configurer Nagios pour qu'il fasse appel à PNP4Nagios : | ||
+ | <code bash> | ||
+ | vi / | ||
+ | |||
+ | # activer le traitement des perfdata | ||
+ | process_performance_data=1 | ||
+ | |||
+ | # décommenter les lignes suivantes | ||
+ | host_perfdata_command=process-host-perfdata | ||
+ | service_perfdata_command=process-service-perfdata | ||
+ | </ | ||
+ | |||
+ | Préciser les commandes de perfdata (adaptez les chemins à vos environnements !) : pour notre installation | ||
+ | <code bash> | ||
+ | vi / | ||
+ | |||
+ | define command { | ||
+ | | ||
+ | | ||
+ | } | ||
+ | define command { | ||
+ | | ||
+ | | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | * Relancer Nagios, patienter 5 min, et jeter un œil ici : http:// | ||
+ | |||
+ | * Pour avoir des liens cliquables directement dans l' | ||
+ | * Donner accès à Nagios au fichier .ssi en créant un lien symbolique : | ||
+ | <code bash> | ||
+ | ln -s / | ||
+ | |||
+ | # ou, avec un Nagios/PNP récemment compilée : | ||
+ | cp / | ||
+ | ln -s / | ||
+ | </ | ||
+ | |||
+ | * Créer les templates suivants (dans, par exemple, / | ||
+ | <code bash> | ||
+ | define host { | ||
+ | | ||
+ | | ||
+ | | ||
+ | } | ||
+ | |||
+ | define service { | ||
+ | | ||
+ | | ||
+ | | ||
+ | } | ||
+ | </code> | ||
+ | |||
+ | Si comme moi vous le voulez pour tous (hosts et services), vous pouvez surcharger directement les templates //generic// de vos hosts / services en ajoutant : | ||
+ | <code bash> | ||
+ | vi conf.d/ | ||
+ | use host-pnp | ||
+ | |||
+ | vi conf.d/ | ||
+ | use srv-pnp | ||
+ | </ | ||
+ | |||
+ | * Pour que les graphes s' | ||
+ | <code bash> | ||
+ | vi cgi.cfg | ||
+ | action_url_target=_self | ||
+ | </ | ||
+ | |||
+ | Enfin, relancer nagios : | ||
+ | <code bash> | ||
+ | service nagios3 restart | ||
+ | # OU | ||
+ | systemctl restart nagios | ||
+ | </ | ||
+ | |||
+ | * Si on obtient des erreurs de fonctionnement ou si les graphiques ne sont pas générés, il existe un script de diagnostique qu'on peut télécharger et lancer (en root et avec les bons chemins d' | ||
+ | <code bash> | ||
+ | wget http:// | ||
+ | perl verify_pnp_config --mode=sync --config=/etc/nagios3/nagios.cfg --pnpcfg=/ | ||
+ | </ | ||
+ | |||
+ | =====Certains | ||
+ | |||
+ | Effectivement certains plugins ne fonctionnent pas avec PNP4Nagios car ils ne génèrent pas de perfdata. Pour rappel, les perfdatas sont affichés par le plugin juste après le status, séparé par un '' | ||
+ | <code bash> | ||
+ | check_ping -H 127.0.0.1 -w30,50% -c 50,60% | ||
+ | PING OK - Paquets perdus = 0%, RTA = 0.07 ms|rta=0.074000ms; | ||
+ | </code> | ||
+ | |||
+ | * Status = '' | ||
+ | * Perfdata = '' | ||
+ | |||
+ | C'est notamment le cas du service "Total processes", | ||
+ | <code bash> | ||
+ | /usr/ | ||
+ | PROCS OK: 3 processus avec args ' | ||
+ | </ | ||
+ | |||
+ | C'est dommage parce qu'il fait le taff mais sa sortie est juste mal formattée, il ne lui manque que : '' | ||
+ | |||
+ | Pour corriger cela, on va utiliser le [[http:// | ||
+ | <code bash> | ||
+ | #!/ | ||
+ | # ersatz de cmde pour checker le nb de processes et afficher les perfdata | ||
+ | |||
+ | LINE=`/ | ||
+ | RC=$? | ||
+ | COUNT=`echo $LINE | awk ' | ||
+ | PROCS=`expr $COUNT - 1` | ||
+ | LINE=`echo $LINE | sed "s/: $COUNT /: $PROCS /"` | ||
+ | echo $LINE \| procs=$PROCS | ||
+ | exit $RC | ||
+ | </ | ||
+ | |||
+ | <WRAP center round info 60%> | ||
+ | on notera que j'ai adapté le chemin du script check_procs puisque sous Debian ils sont dans ''/ | ||
+ | </ | ||
+ | |||
+ | On dépose donc ces lignes dans un nouveau fichier, par exemple ''/ | ||
+ | <code bash> | ||
+ | chmod 755 / | ||
+ | </ | ||
+ | |||
+ | Puis, on définit une nouvelle commande dans '' | ||
+ | <code bash> | ||
+ | # contournement de check_procs pour avoir des perfdatas | ||
+ | # cf http:// | ||
define command{ | define command{ | ||
- | command_name | + | |
- | # | + | command_line |
- | # | + | } |
- | #nouvelle ligne | + | |
- | command_line | + | |
- | | + | |
</ | </ | ||
- | Puis il faut recharger la conf dans Nagios | + | Enfin, on remplace le service |
- | < | + | < |
- | sudo service | + | define |
- | * Stopping nagios3 monitoring daemon nagios3 | + | |
+ | host_name | ||
+ | service_description | ||
+ | # | ||
+ | check_command | ||
+ | </ | ||
- | sudo service | + | (Et on relance Nagios après avoir vérifier les éventuelles erreurs avec '' |
- | * Starting nagios3 monitoring daemon nagios3 | + | |
- | kill: 1: No such process | + | =====Créer ses templates PNP===== |
+ | |||
+ | Un template (au sens PNP4nagios du terme) est un modèle de graphique adapté aux valeurs des données de performance. Il est intéressant d' | ||
+ | |||
+ | On peut choisir les couleurs, le type de graphique (courbe, aire, ligne), sa hauteur, la plage de données utilisée (1h, 12h, 1 semaine), etc... ça peut devenir des trucs très sympa : | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Pour chaque service disposant de perfdata et sur lequel PNP4nagios est activé, le plugin va rechercher un template éponyme du nom de sa commande ('' | ||
+ | <code bash> | ||
+ | # avec le paquet pnp4nagios sous debian 7 : | ||
+ | / | ||
+ | / | ||
+ | / | ||
+ | |||
+ | # avec une installation à partir des sources, ils seront plutôt ici : | ||
+ | / | ||
</ | </ | ||
- | //source | + | Par exemple pour un service " |
+ | |||
+ | ====Exemple 1 : trafic in/ | ||
+ | |||
+ | Voici un exemple de " | ||
+ | * création des objets dans Nagios : | ||
+ | <code bash> | ||
+ | vi / | ||
+ | |||
+ | # déclaration du NAS, on utilise bien le template nagios " | ||
+ | define host{ | ||
+ | use | ||
+ | host_name | ||
+ | address | ||
+ | hostgroups | ||
+ | } | ||
+ | |||
+ | # dans le service on ne précise que le nom de communauté, | ||
+ | # le service est appliqué au host grâce au groupe " | ||
+ | define service{ | ||
+ | use | ||
+ | hostgroup_name | ||
+ | service_description traffic eth0 | ||
+ | check_command | ||
+ | } | ||
+ | |||
+ | # trafic reseau | ||
+ | # -o est suivi par les 2 OIDs correspondant au trafic in et out de l' | ||
+ | # -l permet d' | ||
+ | # -u permet de préciser l' | ||
+ | # -P précise la version de SNMP | ||
+ | # -C spécifie la communauté SNMP | ||
+ | # --rate induqe qu'il s'agit d'un compteur qui nécessite donc un calcul \ | ||
+ | # par rapport à la précédente valeur (voir plus bas pour l' | ||
+ | define command{ | ||
+ | command_name | ||
+ | command_line | ||
+ | -u bytes,bytes --rate -o .1.3.6.1.2.1.31.1.1.1.6.3, | ||
+ | } | ||
+ | </ | ||
+ | NB : le plugin **check_snmp** avec l' | ||
+ | * sous Debian j'ai eu ''/ | ||
+ | * sous centOS c'est ''/ | ||
+ | * ça peut aussi être ''/ | ||
+ | Pour ne pas avoir d' | ||
+ | <code bash> | ||
+ | chmod 755 /usr/var && mkdir / | ||
+ | </ | ||
+ | |||
+ | * On créer ensuite le template, qui permet d' | ||
+ | <code bash> | ||
+ | vi / | ||
+ | <?php | ||
+ | # | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # Plugin: check_iftraffic.pl (COUNTER) | ||
+ | # adaptation pour traffic syno | ||
+ | |||
+ | $opt[1] | ||
+ | # | ||
+ | $def[1] | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | |||
+ | # pour afficher le dernier check sur le graphe | ||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | </ | ||
+ | |||
+ | Résultat : | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Le même, un peu plus perfectionné : | ||
+ | <code php> | ||
+ | <?php | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # Plugin: check_snmp_int.pl (COUNTER) | ||
+ | # modif traffic reseau in/out | ||
+ | |||
+ | $unit = " | ||
+ | |||
+ | $ds_name[1] = " | ||
+ | $opt[1] = " --vertical-label $unit -b 1000 --title \" | ||
+ | $def[1] = rrd:: | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | #$def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | $def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | |||
+ | </ | ||
+ | ====Exemple 2 : courbe CPU==== | ||
+ | |||
+ | Autre exemple pour grapher l' | ||
+ | |||
+ | Conf nagios, en vrac : | ||
+ | <code bash> | ||
+ | # paramètres de check_snmp : | ||
+ | # -P2c pour préciser le version de SNMP (2c) | ||
+ | # -t5 pour préciser le timeout (en secondes) de la commande | ||
+ | # -l < | ||
+ | # et les classiques mandataires : -C < | ||
+ | define command{ | ||
+ | command_name | ||
+ | command_line | ||
+ | } | ||
+ | |||
+ | # le service est rattaché au groupe fortigate_v4 | ||
+ | define service { | ||
+ | name check-snmp-forti-cpu-v4 | ||
+ | hostgroup_name | ||
+ | use | ||
+ | service_description | ||
+ | check_command | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | On réutilise le template par défaut : | ||
+ | <code bash> | ||
+ | <?php | ||
+ | # template CPU derive du default template : | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # | ||
+ | # Define some colors .. | ||
+ | # | ||
+ | $_WARNRULE = '# | ||
+ | $_CRITRULE = '# | ||
+ | $_AREA | ||
+ | |||
+ | # couleurs de la courbe | ||
+ | $_LINE | ||
+ | $GRAD_INF | ||
+ | $GRAD_SUP | ||
+ | |||
+ | # | ||
+ | # Initial Logic ... | ||
+ | # | ||
+ | |||
+ | foreach ($this-> | ||
+ | |||
+ | $maximum | ||
+ | $minimum | ||
+ | $critical = ""; | ||
+ | $crit_min = ""; | ||
+ | $crit_max = ""; | ||
+ | $warning | ||
+ | $warn_max = ""; | ||
+ | $warn_min = ""; | ||
+ | $vlabel | ||
+ | $lower | ||
+ | $upper | ||
+ | |||
+ | if ($VAL[' | ||
+ | $warning = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $warn_max = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $warn_min = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $critical = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $crit_max = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $crit_min = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $lower = " --lower=" | ||
+ | $minimum = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $maximum = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $vlabel = " | ||
+ | $upper = " --upper=101 "; | ||
+ | $lower = " --lower=0 "; | ||
+ | } | ||
+ | else { | ||
+ | $vlabel = $VAL[' | ||
+ | } | ||
+ | |||
+ | $opt[$KEY] = ' | ||
+ | $ds_name[$KEY] = $VAL[' | ||
+ | $def[$KEY] | ||
+ | $def[$KEY] .= rrd:: | ||
+ | $def[$KEY] .= rrd:: | ||
+ | $def[$KEY] .= rrd:: | ||
+ | if ($warning != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($warn_min != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($warn_max != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($critical != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($crit_min != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($crit_max != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | ?> | ||
+ | </ | ||
+ | |||
+ | Résultat : | ||
+ | {{ : | ||
+ | |||
+ | ====Exemple 3 : graphique adaptatif==== | ||
+ | |||
+ | Ce template va détecter automatiquement le nombre d' | ||
+ | <code bash> | ||
+ | <?php | ||
+ | $unit = " | ||
+ | |||
+ | # max : 7 entrées | ||
+ | $TAB_COLORS = array('# | ||
+ | $CPT=1; | ||
+ | |||
+ | $ds_name[$CPT] = " | ||
+ | $opt[$CPT] = " --vertical-label $unit -b 1000 --title \" | ||
+ | |||
+ | foreach ($this-> | ||
+ | |||
+ | if ($CPT == " | ||
+ | $def[1] = rrd:: | ||
+ | } | ||
+ | else { | ||
+ | $def[1] .= rrd:: | ||
+ | } | ||
+ | |||
+ | $def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | $CPT++; | ||
+ | } | ||
+ | |||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | |||
+ | </ | ||
+ | |||
+ | ======Tips====== | ||
+ | |||
+ | =====Activer les commandes externes===== | ||
+ | |||
+ | Pour utiliser certaines fonctionnalités, | ||
+ | |||
+ | Pour cela : | ||
+ | <code bash> | ||
+ | # arrêter Apache et Nagios : | ||
+ | service apache2 stop | ||
+ | service nagios3 stop | ||
+ | |||
+ | # activer les commandes externes dans la configuration de Nagios : | ||
+ | vi nagios.cfg | ||
+ | |||
+ | check_external_commands=1 | ||
+ | command_check_interval=15s | ||
+ | |||
+ | # ajouter l' | ||
+ | vi / | ||
+ | |||
+ | nagios: | ||
+ | |||
+ | # le paquet Debian a des problemes de droits sur certains répertoire, | ||
+ | # - ajouter l' | ||
+ | dpkg-statoverride --update --add nagios nagios 751 / | ||
+ | # - ajouter le sticky bit au répertoire parent du pipe des commandes externes | ||
+ | dpkg-statoverride --update --add nagios www-data 2710 / | ||
+ | |||
+ | # relancer Apache et Nagios : | ||
+ | service apache2 start | ||
+ | service nagios3 start | ||
+ | </ | ||
+ | |||
+ | =====Crash de la machine===== | ||
+ | |||
+ | Lors d'un crash de la machine, malgré que le service nagios se soit relancé correctement, | ||
+ | <code bash> | ||
+ | / | ||
+ | Starting ndo2db: | ||
+ | | ||
+ | </ | ||
+ | .. solutionné en supprimant la socket : | ||
+ | <code bash> | ||
+ | rm -f / | ||
+ | |||
+ | / | ||
+ | Starting ndo2db: done. | ||
+ | </ | ||
+ | |||
+ | Le second problème venait de la base mySQL corrompue ; la solution a été de réparer la partie de la base qui remontait en erreur : | ||
+ | <code bash> | ||
+ | myisamchk --fast / | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | Data records: | ||
+ | | ||
+ | | ||
+ | - check file-size | ||
+ | - check record delete-chain | ||
+ | | ||
+ | | ||
+ | | ||
+ | Fix it using switch " | ||
+ | You have new mail in / | ||
+ | |||
+ | myisamchk --recover / | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | - recovering (with sort) MyISAM-table '/ | ||
+ | Data records: 714030 | ||
+ | - Fixing index 1 | ||
+ | - Fixing index 2 | ||
+ | - Fixing index 3 | ||
+ | - Fixing index 4 | ||
+ | Data records: 714032 | ||
+ | |||
+ | myisamchk --fast / | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | service nagios start | ||
+ | | ||
+ | | ||
+ | </ | ||
+ | |||
+ | =====Upgrade de Wheezy vers Jessie===== | ||
+ | |||
+ | Depuis quelques jours (fin avril 2015) Debian 8 stable est release. Je me suis donc mis à la page et j'ai eu la stupeur de voir que mon nagios3 avait été à moitié dézingué, et que le pnp4nagios avait même disparu des paquets (à priori il n' | ||
+ | |||
+ | Voici le mode pompier pour restaurer nos courbes : | ||
+ | <code bash> | ||
+ | // prérequis | ||
+ | aptitude install rrdtool librrds-perl php5-gd | ||
+ | |||
+ | wget https://sourceforge.net/ | ||
+ | # dans mon cas c'est la version pnp4nagios-0.6.25.tar.gz | ||
+ | tar -zxvf pnp4nagios-0.6.25.tar.gz | ||
+ | cd pnp4nagios-0.6.25 | ||
+ | ./ | ||
+ | [..] | ||
+ | *** Configuration summary for pnp4nagios-0.6.25 03-01-2015 *** | ||
+ | |||
+ | General Options: | ||
+ | ------------------------- | ||
+ | Nagios user/ | ||
+ | Install directory: | ||
+ | HTML Dir: / | ||
+ | Config Dir: / | ||
+ | Location of rrdtool binary: | ||
+ | RRDs Perl Modules: | ||
+ | RRD Files stored in: / | ||
+ | process_perfdata.pl Logfile: | ||
+ | Perfdata files (NPCD) stored in: / | ||
+ | |||
+ | Web Interface Options: | ||
+ | ------------------------- | ||
+ | HTML URL: | ||
+ | Apache Config File: / | ||
+ | |||
+ | |||
+ | Review the options above for accuracy. | ||
+ | type 'make all' to compile. | ||
+ | |||
+ | make all | ||
+ | cd ./src && make | ||
+ | make[1]: Entering directory '/ | ||
+ | gcc -g -O2 -DHAVE_CONFIG_H -DNSCORE | ||
+ | gcc -g -O2 -DHAVE_CONFIG_H -DNSCORE | ||
+ | gcc -g -O2 -DHAVE_CONFIG_H -DNSCORE | ||
+ | gcc -g -O2 -DHAVE_CONFIG_H -DNSCORE -o npcd npcd.c utils.o config.o logging.o -lpthread | ||
+ | gcc -fPIC -g -O2 -DHAVE_CONFIG_H -DNSCORE -o npcdmod.o npcdmod.c -shared | ||
+ | make[1]: Leaving directory '/ | ||
+ | cd ./share && make | ||
+ | make[1]: Entering directory '/ | ||
+ | make[1]: Nothing to be done for ' | ||
+ | make[1]: Leaving directory '/ | ||
+ | cd ./scripts && make | ||
+ | make[1]: Entering directory '/ | ||
+ | make[1]: Nothing to be done for ' | ||
+ | make[1]: Leaving directory '/ | ||
+ | chmod a+r ./ | ||
+ | |||
+ | *** Compile finished *** | ||
+ | |||
+ | make install | ||
+ | - This installs the main program and HTML files | ||
+ | |||
+ | make fullinstall | ||
+ | - This installs the main program, runlevel scripts, config and HTML files | ||
+ | |||
+ | Enjoy. | ||
+ | |||
+ | # on va faire simple : | ||
+ | make fullinstall | ||
+ | [..] | ||
+ | </ | ||
+ | |||
+ | Seulement voilà il faut le réintégrer au bousin, donc corriger quelques trucs : | ||
+ | * le fichier de conf d' | ||
+ | <code bash> | ||
+ | mv / | ||
+ | ln -s / | ||
+ | </ | ||
+ | NB : on aurait pu utiliser les commandes toutes faites d' | ||
+ | |||
+ | * dans ce même fichier, le chemin du fichier de mots de passe (htpasswd) n'est pas correct, il faut le corriger : | ||
+ | <code bash> | ||
+ | vi / | ||
+ | # | ||
+ | AuthUserFile / | ||
+ | </ | ||
+ | |||
+ | * dans le cadre de l' | ||
+ | <code bash> | ||
+ | vi / | ||
+ | define command{ | ||
+ | command_name | ||
+ | # | ||
+ | command_line | ||
+ | } | ||
+ | |||
+ | define command{ | ||
+ | command_name | ||
+ | # | ||
+ | command_line | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | * du au changement de path, le chemin des templates à été modifié et pnp ne retrouve plus ces petits ; il faut donc déplacer les templates persos de l' | ||
+ | <code bash> | ||
+ | mv / | ||
+ | </ | ||
+ | |||
+ | * pour une raison qui m'est inconnue, le plugin **check_snmp** (quand utilisé avec l' | ||
+ | <code bash> | ||
+ | mkdir / | ||
+ | chown nagios / | ||
+ | </ | ||
+ | |||
+ | * quand on passe la souris sur les icônes, les courbes ne s' | ||
+ | <code bash> | ||
+ | updatedb | ||
+ | locate status-header.ssi | ||
+ | / | ||
+ | / | ||
+ | / | ||
+ | |||
+ | // on copie donc status-header.ssi à la place du symlink " | ||
+ | rm / | ||
+ | cp / | ||
+ | chmod o+r / | ||
+ | </ | ||
+ | |||
+ | * TODO : la prochaine fois, ne pas oublier de restaurer les bases RRD pour ne pas perdre tout l' | ||
+ | |||
+ | |||
+ | =====Horodatage illisibles des logs===== | ||
+ | |||
+ | Les logs Nagios sont par défaut verbeux mais l' | ||
+ | <code bash> | ||
+ | # les logs bruts | ||
+ | tail -3 / | ||
+ | [1441261778] Auto-save of retention data completed successfully. | ||
+ | [1441265378] Auto-save of retention data completed successfully. | ||
+ | [1441268978] Auto-save of retention data completed successfully. | ||
+ | |||
+ | # après convertion | ||
+ | tail -3 / | ||
+ | [Thu Sep 3 08:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | [Thu Sep 3 09:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | [Thu Sep 3 10:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | </ | ||
+ | |||
+ | |||
+ | |||
+ | =====Contrôler Nagios en CLI===== | ||
+ | |||
+ | Grâce au commandes externes, on peut envoyer des ordres à Nagios via la ligne de commande, ce qui va plus vite que l' | ||
+ | |||
+ | Exemples de scripts inspirés de ceux de la doc : | ||
+ | * '' | ||
+ | <code bash nagios_downtime-host-and-childs.sh> | ||
+ | #!/ | ||
+ | # This is a sample shell script showing how you can submit the SCHEDULE_AND_PROPAGATE_HOST_DOWNTIME command | ||
+ | # to Nagios. Adjust variables to fit your environment as necessary. | ||
+ | |||
+ | [ -z " | ||
+ | |||
+ | now=`date +%s` | ||
+ | commandfile='/ | ||
+ | end=`expr $now + $1` | ||
+ | comment=" | ||
+ | shift 2 | ||
+ | |||
+ | while [ -n " | ||
+ | / | ||
+ | | ||
+ | done | ||
+ | </code> | ||
+ | |||
+ | * permet de planifier un downtime pour un host et ses childs à un date donnée | ||
+ | <code bash nagios_downtime_w_childs.sh> | ||
+ | function usage { | ||
+ | echo " | ||
+ | echo " format dates: \" | ||
+ | echo " ex: nagios_downtime_w_childs.sh switch1 \" | ||
+ | exit 1 | ||
+ | } | ||
+ | |||
+ | [ -z " | ||
+ | |||
+ | now=$(date +%s) | ||
+ | commandfile='/ | ||
+ | |||
+ | # affectation et contrôle des inputs | ||
+ | naghost=$1 | ||
+ | debut=$(date -d " | ||
+ | [ -z " | ||
+ | #[[ " | ||
+ | fin=$(date -d " | ||
+ | [ -z " | ||
+ | comment=" | ||
+ | |||
+ | / | ||
+ | </ | ||
+ | =====Annuler des actions en masse===== | ||
+ | |||
+ | // | ||
+ | |||
+ | Pour annuler en masse certaines actions, on peut interagir avec le fichier de pipe nommé **nagios.cmd** (situé dans **/ | ||
+ | |||
+ | Exemple pour supprimer des DOWNTIME planifiés pour un équipement et tous ses fils (soit une centaine de DOWNTIME) : | ||
+ | * on pourrait les supprimer un par un / clic par clic dans le menu " | ||
+ | * puis se connecter en SSH sur le serveur et lancer la commande : | ||
+ | <code bash> | ||
+ | for i in `seq 1050 1150`; do | ||
+ | printf "[%lu] DEL_HOST_DOWNTIME; | ||
+ | done | ||
+ | </ | ||
+ | Cela a pour effet d' | ||
- | ===== Liens ===== | + | ======Liens====== |
* http:// | * http:// |
informatique/logiciels/nagios.1274279419.txt.gz · Last modified: 2013/10/14 20:55 (external edit)