informatique:logiciels:nagios
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
informatique:logiciels:nagios [2015/04/29 15:56] – [De Wheezy vers Jessie] ou comment réinstaller pnp4nagios à partir des sources pteu | informatique:logiciels:nagios [2021/01/15 15:47] (current) – [Contrôler Nagios en CLI] nagios_downtime_w_childs.sh pteu | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | {{tag> | + | ======Nagios====== |
- | + | ||
- | ====== Nagios ====== | + | |
Nagios est un programme de supervision libre composé d'un scheduler (nagios-core), | Nagios est un programme de supervision libre composé d'un scheduler (nagios-core), | ||
- | =====Généralités===== | + | ======Généralités====== |
Le principe de base est simple : on configure différents plugins pour qu'ils interrogent certains équipements ; et ces plugins sont ordonnancés par le moteur Nagios. Comme tous les processus, les plugins retournent : | Le principe de base est simple : on configure différents plugins pour qu'ils interrogent certains équipements ; et ces plugins sont ordonnancés par le moteur Nagios. Comme tous les processus, les plugins retournent : | ||
Line 15: | Line 13: | ||
- | =====Installation | + | ======Installation====== |
+ | |||
+ | =====sous | ||
Installation classique sous Ubuntu avec résolution automatique des dépendances : | Installation classique sous Ubuntu avec résolution automatique des dépendances : | ||
Line 35: | Line 35: | ||
* utiliser l' | * utiliser l' | ||
... alors il faut le compiler à partir des sources. | ... alors il faut le compiler à partir des sources. | ||
+ | |||
+ | =====sous Ubuntu 9.10 (OLD)===== | ||
+ | |||
+ | Sous Ubuntu (9.10) il y a(vait) 2 problèmes avec l' | ||
+ | * problème avec le plugin **check_ssh** : en fait il n'y a pas de serveur SSH installé sous Ubuntu par défaut. Pour l' | ||
+ | * problème de droit d' | ||
+ | |||
+ | Pour ignorer le fichier qui pose ce problème de droit d' | ||
+ | <code bash> | ||
+ | sudo vi / | ||
+ | # ' | ||
+ | define command{ | ||
+ | | ||
+ | # | ||
+ | # | ||
+ | # | ||
+ | | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Puis il faut recharger la conf dans Nagios : | ||
+ | <code bash> | ||
+ | sudo service nagios3 stop | ||
+ | * Stopping nagios3 monitoring daemon nagios3 | ||
+ | |||
+ | sudo service nagios3 start [ OK ] | ||
+ | * Starting nagios3 monitoring daemon nagios3 | ||
+ | kill: 1: No such process | ||
+ | </ | ||
+ | |||
+ | //source : https:// | ||
Line 196: | Line 227: | ||
- | ===== Configuration ===== | + | ======Configuration====== |
- | Les fichiers principaux se trouvent dans ''/ | + | Les fichiers principaux se trouvent dans ''/ |
- | ==== Contacts et groupes de contacts ==== | + | =====Contacts et groupes de contacts===== |
On renseigne les personnes de contact (qui seront notifiées lors d'un problème) dans le fichier ''/ | On renseigne les personnes de contact (qui seront notifiées lors d'un problème) dans le fichier ''/ | ||
Line 239: | Line 270: | ||
</ | </ | ||
- | ==== Droits des contacts ==== | + | =====Droits des contacts===== |
Pour attribuer des droits à un utilisateur, | Pour attribuer des droits à un utilisateur, | ||
Line 246: | Line 277: | ||
</ | </ | ||
- | ==== Périodes de temps ==== | + | =====Périodes de temps===== |
On peut consulter ou définir des périodes de temps dans le fichier ''/ | On peut consulter ou définir des périodes de temps dans le fichier ''/ | ||
Line 263: | Line 294: | ||
</ | </ | ||
- | ==== Déclaration d'un host ==== | + | =====Déclaration d'un host===== |
Ça se passe dans le fichier **/ | Ça se passe dans le fichier **/ | ||
Line 277: | Line 308: | ||
Cet host utilise le template generic-host qui définit tous les paramètres nécessaires par défaut. On peut surcharger l' | Cet host utilise le template generic-host qui définit tous les paramètres nécessaires par défaut. On peut surcharger l' | ||
- | ==== Création de hostgroup ==== | + | =====Création de hostgroup===== |
On doit mettre chaque host dans un hostgroup, défini dans le fichier **/ | On doit mettre chaque host dans un hostgroup, défini dans le fichier **/ | ||
Line 289: | Line 320: | ||
</ | </ | ||
- | ==== Création d'un service ==== | + | =====Création d'un service===== |
Ils sont déclarés dans le fichier **/ | Ils sont déclarés dans le fichier **/ | ||
Line 311: | Line 342: | ||
* '' | * '' | ||
- | ===== Vérifications ===== | + | =====Vérifications===== |
Pour vérifier la validité de la configuration de Nagios sans relancer le démon : | Pour vérifier la validité de la configuration de Nagios sans relancer le démon : | ||
Line 320: | Line 351: | ||
- | =====Installation de Nagvis===== | + | ======Installation de Nagvis====== |
Nagvis est un addon pour Nagios qui permet d' | Nagvis est un addon pour Nagios qui permet d' | ||
Line 326: | Line 357: | ||
- | ====MySQL==== | + | =====MySQL===== |
MySQL est un prérequis de notre installation de NDOUtils. | MySQL est un prérequis de notre installation de NDOUtils. | ||
Line 346: | Line 377: | ||
</ | </ | ||
- | ====NDOUtils==== | + | =====NDOUtils===== |
// | // | ||
Line 427: | Line 458: | ||
</ | </ | ||
- | ====Graphviz==== | + | =====Graphviz===== |
[[http:// | [[http:// | ||
Line 507: | Line 538: | ||
</ | </ | ||
- | ====Nagvis==== | + | |
+ | =====Nagvis===== | ||
Nagvis est un scripts PHP qui récupère les états Nagios pour générer une carte interactive. | Nagvis est un scripts PHP qui récupère les états Nagios pour générer une carte interactive. | ||
Line 577: | Line 609: | ||
- | ====Exemple de configuration | + | ====Exemple de configuration==== |
===Map=== | ===Map=== | ||
Line 607: | Line 639: | ||
</ | </ | ||
- | =====Installation de l' | + | |
+ | ======Installation de l' | ||
[[http:// | [[http:// | ||
Line 613: | Line 646: | ||
Son fonctionnement est simple : le serveur distant fait tourner le démon NRPE qui écoute sur le port tcp/5666 (par défaut). Le serveur nagios émet une requête vers ce serveur distant grâce au plugin **check_nrpe** ; il lui demande d' | Son fonctionnement est simple : le serveur distant fait tourner le démon NRPE qui écoute sur le port tcp/5666 (par défaut). Le serveur nagios émet une requête vers ce serveur distant grâce au plugin **check_nrpe** ; il lui demande d' | ||
- | ====Sur le serveur Nagios==== | + | =====Sur le serveur Nagios===== |
- | ===Prérequis=== | + | ====Prérequis==== |
NRPE utilise par défaut SSL pour échanger les données ; pour le compiler on doit installer le support SSL : | NRPE utilise par défaut SSL pour échanger les données ; pour le compiler on doit installer le support SSL : | ||
<code bash> | <code bash> | ||
Line 621: | Line 654: | ||
</ | </ | ||
- | ===Compilation et installation=== | + | ====Compilation et installation==== |
L' | L' | ||
<code bash> | <code bash> | ||
Line 638: | Line 671: | ||
</ | </ | ||
- | ===Vérification=== | + | ====Vérification==== |
Le protocole NRPE utilise par défaut le port tcp/5666 qu'il faudra donc ouvrir sur les serveurs et les éventuels pare-feux intermédiaires. | Le protocole NRPE utilise par défaut le port tcp/5666 qu'il faudra donc ouvrir sur les serveurs et les éventuels pare-feux intermédiaires. | ||
<code bash> | <code bash> | ||
Line 645: | Line 678: | ||
- | ====Sur le serveur distant==== | + | =====Sur le serveur distant===== |
(Pour les prérequis, voir partie précédente : //sur le serveur nagios//) | (Pour les prérequis, voir partie précédente : //sur le serveur nagios//) | ||
Line 655: | Line 688: | ||
</ | </ | ||
- | ===Installation des nagios-plugins=== | + | ====Installation des nagios-plugins==== |
Installer les nagios-plugins qui seront lancés sur le serveur distant (cf partie plus haut). | Installer les nagios-plugins qui seront lancés sur le serveur distant (cf partie plus haut). | ||
- | ===Compilation et installation=== | + | ====Compilation et installation==== |
Même chose que sur le serveur nagios : | Même chose que sur le serveur nagios : | ||
<code bash> | <code bash> | ||
Line 670: | Line 703: | ||
</ | </ | ||
- | ===Configuration=== | + | ====Configuration==== |
Comme pour le serveur nagios, on s' | Comme pour le serveur nagios, on s' | ||
<code bash> | <code bash> | ||
Line 719: | Line 752: | ||
- | ====Configuration==== | + | =====Configuration===== |
Pour vérifier la connectivité NRPE entre les 2 serveurs, lancer sur le serveur nagios : | Pour vérifier la connectivité NRPE entre les 2 serveurs, lancer sur le serveur nagios : | ||
Line 759: | Line 792: | ||
- | =====Ajout de plugins===== | + | ======Ajout de plugins====== |
- | Les plugins sont des programmes/ | + | Les plugins sont des programmes/ |
- | ====Check_multi==== | + | =====Check_multi===== |
[[http:// | [[http:// | ||
Line 770: | Line 803: | ||
- | ===Compilation=== | + | ====Compilation==== |
<note important> | <note important> | ||
Il est conseillé (par la doc officielle) de changer les buffers MAX_PLUGIN_OUTPUT_LENGTH et MAX_INPUT_BUFFER ; ceci dit je n'en ai pas vu l' | Il est conseillé (par la doc officielle) de changer les buffers MAX_PLUGIN_OUTPUT_LENGTH et MAX_INPUT_BUFFER ; ceci dit je n'en ai pas vu l' | ||
Line 853: | Line 886: | ||
| | ||
| | ||
- | make: *** [test] Error 2</ | + | make: *** [test] Error 2 |
+ | </ | ||
Le '' | Le '' | ||
Line 873: | Line 907: | ||
Le plugin fonctionne tout de même, alors on poursuit. | Le plugin fonctionne tout de même, alors on poursuit. | ||
- | ===Installation=== | + | ====Installation==== |
<code bash> | <code bash> | ||
Line 881: | Line 915: | ||
Le plugin s' | Le plugin s' | ||
- | ===Configuration=== | + | ====Configuration==== |
Le concept est le suivant : on créer un fichier **.cmd** correspondant, | Le concept est le suivant : on créer un fichier **.cmd** correspondant, | ||
* les état nagios à récupérer (directive **statusdat**) ou les commandes à lancer (directive **command**) | * les état nagios à récupérer (directive **statusdat**) ou les commandes à lancer (directive **command**) | ||
Line 887: | Line 922: | ||
Ce fichier sera appelé par un service déclaré dans Nagios, sous la forme : '' | Ce fichier sera appelé par un service déclaré dans Nagios, sous la forme : '' | ||
- | ==Création de http.cmd== | + | ===Création de http.cmd=== |
Les états de Nagios sont récupérés via le fichier ''< | Les états de Nagios sont récupérés via le fichier ''< | ||
Line 934: | Line 969: | ||
* on peut utiliser les macros Nagios avec les commandes ($HOSTNAME$, | * on peut utiliser les macros Nagios avec les commandes ($HOSTNAME$, | ||
- | ==Création du service Nagios== | + | ===Création du service Nagios=== |
Dans la conf de Nagios : | Dans la conf de Nagios : | ||
Line 954: | Line 989: | ||
Pour aller plus loin je vous recommande fortement le wiki officiel : http:// | Pour aller plus loin je vous recommande fortement le wiki officiel : http:// | ||
- | ===Passage de paramètres=== | + | ====Passage de paramètres==== |
* on ne peut passer de paramètres qu' | * on ne peut passer de paramètres qu' | ||
Line 984: | Line 1019: | ||
- | =====Installation de PNP4Nagios===== | + | ======Installation de PNP4Nagios====== |
[[http:// | [[http:// | ||
Line 1017: | Line 1052: | ||
* Choisir le mode de fonctionnement de pnp4nagios (cf http:// | * Choisir le mode de fonctionnement de pnp4nagios (cf http:// | ||
+ | <WRAP center round info 60%> | ||
+ | Note : ce mode semble buggué sur Debian 9 / Nagios 4.3.4 / PNP 0.6.26, utiliser plutôt d' | ||
+ | </ | ||
* Configurer Nagios pour qu'il fasse appel à PNP4Nagios : | * Configurer Nagios pour qu'il fasse appel à PNP4Nagios : | ||
Line 1050: | Line 1088: | ||
<code bash> | <code bash> | ||
ln -s / | ln -s / | ||
+ | |||
+ | # ou, avec un Nagios/PNP récemment compilée : | ||
+ | cp / | ||
+ | ln -s / | ||
</ | </ | ||
Line 1079: | Line 1121: | ||
<code bash> | <code bash> | ||
vi cgi.cfg | vi cgi.cfg | ||
- | action_url_target=main | + | action_url_target=_self |
</ | </ | ||
Line 1085: | Line 1127: | ||
<code bash> | <code bash> | ||
service nagios3 restart | service nagios3 restart | ||
+ | # OU | ||
+ | systemctl restart nagios | ||
</ | </ | ||
Line 1093: | Line 1137: | ||
</ | </ | ||
- | ====Certains plugins ne marchent pas !==== | + | =====Certains plugins ne marchent pas !===== |
Effectivement certains plugins ne fonctionnent pas avec PNP4Nagios car ils ne génèrent pas de perfdata. Pour rappel, les perfdatas sont affichés par le plugin juste après le status, séparé par un '' | Effectivement certains plugins ne fonctionnent pas avec PNP4Nagios car ils ne génèrent pas de perfdata. Pour rappel, les perfdatas sont affichés par le plugin juste après le status, séparé par un '' | ||
Line 1156: | Line 1200: | ||
(Et on relance Nagios après avoir vérifier les éventuelles erreurs avec '' | (Et on relance Nagios après avoir vérifier les éventuelles erreurs avec '' | ||
+ | |||
+ | =====Créer ses templates PNP===== | ||
+ | |||
+ | Un template (au sens PNP4nagios du terme) est un modèle de graphique adapté aux valeurs des données de performance. Il est intéressant d' | ||
+ | |||
+ | On peut choisir les couleurs, le type de graphique (courbe, aire, ligne), sa hauteur, la plage de données utilisée (1h, 12h, 1 semaine), etc... ça peut devenir des trucs très sympa : | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Pour chaque service disposant de perfdata et sur lequel PNP4nagios est activé, le plugin va rechercher un template éponyme du nom de sa commande ('' | ||
+ | <code bash> | ||
+ | # avec le paquet pnp4nagios sous debian 7 : | ||
+ | / | ||
+ | / | ||
+ | / | ||
+ | |||
+ | # avec une installation à partir des sources, ils seront plutôt ici : | ||
+ | / | ||
+ | </ | ||
+ | |||
+ | Par exemple pour un service " | ||
+ | |||
+ | ====Exemple 1 : trafic in/out==== | ||
+ | |||
+ | Voici un exemple de " | ||
+ | * création des objets dans Nagios : | ||
+ | <code bash> | ||
+ | vi / | ||
+ | |||
+ | # déclaration du NAS, on utilise bien le template nagios " | ||
+ | define host{ | ||
+ | use | ||
+ | host_name | ||
+ | address | ||
+ | hostgroups | ||
+ | } | ||
+ | |||
+ | # dans le service on ne précise que le nom de communauté, | ||
+ | # le service est appliqué au host grâce au groupe " | ||
+ | define service{ | ||
+ | use | ||
+ | hostgroup_name | ||
+ | service_description traffic eth0 | ||
+ | check_command | ||
+ | } | ||
+ | | ||
+ | # trafic reseau | ||
+ | # -o est suivi par les 2 OIDs correspondant au trafic in et out de l' | ||
+ | # -l permet d' | ||
+ | # -u permet de préciser l' | ||
+ | # -P précise la version de SNMP | ||
+ | # -C spécifie la communauté SNMP | ||
+ | # --rate induqe qu'il s'agit d'un compteur qui nécessite donc un calcul \ | ||
+ | # par rapport à la précédente valeur (voir plus bas pour l' | ||
+ | define command{ | ||
+ | command_name | ||
+ | command_line | ||
+ | -u bytes,bytes --rate -o .1.3.6.1.2.1.31.1.1.1.6.3, | ||
+ | } | ||
+ | </ | ||
+ | NB : le plugin **check_snmp** avec l' | ||
+ | * sous Debian j'ai eu ''/ | ||
+ | * sous centOS c'est ''/ | ||
+ | * ça peut aussi être ''/ | ||
+ | Pour ne pas avoir d' | ||
+ | <code bash> | ||
+ | chmod 755 /usr/var && mkdir / | ||
+ | </ | ||
+ | |||
+ | * On créer ensuite le template, qui permet d' | ||
+ | <code bash> | ||
+ | vi / | ||
+ | <?php | ||
+ | # | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # Plugin: check_iftraffic.pl (COUNTER) | ||
+ | # adaptation pour traffic syno | ||
+ | |||
+ | $opt[1] | ||
+ | # | ||
+ | $def[1] | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | $def[1] .= " | ||
+ | |||
+ | # pour afficher le dernier check sur le graphe | ||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | </ | ||
+ | |||
+ | Résultat : | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Le même, un peu plus perfectionné : | ||
+ | <code php> | ||
+ | <?php | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # Plugin: check_snmp_int.pl (COUNTER) | ||
+ | # modif traffic reseau in/out | ||
+ | |||
+ | $unit = " | ||
+ | |||
+ | $ds_name[1] = " | ||
+ | $opt[1] = " --vertical-label $unit -b 1000 --title \" | ||
+ | $def[1] = rrd:: | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | #$def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | $def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | |||
+ | </ | ||
+ | ====Exemple 2 : courbe CPU==== | ||
+ | |||
+ | Autre exemple pour grapher l' | ||
+ | |||
+ | Conf nagios, en vrac : | ||
+ | <code bash> | ||
+ | # paramètres de check_snmp : | ||
+ | # -P2c pour préciser le version de SNMP (2c) | ||
+ | # -t5 pour préciser le timeout (en secondes) de la commande | ||
+ | # -l < | ||
+ | # et les classiques mandataires : -C < | ||
+ | define command{ | ||
+ | command_name | ||
+ | command_line | ||
+ | } | ||
+ | |||
+ | # le service est rattaché au groupe fortigate_v4 | ||
+ | define service { | ||
+ | name check-snmp-forti-cpu-v4 | ||
+ | hostgroup_name | ||
+ | use | ||
+ | service_description | ||
+ | check_command | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | On réutilise le template par défaut : | ||
+ | <code bash> | ||
+ | <?php | ||
+ | # template CPU derive du default template : | ||
+ | # Copyright (c) 2006-2010 Joerg Linge (http:// | ||
+ | # | ||
+ | # Define some colors .. | ||
+ | # | ||
+ | $_WARNRULE = '# | ||
+ | $_CRITRULE = '# | ||
+ | $_AREA | ||
+ | |||
+ | # couleurs de la courbe | ||
+ | $_LINE | ||
+ | $GRAD_INF | ||
+ | $GRAD_SUP | ||
+ | |||
+ | # | ||
+ | # Initial Logic ... | ||
+ | # | ||
+ | |||
+ | foreach ($this-> | ||
+ | |||
+ | $maximum | ||
+ | $minimum | ||
+ | $critical = ""; | ||
+ | $crit_min = ""; | ||
+ | $crit_max = ""; | ||
+ | $warning | ||
+ | $warn_max = ""; | ||
+ | $warn_min = ""; | ||
+ | $vlabel | ||
+ | $lower | ||
+ | $upper | ||
+ | |||
+ | if ($VAL[' | ||
+ | $warning = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $warn_max = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $warn_min = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $critical = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $crit_max = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $crit_min = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $lower = " --lower=" | ||
+ | $minimum = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $maximum = $VAL[' | ||
+ | } | ||
+ | if ($VAL[' | ||
+ | $vlabel = " | ||
+ | $upper = " --upper=101 "; | ||
+ | $lower = " --lower=0 "; | ||
+ | } | ||
+ | else { | ||
+ | $vlabel = $VAL[' | ||
+ | } | ||
+ | |||
+ | $opt[$KEY] = ' | ||
+ | $ds_name[$KEY] = $VAL[' | ||
+ | $def[$KEY] | ||
+ | $def[$KEY] .= rrd:: | ||
+ | $def[$KEY] .= rrd:: | ||
+ | $def[$KEY] .= rrd:: | ||
+ | if ($warning != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($warn_min != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($warn_max != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($critical != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($crit_min != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | if ($crit_max != "" | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | $def[$KEY] .= rrd:: | ||
+ | } | ||
+ | ?> | ||
+ | </ | ||
+ | |||
+ | Résultat : | ||
+ | {{ : | ||
+ | |||
+ | ====Exemple 3 : graphique adaptatif==== | ||
+ | |||
+ | Ce template va détecter automatiquement le nombre d' | ||
+ | <code bash> | ||
+ | <?php | ||
+ | $unit = " | ||
+ | |||
+ | # max : 7 entrées | ||
+ | $TAB_COLORS = array('# | ||
+ | $CPT=1; | ||
+ | |||
+ | $ds_name[$CPT] = " | ||
+ | $opt[$CPT] = " --vertical-label $unit -b 1000 --title \" | ||
+ | |||
+ | foreach ($this-> | ||
+ | |||
+ | if ($CPT == " | ||
+ | $def[1] = rrd:: | ||
+ | } | ||
+ | else { | ||
+ | $def[1] .= rrd:: | ||
+ | } | ||
+ | |||
+ | $def[1] .= " | ||
+ | $def[1] .= rrd:: | ||
+ | |||
+ | $CPT++; | ||
+ | } | ||
+ | |||
+ | if($this-> | ||
+ | $def[1] .= " | ||
+ | } | ||
+ | ?> | ||
+ | |||
+ | </ | ||
+ | |||
+ | ======Tips====== | ||
=====Activer les commandes externes===== | =====Activer les commandes externes===== | ||
Line 1189: | Line 1526: | ||
</ | </ | ||
- | ====Installation du paquet Ubuntu par défaut==== | + | =====Crash de la machine===== |
- | + | ||
- | Sous Ubuntu (9.10) il y a 2 problèmes avec l' | + | |
- | * problème avec le plugin **check_ssh** : en fait il n'y a pas de serveur SSH installé sous Ubuntu par défaut. Pour l' | + | |
- | * problème de droit d' | + | |
- | + | ||
- | Pour ignorer le fichier qui pose ce problème de droit d' | + | |
- | <code bash> | + | |
- | sudo vi / | + | |
- | # ' | + | |
- | define command{ | + | |
- | | + | |
- | # | + | |
- | # | + | |
- | # | + | |
- | | + | |
- | } | + | |
- | </ | + | |
- | + | ||
- | Puis il faut recharger la conf dans Nagios : | + | |
- | <code bash> | + | |
- | sudo service nagios3 stop | + | |
- | * Stopping nagios3 monitoring daemon nagios3 | + | |
- | + | ||
- | sudo service nagios3 start [ OK ] | + | |
- | * Starting nagios3 monitoring daemon nagios3 | + | |
- | kill: 1: No such process | + | |
- | </ | + | |
- | + | ||
- | //source : https:// | + | |
- | + | ||
- | ====Crash de la machine==== | + | |
Lors d'un crash de la machine, malgré que le service nagios se soit relancé correctement, | Lors d'un crash de la machine, malgré que le service nagios se soit relancé correctement, | ||
Line 1280: | Line 1586: | ||
</ | </ | ||
- | =====De Wheezy vers Jessie===== | + | =====Upgrade de Wheezy vers Jessie===== |
Depuis quelques jours (fin avril 2015) Debian 8 stable est release. Je me suis donc mis à la page et j'ai eu la stupeur de voir que mon nagios3 avait été à moitié dézingué, et que le pnp4nagios avait même disparu des paquets (à priori il n' | Depuis quelques jours (fin avril 2015) Debian 8 stable est release. Je me suis donc mis à la page et j'ai eu la stupeur de voir que mon nagios3 avait été à moitié dézingué, et que le pnp4nagios avait même disparu des paquets (à priori il n' | ||
Line 1388: | Line 1694: | ||
</ | </ | ||
- | * pour une raison qui m'est inconnue, le plugin **check_snmp** (quand utilisé avec l' | + | * pour une raison qui m'est inconnue, le plugin **check_snmp** (quand utilisé avec l' |
<code bash> | <code bash> | ||
mkdir / | mkdir / | ||
Line 1411: | Line 1717: | ||
- | ===== Liens ===== | + | =====Horodatage illisibles des logs===== |
+ | |||
+ | Les logs Nagios sont par défaut verbeux mais l' | ||
+ | <code bash> | ||
+ | # les logs bruts | ||
+ | tail -3 / | ||
+ | [1441261778] Auto-save of retention data completed successfully. | ||
+ | [1441265378] Auto-save of retention data completed successfully. | ||
+ | [1441268978] Auto-save of retention data completed successfully. | ||
+ | |||
+ | # après convertion | ||
+ | tail -3 / | ||
+ | [Thu Sep 3 08:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | [Thu Sep 3 09:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | [Thu Sep 3 10:29:38 2015] Auto-save of retention data completed successfully. | ||
+ | </ | ||
+ | |||
+ | |||
+ | |||
+ | =====Contrôler Nagios en CLI===== | ||
+ | |||
+ | Grâce au commandes externes, on peut envoyer des ordres à Nagios via la ligne de commande, ce qui va plus vite que l' | ||
+ | |||
+ | Exemples de scripts inspirés de ceux de la doc : | ||
+ | * '' | ||
+ | <code bash nagios_downtime-host-and-childs.sh> | ||
+ | # | ||
+ | # This is a sample shell script showing how you can submit the SCHEDULE_AND_PROPAGATE_HOST_DOWNTIME command | ||
+ | # to Nagios. Adjust variables to fit your environment as necessary. | ||
+ | |||
+ | [ -z " | ||
+ | |||
+ | now=`date +%s` | ||
+ | commandfile='/ | ||
+ | end=`expr $now + $1` | ||
+ | comment=" | ||
+ | shift 2 | ||
+ | |||
+ | while [ -n " | ||
+ | / | ||
+ | | ||
+ | done | ||
+ | </ | ||
+ | |||
+ | * permet de planifier un downtime pour un host et ses childs à un date donnée | ||
+ | <code bash nagios_downtime_w_childs.sh> | ||
+ | function usage { | ||
+ | echo " | ||
+ | echo " format dates: \" | ||
+ | echo " ex: nagios_downtime_w_childs.sh switch1 \" | ||
+ | exit 1 | ||
+ | } | ||
+ | |||
+ | [ -z " | ||
+ | |||
+ | now=$(date +%s) | ||
+ | commandfile='/ | ||
+ | |||
+ | # affectation et contrôle des inputs | ||
+ | naghost=$1 | ||
+ | debut=$(date -d " | ||
+ | [ -z " | ||
+ | #[[ " | ||
+ | fin=$(date -d " | ||
+ | [ -z " | ||
+ | comment=" | ||
+ | |||
+ | / | ||
+ | </ | ||
+ | =====Annuler des actions en masse===== | ||
+ | |||
+ | // | ||
+ | |||
+ | Pour annuler en masse certaines actions, on peut interagir avec le fichier de pipe nommé **nagios.cmd** (situé dans **/ | ||
+ | |||
+ | Exemple pour supprimer des DOWNTIME planifiés pour un équipement et tous ses fils (soit une centaine de DOWNTIME) : | ||
+ | * on pourrait les supprimer un par un / clic par clic dans le menu " | ||
+ | * puis se connecter en SSH sur le serveur et lancer la commande : | ||
+ | <code bash> | ||
+ | for i in `seq 1050 1150`; do | ||
+ | printf "[%lu] DEL_HOST_DOWNTIME; | ||
+ | done | ||
+ | </ | ||
+ | Cela a pour effet d' | ||
+ | |||
+ | |||
+ | ======Liens====== | ||
* http:// | * http:// |
informatique/logiciels/nagios.1430322988.txt.gz · Last modified: 2015/04/29 15:56 by pteu