La memoria del processo principale (gwd) viene monitorata da vc_process_monitor, che assicura che non utilizzi mai più del 75% della memoria disponibile. Di conseguenza, il monitoraggio della memoria totale del sistema viene eseguito con una soglia di avviso dell'80% e una soglia critica del 90%.
È possibile monitorare un gateway con soglie che forniscono avvisi o stati critici indicanti potenziali problemi prima che influiscano sui servizi. Nella tabella seguente sono elencati i valori di soglia e le azioni consigliate.
| Stato della soglia | Valore di soglia | Azione correttiva consigliata |
|---|---|---|
| Avviso | 80% | Se la memoria supera la soglia di avviso:
Continuare a monitorare attivamente e verificare l'eventuale aumento dell'utilizzo. |
| Critico | 90% | Se la memoria supera la soglia critica:
Se il problema si verifica nuovamente:
Nota: Prima di ribilanciare il gateway, verificare che le metriche di capacità rientrino nel limite consigliato. Per ulteriori informazioni sulle metriche di capacità, vedere
Capacità dei componenti del gateway.
|
Di seguito è disponibile uno script Python di esempio per il monitoraggio dell'utilizzo della memoria:
Nota: È inoltre possibile utilizzare Telegraf per monitorare l'utilizzo della memoria. Per ulteriori informazioni, vedere
Monitoraggio dei gateway tramite Telegraf.
#!/usr/bin/env python
from optparse import OptionParser
import sys
# Parse commandline options:
parser = OptionParser(usage="%prog -w <warning threshold>% -c <critical threshold>% [ -h ]")
parser.add_option("-w", "--warning",
action="store", type="string", dest="warn_threshold", help="Warning threshold in absolute(MB) or percentage")
parser.add_option("-c", "--critical",
action="store", type="string", dest="crit_threshold", help="Critical threshold in ansolute(MB) or percentage")
(options, args) = parser.parse_args()
def read_meminfo():
meminfo = {}
for line in open('/proc/meminfo'):
if not line: continue
(name, value) = line.split()[0:2]
meminfo[name.strip().rstrip(':')] = int(value)
return meminfo
if __name__ == '__main__':
if not options.crit_threshold:
print "UNKNOWN: Missing critical threshold value."
sys.exit(3)
if not options.warn_threshold:
print "UNKNOWN: Missing warning threshold value."
sys.exit(3)
is_warn_pct = options.warn_threshold.endswith('%')
if is_warn_pct:
warn_threshold = int(options.warn_threshold[0:-1])
else:
warn_threshold = int(options.warn_threshold)
is_crit_pct = options.crit_threshold.endswith('%')
if is_crit_pct:
crit_threshold = int(options.crit_threshold[0:-1])
else:
crit_threshold = int(options.crit_threshold)
if crit_threshold >= warn_threshold:
print "UNKNOWN: Critical percentage can't be equal to or bigger than warning percentage."
sys.exit(3)
meminfo = read_meminfo()
memTotal = meminfo["MemTotal"]
memFree = meminfo["MemFree"] + meminfo["Buffers"] + meminfo["Cached"]
memFreePct = 100.0*memFree/memTotal
if (is_crit_pct and memFreePct <= crit_threshold) or (not is_crit_pct and memFree/1024<=crit_threshold):
print "CRITICAL: Free memory is at %2.0f %% ( %d MB free our of %d MB total)" % (memFreePct, memFree/1024, memTotal/1024)
sys.exit(2)
if (is_warn_pct and memFreePct <= warn_threshold) or (not is_warn_pct and memFree/1024<=warn_threshold):
print "WARNING: Free memory is at %2.0f %% ( %d MB free our of %d MB total)" % (memFreePct, memFree/1024, memTotal/1024)
sys.exit(1)
else:
print "OK: Free memory is at %2.0f %% ( %d MB free our of %d MB total)" % (memFreePct, memFree/1024, memTotal/1024)
sys.exit(0)