zabbix报错:More than 100 items having missing data for more than 10 minutes

今天遇到zabbix报错: More than 100 items having missing data for more than 10 minutes 。

意思是超过了100项数据丢失了超过十分钟

查看zabbix-Administration-Queue-Overview by proxy

发现大量的等待item

原因分析:

  1.  server端与proxy端时间不同步
  2. server端分配的缓存不够
  3. server端分配的线程不够
  4. server端负载比较大{CPU,IO,MEM}

    解决方法:

 1.查看服务器资源负载状态,排除服务器本身原因

 htop   iotop iostat

  2.查看zabbix_server有没有出现 Zabbix poller processes more than 75% busy 告警

 修改配置文件增大线程数和缓存

        vim /usr/local/zabbix/etc/zabbix_server.conf
        StartPollers=500
        StartPollersUnreachable=50
        StartTrappers=30
        StartDiscoverers=6
        CacheSize=1G
        CacheUpdateFrequency=300
        StartDBSyncers=20
        HistoryCacheSize=512M
        TrendCacheSize=256M
        HistoryTextCacheSize=80M
        ValueCacheSize=1G

 3.查看服务端与代理端的时间是不是同步的

crontab -e
*/3 */1 * * * /usr/sbin/ntpdate -u 202.120.2.101 &> /dev/null

4.重启server端与proxy端服务

再次查看报警信息:

问题已解决

发表评论

后才能评论