AD短信告警正确打开方式之又get一新技能
  

饶林瑞 发表于 2015-10-31 20:15

本帖最后由 饶林瑞 于 2015-10-31 20:19 编辑

AD短信告警正确打开方式之又get一新技能
        AD设备大家都知道,负载均衡。出站负载均衡、入站负载均衡。出站又分DNS代理、智能路由。入站又分智能DNS、应用负载。反正功能相当强大,知识点相当丰富
    我们来看看事发的背景
一、客户的需求
        1、现在新开发的一个http 80端口web应用,这个应用准备大规模的在内部使用(政府部门),内网用10台服务器来提供这种应用的服务,要做服务器负载均衡
        2、同时这些服务器还提供别的服务。客户需求只要某个应用出现了故障,就认为这台服务器故障,暂时不让这台服务器提供服务。
        也就是应用负载里节点池中节点监视器选用的知识点,最后的解决方案是分别对每个应用配置一个监视器,然后多种节点监视器复合使用,都通过的情况下才认为是节点正常。
具体的配置就参考AD服务器负载的文档。
        3、客户想要使用短信告警
        客户买了一套监控系统,基于SNMP协议的监控,但是客户又觉得这种监控方式不合理不全面。在了解到AD具有短信告警功能之后,AD做监控系统的新想法诞生了!
        首先我们来看看AD短信告警都能告警哪些东西:
1.png
        ①链路状态:线路健康状态检查
        ②虚拟服务:服务器负载的时候检测虚拟服务是否正常
        ③节点:检测节点状态发生变化
        ④网络攻击:检测简单的网络攻击
        ⑤高可用性:双机、集群环境检测设备工作健康状态
        ⑥CPU负荷:AD设备负荷告警
        ⑦连接数:所有节点的连接数总和达到一个值之后告警
        好样的,客户一看,节点能够检测到,只要节点状态发生变化,就会发送短信告警。这简直太好了!客户又问,那AD这个检测,是必须通过AD搭建虚拟服务才能检测到节点状态吗?
当时我也没敢确定,没给准确答案。我就含糊的说了一句:不用,只要建节点池就行了。后来跟400同事确认了一下,的确是这样。

        这可给客户乐坏了!再来看看AD节点的检测方法
2.png
        那简直是真的应有尽有!
        只要建立了节点池,在节点池里面把节点都设置好,根据不同的服务器采用不同的节点监视器来实时监控节点状态。一旦某个状态发生变化了,就能立马接到短信告知,非常清楚地定位到状态改变的服务器(正常到故障,故障到恢复都会告警)简直是监控神器!
二、短信告警配置

        清楚了客户的需求之后,我需要做的最重要的时候就是把短信猫装上去。因为之前没有实施过短信猫,只看过PPT了解过基础配置。而实际配置起来,就遇到了你们意想不到的问题….由于现场不允许上外网,并且手机网络信号特别差,图片都是拍照的。遇到问题也是拍照发给好友列表里的400然后打电话转给他让帮忙排查的。在这里特别感谢一下sangfor2176!太机智了!太靠谱了!
        1、短信猫
        首先,客户拿出了1个GSM短信猫,我印象中GSM短信猫是支持联通、移动GSM卡,也就是2G网络短信卡。然而销售给我的是一张移动4G卡,我特别心虚,不知道支持不支持。先不管了,把短信猫装好再说!
        如下图所示,大概就长这样。当时没有好好拍照,各个部件组装一下就好了!
3.png
        2、配置
        装好之后进行短信猫的配置
4.png

        咋一看,没什么问题!OK,测试一下吧~
5.png

        过了好一会儿,没有收到短信….这到底是什么问题呢?
        排查思路:
        (1)给短信猫打个电话,能打通,OK,没问题!
        (2)再一次检查配置,GSM短信猫,连线都没问题!
        (3)难道是这卡不能发短信?欠费了?把卡拿出去,找了个N年前的摩托罗拉小手机(驻场工程师手里借的)把卡插上去,给自己发了个短信,能收到。也没问题!
        (4)手机卡是4G卡,不是GSM卡,难道问题出在这里了!!!!
打个电话问问400,到底支持不支持。并且在群里发了我的疑问….没人能确定是否支持。等400回复吧!最后400做了测试,确认了GSM短信猫支持联通移动4G卡、3G卡、2G
这一磨叽,时间就慢慢过去了。快6点了….客户着急,我也着急。为啥就是收不到短信呢?难道猫坏了?
        (5)换了一个短信猫(有钱啊,短信猫都是一批一批买),再来试试。
还是收不到短信。
        难道我手机拦截了?去骚扰拦截里面也没有找到。再添加一个别人的手机号码进去,继续测试,依然不行。着急啊!
忽然发现好友里面有个400叫2176,周二的时候给我远程加的好友,现在这个现场是不可能远程的,我实在是没有时间再去慢慢描述了。
       也许是我策略有点问题,我再排查,再排查,再排查。
       先不管了。机智勇敢的我把现场照片挨个拍照一股脑全发给2176!打400,让给我转2176.告诉他我短信猫发出来的短信我收不到,策略拍照发给他了,快帮我看看什么问题。
        2176也是思路非常清晰的帮我做了排查,大致如上诉过程一样,应该是不会有问题了。
        2176教我如何打开调试日志,打开调试日志发现短信都是发送成功的。
6.png
        他说试试别的波特率,我也尝试了,只有115200是能够成功连接上短信猫,其他的都无法连接。我让他再看看我的策略,硬件方面的问题全部排查过了,就看是否是策略出错了。我实在是找不到问题了。

    最后,机智的2176发现了问题,我的接收短信号码格式写错了!!
7.png
8.png
        手机号码前面加个86,测试,手机短信提示音想起来了!天籁之音啊!喜极而泣啊!
        好机智的2176啊!好靠谱啊!我就那么想当然的把手机号码填写进去了,一点都没有考虑到旁边的提示是什么。知道真相的我眼泪掉下来….半小时可以搞定的事情我磨叽了一下午。也好,以后长点心!又吃了次教训~安慰自己说,成长要是一帆风顺那多没意思…嗯,我一定不会告诉你们那么晚回家外面风有多大有多冷。
        小伙伴们记住了….以后多看提示。T.T

       最后再赞一句,客户好机智啊!AD用来当监控系统,AD新卖点又出来了!可以短信告警、可以邮件告警,好腻害啊有木有!基于各种协议的节点健康检查,不需要通过AD负载只需要添加节点就能检测到。Sangfor AD啊,你咋辣么NB




喜欢这篇分享吗?喜欢就给楼主打点赏吧!点个赞也是极大的鼓励!

发帖可获得5S豆;若您的分享被加精或推荐优秀等,将获得更多S豆奖励,了解更多S豆奖励信息

完善手机号和公司名称,让服务更省心更便捷!立即完善

×
有话想说?点这里!
可评论、可发帖

本版热帖

本版达人

adds

本周分享达人

新手58354...

本周提问达人

#厉害了! 我的技术等级已提升#