质量改进 a.虚拟存储,实现单点故障隔离框架;单磁盘卡慢场景下,不依赖系统踢盘,从虚拟存储层面进行隔离,并支持按分片级别粒度进行隔离 b.虚拟存储口默认开启网络亚健康丢包场景下自动隔离故障网口,避免业务受影响。其他网络平面需要手动按需配置。 c.外置存储部分链路时延高,支持主动隔离避免业务影响;单存储lun故障,不会扩散影响别的存储;在存储故障处置完成后,平台因IO卡住的服务能自愈 d.网络亚健康优化 网络亚健康功能 | 详细说明 | 各网络平面默认配置 | 管理通信口:默认不开启网络亚健康检测。丢包默认阈值5%,仅告警;时延默认阈值50ms,仅告警 数据通信口:默认不开启网络亚健康检测。丢包默认阈值5%,仅告警;时延阈值50ms,仅告警 业务通信口:默认不开启网络亚健康检测。丢包默认阈值5%,仅告警;时延阈值50ms,仅告警 存储通信口:默认开启丢包检测,不开启时延检测。丢包默认阈值5%,告警并处置;时延默认阈值10ms,仅告警 外置存储通信口:默认不开启网络亚健康检测。丢包默认阈值5%,仅告警;时延阈值50ms,仅告警 终端通信口:默认不开启网络亚健康检测。丢包默认阈值5%,仅告警;时延阈值50ms,仅告警 各网络平面丢包阈值调整范围1%-50%,时延阈值调整范围1-1000ms。 所有配置修改后点击保存后生效。 | 告警及处置 | 仅告警:物理网口直连交换机链路亚健康时,上报告警到用户界面,一小时内不会重复相同时延丢包告警,十分钟内不会重复链路故障告警。 告警并隔离:物理网口直连链路亚健康时,上报告警到用户界面,同时触发物理网口的隔离动作。 非存储通信网口隔离动作仅对主备(mode1)、LACP(mode4)聚合模式生效。 存储通信网口支持主备(mode1),手工负载分担(mode2),LACP(mode4)模式,若存储通信口所有物理口亚健康则根据副本状况决定是否隔离主机。隔离主机的动作,8小时内仅会执行一次。 网口复用场景(非存储网复用):每个网络平面独立告警并根据用户配置决定是否隔离。同时触发多条告警时,任一告警的网络平面配置了“告警并隔离”,网口将会被处置。 | 网络亚健康检测 | 根据网络配置,每台HCI物理主机会选择多个对端HCI主机进行发包探测。 统计探测包丢包、rtt往返时延,利用亚健康检测算法,判断物理网口(聚合网络的成员口)直连交换机链路的亚健康状态。 当前检测算法会统计一段时间内的丢包及时延,瞬时丢包或时延超过阈值将不会被检出。 |
|