内蒙古XXXXX外网系统,是XXXXX重要公共基础设施,是服务于自治区党委、人大、政府、政协等政务部门,满足其经济调节、市场监管、社会管理和公共服务等方面需要的政务公用网络平台。
自治区电子政务外网系统由核心区、互联网出口区、外部应用区、外部托管区、外部虚拟化区、内部应用区、内部托管区、内部虚拟化区;以及互联国家区、互联城域网区、互联盟市区、互联旗县区等多个网络区域组成。
自治区电子政务外网系统是内蒙古自治区电子政务重要公共基础设施;通过政务外网网络、政务云平台等,服务于自治区党委、人大、政府、政协等政务部门,满足其经济调节、市场监管、社会管理和公共服务等方面需要的政务公用网络平台。
第2章 需求分析
2.1 项目搜集及整理
自治区电子政务系统保护等级为:第三级且已通过等级保护测评;但是、政务云和云上各委办厅局的业务系统,尚未完成等保测评,对应等级的安全措施也不完整。缺乏针对政务云平台、各委办厅局上云和云上业务系统的安全合规和整体运维保障体系。
结合国家电子政务的业务需求,以及各委办厅局托管系统建设的现状来看,保障各个委办单位托管业务平台的系统及数据安全,成为下一阶段安全建设的主要方向。在当前互联网环境日趋复杂的背景下,急需以先进的技术理念为驱动,以国家标准为建设原则,进行各个委办单位业务平台的体系化安全建设。
2.2 需求分析
基础设施服务需求:基于云计算的高弹性、高可靠性、高冗余的特点,采用可行的云计算模式,充分利用IDC专用数据中心等基础设施构建逻辑集中、统一的电子政务云公共平台,将物理分散的各类资源池化后统筹调度和管理,设计形成整体解决方案,能够快速交付虚拟化基础设施服务,灵活高效地分配资源,提供不中断业务的设备更新,提高政务基础设施运行效率,绿色低碳,节省电力。
信息安全服务需求:信息安全服务包括基础环境安全和业务及数据支撑安全两大部分,保障电子政务云公共平台及提供的各项服务的安全。基础环境安全的重点是满足云计算环境中等级保护的要求,应从区域边界安全、计算环境安全(主机/虚拟主机)、虚拟平台安全三个层面建立三重安全防护体系,尤其加强政务外网安全应用支撑,科学划分安全域和安全等级,开展安全防护,符合GB/T22239-2008《信息系统安全等级保护基本要求》三级等保能力要求。业务及数据支撑安全的重点是访问控制和数据隔离及加密。
运行保障服务需求:基于云计算的电子政务云公共平台的建设,采用了云计算等新技术整合了已有的机房资源、计算资源、存储资源、网络资源、基础信息资源、信息资源支撑能力、公共应用环境等资源,统一向政府部门、政务人员以及公众提供计算资源、存储资源、网络资源、机房资源等服务,采用集中建设、集中运营的方式,减少了独立组建电子政务运营环境的时间,提高了服务质量。随着电子政务发展方式的改变,对基于云计算的电子政务云公共平台的运行保障服务提出了更高的要求。
业务应用支撑要求:自治区政务云平台应为各政府部门实现政务、业务目标提供公共的技术环境和服务支撑,有效支持政务部门灵活、快速部署应用业务;满足跨地区、跨部门、跨层级信息共享,以及行业系统与县级应用结合的需要;满足大量数据访问、存储和智能化处理的需要;解决政务应用开发部署的响应速度慢、无法满足快速变化的各政府机构管理体制和工作机制变革的问题。
2.3 业务梳理分析
1. 政务部门灵活、快速部署应用业务。
2. 满足跨地区、跨部门、跨层级信息共享,以及行业系统与县级应用结合的需要。
3. 满足大量数据访问、存储和智能化处理的需要。
4. 解决政务应用开发部署的响应速度慢、无法满足快速变化的各政府机构管理体制和工作机制变革的问题。
第3章 技术方案
3.1 方案总体实施方案拓扑
安全资源池拓扑图(局部)
3.2 技术说明
通过单臂引流的方式,最大化的保证客户网络的连续性,即使在安全资源发生故障的时候也能在1秒内切换到原有路由,保证业务的连续性。
第4章 测试验证说明
4.1 连通性测试
安全资源池集群搭建完成后,测试了管理口、业务口、vxlan口、存储口的连通性,均无问题。
测试组件IP、对外发布IP的连通性,均无问题。
4.2 压力测试
测试用例和数据汇总:
结论:
1- 由于资源池内部网络拓扑优化删除了一个虚拟路由器,整个流量路径TTL减少2次;底层平台从5.3版本升级到5.8版本,两个因素导致本次测试项中延时参数比一期要稍好;
多租户流量场景下资源池性能结果可以说明vxlan线路正常;
4.3 冗余测试
1.主机断电测试结论:
在主机发生故障时,核心路由器发生迁移,迁移时间大约1秒钟,安全防护和业务都会瞬断。
AF组件发生迁移,迁移时间大约3分钟,安全防护会中断,业务丢3个包。
CSSP虚拟机迁移,迁移时间大约4分钟,安全防护会中断10秒左右后恢复,业务丢三个包后恢复。
2.业务网口故障测试结论:
拔掉聚合口的其中一个口,均不会影响安全防护和业务。
断掉两个口,要取决于虚拟核心路由器是否迁移,如果迁移,业务会丢一个包,安全防护失效约10秒钟。
NQA测试生效,当安全资源池故障的时候,可以切回正常路由,保障业务,但是此时安全防护失效。
3.存储网口故障测试结论:
当AF组件运行位置所在主机存储口拔掉后,会影响安全防护,最多影响8分钟。
对业务的影响,最多丢4个包。
4.数据网口(vxlan)故障测试结论:
vxlan单线中断,不会一影响业务和安全防护。
如果AF组件所在主机vxlan全断,且和边界路由器或者核心路由器不在同一位置,安全防护会失效,业务丢一个包。
如果AF组件所在主机vxlan正常,但和边界路由器或者核心路由器不在同一位置,不影响安全防护,业务丢3个包。
如果AF组件和边界路由器或者核心路由器在同一位置,则不会影响安全防护和业务。
5.管理网口故障测试结论:
管理口掉线会导致主机离线,如果涉及到组件或者虚拟机迁移,业务最多丢3个包。
4.4 业务测试
配合客户进行线下组件功能测试,各个安全组件均可以正常承载业务,满足客户的需求。
第5章 方案价值点说明
5.1 业务需求满足情况
安全资源池的单臂部署方式,可以最大化的保证客户的业务连续性;各个安全组件均可以正常承载业务,满足客户的需求。
5.2 方案可参考性说明
本方案适用于大部分的政务云场景,和研发在客户机房连续蹲了13天完成的压力测试和冗余测试可以给其他用户和区域做实施前参考,详细的测试报告可以找内蒙办技服杨磊96252获取。
第6章 经验总结
6.1 做的好的地方
在一期项目的基础上,在项目前期就做了对应的物料规划,在二期项目也确实遇到了物料短缺的问题,好在提前介入,在项目正式实施前解决了物料问题,保证项目的顺利交付;
在项目经理以及公司各级同事的协助下,争取借测到了思博伦设备,提前协调好研发同事上门,保证了压力测试的如期进行,整体效果及结论达到客户的预期。
6.2 其他建议
安全资源池在新版本发布前要做一下详细的测试,在本次实际的压力和冗余测试中,有部分数据跟总部给出的有差异,望改进。
在安全资源池项目交付中,会涉及到的物料比较多,在项目前期规划是技服要提前介入做物料评估,不然在交付过程中遇到问题,会严重影响项目进度,进而影响客户满意度。