本帖最后由 新手386710 于 2022-10-19 10:26 编辑
一、需求背景
承载数据库的物理服务器或者存储,使用的时间过久,物理服务器或者存储难免会出问题,这时就需要迁移数据库。在这个云网数安时代,可以直接把数据库迁移上云。今天就给大家分享一下oracle rac数据库恢复到超融合平台的实战。整个过程结合了科力锐的灾备一体机进行配合使用,有很多细节注意事项,后面我都总结给大家。先看注意事项可以避免很多不必要的麻烦。 二、科力锐灾备一体机(源机)节点1操作步骤 2.1 查看oracle rac的备份计划,这个oracle rac需要单独授权,也叫做集群备份
2.2 查看共享盘 物理服务器使用的是日立的共享存储,总共7块磁盘,超融合目标机也需要新增7块共享盘 2.3 整机验证 目的是检查备份是否可用,oracle rac环境很特殊,在自己新增备份策略时,备份完成的第一件事就是,通过灾备一体机进行一次整机验证,检查数据或者集群状态,备份完成不代表备份数据恢复时是可用的,如果备份数据有问题,就需要联系备份厂家处理,觉大可能要替换文件。 2.4 数据验证 集群状态都为online说明备份没问题,数据一致,才可以进行恢复。 2.5 下载裸机恢复启动介质恢复介质 2.6 整机恢复 2.7 读取恢复信息 2.8 选择加载驱动 2.9 平台检查 2.10选择驱动 2.11 设置IP地址,切记这里的网卡IP和名称必须对应源机的网卡名和IP 对比图,节点2完全正确 2.12 添加恢复磁盘 2.13 切记这里只勾选自动修正rac参数,别的不用勾选 2.14 正式恢复 2.15 恢复完成,网络带宽十分重要,强烈建议千兆聚合 第一次14个小时,此时超融合的上联设备都是单根千兆 第二次7个小时,此时超融合的上联设备都是聚合千兆 三、超融合(目标机)节点1操作步骤 3.1 查看源机配置 准备和源机一样的操作系统。版本可以相同,但是版本不能低于原版本,可以高一点,比如之前是redhat 6.7的可以用redhat7或者redhat8,都没有问题。资源配置,CPU、磁盘、内存可以通过源机查看。 查看CPU个数 cat /proc/cpuinfo| grep "physical id"|sort| uniq| wc -l 查看逻辑CPU线程数 cat /proc/cpuinfo| grep "processor"| wc -l 查看操作系统版本 cat /etc/redhat-release 查看内存 free -m 查看分区lsblk或者df -h 3.2 上传镜像、安装操作系统(略)、分区。最好做一下配置对比,这里我下载的是redhat 8的版本 3.3 创建共享盘和挂载共享盘 共享盘的大小需要大于源机的共享盘,至少多加几个G,甚至10几个G,不然恢复过程会有问题,并且虚拟机存储策略必须和添加的共享磁盘存储策略一样,已经虚拟机必须安装性能优化工具。前者识别共享盘无法添加,后者直接无法添加共享磁盘 3.4 因为恢复过程,超融合目标机和灾备机源机是不能进行任何通信的,现网有安全设备可以通过安全设备做策略,没有就可以通过超融合的分布式防火墙进行策略配置。分布式防火墙配置比较简单。添加源目地址,策略设置。 3.4.3 新增虚拟交换机 这里需要新增2台虚拟交换机,作用分别是一台作为分布式防火墙使用,一台作为配置源机IP地址使用。原则上需要新增3台,因为是oracle rac环境还有心跳交换机,2台也没有问题。 分布防火墙所用虚拟交换机 源机IP地址虚拟交换机 3.5 网卡连接配置,带有网关地址的必须放到最后一块网卡,不用配置IP地址这里需要特别注意,网卡的配置需要和源机的网卡名称一致,不然恢复完成,数据库会起不来。 3.6 分布式防火墙策略验证 这里网络一定不能互访,互访的话第一会出现地址冲突,第二会影响生产环境的数据库运行状态。 3.8 挂载灾备一体机的裸机恢复或迁移启动介质,修改启动项和bios停留时间
3.9 开启目标机,安装驱动
3.10 设置目标机的参数信息,设置完毕点击重新连接 3.11 恢复完成,等待目标机自动重启完成,在关闭目标机设置bios停留时间和光驱 四、科力锐和超融合(目标机)节点2恢复操作步骤 操作步骤和节点1一样,区别在于不勾选集群盘,也就是共享盘,选择节点2恢复即可,别的配置和操作参考节点1。 4.1 找到恢复点 4.2 找到启动介质 4.3 平台检测 4.4网卡对比(吃个大亏,一定要注意mac地址、网卡名、IP地址) 4.5 选择恢复磁盘,只勾选系统盘和自动修正rac参数 4.6 恢复完成,系统盘160G,单独恢复不到1个小时可以恢复完 五、数据验证 数据验证是需要两个节点都恢复完,在超融合查看oracle rac的集群状态。crs_stat – t
六、总结和注意事项 6.1 总结 科力锐 1、首先进行oracle rac数据备份和验证rac备份是否可用 2、整机验证,验证数据和源机是否一致 3、查看源机配置 4、下载裸机恢复介质 5、找到备份节点恢复 6、恢复、获取相应参数、选择启动介质、配置IP地址和磁盘信息 注:节点1系统盘、集群盘都恢复,节点2只恢复系统盘。 超融合 1、新增和源机一样的目标机 2、新增共享盘(存储策略必须一致、安装性能优化工具) 3、新增网卡(网卡名称必须一致,带有网关的网卡需要放到最后一块网卡,不用配置IP地址) 4、设置启动项和bios停留时间 5、开机安装驱动,设置IP地址,连接灾备机 6、节点1恢复需要恢复系统盘和共享盘,节点2只需要恢复系统盘等待目标机自动重启完成,在关闭目标机设置bios停留时间和光驱 6.2 注意事项 目标机的地址和灾备机是通的可以,但不能和源机通,网络隔离,不能互相通信,源机有两张网卡是启动rac服务需要的,目标机可以配三个网卡,两个网卡使用不和其他网络通信的虚拟交换机,用来配置源机两个网卡的信息,一个网卡和灾备机通信,这个网卡也不能和源机通信,不预先配IP,加网卡就行,配置网关的网卡要放在最后一个,集群用的盘要是共享盘,才是scsi控制器,目标机需使用虚拟共享盘,前提是目标机安装了性能优化工具,所以需要先部署一台一样操作系统的目标机,安装性能优化工具后,再添加虚拟共享盘,虚拟共享盘需要先创建,添加时再勾选,盘的个数和源机一致,大小需要比源机多几G,或者10-50G,要准备磁盘的个数,大小可以到接管机里面用lsblk看,也可以在备份计划那里查看,准备一台目标机就行了,恢复单节点和恢复双节点的效果一样,机器有系统,可以安装客户端软件来连接灾备机,客户端程序需要进入系统后才能运行,机器没有系统,可以使用PE连接灾备机,快速恢复的目标机和灾备机不通,接收不到数据,只能把全部数据传输完再重启,单机那种业务,正式恢复源机可以不关机,因为没有绑定行为,但rac的恢复必须要填源机IP,不然数据库起不来,并且恢复的过程最好没有新数据产生,这样目标机的数据传完后检查数据没问题就可以用,对比硬盘那里,下面有高级设置,默认勾选的快速恢复取消勾选就是全量恢复,周六做的就是全量恢复;然后再勾选自动修正rac参数,先恢复一台系统加集群盘,另外一台只恢复系统盘,源机的网卡名和IP盘配到目标机不能和外界通信的网卡上不能和外界通信的网卡可以通过MAC地址,与虚拟机上的网卡MAC地址对比得出,千兆换算速率理论是125MB/s,目标机磁盘的写入性能如果可以达到125MB/s,就可以满千兆传输,这个rac恢复的时候配好网卡名,IP,勾选修正rac参数,目标机就可以自动启动让出服务,把网卡名修改了,重启rac服务。2节点目标机和1节点目标机的配置一样,共享盘要添加的同样的,确认硬盘那里只勾选系统盘,其他的一样。网络需要千兆聚合或者万兆,恢复时间才有保证。 |