关于超融合关于存储方面的知识,作为一个新人,刚开始学习很是头大,什么存储卷、分布卷、虚拟存储、分布式存储、条带化、分片,整体每个东西我都懂,但是这些东西放在一起,我就不知道具体是如何组合起来运行的,趁着讲白板的时候,将关于存储方面已知的信息进行了总结,希望能帮助到大家,欢迎大佬批评指正加补充。
本贴关于存储分为两个部分展开,一是超融合内部存储是如何组件起来的,二是超融合存储是如何写入的。
1.超融合内部存储如何组建起来的?
首先我们拿到超融合机器,经过我们手和直接装在超融合机器里面的就是磁盘,这里磁盘分为固态硬盘(SSD)和机械硬盘(HDD),这些硬盘组合在一起形成了磁盘组,每个磁盘组至少包含一个SSD和n个HDD(n<=7),然后多个磁盘组结合在一起,组合成了存储卷。 那么问题来了,存储卷是什么呢? 答:存储卷是虚拟存储对上层应用可见的逻辑卷、HCI的读写都是对分布卷进行操作的,分布卷指的是创建的虚拟存储卷是分布式的,分布在不同主机由分布卷组成了 分布式存储。
逻辑顺一下:磁盘——磁盘组——分布卷——存储卷,关于整个HCI的存储如何组建起来这个逻辑就通了。
2.外部数据是如何写入到这个存储中的呢?
首先大数据写入的时候,先对数据进行条带化,这里默认条带数是6,条带大小是128k,数据经过条带化之后,分别写入分片中,这里分片数等于条带数的倍数(默认是相等(多副本除外),但是分片最大写入是4GB大于4GB重起来分片),同一个主机里面的分片组合在一起,形成了聚合副本,其他主机的组合在一起成为了散列副本。
然后数据向存储里面写的时候,用到了分层的技术,传统的分层是30%的读缓存和70%的写缓存,这样容易引起的问题就是数据写入进行一段时间之后,读缓存已经全被占用了 ,但是写缓存还剩下没有用完,容易造成资源浪费。 然而某公司采用的分层技术,打破了传统架构,新架构中70%是分层区域,10%是读缓存,10%是写缓存,10%作为冗余区,其中10%的读缓存是为了提升非本地读的速度,10%的写缓存是为了应对小于4KB数据的情况,10%的冗余区是为了提高SSD寿命。 分层技术中,虚拟机的写操作可以直接快速的写入到分层中,立即向上层返回写入成功,然后分层上已有的数据在回写到容量层的HDD中,从而释放出分层上的空间用于接纳后续的写操作。虚拟机的读操作尽可能地直接从分层中读取到所需访问的数据,无需从容量曾HDD中读取,从而显著的减少读I/O的延迟。具体写入如下图
整体大概就是这两两面之前比较乱,现在顺清楚了 希望可以帮助到大家,望大佬批评指正补充呀 |