家会欢迎大家回到 acie 存储课程的学习上,一张结,我们学习了存储做储备双活的解决方案以及其应用实践。这一张结,我们将继续讲解另一个提高存储系统可用性以及业务连续性的技术,双火溶灾解决方案 在上一节我们介绍主备容灾解决方案时,我们发现主备容灾在同城以及异地均会造成 rq 大于零。 生产站点当机的时候,如果我们需要进行储备切换的话,我们也需要花费一定的时间,这样就会造成数据丢失以及业务中断,并且容灾站点平时无法对外提供业务,存在资源浪费。一些对于数据十分看重或者对于业务连续性十分 看中的企业,比如银行、医院等,更期待一种 rq 接近于零的溶灾解决方案。而目前最接近的,其实我们今天将要介绍的双火溶灾解决方案的应用事件。 在本章中,我们将从双活龙灾的概念介绍开始,然后讲解双活龙灾解决方案所使用到的技术以及软件。最后我们将通过 应用实践的方式来讲解双火溶灾解决方案的调研、规划、设计,进而对安装、部署、运维和故障处理进行介绍。 我们的目标是在完成本课程之后,能够对双活龙灾的定义、技术规划、设计与安装以及运为方面能够有更深的理解。根据本章目标, 我们可以将我们的培训内容分成若干部分进行讲解。第一部分的介绍即是对存储双活的解决方案的介绍。双活溶灾解决方案,我们又称 come michael 及双活特性, 其架构包含两个以 active active 及 a a 模式进行配置的数据中心。 与主背容灾的 active standby 模式不同,在 a a 模式下,两个数据中心互为备份,且两个数据中心都可对外提供足协服务。当其中一个数据中心设备故障或者整个数据中心瘫痪的时候, 业务将自动切换到另一个税中心进行处理。由于业务切换无需担心 数据丢失,且没有主被切换的时候的切换操作,所以数据也不会损失。 所以双活容的特点就在于 rq 十分接近于零,且切换时业务不受影响,这既提高了存储系统的高可用性,也保证了业务的连续性。 其典型的组网类型如下图所示。两个数据中心均为生产中心,双方的存储设备均通过业务网络连接到各自的业务交换机,然后再通过业务交换机联通彼此配置双火。 最后,业务交换机在联通到前台的应用服务器,保证双方的前台应用均可以通过业务交换机连接到彼此 控制设备,保证了系统在部分列路发生问题的时候依然能够联通存储与应用服务器, 提高了整个系统的高可用性,保证了业务的延续性。最后,由于双火龙灾使用的是 心跳链接来互相监督对方的状态,缺乏稳定性与可靠性,所以我们需要额外的可靠的服务器来进行业务切换的 仲裁,这就是我们的仲裁服务器,他就是与存储相连的额外服务器, 主要功能就是用于业务的仲裁,当心跳链路故障的时候,他可以协助双火溶灾进行业务裁决,具体的功能以及原理我们会在下一部分中详细提及。那么 在介绍完存储的双火溶灾解决方案之后,我们可以思考一下这解决方案应用到了哪些技术或者哪些特性来保证我们双火溶灾的稳定性以及高可用呢?这就是我们在第二部分即将学习到的内容, 在双火溶灾解决方案中使用到的技术。第二部分一开始的模块及我们在第一部分起到的双火仲裁的内容介绍。 关于其基本功能,我们在第一部分中已经提及,下面我们将详细介绍其双活仲裁的原理。 双活存储阵列的优先级判断分为两重,第一重,静态优先级模式,这种模式下,双活存储阵列 a 跟 b 在心跳受到影响不通的时候,他们会按 预先设置的优先级进行调整。 第二种,仲裁服务器模式,当心跳不通的时候,仲裁服务器使用仲裁来判断两个存储质量的获胜方,获胜方将继续提供业务,而失败方将停止业务, 后面再启动则需要手动进行启动。优先站点具有仲裁的优先权,所以优先站点在本身状态成长的情况下一般都会获胜,从而保证了系统不会在没有心跳情况下进行误判。 为了更清楚的理解两重优先级的判断,我们将两个模式下的各种策略以表格的形式进行列出。首先是第一重,静态优先级模式,在 静态游行局模式下的各种仲裁策略如下图所示,在练路非故障情况下,该模式的仲裁结果均已存活的浪获胜,继续运行业务。 但如果是 b 获胜,则我们需要去手动启动我们的数据中心 b, 因为 b 获胜的时候, a 跟 b 都会同时停止业务运行。如果是由于列路中断, 为了保证不会出现业务运行错乱造成脑裂,两个税中心 a 跟 b 的业务都会被停止,检查过链路之后再重新开放。 然后是第二种,仲裁服务器模式。由于多了额外的仲裁服务器以及链路,这个模式下可能存在的情况更多,大致可以分为九种。第一种,仲裁 财服务器异常的情况。在这种情况下,仲裁服务器会切换到被仲裁,然后按照常规情况进行处理。第二种,仲裁服务器与数据中心 a 站点的链接断开, 这种情况下, a 站点与 b 站点的心跳未受影响,所以业务不受到影响,主仲裁自动切换到被仲裁。 第三种,仅数据中心 a 站点的状态异常, a 的浪失效,而 b 由于获取到了 a 的 状态异常的信息,必将继续进行业务处理。第四种, ab 站点之间的心跳恋路状态异常。此时由于心跳恋路失效,我们将由仲裁服务器进行仲裁。如果 a 站点为优先站点,则 a 的浪继续 运行业务, b 字浪停止业务。反之,如果 b 是有限站点,则 b 继续进行业务, a 停止业务。第五种,数据中心 a 以及 仲裁服务器同时故障,则 a 的浪失效, b 的业务会暂时停止,需要我们手动强制启动 b 的浪才能继续提供业务。第六种情况,心跳链接以及数据中心站点 a 站点 与仲裁服务器之间的链接同时异常, b 站点以及仲裁服务器均无法获取到 a 站点的状态信息,所以 a 的浪停止运行业务,而 b 的浪则继续运行业务。 第七种, a 站点的状态异常, b 站点到仲裁服务器之间的链路同时异常, b 获取到 a 站点的状态异常, 所以 a 站点的浪失效, b 站点的浪停止业务,需要手动进行强制启动才能继续提供业务。接下来第八种,仲裁服务器与心跳链路同时故障时, a 站点与 b 站点的浪均停止业务, 我们需要手动启动优先级小高的站点的浪提供业务。最后一种,第九种,仲裁服务器以及 a 站点到仲裁服务器的链路两个同时异常, 由于心跳联络正常,所以站点 a 与 b 的浪都继续运营业务。以上就是两种模式下涉及到仲裁的各种情况, 我们可以看到引入仲裁服务器之后,既能降低脑力的异常情况,也能提高系统的可用性以及业务的连续性,这就说明到了仲裁服务器的必要性。介绍完仲裁 技术之后,下个介绍的技术是读写相关的,我们先来熟悉一下双活溶灾解决方案的读写流程。首先是我们写 io 的流程, 主机向双活管理模块发送起球,然后双活管理模块记录写请求的数据变更日志, 然后由生活关系模块分别向本端以及远端存储系统发送写请求。接下来就是正常的写入流程,先写入缓存,然后入盘并反馈写结果。 当双火管理模块收到了两个存储系统的写反馈之后,判断血流程完成,并反馈给主机测,这就是整个血流程,然后是毒 io 的流程。我们的应用服务器向生活 观点模块发送读请求,该请求会优先发送给本端浪进行数据的读取,如果本端没有发现早,我们会去对端浪进行数据的读取, 然后反馈信息给应用服务器,则完成读 io 的流程。而华为的存储双活解决方案针对双写以及数据读取均做出了对应的优化。针对双写的性能优化,使用了 fast right 技术,如下图,琐事 对比通用方案与发 sprese 技术,其主要区别在于向远端存储设备写的过程。 通用技术里面的写流程分为了四步,写请求、确认请求、写,数据、确认数据写。而我们使用 fast right 写流程仅需要两步,写请求以及需要写入的数据,整合成一条请求,然后确认写入的结果,这样写性能相较于传统的方案提升了近百分之三十三。 另一个优化则是针对读取数据的,为了提升读 io 的性能, 华为将毒场景分为了两类,第一类是近距离场景,例如我们在同机房内部署的场景,这种属于本地高可用场景,该模式侧重于毒动作的负载均衡。 由于我们是近距离部署,所以我们去远端设备读取的时候,延迟也会小小,根据负载情况在两个阵列下发送 io 请求,就能最大 消化的提升性能。另一种是远距离场景,例如异地步数,这种情况下如果能去远端阵地下发热哦, 就会浪费很多时间来进行数据传输,并等待数据的返回。为了减少传输的食盐,提升性能,华为使用多路径软件,不求 pass 来指定我们的 io, 仅在优先阵力下发及本端 震裂下发,使得该模式可以大幅的减少跨战点的访问。通过这两个优化方案,华为的双火溶灾方案的读写性能均得到了一定的提升。 下一个技术则是对初始以及增量数据的同步速度方面的优化。该技术称为精简拷贝技术。 通用的数据同步方案是对所有的数据进行全量同步。该方案的缺点在于占用的贷宽较高,同步时长较长,而且有一部分的全龄数据是非必要的,但是他们也会占用一定的资源。 而精简拷贝技术则集中于这点进行了优化。在进行数据同步之前,我们会首先进行智能识别,识别出全年数据。 全连数据可以用标记来代替数据的传输,这样可以减少百分之九十的数据同步时间以及降低百分之九十的宽带占用。 以上就是我们在存储双活容灾解决方案中对系统进行优化所使用到的基础。下一步内容我们将讲解双活容灾系统的规划设计与安装部署。
粉丝3.9万获赞9.1万

灾不只是辈分。容灾,顾名思义是指容忍灾难发生的能力。这里的灾难通常是指一些极端的事件造成的 it 系统故障,如火灾、洪水、地震等自然灾害或者事务删除、错误操作和故意破坏等人为事故。 这一类事件有个共同点,那就是通常没法避免,只能接受。唯一能做的就是实施灾后重建工作,尽量减少事故造成的影响。灾后重建工作就是我们说的灾难恢复计划。 desitoricoveri 一个完整的灾难恢复计划通常涉及到三个层面,最底层是数据,其次是应用,最后是业务。 其中数据又是核心中的核心,只要数据还在,应用和业务就可以恢复。这就像你不小心把咖啡撒到笔记本上,笔记本冒烟了。虽然很心痛,但是只要硬盘还是好的,恢复正常办公就只是时间问题。针对数据的溶灾技术通常包括备份、复制、镜像、 双活等等。我们在规划自己的数据服务基础架构时,到底需要用到哪些技术?这个问题需要根据你的目标来定。关于数据的容灾恢复目标通常有两个目标,一、 r p o recovery pointy of jack 提问是指灾难发生后,数据能恢复到过去的哪个时间点,换句话说,最多允许丢掉多长时间以内的数据。 二、 rto recovery time object 提问,是指灾难发生后需要多久才能访问到这些数据,允许停机的时长是多少? rto 是针对数据本身,追求的是数据尽可能不丢失。 rto 则是针对数据提供的访问服务,追求的是尽可能少的停机时长。 还是刚才笔记本冒烟的例子,你找了维修站,将硬盘中的数据拷贝到新电脑,此时可以正常使用了。这个过程花了你一天时间,这就是 rto。 但此时还有一个问题,那就是当你用新电脑打开之前制作的 ppt 时,发现最近添加的页面不见了,只能找到出事前半个小时编辑的页面,也就是你的数据丢失了半个小时,这就是 rpo。 当然,理想的情况是, rto 和 rpo 都接近于零,但实际生产中, rto 和 rpo 要求越高,带来的成本开销也会成成指数据增长。 只有一些特殊的行业,如金融、电信等民生行业,才会要求最高的融灾标准。我们国家的标准委员会有个信息系统灾难恢复规范,规范中将灾难恢复能力分成了六个等级。 针对这六个等级, rto 和 rpo 的要求如下,在这个规范里,灾难恢复能力等级越高, rto 和 rpo 的时间越小,越接近于零,对应的投入成本也会越大,甚至是指数级增加。 一到四级别的容灾要求,通常情况下,用备份系统就可以解决。当灾难导致主数据损坏,备份系统中还保留有数据备份,此时只需将备份数 数据恢复到一个新的站点即可正常使用。备份系统能实现多高的容载等级,取决于备份的频率,频率越高, rpo 越小。但备份系统的频率有个限度,最高也只能做到小时或者天级别。 之所以不能设置太小,是因为备份需要将数据复制到异地的栽培中心。通常栽培中心不会在同一个城市将数据从主机房复制到栽培中心的这个过程,由于贷款的限制,需要耗费很长的时间,备份频率太高,则没法完成备份任务。 第五级别的容灾呢,要求的 rpo 小于三十分钟,也就是允许数据丢失的最大时长不能超过半个小时,这个怎么实现?此时就需要借助数据复制技术了。 数据复制有别于备份,备份会改变数据的格式,备份的数据通常不能直接使用,必须先恢复后才能使用。而复制是一次完整数据镜像,不会改变数据的格式。复制的数据在灾贝端可以直接使 使用,也因此栽背端通常有一套一模一样的设备,原端是什么格式,复制端就是什么格式,复制的时间间隔可以做到分钟级别甚至同步。也因此复制对带宽的要求就比较高了,通常是在相距很近的两个城市,如广深或者北京、天津之间,或者同城内才能做到。 在网上呢,也就是最高等级的融灾,要求数据零丢失,更关键的是要求数据服务中段时间必须控制在分钟级别。基本上所有的金融和电信行业就是这样的要求。通常我们所说的两地三中心就是这样的融灾解决方案。 到这个级别,怎么实现数据的融灾呢?答案是集群模式。 r code、 r a c 存储的双活技术都属于集群技术,在集群模式下,任何一个站点都可以独立承担业务的正常运行,两个站点之间其实已经没有明显的主备角色之分了。 集群是 it 技术里面最复杂的技术之一,具体留代后期再讲解。

嗯嗯,大家也讲一下十分钟,关于这个啊,咱们制药行业这个备份已恢复,这个备份已笼栽,整个体系啊,怎么去做会更好,包括外部审计可能会更加的去更好过啊。嗯 啊,首先这个要对备份数据进行分类啊,分类呢,总体可以分为两大类,一个是电子数据和系统及数据,然后针对电子数据的话, 如果咱们的持盘空间够大的话,是可以就说,呃,不管是关键数据还是非关键数据,他的备份策略可以设为一致啊,举个例子,比如说每天都进行备份啊,因为如果非关键数据,你 啊是个有一周备份一次,现在的话对于现在的一个啊,服务器空间啊等等,我觉得认为做做到每天备份一次是比较合理的啊,有电子数据, 电子数据可以用两个,可以用两套备份系统去做抓取备份,这样的话可以有个龙斋的空间,就是万一如果其中一台服务器出问题了,另外一台服务器他还能还还能跟上。 第二呢就是系统级数据,系统级数据呢,他跟电子数据的区别就就在于啊,他包含的电子数据,并且呢他 包还包含了应用程序,他们两个电子数据和系统级数据,他们的面相的一个面相的一个呃场景是不一样的,就如果我们仅仅仅只是 呃我某个数据有问题或某个项目有问题,我们可以用电子数据去做恢复,但如果是整个程序崩溃或电脑主机损坏,那我们需要采用整机去恢复。所以这两个东西两个呃电子数据备份和信用机数据备份它的场景是不同的, 在法规里明确规定是我们肯定要做电子数据的备份啊,对于系统级的数据备份,这个实际上 it 里应去要求的,因为他要求你去做派出的恢复和响应啊,因为做整机的一备份,他这个恢复的速度会比较快 啊。这个,这个是一个备份的一个数据进行分类,然后对于备份策略的话,无论是单机版和法国版,我们都会选择以每天就是至少你每天,至少如果你今天如果出问题了,你能恢复到昨天的数据啊,能恢复到昨 好听的数据。嗯嗯,这一个是,这个是辈分策略啊。呃,第三呢,每年呢,要做辈分与孝心验证和辈分的一个灾难恢复还原,这个就是每年要劣质计划。如果今年我们对啊单机版和网络版的工作账,要抽 几套的备份数据去做有效性验证啊,包括这个灾难恢复还原啊。如果 it 容颜比较少的话,一年做一套就够了。这个做一套也可以去抽查,以抽样的形式去抽到其中一套去做灾难恢复还原, 做整个辈分有效性和灾难恢复还原都是以验证的形式去做,就要写发,要有测试数据,记录所有的测试过程,测试过程这个是要有数据支撑的啊, 整个包括备份就说你啊,备份的话手就说电子数据已经做好了,就是做好分类之后呢?那你你这个每个工作账号数据存放在哪里?他肯定有备份清单, 那针对每个备份清单要做备份计划,做好备份计划之后要做美,要做巡检那个计划啊,然后巡检如果有问题的话,要去做异常的一个处理啊,这个是整个日常的一个工作。那么啊如果当有新增工作账户系统退役的话,要去更新备份清单, 还有更新备份计划啊,这个就是整个的一个备份体系的一个日常运作过程。

如何快速完成 mecco 数据的差异对比? mecco 作为最受欢迎的关系型数据库管理系统,广泛应用于各行各业。 然而,在融灾、数据迁移和备份恢复等场景下,确保数据一致性对比是至关重要的。传统的人工抽检方法往往耗时且容易出错,对于大数据量和复杂数据库结构的情况尤其如此。 为了避免数据不一致导致的严重业务故障,自动化数据对比成为趋势。市面上的数据对比工具存在性能问题、功能局限性、操作系统兼容性不全面以及价格昂贵等不足之处, 因此,使用难以 data 数据对比是解决这些问题的最佳选择。难以 data 数据 对比功能是一种比较数据库之间差异的工具,它用于比较两个数据库之间的数据结构的不同之处,帮助您追踪数据库的变化,发现问题并快速修复。相比其他数据对比工具,南音 data 数据对比功能具有如下优点, 即开即用, sas 平台提供服务,完全免安装,不依赖于特定的操作系统, 不需要在本地安装软件,大大减少对本地存储资源的占用,性能强大。基于大型服务器集群, 支持对超过一 t b 的数据进行对比,每秒上百兆的对比数据量全面的数据源支持。支持 mythical sql server、 passco、 sql、 click、 house、 doors、 select、 d b、 redis 等多种数据源。完善的对比功能支持库表结构数据的一致性对比,同时提供了一次性对比、周期性对比、快速对比等适合多种使用场景的对比功能。快速高效,采用先进的算法和技术, 能够快速处理大规模、复杂结构的数据对比任务,大幅缩短对比时间。可视化界面拥有简洁直观的用户界面,无需复杂的设置即可进行数据对比,并且以直观的图表和报告呈现对比结果,使您轻松理解数据差异。 一键差异修复,自动生成不一致内容的修复 sql, 通过简单的复制粘贴即可完成不一致数据的修复,节省大 量时间精力。免费使用与售价高昂的商业化工具相比,南营 data 的结构对比、数据对比功能可免费使用,适用于不同规模的企业和个人, 安全可靠。南营 data 平台通过国家公安部三级网络安全等级保护认证,为企业的信息安全提供高等级的防护。南营 data 让每个人用好数据和云。

你的网站是否出现过原站不可用的情况? go to off 有网站云分身功能,可以提供部分服务,确保用户能够访问和浏览网站的部分内容, 提高网站的可用性。加速页面加载并减轻原站压力,维护良好的用户体验,保持网站运营和提高容灾能力。 nice, 记得点赞关注哦!

当地时间十号,欧洲最大的云服务和网络托管服务运营商 o v h 位于法国的一个数据中心发生火灾,导致约三百六十万个网站出现故障,一点二万到一点五万名客户的资料或受到影响,其中包括法国政府的部分数据。 截止到目前,部分受到影响的网站仍然没有恢复。当地时间十三号, ovh 云服务公司创始人欧克塔夫克拉巴在个人推特上更新了最新情况。 他表示, ovh 公司正在发送最后一批邮件,向客户通报其数据和备份受损的情况。此外,克拉巴在十二号发布的视频中称,火灾可能是一个逆变器引起的,这个逆变器曾在九号上午接受维护,但是火灾具体原因还 需要进一步调查,有关部门将提取数据中心的三百个摄像头影像进行分析。目前, ovh 公司的首要任务包括尽快恢复数据中心的服务,将受影响的服务转移到该公司位于其他城市的数据中心, 协助客户恢复数据,及时备份。据了解,受这次火灾影响的有不少游戏玩家,此前他们花钱购买装备的历史数据可能不复存在,损失难以估计。 还有公司表示服务器已经无法使用,要求 obh 提供解决办法。无论是数据中心、云服务平台啊,他的客户们在选择云计算服务的时候,一定要选择异地容灾备份这样的一个选项。 如果一旦出现意外的情况,那么数据彻底丢失,又没有融于融在异地备份的条件的话,那么这些数据不可 恢复。很多的业务事实上就完全崩溃了。据了解,此次发生意外事故的 ovh 是欧洲第一、世界第三大云计算和托管服务商,近年发展势头迅猛,是法国乃至欧盟云计算领域领军代表之一。此次火灾或对欧盟云计算行业发展产生深远影响。

cdp 是 continuous data protection 连续数据保护的缩写,是一种用于数据备份和恢复的技术。 cdp 技术能够在数据被修改或更新时立即备份数据,以确保数据的完整性和可靠性。与传统的周期性备份技术不同, cdp 可以提供更快速和精准的数据备份和恢复,减少数据丢失的风险和业务中断的时间。 cdp 技术可以对企业中的数据进行实时备份, 保障数据的安全性和完整性。在 cdp 备份过程中,系统将实时记录每一次数据修改的详细信息,并创建一个时间线, 以便在需要时恢复到任何一个特定时间点的数据状态。这种时间点恢复 point in time recovery 的技术可以帮助企业快速恢复数据并减少数据丢失的风险。总之, c dp 是一种高级的数据备份和恢复技术,可以实时备份数据,减少数据丢失的风险,同时提高数据备份和恢复的效率和精准性。

永灾悲愤实战是两个概念。永灾是为了应对交易灾难时,能够保证信息系统能正常的运行,帮助企业实现业务联系性的目的。 备份是为了应对灾难来临的时候造成数据丢失的问题。在容灾备份一体化产品出现之前,容灾系统和备份系统是独立的。容灾备份产品最终的目标是 帮助企业应对严为勿操作、远见错误、病毒入侵等远性灾害,以及硬件故障、自然灾害等硬性灾害。 相隔较远的异地建立两道或多道功能, it 系统互相之间可以进行健康状态监视和功能切换。 当一处系统因意外如火灾、地震等停止工作时,整个应用系统可以切换到 另一处,使得该系统功能可以积极正常的工作。容三技术是系统的高可用性技术的一个组成部分, 容三系统更加强调处理外界环境对系统的影响,特别是灾难性自建对 id 节点的影响,提供节点级别的系统恢复功能。当客户的数据丢失参数、 人为物操作、远见错误、病毒入侵、自然灾害、硬件设备等可以进行数据恢复,防止业务终端 bye bye bye。