越來越多的行業(yè)用戶選擇利用云計算技術(shù)構(gòu)建自己的數(shù)據(jù)中心,但業(yè)務(wù)集中、數(shù)據(jù)集中的同時,也意味著風(fēng)險的集中。
一旦發(fā)生數(shù)據(jù)中心人為誤操作、網(wǎng)絡(luò)故障甚至災(zāi)難時,企業(yè)及分支機構(gòu)將無法對外提供服務(wù),甚至關(guān)鍵數(shù)據(jù)也會丟失。
從GitLab事件看企業(yè)災(zāi)備現(xiàn)狀
去年,全球知名的開源托管服務(wù)平臺GitLab數(shù)據(jù)丟失事件可能大多數(shù)人還印象深刻,因為缺乏完善的災(zāi)備方案,人為誤刪數(shù)據(jù)庫致使系統(tǒng)宕機,并且長時間無法恢復(fù)。慶幸的是,運維工程師利用一次偶然產(chǎn)出的LVM快照,使數(shù)據(jù)得以恢復(fù)到6個小時之前的狀態(tài),但中間丟失的那部分?jǐn)?shù)據(jù)對用戶的潛在影響是無法用數(shù)字衡量的。
事實上,缺失災(zāi)備方案的并不只有GitLab,諸多企業(yè)均存在類似的情況。由于成本和技術(shù)等原因,企業(yè)只應(yīng)用傳統(tǒng)的本地備份方案,并且通常只針對企業(yè)重要的業(yè)務(wù)數(shù)據(jù)(數(shù)據(jù)庫、電子郵件等)進行備份,而不對操作系統(tǒng)及應(yīng)用程序進行備份。故障發(fā)生后,需要耗費大量的時間在備份文件的導(dǎo)入恢復(fù)和配置上。業(yè)務(wù)恢復(fù)周期長、操作復(fù)雜,很多企業(yè)在做了災(zāi)備方案后,卻束之高閣,無法應(yīng)用。
因此,如何以更高的性價比實現(xiàn)企業(yè)業(yè)務(wù)連續(xù)性,平衡風(fēng)險、效率與成本,是當(dāng)前企業(yè)用戶的迫切期望。
企業(yè)災(zāi)備建設(shè)需要“因地制宜”
不同類型的風(fēng)險其影響程度、發(fā)生概率和造成的損失大小是不同的, 在討論企業(yè)災(zāi)備建設(shè)方案之前,可以將企業(yè)各信息系統(tǒng)所面臨的風(fēng)險因素、概率、影響和應(yīng)對手段進行分析,以便于企業(yè)根據(jù)風(fēng)險的抵御能力以及應(yīng)用系統(tǒng)的重要程度,評估如何采取相應(yīng)的災(zāi)備措施來減低各種風(fēng)險和威脅可能帶來的影響和損失。
企業(yè)信息化風(fēng)險評估與應(yīng)對措施
根據(jù)上面的分析,基于不同的風(fēng)險抵御能力,災(zāi)備的建設(shè)分為兩個維度、四個層次:
- 數(shù)據(jù)維度(本地、異地)
- 業(yè)務(wù)維度(同城連續(xù)性、異地連續(xù)性)
企業(yè)應(yīng)用云計算技術(shù)之前,災(zāi)備的建設(shè)更多還是解決數(shù)據(jù)層面的問題,主要是利用傳統(tǒng)存儲設(shè)備的數(shù)據(jù)復(fù)制特性,由存儲設(shè)備統(tǒng)一完成上層業(yè)務(wù)(包括數(shù)據(jù)庫系統(tǒng))的跨地域數(shù)據(jù)復(fù)制。但因為技術(shù)綁定和所有業(yè)務(wù)系統(tǒng)共吃一個”大鍋飯”的原因,建設(shè)成本高昂,災(zāi)備效率不高,兼容性和數(shù)據(jù)一致性也存在一定的風(fēng)險,并且由于只是數(shù)據(jù)級的復(fù)制,依舊無法解決數(shù)據(jù)備份和業(yè)務(wù)恢復(fù)復(fù)雜度高的問題。