備份工作的核心是恢復(fù)
發(fā)布人:scutech 發(fā)布日期:2012-09-27 16:48:33 點(diǎn)擊數(shù):4697
數(shù)據(jù)備份的根本目的,是重新利用,這也就是說(shuō),備份工作的核心是恢復(fù),一個(gè)無(wú)法恢復(fù)的備份,對(duì)任何系統(tǒng)來(lái)說(shuō)都是毫無(wú)意義的。在實(shí)際情況中,廠商或集成商更多的是向用戶吹噓,自己的產(chǎn)品在備份過(guò)程中如何的巧妙。然而,作為最終用戶,一定需要清醒的認(rèn)識(shí)到,能夠安全、方便而又高效的恢復(fù)數(shù)據(jù),才是備份系統(tǒng)的真正生命所在。也許很多人會(huì)以為,既然備份系統(tǒng)已經(jīng)把需要的數(shù)據(jù)備份下來(lái)了,恢復(fù)應(yīng)該不成什么問(wèn)題。這就大錯(cuò)而特錯(cuò)了,事實(shí)上,無(wú)論是在金融電信行業(yè)的數(shù)據(jù)中心,還是在普通的桌面級(jí)系統(tǒng)中,備份數(shù)據(jù)無(wú)法恢復(fù),從而導(dǎo)致數(shù)據(jù)丟失的例子實(shí)在太多了。就在日前,我國(guó)西北地區(qū)的一個(gè)省級(jí)電信運(yùn)營(yíng)商還糟此劫難,系統(tǒng)數(shù)據(jù)遺失殆盡,該運(yùn)營(yíng)商的聲譽(yù)和眾多用戶的利益都受到了重大損害。這次事故的主要責(zé)任者之一,就是一個(gè)全球知名的備份軟件廠商,因?yàn)槠涮峁┑膫浞莓a(chǎn)品沒(méi)能正?;謴?fù)系統(tǒng)數(shù)據(jù)。
眾所周知,建造大樓時(shí)一定會(huì)配備消防系統(tǒng),但是,并非有了消防系統(tǒng)就能高枕無(wú)憂。人們經(jīng)常獲悉,有的樓房突遭火災(zāi)時(shí),消防系統(tǒng)卻無(wú)故癱瘓了,或者消防栓里沒(méi)有水,或者消防通道被堵塞,以致火勢(shì)蔓延,造成巨大的生命財(cái)產(chǎn)損失。因此,并非所有的消防系統(tǒng),在遭遇火災(zāi)時(shí)都能起作用。一樣的道理,數(shù)據(jù)備份設(shè)施之于IT系統(tǒng),就相當(dāng)于消防系統(tǒng)之于樓房,它是保護(hù)IT系統(tǒng)的最后一道防線。即使配備了數(shù)據(jù)備份設(shè)施,并不表明在IT系統(tǒng)遇到問(wèn)題時(shí)一定能將丟失的數(shù)據(jù)成功恢復(fù)。
為了進(jìn)一步闡明恢復(fù)的重要性,讓我們?cè)賮?lái)對(duì)比一下備份和恢復(fù)操作的區(qū)別。
一.備份是計(jì)劃內(nèi)的工作,而恢復(fù)則是計(jì)劃外的工作。
對(duì)于IT技術(shù)人員來(lái)說(shuō),備份是按照既定的備份策略,每隔一定時(shí)間,按部就班地操作即可。而恢復(fù),則是只有當(dāng)發(fā)生數(shù)據(jù)丟失時(shí),或者要查找歷史數(shù)據(jù)時(shí),才會(huì)進(jìn)行的操作。通常情況下,實(shí)施恢復(fù)操作時(shí),往往都是十萬(wàn)火急,越快越好,同時(shí)還希望恢復(fù)后的數(shù)據(jù)可用。
由于備份對(duì)系統(tǒng)的影響比較大,所以備份的工作往往是在特定的時(shí)間內(nèi)完成的,也即所謂的“備份窗口”,這時(shí)生產(chǎn)系統(tǒng)通常不工作。而恢復(fù),因?yàn)槭怯?jì)劃外的工作,對(duì)生產(chǎn)系統(tǒng)肯定會(huì)產(chǎn)生影響。下面以電子郵件數(shù)據(jù)的備份和恢復(fù)為例,來(lái)說(shuō)明恢復(fù)對(duì)系統(tǒng)的影響。
假定您對(duì)電子郵件系統(tǒng)的備份策略是每晚八點(diǎn)定時(shí)備份到磁帶,備份完成后磁帶里就會(huì)保存有昨天晚上八點(diǎn)之前收到的所有電子郵件。當(dāng)然,收發(fā)電子郵件是一個(gè)連續(xù)的動(dòng)作,晚上八點(diǎn)后,郵箱仍然在不停地收郵件。假設(shè)到了今天中午12點(diǎn),您發(fā)現(xiàn)某一個(gè)重要的郵件不小心被刪掉了,如果這個(gè)郵件是昨天晚上八點(diǎn)前收到的,那么您還是有可能從磁帶里恢復(fù)該郵件。這時(shí)就要啟動(dòng)恢復(fù)操作了。
如果備份軟件能夠?qū)崿F(xiàn)郵件一級(jí)的恢復(fù)(恢復(fù)顆粒是單個(gè)郵件)的話,您只要能找到那封丟失的郵件,直接將它恢復(fù)到郵箱就可以了,恢復(fù)的過(guò)程對(duì)整個(gè)郵件系統(tǒng)沒(méi)有任何影響;但是,如果您的備份軟件只能做到郵箱級(jí)的恢復(fù)(恢復(fù)顆粒是一個(gè)郵箱),那么如果您想恢復(fù)該郵件的話,就不得不把整個(gè)郵箱恢復(fù)到昨晚八時(shí)的狀態(tài),造成的后果就是昨天晚上八點(diǎn)到今天上午12點(diǎn)收進(jìn)的郵件會(huì)全部被覆蓋??梢?jiàn),如果從備份的角度來(lái)說(shuō),兩者沒(méi)什么區(qū)別;但是從恢復(fù)的角度來(lái)講,兩者差別很大。
二. 備份是大批量的數(shù)據(jù)移動(dòng)過(guò)程,往往需要將所有數(shù)據(jù)或所有增量數(shù)據(jù)全部拷貝到備份設(shè)備,而恢復(fù)往往是少量的數(shù)據(jù)移動(dòng)過(guò)程,只需將需要恢復(fù)的數(shù)據(jù)從備份設(shè)備拷貝回主服務(wù)器。
現(xiàn)在市場(chǎng)上流行的很多備份軟件,基本上都是在上世紀(jì)80年代設(shè)計(jì)的,那時(shí)的數(shù)據(jù)量相對(duì)較?。◣资椎綆装僬祝.?dāng)進(jìn)行備份操作的時(shí)候,備份軟件會(huì)把所需要備份的數(shù)據(jù)文件打包成一個(gè)備份集(backup set),然后將它拷貝至備份設(shè)備中,并且針對(duì)該備份集形成相對(duì)應(yīng)的索引,但一般不會(huì)對(duì)備份集里的內(nèi)容建立詳細(xì)的索引。那么當(dāng)需要恢復(fù)該備份集中的某一個(gè)文件時(shí),備份軟件就必須從備份集中搜索到該文件,然后進(jìn)行恢復(fù)。這在只有幾百兆數(shù)據(jù)量的IT環(huán)境下完全可行,然而來(lái)到我們目前所處的海量數(shù)據(jù)的時(shí)代,由于數(shù)據(jù)量已經(jīng)高達(dá)幾十甚至幾百TB,如果繼續(xù)沿用這種方式,勢(shì)必產(chǎn)生許多問(wèn)題:從浩如煙淼的備份數(shù)據(jù)里,找到并恢復(fù)您需要的那一個(gè),難度無(wú)異于大海撈針!例如,有的用戶去電信公司要求查詢自己的歷史話單(如兩年前的某一個(gè)月的通話記錄),今天,很多電信公司無(wú)法滿足用戶的這一需求,因?yàn)楹芏嗲闆r下明知該歷史話單一定存在于原先的備份介質(zhì)中,但由于數(shù)據(jù)量實(shí)在太大,幾乎沒(méi)有可操作性。這種情況下,備份雖然是成功的,但是恢復(fù)的成功率卻很低。
META Group在2004年4月的一份題為“Proactive Data Protection”的調(diào)查揭示了數(shù)據(jù)恢復(fù)的真相:
-
恢復(fù)作業(yè)的平均成功率只有70%左右;
-
主要的恢復(fù)需求是恢復(fù)單個(gè)文件或單個(gè)表空間,而不是整個(gè)卷;
-
而恢復(fù)單個(gè)文件至少要花1個(gè)小時(shí), 有時(shí)甚至要接近1天。
所以,當(dāng)考慮數(shù)據(jù)保護(hù)時(shí),應(yīng)著眼于“恢復(fù)”,需著重考慮以下幾點(diǎn):
1.確保數(shù)據(jù)能夠恢復(fù)
2.恢復(fù)速度要盡量快
3.恢復(fù)操作對(duì)系統(tǒng)的影響要盡可能小
4.能夠恢復(fù)到用戶指定的時(shí)間點(diǎn)
5.恢復(fù)的數(shù)據(jù)是可以使用的
當(dāng)然,恢復(fù)是在備份的基礎(chǔ)上進(jìn)行的,如果備份失敗,恢復(fù)肯定不會(huì)成功。為了確保能達(dá)到恢復(fù)的目的,對(duì)備份操作有以下幾點(diǎn)基本要求:
1.提高備份成功率
備份過(guò)程中,當(dāng)備份介質(zhì)、備份設(shè)備和網(wǎng)絡(luò)出現(xiàn)問(wèn)題時(shí),備份作業(yè)就會(huì)中斷,要提高備份的成功率,備份系統(tǒng)就應(yīng)具有容錯(cuò)機(jī)制。如果是備份介質(zhì)或備份設(shè)備出現(xiàn)問(wèn)題,可以將備份自動(dòng)切換到其他的備份介質(zhì)、設(shè)備或路徑上,并能確保從中斷處繼續(xù)備份操作。另外,“備份的斷點(diǎn)續(xù)傳”也很重要,當(dāng)網(wǎng)絡(luò)發(fā)生阻塞時(shí),備份也會(huì)中斷;一旦網(wǎng)絡(luò)恢復(fù)正常,備份能從中斷處自動(dòng)重啟并繼續(xù)進(jìn)行。
2.精細(xì)的備份數(shù)據(jù)索引
當(dāng)用戶希望恢復(fù)數(shù)據(jù)時(shí),絕大多數(shù)情況下并不需要恢復(fù)整個(gè)系統(tǒng),而只要恢復(fù)部分?jǐn)?shù)據(jù),甚至只是一個(gè)文件或郵件。索引做得足夠精細(xì),有利于在恢復(fù)時(shí)能快速查找并定位所需要恢復(fù)的數(shù)據(jù),實(shí)現(xiàn)小顆?;謴?fù),同時(shí)將對(duì)系統(tǒng)的影響降到最小,恢復(fù)速度大幅提高。
3.能產(chǎn)生多個(gè)數(shù)據(jù)副本
為了防止備份數(shù)據(jù)意外損壞,產(chǎn)生多個(gè)備份副本是必要的,也很有效。產(chǎn)生數(shù)據(jù)副本的方法有兩種:同步和異步。同步的方法是,在備份時(shí),同時(shí)把備份數(shù)據(jù)寫(xiě)入到兩個(gè)不同的介質(zhì)中;異步的做法是,先把備份數(shù)據(jù)寫(xiě)入一個(gè)介質(zhì),然后再利用空閑時(shí)段,將備份數(shù)據(jù)復(fù)制到其他介質(zhì)上。當(dāng)然也可以通過(guò)網(wǎng)絡(luò)將其復(fù)制到異地,達(dá)到數(shù)據(jù)容災(zāi)的目的。
4.離場(chǎng)保護(hù)
如果數(shù)據(jù)備份是為了恢復(fù)而進(jìn)行的,就應(yīng)該考慮到萬(wàn)一數(shù)據(jù)中心遭遇災(zāi)難時(shí),怎樣進(jìn)行恢復(fù)。這時(shí)“離場(chǎng)保護(hù)”中保存的數(shù)據(jù)副本就會(huì)起到很大的作用。
5.操作界面應(yīng)足夠簡(jiǎn)單
用戶界面應(yīng)該面向恢復(fù),而非面向備份。在面向數(shù)據(jù)恢復(fù)的用戶界面,所有的備份數(shù)據(jù)是按照數(shù)據(jù)原先的結(jié)構(gòu)來(lái)組織的,需要恢復(fù)哪個(gè)數(shù)據(jù),很快就能找到,輕松點(diǎn)擊一下就能恢復(fù)該數(shù)據(jù)了。