6分鐘徹底掌握存儲(chǔ)和備份的區(qū)別
一直以來,存儲(chǔ)和備份是兩個(gè)相近的概念,但是又有很大區(qū)別的。如果不是專業(yè)的技術(shù)專家,是比較難搞清楚這兩者之間區(qū)別,特別是云的出現(xiàn),這兩個(gè)概念往往容易混在一起看。本文從幾個(gè)方面快速對(duì)比下存儲(chǔ)和備份這兩個(gè)概念的區(qū)別和發(fā)展,以及演變趨勢(shì)。
1. 備份是不能獨(dú)立數(shù)據(jù)容器存在,永遠(yuǎn)構(gòu)建于存儲(chǔ)之上
存儲(chǔ)是數(shù)據(jù)保存容器的統(tǒng)稱,比如軟盤,光盤,磁盤,磁盤陣列,中小規(guī)模業(yè)務(wù)用的NAS,專業(yè)的磁帶庫,專業(yè)的光纖存儲(chǔ)網(wǎng)絡(luò)SAN。存儲(chǔ)容量從幾MB,到上100TB,甚至P級(jí)。最近幾年出現(xiàn)新的一種方案,云存儲(chǔ),其本身也分為個(gè)人用途和企業(yè)用途的。個(gè)人數(shù)據(jù)存儲(chǔ)用途比如百度網(wǎng)盤, 360網(wǎng)盤,DropBox等,通稱保存?zhèn)€人的一些資圖片,文檔等;企業(yè)用途的如AWS的S3, 阿里云的OSS,以及七牛云存儲(chǔ),又拍云,金山云的云存儲(chǔ)等,通常用于關(guān)鍵業(yè)務(wù)系統(tǒng),比如用戶產(chǎn)生的文檔,圖片,視頻等數(shù)據(jù)存儲(chǔ)。云存儲(chǔ)有個(gè)好處是可以動(dòng)態(tài)擴(kuò)展存儲(chǔ)空間,平臺(tái)提供商由于采用低成本硬盤等方案,采用分布式技術(shù),把本身廉價(jià)的硬盤聚集起來,構(gòu)建成1個(gè)具備較高可靠性的存儲(chǔ)方案; 一些大平臺(tái),當(dāng)具備規(guī)模效應(yīng)后,平攤到用戶,TCO成本會(huì)低不少,這是傳統(tǒng)存儲(chǔ)方案比較軟肋的一個(gè)地方。
備份是一種數(shù)據(jù)保護(hù)的機(jī)制和方案,其實(shí)現(xiàn)必須依賴于具體的存儲(chǔ)容器。目前在備份這塊的市場(chǎng)有非常多的品牌,如Symantec 的NBU ,CommVault的備份產(chǎn)品,IBM的TSM,EMC的NetWorker,還有專注混合云數(shù)據(jù)備份保護(hù)服務(wù)的多備份。備份通常用于保護(hù)業(yè)務(wù)系統(tǒng)產(chǎn)生的核心數(shù)據(jù)或個(gè)人重要的數(shù)據(jù)。一般的備份系統(tǒng),通常會(huì)與硬件存儲(chǔ)設(shè)備搭配組合成備份方案。多備份目前是構(gòu)建在阿里云存儲(chǔ),AWS的S3,七牛,以及金山云,百度云等云存儲(chǔ)之上,所有備份的數(shù)據(jù)會(huì)存儲(chǔ)在這些大存儲(chǔ)平臺(tái)上。
2. 存儲(chǔ)通常解決地理空間的訪問問題;而備份解決地理空間上的冗余保存問題
我們工作用的WORD軟件,如果沒有數(shù)據(jù)存儲(chǔ)介質(zhì),編輯產(chǎn)生的文檔無法保存,配上IDE或SATA硬盤后,應(yīng)用軟件產(chǎn)生的數(shù)據(jù)可以很快保存在硬盤上。這是一個(gè)簡(jiǎn)單的硬盤存儲(chǔ)支持軟件工作的例子。一旦本地硬盤如果壞掉,努力工作一周的成功,可能得重新再來。
通常的重要業(yè)務(wù)系統(tǒng)架構(gòu)設(shè)計(jì)的時(shí)候,會(huì)充分考慮存儲(chǔ)方案的構(gòu)成,什么樣的業(yè)務(wù)系統(tǒng),在幾個(gè)位置,數(shù)據(jù)如何分布,需要的容量,擴(kuò)展需求等進(jìn)行規(guī)劃設(shè)計(jì),重點(diǎn)解決業(yè)務(wù)系統(tǒng)不斷增長的數(shù)據(jù)存儲(chǔ)問題。一般會(huì)就近業(yè)務(wù)應(yīng)用服務(wù)器來部署存儲(chǔ)架構(gòu)。不管是云存儲(chǔ),還是傳統(tǒng)的存儲(chǔ)架構(gòu),都有1個(gè)目標(biāo),讓業(yè)務(wù)系統(tǒng),在不同的位置和存儲(chǔ)在空間上的訪問是穩(wěn)定連續(xù)進(jìn)行的。
數(shù)據(jù)在一個(gè)地方始終是不可靠,機(jī)房斷電,線路故障,硬件故障,火災(zāi)等,特別對(duì)于重要業(yè)務(wù)系統(tǒng),如支付系統(tǒng),一旦業(yè)務(wù)系統(tǒng)為了保持業(yè)務(wù)連續(xù)訪問,考慮到了多個(gè)地點(diǎn)的數(shù)據(jù)鏡像,就有一點(diǎn)備份的味道。云存儲(chǔ)目前在空間數(shù)據(jù)冗余保存方面,一般也有做數(shù)據(jù)垮地區(qū)的冗余保存,防止災(zāi)難的發(fā)生。
備份在此基礎(chǔ)上,進(jìn)一步封裝邏輯,對(duì)數(shù)據(jù)在不同的地方,可以訂制不同的復(fù)制策略。較重要的數(shù)據(jù),通常可以在1個(gè)地方進(jìn)行冗余,比如用戶產(chǎn)生的日志,圖片等可以冗余1份;對(duì)于更關(guān)鍵的數(shù)據(jù),如用戶注冊(cè)數(shù)據(jù),數(shù)據(jù)存儲(chǔ)索引數(shù)據(jù),交易數(shù)據(jù),金融系統(tǒng)相關(guān)數(shù)據(jù)等,必要時(shí)得多地冗余。云存儲(chǔ)的出現(xiàn),使得基于云的備份方案,實(shí)現(xiàn)起來更加容易,輕易按需構(gòu)建不同的地理位置的通道,只要你愿意,數(shù)據(jù)備份到全球幾十個(gè)地區(qū)的云存儲(chǔ)中心都可以。這一切可以用最簡(jiǎn)單的手動(dòng)復(fù)制方案,也可以用自動(dòng)管理的方案,比如多備份等。
3. 存儲(chǔ)通常解決連續(xù)數(shù)據(jù)讀寫,保存問題 ;備份解決時(shí)間版本凍結(jié)和回溯問題
保存1個(gè)word文檔,上傳完一部電影,修改一個(gè)帖子,發(fā)送1條微信消息,這些要么被順序?qū)懭胗脖P,要么被寫入專業(yè)的數(shù)據(jù)庫或文件系統(tǒng)。這是存儲(chǔ)典型的一個(gè)應(yīng)用場(chǎng)景,就是不斷響應(yīng)從業(yè)務(wù)或軟件發(fā)送的數(shù)據(jù)保存需求,文檔,電影,帖子最后只會(huì)有最新的一個(gè)狀態(tài),歷史的狀態(tài)一直被最新的狀態(tài)覆蓋。
既然有新增,那就也有刪除,也有修改,所以存儲(chǔ)并不識(shí)別上層軟件的意圖,可能是正常,也可能是惡意入侵,或誤操作,新增和刪除同樣在底層會(huì)進(jìn)行操作。部分存儲(chǔ)設(shè)計(jì),帶有一定的備份恢復(fù)能力,當(dāng)然要想使用備份恢復(fù)能力,可能比部署一套備份方案,來的成本會(huì)更大。我們都知道恢復(fù)一個(gè)硬盤的數(shù)據(jù),通常得數(shù)上千塊,硬盤不值錢,但里面的數(shù)據(jù)值錢。
解決新增,刪除,修改等有意無意的行為對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)帶來的影響,這時(shí)候得專業(yè)功能-備份上場(chǎng)。備份系統(tǒng)最主要考慮的一個(gè)功能就是時(shí)間線版本凍結(jié)和回溯。每次對(duì)存儲(chǔ)系統(tǒng)的備份,都會(huì)形成1個(gè)當(dāng)前備份時(shí)刻的數(shù)據(jù)鏡像版本,恢復(fù)的時(shí)候就可以直接選擇對(duì)應(yīng)的版本恢復(fù),數(shù)據(jù)就回到從前那一時(shí)刻狀態(tài)。當(dāng)然不同的產(chǎn)品實(shí)現(xiàn)備份方案不一樣,對(duì)于基于混合云架構(gòu)的多備份來說,版本理論上可以一直保持下來,想怎么恢復(fù),就怎么恢復(fù)。另外,不同的實(shí)現(xiàn),鏡像的一致性結(jié)果不盡相同。對(duì)于一致性要求高的場(chǎng)景,版本可能會(huì)凍結(jié)寫請(qǐng)求,如數(shù)據(jù)庫備份直接加寫鎖,這時(shí)候?qū)I(yè)務(wù)會(huì)有短時(shí)間影響;如果你說自己是土豪出得起價(jià),需要對(duì)業(yè)務(wù)系統(tǒng)幾乎無干擾,幾十上百萬無所謂,則可以購買比較牛的連續(xù)數(shù)據(jù)保護(hù)方案(CDP),如國外的飛康CDP。
4. 存儲(chǔ)通常面向硬件故障為安全設(shè)計(jì)目標(biāo);備份解決軟硬件故障在內(nèi)的多種因素引起的數(shù)據(jù)安全問題
在我們?nèi)粘8拍钪校鎯?chǔ)就等于安全,特別是云計(jì)算概念出現(xiàn)后,包括周邊的一些技術(shù)高手也有類似看法,實(shí)際上這是一個(gè)誤區(qū)。
從最常用的機(jī)械硬盤開始,通常圍繞溫度,讀寫壽命,抗沖擊力等設(shè)計(jì),一些硬盤在讀寫超過幾百TB后,就開始工作不正常,SSD硬盤在環(huán)境溫度變化,可能也會(huì)引起數(shù)據(jù)有效性變化。隨著存儲(chǔ)安全技術(shù)的加強(qiáng),出現(xiàn)了冗余整理的技術(shù),把多塊硬盤進(jìn)行聚合,數(shù)據(jù)寫入多塊硬盤;提高了單塊硬盤的可靠性。進(jìn)入到NAS,SAN等專用存儲(chǔ)解決方案后,通過冗余陣列,通道冗余,快照鏡像等技術(shù),進(jìn)一步提高了存儲(chǔ)容量和整個(gè)讀寫環(huán)節(jié)的可靠性。但這些都是圍繞硬件故障或存儲(chǔ)區(qū)域故障進(jìn)行設(shè)計(jì)。云存儲(chǔ),包括對(duì)象存儲(chǔ)和彈性塊存儲(chǔ),核心設(shè)計(jì)目標(biāo)依然是數(shù)據(jù)在硬件或存儲(chǔ)節(jié)點(diǎn)或區(qū)域系統(tǒng)出問題時(shí)候,有能力從其它節(jié)點(diǎn)恢復(fù)。
備份系統(tǒng)一個(gè)重要設(shè)計(jì)思想就是圍繞恢復(fù)設(shè)計(jì)。備份把數(shù)據(jù)從1個(gè)節(jié)點(diǎn),一個(gè)系統(tǒng)復(fù)制到另外一個(gè)節(jié)點(diǎn),一個(gè)系統(tǒng),規(guī)避了硬件、軟件在同一時(shí)期發(fā)生問題的可能性;備份系統(tǒng)通常會(huì)在數(shù)據(jù)存儲(chǔ)這里增加高級(jí)別的冗余配置,或冗余復(fù)制,或低成本的算術(shù)冗余數(shù)據(jù)分布。備份系統(tǒng)通過時(shí)間版本化,空間冗余分布進(jìn)一步規(guī)避了因?yàn)楦鞣N有意,無意的數(shù)據(jù)讀寫動(dòng)作,包括人為操作,系統(tǒng)故障,軟件缺陷,黑客入侵,病毒,自然災(zāi)難等,引起的數(shù)據(jù)丟失,新增,修改等問題。一些設(shè)計(jì)得比較好的方案,會(huì)輕松還原數(shù)據(jù)。即時(shí)在備份系統(tǒng)軟件出現(xiàn)問題,也能把數(shù)據(jù)通過一定的流程還原回去。多備份在業(yè)務(wù)系統(tǒng)出現(xiàn)問題后,甚至可以在選定數(shù)據(jù)庫表或某1個(gè)文件獨(dú)立恢復(fù);如果數(shù)據(jù)采用混合云模式,數(shù)據(jù)再TB級(jí)別,也可以在極其短暫的情況下恢復(fù)到業(yè)務(wù)系統(tǒng)中。
5. 存儲(chǔ)通常關(guān)注訪問性能指標(biāo)設(shè)計(jì);備份重點(diǎn)關(guān)注一次備份和恢復(fù)的時(shí)間開銷
電腦從IDE硬盤,升級(jí)到SSD硬盤,操作系統(tǒng)啟動(dòng)速度,軟件運(yùn)行的速度明顯不一樣。業(yè)務(wù)系統(tǒng)從普通的硬盤存儲(chǔ),過度到專業(yè)級(jí)SAN全光纖存儲(chǔ),甚至對(duì)數(shù)據(jù)進(jìn)行上幾百GB的全內(nèi)存加速,目的就是為了提高數(shù)據(jù)讀寫的速度,提升終端用戶的體驗(yàn)。所以,存儲(chǔ)系統(tǒng)通常會(huì)圍繞IOPS指標(biāo)來選型,場(chǎng)景不一樣IOPS的選擇也不一樣。當(dāng)然價(jià)格也不一樣。云存儲(chǔ)涉及到的彈性塊存儲(chǔ),以及對(duì)象存儲(chǔ)都有同樣的考量指標(biāo) ,目標(biāo)筆者了解到的是,彈性塊存儲(chǔ)通常在幾十MB左右,而結(jié)合SSD方案的,則可以到上百M(fèi)B。云存儲(chǔ)為了提高讀的能力,通常結(jié)合了CDN技術(shù)。部分廠家還提供了上傳加速,比如七牛。
備份系統(tǒng),非常關(guān)注一次備份和恢復(fù)的時(shí)間窗口,主要原因在于大部分備份系統(tǒng)是構(gòu)建在生產(chǎn)主系統(tǒng)之上。通常備份越快,對(duì)業(yè)務(wù)系統(tǒng)的影響越小。業(yè)務(wù)系統(tǒng)的場(chǎng)景非常復(fù)雜,有的是文件大,如視頻,圖片,系統(tǒng)壓縮文件,如多備份不少客戶是數(shù)據(jù)庫壓縮后的文件進(jìn)行備份,但單個(gè)文件得幾百GB ;有的客戶是海量的文件,如郵件系統(tǒng),規(guī)模上TB級(jí),數(shù)量也在億級(jí)別。如何在最短之內(nèi)把數(shù)據(jù)備份完成,通常是一個(gè)比較辣手的問題。在這塊包括先壓縮后備份,先歸檔再備份,或者直接快照后再備份等各種方案都有。基本上總結(jié)起來就包括文件系統(tǒng)級(jí)的,IO塊級(jí)別的,或者快照級(jí)別的備份。文件系統(tǒng)級(jí)實(shí)施簡(jiǎn)單,價(jià)格低,性能受限文件系統(tǒng)IO能力;IO塊級(jí)別實(shí)施復(fù)雜,價(jià)格貴,通常需要變化存儲(chǔ)架構(gòu);快照級(jí)別可能對(duì)存儲(chǔ)架構(gòu)會(huì)有調(diào)整,適合規(guī)模小一點(diǎn)的。傳統(tǒng)主流大廠的方案一般都會(huì)有以上幾個(gè)組合。多備份目前聚焦在文件系統(tǒng)對(duì)象級(jí),IO塊和快照方案作為輔組;結(jié)合變掃描邊備份,實(shí)時(shí)發(fā)現(xiàn),智能壓縮,自適應(yīng)CPU硬件加密等方案,盡可能減低處理時(shí)間。依賴備份方案,恢復(fù)的機(jī)制相應(yīng)也不一樣,恢復(fù)速度也不一樣; 對(duì)于純粹的備份來說,按照備份對(duì)象序列差異式的恢復(fù)變化的內(nèi)容,依然是一個(gè)可靠與速度平衡的解決思路,且在目標(biāo)系統(tǒng)可用的情況下,是非常合適的一個(gè)方案。如果對(duì)于做了異地備份的情況,災(zāi)難式的恢復(fù)通常會(huì)受限于網(wǎng)絡(luò)通道。
6. 存儲(chǔ)通常以數(shù)據(jù)規(guī)模變”大”為美,而備份通常以最大程度把數(shù)據(jù)變“小”為美
這里的變大,是指存儲(chǔ)解決的問題是如何存儲(chǔ)超大規(guī)模的數(shù)據(jù)。在我們?nèi)粘T掝}中,通常溝通交流的是誰家的硬盤支持1TB,2TB,4TB等,業(yè)務(wù)系統(tǒng)支持多少用戶規(guī)模,產(chǎn)生了多少TB數(shù)據(jù),數(shù)據(jù)庫存儲(chǔ)規(guī)模如何等, 衡量一個(gè)存儲(chǔ)系統(tǒng)設(shè)計(jì)的是否好,就是在大規(guī)模數(shù)據(jù)下,系統(tǒng)反應(yīng)良好,用戶感覺流暢。而支持這一目標(biāo),通常會(huì)說存儲(chǔ)服務(wù)器支持的硬盤塊數(shù),單塊硬盤的容量,當(dāng)然IO通道能力也是配套指標(biāo)。
為了支持足夠的大,配上專門的存儲(chǔ)交換機(jī),快速把大容量存儲(chǔ)陣列映射到不同的服務(wù)器上;而數(shù)據(jù)集中存儲(chǔ)在SAN網(wǎng)絡(luò)中,有的高達(dá)幾百TB甚至PB級(jí)別。即使這樣,支持壓縮的特性也能派上用場(chǎng),特別巨大的數(shù)據(jù)量,對(duì)存儲(chǔ)的數(shù)據(jù)默認(rèn)進(jìn)行壓縮或去重,降低數(shù)據(jù)占用空間。云存儲(chǔ)的出現(xiàn),更是把容量推向了幾乎無限;單個(gè)云平臺(tái)或者準(zhǔn)確受限于存儲(chǔ)機(jī)房區(qū)域的容量和區(qū)域的數(shù)量。由于動(dòng)態(tài)擴(kuò)容特性,當(dāng)存儲(chǔ)網(wǎng)絡(luò)不夠時(shí),在IDC空間足夠的情況下,可以不斷增加節(jié)點(diǎn)完成存儲(chǔ)節(jié)點(diǎn)的增加。
通常當(dāng)數(shù)據(jù)足夠大,數(shù)據(jù)足夠久的時(shí)候,數(shù)據(jù)就需要?dú)w檔備份起來。而備份就是解決如何保持完整的數(shù)據(jù)同時(shí),能更好的減低存儲(chǔ)開銷。所以,一般來說,由于備份會(huì)采取在原端去重,或存儲(chǔ)端全局去重等技術(shù),保持最小的備份空間。同時(shí)包括壓縮等方案,也會(huì)自動(dòng)在備份流程中引入。在傳統(tǒng)的實(shí)施方案中,由于要定期作全量,數(shù)據(jù)會(huì)變得很大,所以一般保留3個(gè)月,或半年,或按年做次全量等策略 ; 在快照模型下,由于產(chǎn)生的數(shù)據(jù)規(guī)模比較大,通常云主機(jī)對(duì)云磁盤采取的快照備份一般也保持幾個(gè)快照。傳統(tǒng)備份產(chǎn)品也有全增量策略,只是結(jié)合硬件存儲(chǔ)方案,使用和管理成本依然還是比較高; 多備份采取的全增量策略,優(yōu)勢(shì)主要集中在混合云索引增量模型,數(shù)據(jù)保持最小增長規(guī)模可靠存儲(chǔ)的同時(shí),還可以保持更簡(jiǎn)單的快速恢復(fù)體驗(yàn),大規(guī)模數(shù)據(jù)備份非常省空間。
存儲(chǔ)和備份的差異總結(jié)
存儲(chǔ)主要重點(diǎn)解決原始產(chǎn)生數(shù)據(jù)的正常存放和讀取問題,包括媒介,以及存放讀取方法,
比如數(shù)據(jù)通過文件系統(tǒng)或?qū)iT的訪問接口保存在U盤,硬盤,光盤,磁盤陣列,NAS,SAN存儲(chǔ)網(wǎng)絡(luò),云存儲(chǔ)等。一般個(gè)人存儲(chǔ)和企業(yè)存儲(chǔ)在讀寫性能,安全,可靠性,可管理性,服務(wù)質(zhì)量承諾等方面存在本質(zhì)區(qū)別。正如硬盤,網(wǎng)盤永遠(yuǎn)是解決個(gè)人照片,非敏感資料等存儲(chǔ)需求,而SAN,NAS,企業(yè)級(jí)云存儲(chǔ)服務(wù)則是企業(yè)重要資料存取方案。性能,容量,規(guī)避單節(jié)點(diǎn),單區(qū)域依然是最求的最大設(shè)計(jì)目標(biāo),備份依然不是其重點(diǎn)解決點(diǎn); 進(jìn)一步,基于云存儲(chǔ)的模型,產(chǎn)生了用于保存相對(duì)冷數(shù)據(jù)的服務(wù),包括Google,AWS,還有阿里云的歸檔服務(wù)。這為歷史累計(jì)不常用的數(shù)據(jù)歸檔備份打下了基礎(chǔ),但普通個(gè)人或企業(yè)也難于直接使用。
備份則通過定期或?qū)崟r(shí)復(fù)制技術(shù),應(yīng)對(duì)各類人為,軟件故障,系統(tǒng)故障,自然災(zāi)難引起的數(shù)據(jù)丟失,損壞,出錯(cuò)等問題
U盤備份,硬盤備份,磁帶備份,光盤備份,本地備份,異地備份,云備份,本地與云結(jié)合的混合云模式備份等類型,以及CDP 實(shí)時(shí)備份保護(hù)等。手動(dòng)復(fù)制到U盤,硬盤構(gòu)成一個(gè)最簡(jiǎn)單的備份方案。但涉及到大規(guī)模數(shù)據(jù),保護(hù)服務(wù)或系統(tǒng)數(shù)量增加,以及資料的敏感控制,生產(chǎn)系統(tǒng)資源占用控制管理等需求,只要用專業(yè)的保護(hù)方案才能解決。
最新的系統(tǒng)與數(shù)據(jù)備份保護(hù)趨勢(shì)將逐步超出備份范疇,智能化數(shù)據(jù)管理,數(shù)據(jù)保護(hù)虛擬化,以及和各種云環(huán)境的融合,與數(shù)據(jù)安全的融合將是重要的發(fā)展方向 ;備份即是立即可用的服務(wù),備份即是保護(hù)服務(wù),備份即是數(shù)據(jù)虛擬化,備份即是數(shù)據(jù)服務(wù),備份即是數(shù)據(jù)遷移服務(wù)等是重要的數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用發(fā)展方向。目前巨頭和多備份等一些創(chuàng)新類企業(yè)等已經(jīng)在加快邁向這個(gè)趨勢(shì)。
-
企業(yè)如何實(shí)現(xiàn)對(duì)大數(shù)據(jù)的處理與分析?
-
企業(yè)如何實(shí)現(xiàn)對(duì)大數(shù)據(jù)的處理與分析?
-
要跟上云數(shù)據(jù)中心市場(chǎng)的步伐,您需要了解這十大趨勢(shì)
-
企業(yè)如何實(shí)現(xiàn)對(duì)大數(shù)據(jù)的處理與分析?
-
企業(yè)如何實(shí)現(xiàn)對(duì)大數(shù)據(jù)的處理與分析?
-
技術(shù)人再不懂區(qū)塊鏈,你就OUT了?