問(wèn)題與挑戰(zhàn)
某用戶(hù)配置了16塊1TB磁盤(pán)做RAID5,承載其在線關(guān)鍵業(yè)務(wù)。運(yùn)行3年后,磁盤(pán)開(kāi)始陸續(xù)損壞,發(fā)現(xiàn)其重建過(guò)程漫長(zhǎng)。在其業(yè)務(wù)未中斷的情況下,完成一次重建所需時(shí)間長(zhǎng)達(dá)5天,這種情況還不是最糟的。更糟的是,在某次重建過(guò)程中,重建進(jìn)程完成到60%時(shí),過(guò)程被異常中止,RAID組fail,整個(gè)數(shù)據(jù)卷?yè)p壞,數(shù)據(jù)丟失。經(jīng)檢查發(fā)現(xiàn),在重建過(guò)程中,該RAID組中的另一塊磁盤(pán)發(fā)生了讀錯(cuò)誤,導(dǎo)致磁盤(pán)failed,被RAID組踢出。
通過(guò)這個(gè)案例可以看出幾個(gè)問(wèn)題:
1、磁盤(pán)屬于消耗品,發(fā)生老化后,會(huì)產(chǎn)生潛在故障盤(pán)或假象故障盤(pán);
2、故障盤(pán)或假象故障盤(pán)都將導(dǎo)致RAID組重建;
3、大容量磁盤(pán)RAID重建時(shí)間過(guò)長(zhǎng),重建過(guò)程風(fēng)險(xiǎn)巨大;
4、潛在故障盤(pán)將導(dǎo)致RAID重建失敗;
隨著云時(shí)代的到來(lái),數(shù)據(jù)量越來(lái)越多,磁盤(pán)容量越來(lái)越大,發(fā)生磁盤(pán)損壞的機(jī)率也越來(lái)越高,如何解決磁盤(pán)故障對(duì)存儲(chǔ)帶來(lái)的危害成為重要課題目。
磁盤(pán)維護(hù)新方式-IDDC主動(dòng)式磁盤(pán)診斷中心
基于多年存儲(chǔ)維護(hù)經(jīng)驗(yàn)的深刻理解,MacroSAN開(kāi)發(fā)了一套可以在不增加任何附加投資的條件下,最大化提高磁盤(pán)及RAID組安全性的、智能存儲(chǔ)磁盤(pán)維護(hù)檢測(cè)修復(fù)工具,即下述的IDDC。
IDDC:Initiative Disk Diagnosis Center,主動(dòng)式磁盤(pán)診斷中心
該診斷中心包含了4個(gè)模塊(磁盤(pán)檢測(cè)、快速修復(fù)、壞塊復(fù)位、磁盤(pán)診斷),它可以通過(guò)預(yù)先設(shè)置的策略定期對(duì)磁盤(pán)進(jìn)行錯(cuò)誤檢測(cè),用于發(fā)現(xiàn)磁盤(pán)中是否存在錯(cuò)誤碼。再根據(jù)錯(cuò)誤碼判斷磁盤(pán)錯(cuò)誤類(lèi)型,并進(jìn)行相應(yīng)的壞塊修復(fù)、磁盤(pán)遷移或磁盤(pán)修復(fù)等操作,以提早處理磁盤(pán)潛在的故障隱患,降低RAID組重建損壞機(jī)率,提高設(shè)備穩(wěn)定性。
? 磁盤(pán)檢測(cè):
? 對(duì)所有磁盤(pán)進(jìn)行周期性全盤(pán)檢測(cè),提前發(fā)現(xiàn)故障;
? 支持磁盤(pán)檢測(cè)速率動(dòng)態(tài)調(diào)整,不影響應(yīng)用性能;
? 發(fā)現(xiàn)問(wèn)題的磁盤(pán)交由診斷中心統(tǒng)一處理;
? 快速?gòu)?fù)位:結(jié)合CRAID的局部重建機(jī)制,可快速修復(fù)磁盤(pán)邏輯錯(cuò)誤,降低全盤(pán)重建機(jī)率。
? 壞塊修復(fù):經(jīng)過(guò)檢測(cè)的磁盤(pán)發(fā)現(xiàn)存在壞塊(扇區(qū))后,會(huì)觸發(fā)磁盤(pán)自身的remap機(jī)制,將壞塊的指針重定向到好的保留扇區(qū)中。然后調(diào)用RAID組的校驗(yàn)功能,重建該數(shù)據(jù)塊,確保數(shù)據(jù)一致性。
? 磁盤(pán)診斷:所有告警磁盤(pán)、故障磁盤(pán)會(huì)在診斷中心進(jìn)行復(fù)診并嘗試修復(fù),減少磁盤(pán)故障誤判。修復(fù)后的磁盤(pán)自動(dòng)轉(zhuǎn)為全局熱備磁盤(pán)。[nextpage]
RAID維護(hù)新方式-CRAID
根據(jù)統(tǒng)計(jì)數(shù)據(jù)分析,存儲(chǔ)系統(tǒng)的硬件故障90%以上是磁盤(pán)故障,而故障磁盤(pán)中,只有12%是完全的物理?yè)p壞,88%屬于部分/完全可用。如果磁盤(pán)發(fā)生錯(cuò)誤后立即被踢出陣列,一方面客戶(hù)需要為100%的故障磁盤(pán)買(mǎi)單,另外一方面客戶(hù)還需要承擔(dān)故障磁盤(pán)被踢出陣列到被更換過(guò)程中其他磁盤(pán)再次故障所導(dǎo)致的數(shù)據(jù)丟失風(fēng)險(xiǎn)。ODSP存儲(chǔ)軟件平臺(tái)在分層次、模塊化設(shè)計(jì)的基礎(chǔ)上,在多個(gè)層次上進(jìn)行了磁盤(pán)錯(cuò)誤處理,其目標(biāo)是:“盡量嘗試修復(fù),盡可能減少踢盤(pán)”,以提高用戶(hù)的投資回報(bào)率,提出基于Cell的RAID同步和重建技術(shù)。
Cell,稱(chēng)之為“細(xì)胞”,指帶“活性”的數(shù)據(jù)單元,是存儲(chǔ)資源管理的基本單位。引入Cell的概念后,資源管理層次如下圖所示,在具體的實(shí)現(xiàn)上,首先用物理磁盤(pán)創(chuàng)建RAID,然后把RAID的可用空間根據(jù)指定長(zhǎng)度(默認(rèn)1GB)劃分為多個(gè)Cell,創(chuàng)建LUN時(shí),系統(tǒng)自動(dòng)分配空閑Cell,破除了LUN與RAID、Disk之間的捆綁關(guān)系,使RAID的最小維護(hù)單位由原來(lái)的磁盤(pán)變成了更小更靈活的Cell,實(shí)現(xiàn)了完全的虛擬化存儲(chǔ)架構(gòu)。
CRAID(基于Cell的RAID)技術(shù)是宏杉科技在RAID機(jī)制上的一項(xiàng)創(chuàng)新技術(shù)。CRAID通過(guò)更精細(xì)的資源管理單元——Cell來(lái)實(shí)現(xiàn)對(duì)磁盤(pán)的精細(xì)化管理,不僅能有效提高系統(tǒng)對(duì)于磁盤(pán)故障的容忍度,減少數(shù)據(jù)處于臨界危險(xiǎn)狀態(tài)的機(jī)率,而且能數(shù)倍地提升磁盤(pán)故障后的恢復(fù)效率。MS1000的CRAID技術(shù)能夠做到:
1、容忍多塊磁盤(pán)故障:在RAID組內(nèi),只要同一Cell內(nèi)的兩個(gè)數(shù)據(jù)塊不同時(shí)出現(xiàn)故障,RAID組允許多塊磁盤(pán)發(fā)生介質(zhì)損壞,而數(shù)據(jù)不會(huì)丟失。借助CRAID技術(shù)既能解決傳統(tǒng)RAID6、RAID10磁盤(pán)浪費(fèi)嚴(yán)重的問(wèn)題,降低成本,又能解決2塊及以上磁盤(pán)出現(xiàn)介質(zhì)錯(cuò)誤導(dǎo)致數(shù)據(jù)丟失的問(wèn)題,甚至可做到所有磁盤(pán)出現(xiàn)介質(zhì)錯(cuò)誤,系統(tǒng)和數(shù)據(jù)依然正常,極大地增強(qiáng)了可靠性。
2、數(shù)據(jù)重建時(shí)間減少80%:傳統(tǒng)的RAID機(jī)制數(shù)據(jù)重建恢復(fù)過(guò)程非常漫長(zhǎng),尤其是2TB等大容量硬盤(pán)普及后,數(shù)據(jù)丟失風(fēng)險(xiǎn)大幅升高。據(jù)統(tǒng)計(jì),在正常的監(jiān)控業(yè)務(wù)流量下,2TB硬盤(pán)故障的重建恢復(fù)時(shí)間長(zhǎng)達(dá)5天—30天。MS1000通過(guò)下述幾項(xiàng)技術(shù),能夠減少80%-95%的數(shù)據(jù)重建恢復(fù)時(shí)間,大大提高了存儲(chǔ)系統(tǒng)的數(shù)據(jù)保護(hù)能力。
?只對(duì)已寫(xiě)數(shù)據(jù)的Cell進(jìn)行重建,空閑Cell不重建;
?只重建數(shù)據(jù)發(fā)生變化的Cell,不對(duì)整個(gè)硬盤(pán)進(jìn)行重建;
?只對(duì)發(fā)生介質(zhì)錯(cuò)誤的Cell進(jìn)行校驗(yàn)重建恢復(fù),其它Cell通過(guò)拷貝的方式重建;
傳統(tǒng)存儲(chǔ)與IDDC+CRAID比較
結(jié)語(yǔ)
在高清視頻監(jiān)控迅速發(fā)展的今天,大規(guī)模、高容量硬盤(pán)的廣泛部署,在滿(mǎn)足越來(lái)越高的容量需求的同時(shí),也面臨著更高的磁盤(pán)故障率和數(shù)據(jù)丟失風(fēng)險(xiǎn),傳統(tǒng)的RAID機(jī)制已不能滿(mǎn)足需求。而宏杉科技創(chuàng)新性提出了IDDC+CRAID技術(shù),具備高效靈活的磁盤(pán)重建和同步策略,可容忍一組RAID5磁盤(pán)出現(xiàn)多塊磁盤(pán)介質(zhì)錯(cuò)誤數(shù)據(jù)不丟失,同時(shí)減少80%的磁盤(pán)重建時(shí)間,大大提升了整套存儲(chǔ)系統(tǒng)的可靠性。