當(dāng)前位置 :首頁(yè) > 新聞中心
企事業(yè)單位數(shù)據(jù)中心機(jī)房搬遷策略
* 來(lái)源 : * 作者 : * 發(fā)表時(shí)間 : 2015-12-16 * 瀏覽 : 126

搬遷實(shí)施方案必須貼近實(shí)際,在內(nèi)容上周密細(xì)致、切實(shí)可行,其中重點(diǎn)是如何保障網(wǎng)絡(luò)遷移的平滑。

  隨著近些年信息化建設(shè)步伐的加快,舊的機(jī)房已逐漸無(wú)法適應(yīng)現(xiàn)代化的信息化應(yīng)用和管理,新建容災(zāi)機(jī)房,改造舊機(jī)房等新需求正變?yōu)楝F(xiàn)實(shí)。相對(duì)來(lái)說(shuō),在經(jīng)費(fèi)充足的情況下,新建或改造一座機(jī)房并不是那么困難,如何搬機(jī)房才是真正的難點(diǎn)。我們或許考慮過(guò)兩座機(jī)房該如何容災(zāi),考慮過(guò)業(yè)務(wù)系統(tǒng)如何高可用,考慮過(guò)單點(diǎn)故障時(shí)有哪些可應(yīng)急的方案,但是,當(dāng)我們要搬移這些網(wǎng)絡(luò)和計(jì)算設(shè)備時(shí),之前的所有考慮都還能管用么?

  毫無(wú)疑問(wèn),機(jī)房的搬遷工作是一項(xiàng)復(fù)雜的工程,不僅要把網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)等各類生產(chǎn)設(shè)備安全遷移到新機(jī)房,而且要求網(wǎng)絡(luò)系統(tǒng)的遷移和集中存儲(chǔ)系統(tǒng)的遷移必須安全、平穩(wěn),甚至達(dá)到不停機(jī),不影響業(yè)務(wù)系統(tǒng)應(yīng)用的要求?;诖?,機(jī)房搬遷的風(fēng)險(xiǎn)點(diǎn)更加難以控制,技術(shù)難點(diǎn)也比初始部署或技術(shù)改造更為繁瑣。

  雖然高校的業(yè)務(wù)還尚未達(dá)到極致的24小時(shí)×7天的連續(xù)性需求,但保證業(yè)務(wù)連續(xù)性仍然是數(shù)據(jù)中心搬遷過(guò)程最核心的要求,網(wǎng)絡(luò)保障則是機(jī)房搬遷成敗的關(guān)鍵。

  中南民族大學(xué)原有舊機(jī)房建于1999年,面積約70平方米,在配電、空調(diào)制冷、機(jī)柜容量、潔凈度等方面已遠(yuǎn)遠(yuǎn)落后于當(dāng)前信息化發(fā)展水平。經(jīng)過(guò)“十二五”期間的數(shù)字化校園建設(shè),逐漸改造或新建了邊界網(wǎng)絡(luò)、核心網(wǎng)絡(luò)、數(shù)據(jù)中心網(wǎng)絡(luò)、數(shù)據(jù)中心計(jì)算資源池等關(guān)鍵基礎(chǔ)設(shè)施。在學(xué)校的大力支持下,于2014年末立項(xiàng)新建了兩座機(jī)房,分別位于校內(nèi)相隔1千米的兩座建筑物內(nèi),功能上分為容災(zāi)機(jī)房和新的主機(jī)房,每座機(jī)房面積約120平方米,至2015年兩座機(jī)房分別竣工,將舊機(jī)房設(shè)備和業(yè)務(wù)分別遷移到兩座新機(jī)房,最后拆除舊機(jī)房。

  按照機(jī)房和數(shù)字化校園的建設(shè)規(guī)劃,網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)等主體架構(gòu)設(shè)施都是雙活設(shè)計(jì),雙活的實(shí)現(xiàn)也成為本次搬遷可利用的技術(shù)要點(diǎn)和有利條件,它使搬遷具備了不停機(jī)、不斷網(wǎng)的可能。

理清搬遷思路

  總體來(lái)說(shuō),本次搬遷規(guī)劃分為兩個(gè)階段:第一個(gè)階段為舊機(jī)房搬遷到容災(zāi)機(jī)房,使容災(zāi)機(jī)房具備完全獨(dú)立承載全校網(wǎng)絡(luò)和業(yè)務(wù)的能力;第二個(gè)階段為舊機(jī)房斷電,剩余全部設(shè)備搬遷到主機(jī)房并與容災(zāi)機(jī)房一起雙活運(yùn)行。整個(gè)搬遷過(guò)程按照不斷網(wǎng),不停業(yè)務(wù)的高標(biāo)準(zhǔn)進(jìn)行組織安排,工期安排在暑假進(jìn)行。圖1所示為校園總體網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。

  網(wǎng)絡(luò)方面,自無(wú)線控制器,核心交換機(jī)、認(rèn)證BRAS、防火墻,到邊界交換機(jī)均以IEEE802.3ad協(xié)議實(shí)現(xiàn)雙設(shè)備雙活配置連接,所需做的重點(diǎn)是梳理線路連接,確保分拆到兩座機(jī)房后立即正確接好心跳線,避免腦裂導(dǎo)致的網(wǎng)絡(luò)異常,之后逐條接好匯聚到核心的雙上行鏈路,確保雙上行鏈路在割接過(guò)程中至少有一條不斷開(kāi),用戶不會(huì)感知到網(wǎng)絡(luò)中斷。數(shù)據(jù)中心的計(jì)算資源方面,已有兩套刀片服務(wù)器,絕大多數(shù)關(guān)鍵應(yīng)用和服務(wù)都創(chuàng)建在兩套刀片組成的一個(gè)虛擬化集群內(nèi),在兩個(gè)搬遷階段中分別將全部業(yè)務(wù)漂移到一組不搬的計(jì)算環(huán)境就能確保業(yè)務(wù)不斷條件下的搬遷實(shí)施。存儲(chǔ)方面,已在2014年末采購(gòu)了雙活存儲(chǔ)網(wǎng)關(guān),一直等待新機(jī)房完工,圖1所示的存儲(chǔ)拓?fù)錇榘徇w完后規(guī)劃的存儲(chǔ)拓?fù)?。雙活存儲(chǔ)網(wǎng)關(guān)和一套新存儲(chǔ)在搬遷過(guò)程中部署在容災(zāi)機(jī)房,先與舊機(jī)房存儲(chǔ)做好雙活同步,使新舊兩套存儲(chǔ)都具有完整的數(shù)據(jù),再將搬到容災(zāi)機(jī)房的刀片服務(wù)器、新存儲(chǔ)、雙活存儲(chǔ)網(wǎng)關(guān)接通,使容災(zāi)機(jī)房的服務(wù)器與存儲(chǔ)能全部接管全部業(yè)務(wù),達(dá)到舊機(jī)房存儲(chǔ)停機(jī)條件,將舊機(jī)房存儲(chǔ)搬遷到新主機(jī)房,從而保障業(yè)務(wù)運(yùn)行的同時(shí)也兼顧了存儲(chǔ)的搬遷工作。除此之外,還剩余一些非關(guān)鍵業(yè)務(wù)的服務(wù)器或交換機(jī),則在需要搬遷時(shí)短暫停機(jī)。

  根據(jù)上述搬遷思路規(guī)劃,不僅可以在實(shí)踐中檢驗(yàn)雙活架構(gòu)真正做到業(yè)務(wù)和網(wǎng)絡(luò)不中斷的效果,還有額外的優(yōu)勢(shì)在于:第一,所有的搬遷和割接工作都可安排在白天進(jìn)行,實(shí)施人員可在頭腦清醒的狀態(tài)下投入工作,降低人為誤操作的機(jī)率;第二,由于是不間斷網(wǎng)絡(luò)和業(yè)務(wù)的搬遷,所以不存在搬遷的窗口時(shí)間,實(shí)施過(guò)程的時(shí)間壓力減小很多,尤其對(duì)于機(jī)器設(shè)備存在搬動(dòng)后硬件故障的可能,更是無(wú)法掌握的時(shí)間因素;第三,割接過(guò)程萬(wàn)一出現(xiàn)預(yù)料之外的差錯(cuò),用戶會(huì)在最短的時(shí)間反饋給實(shí)施人員,以便及時(shí)調(diào)整和解決,若在夜間進(jìn)行搬遷和割接因無(wú)法得到用戶反饋,即使準(zhǔn)備了相應(yīng)的驗(yàn)證條件,也可能獲得有偏差的結(jié)果,到白天又付出更多回退和中斷事件才能找到癥結(jié)。

  搬遷的風(fēng)險(xiǎn)是客觀存在的,總體上也有三個(gè)方面。技術(shù)方面,雖然有高可用性技術(shù)作為支撐,但仍可能存在意料之外的問(wèn)題,因此必須制定一些策略,將業(yè)務(wù)對(duì)技術(shù)所依賴的各個(gè)方面都考慮進(jìn)來(lái),在搬遷前進(jìn)行驗(yàn)證性測(cè)試和檢查,以縮短萬(wàn)一出現(xiàn)的停機(jī)時(shí)間。硬件遷移方面,很多設(shè)備可能都會(huì)導(dǎo)致搬運(yùn)過(guò)程中遭到損壞,策略之一是提前聯(lián)系好供貨商,在質(zhì)保期內(nèi)還可及時(shí)提供備件的更換,策略之二則是對(duì)該硬件承載的功能提前做出預(yù)判和備用,確保損壞真的發(fā)生時(shí)能減少損失。數(shù)據(jù)方面,不停機(jī)的搬遷在數(shù)據(jù)層面一直是活動(dòng)的,提前的備份并不能持續(xù)跟蹤變化的數(shù)據(jù)存儲(chǔ),但備份仍然是不可缺少的,我們可以采取業(yè)務(wù)系統(tǒng)只讀等措施來(lái)減少搬遷期間的數(shù)據(jù)變化,以兼顧網(wǎng)絡(luò)服務(wù)的持續(xù)使用和數(shù)據(jù)可恢復(fù)能力。